Типы информационных массивов и единицы контент-анализа. Контент-анализ: сущность, задачи, процедуры Объектами контент анализа могут быть

» Контент-анализ социология

Контент-анализ - описание метода

Контент-анализ (от англ. contens содержание) - метод качественно-количественного анализа содержания документов с целью выявления или измерения различных фактов и тенденций, отраженных в этих документах. Особенность контент-анализа состоит в том, что он изучает документы в их социальном контексте. Может использоваться как основной метод исследования (например, контент-анализ текста при исследовании политической направленности газеты), параллельный, т.е. в сочетании с другими методами (напр., в исследовании эффективности функционирования средств массовой информации), вспомогательный или контрольный (напр., при классификации ответов на открытые вопросы анкет).

Не все документы могут стать объектом контент-анализа. Необходимо, чтобы исследуемое содержание позволило задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также, чтобы интересующие исследователя элементы содержания встречались с достаточной частотой (принцип статистической значимости). Чаще всего в качестве объектов исследования контент-анализа выступают сообщения печати, радио, телевидения, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет.

Основные направления применения контент-анализа: выявление того, что существовало до текста и что тем или иным образом получило в нем отражение (текст как индикатор определенных сторон изучаемого объекта - окружающей действительности, автора или адресата); определение того, что существует только в тексте как таковом (различные характеристики формы - язык, структура, жанр сообщения, ритм и тон речи); выявление того, что будет существовать после текста, т.е. после его восприятия адресатом (оценка различных эффектов воздействия).

В разработке и практическом применении контент-анализа выделяют несколько стадий. После того, как сформулированы тема, задачи и гипотезы исследования, определяются категории анализа - наиболее общие, ключевые понятия, соответствующие исследовательским задачам. Система категорий играет роль вопросов в анкете и указывает, какие ответы должны быть найдены в тексте. В практике отечественного контент-анализа сложилась довольно устойчивая система категорий - знак, цели, ценности, тема, герой, автор, жанр и др. Все более широко распространяется контент-анализ сообщений средств массовой информации, основанный на парадигматическом подходе, в соответствии с которым изучаемые признаки текстов (содержание проблемы, причины ее возникновения, проблемообразующий субъект, степень напряженности проблемы, пути ее решения и др.) рассматриваются как определенным образом организованная структура.

Категории контент-анализа должны быть исчерпывающими (охватывать все части содержания, определяемые задачами данного исследования), взаимоисключающими (одни и те же части не должны принадлежать различным категориям), надежными (между кодировщиками не должно быть разногласий по поводу того, какие части содержания следует относить к той или иной категории) и уместными (соответствовать поставленной задаче и исследуемому содержанию). При выборе категорий для контент-анализа следует избегать крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Иногда необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми для контент-анализа.

После того, как категории сформулированы, необходимо выбрать соответствующую единицу анализа - лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явления. В практике отечественных контент-аналитических исследований наиболее, употребительными единицами анализа являются слово, простое предложение, суждение, тема, автор, герой, социальная ситуация, сообщение в целом и др. Сложные виды контент-анализа обычно оперируют не одной, а несколькими единицами анализа. Единицы анализа, взятые изолировано, могут быть не всегда правильно истолкованы, поэтому они рассматриваются на фоне более широких лингвистических или содержательных структур, указывающих на характер членения текста, в пределах которого идентифицируется присутствие или отсутствие единиц анализа - контекстуальных единиц. Например, для единицы анализа «слово» контекстуальная единица - «предложение». Наконец, необходимо установить единицу счета - количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п.), появление признаков в тексте, частота их появления (интенсивность).

Важен выбор необходимых источников, подвергаемых контент-анализу. Проблема выборки содержит в себе выбор источника, количества сообщений, даты сообщения и исследуемого содержания. Все эти параметры выборки определяются задачами и масштабами исследования. Чаше всего контент-анализ проводится на годичной выборке: если это изучение протоколов собраний, то достаточно 12 протоколов (по числу месяцев), если изучение сообщений средств массовой информации - 12-16 номеров газеты или теле-, радиодней. Обычно выборка сообщений средств массовой информации составляет 200-600 текстов.

Необходимым условием является разработка таблицы контент-анализа - основного рабочего документа, с помощью которого проводится исследование. Тип таблицы определяется этапом исследования. Например разрабатывая категориальный аппарат, аналитик составляет таблицу, представляющую собой систему скоординированных и субординированных категорий анализа. Такая таблица внешне напоминает анкету: каждая категория (вопрос) предполагает ряд признаков (ответов), по которым квантифицируется содержание текста. Для регистрации единиц анализа составляется другая таблица - кодировальная матрица. Если объем выборки достаточно велик (свыше 100 единиц), то кодировщик, как правило, работает с тетрадью таких матричных листов. Если выборка невелика (до 100 единиц), то можно проводить двумерный или многомерный анализ. В этом случае для каждого текста должна быть своя кодировальная матрица. Эта работа трудоемка и кропотлива, поэтому при больших объемах выборки сопоставление интересующих исследователя признаков осуществляется на компьютере.

Важным условием контент-анализа является разработка инструкции кодировщику - системы правил и пояснений для того, кто будет собирать эмпирическую информацию, кодируя (регистрируя) заданные единицы анализа. В инструкции точно и однозначно излагается алгоритм действий кодировщика, дается операциональное определение категорий и единиц анализа, правила их кодирования, приводятся конкретные примеры из текстов, являющихся объектом исследования, оговаривается, как следует поступать в спорных случаях, и т.д. Процедура подсчета при количественном контент-анализе в общем виде аналогична стандартным приемам классификации по выделенным группировкам ранжирования и измерения ассоциации. Существуют также специальные процедуры подсчета применительно к контент-анализу, напр., формула коэффициента Яниса, предназначенного для вычисления соотношения положительных и отрицательных (относительно избранной позиции) оценок, суждений, аргументов. В случае, когда число положительных оценок превышает число отрицательных,

Основа процедуры контент-анализа - это подсчет встречаемости некоторых компонентов в анализируемом тексте, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними.

Таким образом, главная предпосылка контент-анализа - это выяснение того, что считать и как считать; иными словами, определение единиц анализа. Выделяют две единицы анализы: смысловые и единицы счета. При этом главной смысловой единицей должна быть социальная идея, социально-значимая тема, отображенная в операциональных понятиях. Цель исследования – отыскать индикаторы, указывающие на наличие в документе темы, значимой для анализа, и раскрывающие содержание текстовой информации.

Единицы эти в зависимости от целей анализа, типа информационного массива могут быть весьма разнообразными. С одной стороны, они должны легко и по возможности однозначно идентифицироваться в тексте. С другой стороны, единицы должны быть интересными для последующей интерпретации. Между тем такие единицы (например, темы) носят собственно содержательный характер, и упоминание их в тексте может осуществляться многими способами. Их идентификация в общем случае предполагает семантический анализ текста. Чаще всего подсчитывают «интересные» или «ключевые» слова или словосочетания, однако чаще исследователя интересуют не отдельные слова, а тематическое целое, стоящие за отдельными словами категории.

Единицы анализа должны легко и по возможности однозначно идентифицироваться в тексте. В идеале их лучше всего свести к самым употребляемым значкам, например, запятым или точкам. Тогда их подсчет не будет представлять никаких трудностей.

При всем разнообразии единиц контент-анализа наиболее популярными являются макроединицы: темы или проблемы, пропозиции, образы и идеологемы. Таковых в отдельно взятых текстах и особенно в небольших по объему текстах СМИ обычно немного, поэтому оценить их динамику можно лишь на большом временном промежутке или при широком «горизонтальном сопоставлении».

Среди единиц контент-анализа можно выделить несколько основных типов:

1. «Физические» единицы. Под ними понимаются сущности с четко очерченными физическими, геометрическими или временными границами, как, например, экземпляры книги, номера газет, экземпляры плакатов или листовок, фотографии и т.п. Подсчет их не составляют особого труда, однако необходимость в таком подсчете возникает достаточно редко и чаще всего осуществляется с целью оценки представленности какой-то тематики или оценки.

2. Структурно-семиотические единицы. Это:

Лексика языка (слова и их эквиваленты, например выражение железная дорога или термин контент-анализ, т. е. то, что фиксируется в словарях);

Грамматические показатели (например, отрицательные частицы).

Количественный подсчет встречаемости слов в тексте - это, пожалуй, самый простой вариант контент-анализа, который, однако, зачастую способен давать небезынтересные результаты. Чаще всего, конечно, подсчитываются «интересные», или «ключевые» слова или словосочетания, например названия ценностных категорий типа свобода, стабильность, доверие, территориальная целостность; сценариев типа предательство или разочарование; достаточно однозначные обозначения тех или иных общественно значимых явлений, например коррупция, преступность или терроризм; значимые атрибуты наподобие жесткий, решительный; эмоционально окрашенная оценочная лексика типа разрушительный, неудержимый, подлый, кошмарный, человеконенавистнический; слова-пароли (тоже зачастую эмоционально окрашенные) типа патриоты, коммунофашисты, мондиалисты; слова, сильно активизированные в конкретный момент времени, вроде «Семья» или «Мабетекс» в начале осени 1999 года.

Контент-анализ грамматических категорий используется достаточно редко, стимулом к которому является гипотеза о том, что употребление грамматических форм в меньшей степени, чем употребление лексики, контролируется автором текста и поэтому может послужить источником таких сведений о нем, которые он сам вовсе не собирался делать доступными своим читателям. В политической психологии существует специальная исследовательская методика, так называемый анализ когнитивной сложности, которая на основе фактически контент-аналитической процедуры позволяет делать выводы о том, насколько простым или сложным является видение политической ситуации автором текста и как оно меняется со временем. Единицами контент-анализа, лежащего в основе оценки когнитивной сложности, являются, например, относимые обычно к служебной лексике категорические квантификаторы типа «всегда», «никогда», «всякий», которым противостоят квантификаторы типа «иногда», «некоторый» и т.п.; категорические оценки истинности в противоположность осторожным «возможно» или «не исключено, что»; языковые средства дифференцированного рассмотрения ситуации наподобие «с одной стороны...», «с другой стороны» и т. д.

Поскольку объектами контент-анализа могут быть не только вербальные (естественноязыковые), но и другие виды текстов (например, карикатуры, фотоснимки, рекламные клипы), постольку в числе структурно-семиотических единиц контент-анализа могут присутствовать визуальные и звуковые (чаще всего музыкальные) образы и символы, которые могут анализироваться на тех же основаниях, что и единицы естественного языка.

3. Понятийно-тематические единицы. В большинстве случаев контент-аналитик интересуется не словами как таковыми и не грамматическими категориями, а стоящими за словами значимыми для него понятиями, темами, проблемами. Исследователь, интересующийся тем, какое место в общественном сознании занимает, скажем, проблема преступности, обязан принимать во внимание не только присутствие в информационном массиве слова «преступность», но и упоминания заказных и всяких прочих убийств, бандитского беспредела, «крыши», «братков», авторитетов, власти криминала и т. д. Интересующийся отношением общественного сознания к каким-то реалиям должен принимать во внимание самый широкий спектр позитивных, негативных и некоторых более конкретных оценок, которые могут быть даны этим реалиям, причем эти оценки вовсе не обязательно должны присутствовать в виде оценочных суждений.

4. Референциальные и квазиреференциальные единицы. К референциальным, точнее, конкретно-референциальным единицам относятся обозначения реальных личностей (как современных, так и исторических деятелей), событий, городов, стран, организаций и т. д. Этот блок, особенно в части персоналий, весьма важен и диагностичен, поскольку позволяет определять личностные рейтинги, оценивать идеологические системы с точки зрения присутствующих в них референтных «знаковых» фигур, своего рода «идеологических героев». Примером интересного исследования роли референтных фигур в российском оппозиционном дискурсе 1996-1997 может послужить работа А.В. Дуки, в которой показано, что способы обозначения в тексте конкретных фигур могут различаться (В.В.Жириновский, Владимир Вольфович, Вольфыч, Жирик, сын юриста, лидер ЛДПР, самый провосточный российский политик, главный либеральный демократ, либералиссимус), однако конкретно-референтная единица здесь во всех случаях одна.

Квазиреференциальные единицы в политических текстах чаще всего бывают представлены обозначениями всякого рода «сил» - коллективных актеров политической сцены, референция которых может колебаться от реальной (типа КПРФ) через обобщенную (коммунисты, либералы, Запад, исламисты) к откровенно мифологизированной (мировая закулиса). Независимо от своей референции все эти персонажи присутствуют в идеологическом пространстве, им могут приписываться действия и оценки, и отношение к ним является немаловажным политико-идеологическим фактором. Грань между квазиреференциальными и некоторыми типами понятийно-тематических единиц размыта в силу того, что некоторые политические понятия способны и даже склонны (например, та же преступность) к метафорической персонификации.

5. Пропозициональные единицы и оценки. Это примеры высказываний, в основе которых лежат пропозиции - описания конкретных ситуаций. Наряду с пропозициями для контент-анализа могут представлять большой интерес оценки. Изучение динамики оценочных суждений, высказываемых в адрес тех или иных лиц, событий, институтов, - весьма распространенный тип контент-аналитического исследования.

6. Макроструктурные единицы. Это достаточно сложные понятийные конструкции, образующие «верхние этажи» человеческих представлений о мире и, в частности, идеологических систем. Эти конструкции, как правило, носят характер сценариев и описывают стереотипные модели развития, с которыми сопряжены ожидания будущего, соображения о прошлом, эмоциональные ассоциации и т.д. Часто эти конструкции имеют литературные или фольклорные прототипы, что отражается в их названиях. Для обозначения таких конструкций чаще всего используется термин «идеологема»; в различных дисциплинах говорят также о мифологемах, кочующих образах и т.д. Среди подобного рода конструкций, присутствующих в общественном сознании современной России, имеются, например, следующие: «Заговор», «Криминальная революция», «Беспредел», «Нет, ребята, все не так», «Возвращение в цивилизацию» и др.

7. Единицы, представляющие результаты концептуальных операций. Их довольно много, однако наибольший интерес для контент-анализа представляют метафоры, примеры и аналогии, которые в общем плане уже были охарактеризованы выше. Например, в политических текстах часто встречается упоминавшаяся «военная метафора» в варианте «Политическое противостояние – это война», проявляющаяся в таких выражениях, как война с бедностью, удар по губернатору, атака со стороны оппозиции, разгромная публикация и т. д.

8. «Поэтические» единицы. Под таковыми имеются в виду допускающие количественное измерение средства художественной выразительности - каламбуров, аллитераций и т. п.

1. Единицы, категории и признаки. Несмотря на то, что контент-анализ является в своей основе количественным методом, в нем почти всегда присутствует и качественная составляющая. Иными словами, контент-аналитик занимается количественным анализом качественных категорий. Но этим дело не исчерпывается. Во многих контент-аналитических проектах осуществляется не только оценка степени представленности в тексте тех или иных единиц, но и одновременная оценка этих единиц по тем или иным градуированным качественным шкалам. В частности, это могут быть предложенные Ч. Осгудом шкалы абстрактности (фактически - трудности для восприятия) того или иного содержания; расстояния до индивидуума (какие-то содержательные компоненты могут непосредственно касаться читателей, а какие-то могут представлять лишь досужий интерес). При анализе могут быть использованы и другие шкалы, кроме того, единицы контент-анализа могут объединяться в различные более широкие категории.

2. «Фронтальный» и «рейдовый» контент-анализ. Контент-аналитические исследования можно разделить на два больших класса, которые, пользуясь вышеупомянутой «военной метафорой», можно назвать фронтальными и рейдовыми. Задачей фронтального контент-аналитического исследования является составление максимально более полного представления об информационном потоке - либо на моментальном срезе, либо на протяжении некоторого периода с целью оценки динамики. Это попытка получить ответ на вопрос «Что пишут?» Единицы такого анализа в принципе могут быть любыми, но чаще всего в таковом качестве выступают либо тематические единицы, либо ключевые слова, реже оценки и пропозиции и еще реже макроструктурные единицы. Такой анализ обычно носит сугубо прикладной характер и ведется в режиме мониторинга. Поскольку целью его является составление общего представления о содержании СМИ и через него - об общественном сознании, он должен в идеале стремиться к возможно более широкому охвату информационного потока. На практике, однако, полный охват чаще всего бывает невозможен, да зачастую и не нужен. Тем самым на повестку дня контент-аналитического исследования встает проблема составления репрезентативной выборки - традиционная проблема эмпирического социологического исследования, которая при неудачном решении может полностью дискредитировать его результаты. Решается она в случае контент-анализа традиционными социологическими методами.

Рейдовый анализ, в противоположность фронтальному, ориентирован на решение частных и порой довольно экзотических задач, вытекающих, как правило, из каких-то скорее исследовательских, нежели прикладных интересов, и применительно к нему проблема выборки решается в связи формулировкой этих исследовательских целей и определением единиц анализа. Обоснование выборки при этом производится с учетом стандартных социологических критериев, но может допускать и их нарушение; важно лишь, чтобы факт этого нарушения осознавался и необходимость нарушения специальным образом обосновывалась.

3. Обработка, презентация и интерпретация результатов.

Кодирование данных при контент-анализе обычно осуществляется с помощью достаточно простых анкет или компьютерных программ, в которых фиксируется каждое появление в анализируемом тексте искомой единицы. (Проблема подготовки кодировщиков, очень важная в практическом плане, в настоящей статье не затрагивается.) Эта элементарная схема может быть усложнена многими разными способами. Прежде всего, наборы единиц с сопоставленными им количественными оценками, как правило, сопоставляются с другими количественными оценками тех же единиц. Это могут быть, например, результаты подсчета частотности упоминания одних и тех же тем для различных выпусков одного и того же печатного издания или одной и той же регулярно выходящей в эфир новостной программы (временные ряды); результаты аналогичного подсчета для различных изданий/программ или обобщенных категорий изданий. Очевидно, что такие данные могут быть представлены с помощью разнообразных графических средств - диаграмм, графиков и т.д., обеспечивающих наглядность. Классификации зачастую бывают многомерными, и для представления это также могут использоваться различные формальные средства. На практике результаты контент-анализа чаще всего представляются рядами диаграмм, столбчатых или круговых, хотя понятно, что в распоряжении контент-аналитика имеется все разнообразие средств представления количественных данных. А также и качественных: для отображения отношений между единицами контент-анализа и результатов их категоризации используются такие стандартные средства отображения структур, как различные графы.

Квантификация данных создает необходимые предпосылки для применения к ним средств математического анализа. Помимо анализа частотного распределения, к ним относится анализ различного рода корреляций между переменными, ассоциаций, анализ сопряженности, кластерный анализ. Разумеется, весь этот инструментарий должен применяться корректно. Содержательная интерпретация результатов зависит от целей анализа; она является прежде всего творческим актом, результаты которого во многом предопределены квалификацией и интуицией исследователей.

В ходе контент-аналитического исследования как для анализа текста, так и для последующей обработки его результатов может использоваться вычислительная техника. После квантификации, т. е. перевода данных в числовую форму, их математическая и, в частности, статистическая обработка может осуществляться многими программными средствами, в том числе стандартными статистическими пакетами типа SPSS. При анализе текста и последующем сохранении результатов этого анализа в базах данных могут использоваться специальные программы, предназначенные для целей лингвистических исследований (программа Dialex, способная осуществлять составление частотных словарей и конкордансов, а также поиск лексических единиц с их контекстами и сохранять его результаты в базе данных. Подсистема контент-анализа входит составной частью в отечественную систему прикладного анализа текстов ВААЛ. Имеется также ряд зарубежных контент-аналитических компьютерных систем, а также систем, потенциально применимых для целей контент-анализа - в частности, система KEDS).

Процедура контент-анализа следующая:

1. Определение проблемы, цели, задачи, объекта и предмета исследования. Разрабатывается программа контент-аналитического исследования, формируется репрезентативная выборка, отбираются необходимые документы. При определении надежности документа необходимо четко определить, что это за документ, с какой целью он создавался, кто его автор.

2. Выделение в текстовой информации категории анализа - смысловой
единицы анализа, которая получается путем интерпретации понятий.

Категории анализа должны выражать теоретические понятия исследования, иметь смысловые единицы в тексте, обладать возможностями однозначной регистрации признаков. Категории анализа выражаются определенными признаками со своей интенсивностью, направленностью, значимостью проблемы или идей.

В качестве смысловых единиц анализа могут выступать:

· понятия, выраженные в словах и отдельных терминах;

· тема, выраженная в смысловых абзацах, частях текста, статьях;

· имена исторических личностей, политиков, организаторов производства, наименования учреждений и т.д.;

· общественные события, факты, случаи и т.д.

3. Выделение единиц анализа, которые являются результатом операционализации понятий.

Единицы анализа выделяются на основе содержания гипотез исследования. Единицы анализа могу не совпадать с единицами счета.

4. Единица счета - это количественная характеристика единицы анализа, фиксирующая регулярность, с которой встречается в тексте та или иная смысловая единица (число слов, строк, абзацев, знаков, колонок, длительность звучания, метраж пленки и т.д.).

5. Процедурный подсчет употребления единиц анализа и подсчет частоты встречаемости этих единиц в выборке.

Обязательный момент в такой процедуре – использование математико-статистических методов счета. Связь между категориями устанавливается методом совместной встречаемости слов различных категорий: для каждого текста выясняется, слова каких категорий в нем встречаются. После этого подсчитывается коэффициент корреляции, выражающий силу связи между категориями и знак этой связи.

Обоснованность (валидность) разработанной методики можно проверить:

· при помощи экспертов,

· получением аналогичных данных другими методами,

· повторным кодированием тех же документов по единой инструкции.

Сбор информации, регистрация единиц анализа осуществляется с помощью обязательного инструментария - заранее разработанных макетов таблиц, специальных карточек или при помощи специальных кодировальных матриц. Бланк кодировки составляется в соответствии со схемой операциональных понятий, содержит единицы анализа и все элементы описания проблемной ситуации.

Контент-анализ – метод качественно-количественного анализа содержания документов с целью выявления или измерения различных фактов и тенденций, отраженных в этих документах.
Контент-анализ – формализованный метод изучения текстовой и графической информации, заключающийся в переводе изучаемой информации в количественные показатели и ее статистической обработке. Характеризуется большой строгостью, систематичностью.
Контент-анализ не отменяет необходимости обычного (т.е. содержательного) анализа документов. Первый дополняет второй, их сочетание углубляет понимание смысла любого текста. Контент-анализ позволяет обнаружить в документе то, что ускользает от поверхностного взгляда при его традиционном изучении, но что имеет важныйсоциальный смысл.

Принципиальное отличие этих методов анализа заключено в явно выраженной строгости, формализованности, систематизированности контент-анализа. Он нацелен на выработку количественного описания смыслового и символического содержания документа, на фиксацию его объективных признаков и подсчет последних.

По мнению ряда социологов (Маркоффа, Шапиро, Вейтмана и др.), контент-анализ можно было бы назвать «текстуальным кодированием», так как он предполагает получение количественной информации о содержимом документа на основе ее кодирования.

Кроме того, контент-анализ отличается от всех прочих способов изучения документов, тем, что он позволяет «вписать» содержание документа в социальный контекст, осмыслить его одновременно и как проявление, и как оценку социальной жизни. «Вписывание» документа в изучаемую проблему предполагает выявление того, что: а) существовало до него и получило в нем отражение, б) наличествует только в нем, в) будет после него, т.е. явится итогом его восприятия адресатом.

Сущность метода

фиксация определенных единиц содержания,
изучает документы в их социальном контексте,
может использоваться как основной метод исследования (например, контент-анализ текста при исследовании политической направленности газеты), параллельный, т.е. в сочетании с другими методами (напр., в исследовании эффективности функционирования средств массовой информации), вспомогательный или контрольный (напр., при классификации ответов на открытые вопросы анкет).

Объект контент-анализа

документы, исследуемое содержание которых, позволяет задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также, интересующие исследователя элементы содержания встречаются с достаточной частотой (принцип статистической значимости).
чаще всего в качестве объектов исследования контент-анализа выступают сообщения печати, радио, телевидения, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет.

Основные направления применения контент-анализа

выявление того, что существовало до текста и что тем или иным образом получило в нем отражение (текст как индикатор определенных сторон изучаемого объекта – окружающей действительности, автора или адресата);
определение того, что существует только в тексте как таковом (различные характеристики формы – язык, структура, жанр сообщения, ритм и тон речи);
выявление того, что будет существовать после текста, т.е. после его восприятия адресатом (оценка различных эффектов воздействия).

Стадии разработки и применения контент-анализа

формулируются тема, задачи и гипотезы исследования
определяются категории анализа – наиболее общие, ключевые понятия, соответствующие исследовательским задачам.

Категории контент-анализа должны быть исчерпывающими (охватывать все части содержания, определяемые задачами данного исследования), взаимоисключающими (одни и те же части не должны принадлежать различным категориям), надежными (между кодировщиками не должно быть разногласий по поводу того, какие части содержания следует относить к той или иной категории) и уместными (соответствовать поставленной задаче и исследуемому содержанию). При выборе категорий для контент-анализа следует избегать крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Иногда необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми для контент-анализа.

уместными, т.е. соответствовать решению исследовательских задач;
исчерпывающими, т.е. достаточно полно отражать смысл основных понятий исследования;
взаимоисключающими (одно и то же содержание не должно входить в различные категории в одинаковом объеме);
надежными, т.е. такими, которые не вызывали бы разногласий между исследователями по поводу того, что следует относить к той или иной категории в процессе анализа документа.

Необходимо выбрать соответствующую единицу анализа – лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явления.

За единицу анализа может быть принято:

слово,
предложение,
тема,
идея,
автор,
персонаж,
социальная ситуация,
часть текста, объединенная чем-то, что соответствует смыслу категории анализа.

Сложные виды контент-анализа обычно оперируют не одной, а несколькими единицами анализа. Единицы анализа, взятые изолировано, могут быть не всегда правильно истолкованы, поэтому они рассматриваются на фоне более широких лингвистических или содержательных структур, указывающих на характер членения текста, в пределах которого идентифицируется присутствие или отсутствие единиц анализа – контекстуальных единиц. Например, для единицы анализа «слово» контекстуальная единица – «предложение».

Необходимо установить единицу счета – количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п.), появление признаков в тексте, частота их появления (интенсивность).

Единица счета – количественная мера единицы анализа, позволяющая регистрировать частоту (регулярность) появления признака категории анализа в тексте. Единицами счета могут быть число определенных слов или их сочетаний, количество строк, печатных знаков, страниц, абзацев, авторских листов, площадь текста, выраженная в физических пространственных величинах и многое другое.

Важен выбор необходимых источников, подвергаемых контент-анализу.

Проблема выборки содержит в себе выбор источника, количества сообщений, даты сообщения и исследуемого содержания. Все эти параметры выборки определяются задачами и масштабами исследования.

Чаще всего контент-анализ проводится на годичной выборке: если это изучение протоколов собраний, то достаточно 12 протоколов (по числу месяцев), если изучение сообщений средств массовой информации – 12-16 номеров газеты или теле-, радиодней. Обычно выборка сообщений средств массовой информации составляет 200-600 текстов.

Основные процедуры контент-анализа

Выявление смысловых единиц контент-анализа, которыми могут быть:

понятия, выраженные в отдельных терминах;
темы, выраженные в целых смысловых абзацах, частях текстов, статьях, радиопередачах и т.п.;
имена, фамилии людей;
события, факты и т.п.;
смысл апелляций к потенциальному адресату.

Единицы контент-анализа выделяются в зависимости от содержания, целей, задач и гипотез конкретного исследования.

Выделение единиц счета, которые могут совпадать либо не совпадать с единицами анализа. В 1-м случае процедура сводится к подсчету частоты упоминания выделенной смысловой единицы, во 2-м – исследователь на основе анализируемого материала и здравого смысла сам выдвигает единицы счета, которыми могут быть:

физическая протяженность текстов;
площадь текста, заполненная смысловыми единицами;
число строк (абзацев, знаков, колонок текста);
длительность трансляции по радио или ТВ;
метраж пленки при аудио- и видеозаписях,
количество рисунков с определенным содержанием, сюжетом и пр.

Процедура подсчета в общем виде сходна со стандартными приемами классификации по выделенным группировкам. Применяется составление специальных таблиц, применение компьютерных программ, специальных формул (напр., «формула оценки удельного веса смысловых категорий в общем объеме текста»), статистические расчеты понятности и аттрактивности текста.

Проведение контент-анализа требует предварительной разработки ряда исследовательских инструментов. Из них обязательными являются:

классификатор контент-анализа,
протокол итогов анализа, который имеет второе обозначение – бланк контент-анализа,
регистрационная карточка или кодировальная матрица,
инструкция исследователю, непосредственно занимающемуся регистрацией и кодировкой единиц счета,
каталог (список) проанализированных документов.

Классификатором контент-анализа называется общая таблица, в которую сведены все категории (и подкатегории) анализа и единицы анализа. Ее основное предназначение – предельно четко зафиксировать то, в каких единицах выражается каждая категория, используемая в исследовании. Классификатор можно уподобить социологической анкете, где категории анализа играют роль вопросов, а единицы анализа – ответов. Он является основным методическим документом контент-анализа, предопределяющим содержание всех прочих инструментов этого метода.

Протокол (бланк) контент-анализа содержит: во-первых, сведения о документе (его авторе, времени издания, объеме и т.п.); во-вторых, итоги его анализа (количество случаев употребления в нем определенных единиц анализа и следующие отсюда выводы относительно категорий анализа). Протоколы заполняются, как правило, в закодированном виде, но не ради сохранения тайны итогов контент-анализа, а исходя из желательности на одном листе бумаги уместить всю информацию о документе, чтобы удобнее было сопоставлять друг с другом итоги анализа разных документов. Если в исследовании осуществляется контент-анализ малого числа документов, то можно обойтись без кодирования и заполнять эти протоколы в открыто-содержательном виде.

1. ТИПЫ ИНФОРМАЦИОННЫХ МАССИВОВ И ЕДИНИЦЫ КОНТЕНТ-АНАЛИЗА

Основа контент-анализа – это подсчет встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными иными количественными или качественными характеристиками. Отсюда понятно, что главная предпосылка контент-анализа – это выяснение того, что считать; иными словами, определение единиц анализа. Единицы эти в зависимости от целей анализа, типа информационного массива, а также ряда дополнительных причин могут быть (и реально бывают) весьма разнообразными. К ним предъявляются два естественных, но, к сожалению, обычно плохо совместимых требования. С одной стороны, они должны легко и по возможности однозначно идентифицироваться в тексте; в идеале хотелось бы, чтобы их выявление вообще могло быть алгоритмизовано. Понятно, что такому требованию лучше всего удовлетворяют формальные элементы текста или же элементы, имеющие четко выраженные и однозначные формальные соответствия, например слова. С другой стороны, от единиц контент-анализа чаще всего требуется некая субъективная, да к тому же еще и зависящая от контекста значимость, делающая их распределение и динамику такого распределения диагностичными для выявления изменений в индивидуальном и общественном сознании, системах убеждений и т.д. – иными словами, единицы должны быть интересными для последующей (политологической, культурологической, социологической и т.д.) интерпретации. Между тем такие единицы (например, темы) носят собственно содержательный характер, и упоминание их в тексте может осуществляться многими разнообразными способами. Их идентификация в общем случае предполагает семантический анализ текста, проблема автоматизации которого, несмотря на многолетние усилия лингвистов и программистов, далека от решения. Характеристику единиц контент-анализа необходимо предварить кратким соображением о природе анализируемого информационного массива. В самом определении метода контент-анализа нет ничего, что препятствовало бы применению его к отдельно взятому тексту; более того, примеры такого анализа известны. Тем не менее существует ряд причин, по которым объектом контент-аналитических проектов обычно является не отдельный текст, пусть даже значительный по объему, а именно информационный массив, или информационный поток, состоящий из большого количества текстов. Во-первых, статистические закономерности проявляются тем более отчетливо, чем больше объем выборки. Во-вторых, большинство целей контент-анализа предопределяют его тяготение к компаративности; аналитиков чаще всего интересуют не одномоментные срезы, а динамика изменений, а если и срезы, то, как правило, «пестрые», отражающие, например, различные СМИ или сознание различных социальных групп. Наконец, при всем разбираемом ниже разнообразии единиц контент-анализа наиболее популярными являются различные макроединицы: темы и/или проблемы, пропозиции, образы и идеологемы. Таковых в отдельно взятых текстах и особенно в небольших по объему текстах СМИ обычно немного, да и новые макроединицы появляются не столь часто, поэтому оценить их динамику можно лишь на большом временном промежутке или при широком «горизонтальном сопоставлении». Таким образом, идея контент-анализа предполагает анализ больших информационных массивов; с другой стороны, его относительная дешевизна и технологичность делают такой анализ принципиально возможным. Поэтому не приходится удивляться тому, что в истории контент-анализа имеются такие проекты, как анализ 427 школьных учебников, 481 частной беседы, 4022 рекламных слоганов, 8039 (в 1938) и 19 533 (в 1952) редакционных статей или 15 000 персонажей в 1000 часов телевизионного эфирного времени. Конкретное разнообразие единиц контент-анализа практически безгранично, однако среди них можно выделить несколько основных типов. (Классификация, приводимая ниже, построена с учетом типологии К.Криппендорфа, однако отличается от нее весьма существенно.)

1.1. «Физические» единицы. Под таковыми понимаются сущности с четко очерченными физическими, геометрическими или временными границами, как, скажем, экземпляры книги, номера газет, экземпляры плакатов или листовок, фотографии и т.п. Идентификация и подсчет их не составляют особого труда, однако необходимость в таком подсчете возникает достаточно редко; подсчет, скажем, листовок или книг чаще всего осуществляется с целью оценки представленности какой-то тематики или оценки, т.е. реально используются единицы других, характеризуемых ниже типов единиц – обычно концептуальных, пропозициональных или тематических.

1.2. Структурно-семиотические единицы. Под таковыми имеются в виду основные элементы семиотических систем (см. СЕМИОТИКА). В случае естественного языка это:

– лексика языка (слова и их эквиваленты, например выражение железная дорога или термин контент-анализ, т.е. то, что фиксируется в словарях) и

– грамматические показатели (например, отрицательные частицы или показатели таких категорий, как, скажем, отглагольные имена).

Количественный подсчет встречаемости слов в тексте – это, пожалуй, самый простой вариант контент-анализа, который, однако, зачастую способен давать небезынтересные результаты. Чаще всего, конечно, подсчитываются «интересные», или «ключевые» слова и/или словосочетания, например названия ценностных категорий типа свобода, стабильность, доверие, территориальная целостность; сценариев типа предательство или разочарование; достаточно однозначные обозначения тех или иных общественно значимых явлений, например коррупция, преступность или терроризм; значимые атрибуты наподобие жесткий, решительный; эмоционально окрашенная оценочная лексика типа разрушительный, неудержимый, подлый, кошмарный, человеконенавистнический; слова-пароли (тоже зачастую эмоционально окрашенные) типа патриоты, коммунофашисты, мондиалисты или белопридурки; слова, сильно активизированные в конкретный момент времени, вроде «Семья» или «Мабетекс» в начале осени 1999 или все та же «Семья» и «Медиа-Мост» в конце весны 2000 в России, терроризм во множестве стран мира осенью 2001 и т.д.

Контент-анализ грамматических категорий представляет собой достаточно редкое исследовательское начинание, стимулом к которому является гипотеза (весьма правдоподобная) о том, что употребление грамматических форм в меньшей степени, чем употребление лексики, контролируется автором текста и поэтому может послужить источником таких сведений о нем, которые он сам вовсе не собирался делать доступными своим читателям. В политической психологии существует специальная исследовательская методика, так называемый анализ когнитивной сложности, которая на основе фактически контент-аналитической процедуры позволяет делать выводы о том, насколько простым (или, напротив, сложным) является видение политической ситуации автором текста и как оно меняется со временем. Единицами контент-анализа, лежащего в основе оценки когнитивной сложности, являются, например, относимые обычно к служебной лексике категорические квантификаторы типа всегда, никогда, всякий, которым противостоят квантификаторы типа иногда, некоторый и т.п.; категорические (вроде знаменитого однозначно) оценки истинности в противоположность осторожным возможно или не исключено, что; языковые средства дифференцированного рассмотрения ситуации наподобие с одной стороны... с другой стороны; упоминания взаимодействия, баланса, взаимозависимости, компромисса и т.д. Известны и примеры контент-анализа чисто грамматических средств, например исследования соотношения глагольных форм, обозначающих, соответственно, процессы и результаты, исследование номинализованных (с отглагольными именами типа построение, усиление и т.п.) конструкций в языке партийных документов брежневского времени, отрицания в политическом тексте и др. Поскольку объектами контент-анализа могут быть не только вербальные (естественноязыковые), но и другие виды текстов (например, карикатуры, фотоснимки, рекламные клипы), постольку в числе структурно-семиотических единиц контент-анализа могут присутствовать визуальные и звуковые (чаще всего музыкальные) образы и символы, которые могут анализироваться на тех же основаниях, что и единицы естественного языка.

1.3. Понятийно-тематические единицы. В большинстве случаев контент-аналитик интересуется не словами как таковыми и тем более не грамматическими категориями, а стоящими за словами значимыми для него понятиями, темами, проблемами – иными словами, тем, что можно назвать понятийно-тематическими единицами. Исследователь, интересующийся тем, какое место в общественном сознании занимает, скажем, проблема преступности, обязан принимать во внимание не только присутствие в анализируемом информационном массиве слова преступность, но и упоминания заказных и всяких прочих убийств, бандитского беспредела, «крыши», «братков», авторитетов, власти криминала и проч. Тот, кого занимает проблема свободы, должен в своем анализе реагировать на упоминания давления на прессу, чиновничьего произвола, контролируемости СМИ, доступа к Internet и т.д. Интересующийся отношением общественного сознания к каким-то реалиям должен принимать во внимание самый широкий спектр позитивных, негативных и некоторых более конкретных оценок, которые могут быть даны этим реалиям, причем эти оценки вовсе не обязательно должны присутствовать в виде оценочных суждений.

1.4. Референциальные и квазиреференциальные единицы. К референциальным, точнее, конкретно-референциальным единицам относятся обозначения реальных личностей (как современных, так и исторических деятелей), событий, городов, стран, организаций и т.д.; это, так сказать, «энциклопедический» блок единиц анализа. Этот блок, особенно в части персоналий, весьма важен и диагностичен, поскольку позволяет определять личностные рейтинги и, что не менее существенно, оценивать идеологические системы с точки зрения присутствующих в них референтных «знаковых» фигур, своего рода «идеологических героев». Примером интересного исследования роли референтных фигур в российском оппозиционном дискурсе 1996–1997 может послужить работа А.В.Дуки. Способы обозначения в тексте конкретных фигур могут различаться (В.В.Жириновский, Владимир Вольфович, Вольфыч, Жирик, сын юриста, лидер ЛДПР, самый провосточный российский политик, главный либеральный демократ, либералиссимус), однако конкретно-референтная единица здесь во всех случаях одна. Квазиреференциальные единицы в политических текстах чаще всего бывают представлены обозначениями всякого рода «сил» – коллективных актеров политической сцены, референция которых может колебаться от реальной (типа КПРФ) через обобщенную (коммунисты, либералы, Запад, исламисты) к откровенно мифологизированной (мировая закулиса). Независимо от своей референции все эти персонажи присутствуют в идеологическом пространстве, им могут приписываться действия и оценки, и отношение к ним является немаловажным политико-идеологическим фактором. Грань между квазиреференциальными и некоторыми типами понятийно-тематических единиц размыта в силу того, что некоторые политические понятия способны и даже склонны (например, та же преступность) к метафорической персонификации. 1.5. Пропозициональные единицы и оценки. Их примеры приводились выше – Карфаген должен быть разрушен или Россия задыхается без инвестиций. Собственно говоря, это примеры высказываний, в основе которых лежат пропозиции – описания конкретных положений дел (ситуаций) безотносительно к их модальности (в первом примере – требование, во втором – констатация). Наряду с пропозициями для контент-анализа могут представлять (и очень часто представляют) большой интерес оценки (Это очень опасное решение). С логической точки зрения они обладают важными отличиями от пропозиций, однако для целей контент-анализа как собственно пропозиция, так и оценка могут рассматриваться как результат связывания некоторого объекта с некоторым атрибутом. Изучение динамики оценочных суждений, высказываемых в адрес тех или иных лиц, событий, институтов, – весьма распространенный тип контент-аналитического исследования.

1.6. Макроструктурные единицы. Под макроструктурными единицами понимаются достаточно сложные понятийные конструкции, образующие «верхние этажи» человеческих представлений о мире и, в частности, идеологических систем. Эти конструкции, как правило, носят характер сценариев и описывают стереотипные модели развития, с которыми сопряжены ожидания будущего, соображения о прошлом, эмоциональные ассоциации и т.д. Часто эти конструкции имеют литературные или фольклорные прототипы, что отражается в их названиях. Все они в очень сильной степени претендуют на объяснение действительности. Для обозначения таких конструкций чаще всего используется термин «идеологема»; в различных дисциплинах говорят также о мифологемах, кочующих образах и т.д. Среди подобного рода конструкций, присутствующих в общественном сознании современной России (и распределенных, порою причудливо, по разным идеологическим системам), имеются, например, следующие: Заговор, Оргия коррупции / Криминальная революция / Беспередел, Ограбление / Конверсия власти в собственность, Страна дураков / Город Глупов, «Нет, ребята, все не так», «Возвращение в цивилизацию» и др. Некоторые еще недавно значимые идеологемы (скажем, Борьба за власть, Естественный распад или Тотальная некомпетентность) в последние полтора-два года по различным причинам вышли из фокуса внимания средств массовой информации, а отчасти и населения.

1.7. Единицы, представляющие результаты концептуальных операций. Их довольно много, однако наибольший интерес для контент-анализа представляют метафоры, примеры и аналогии, которые в общем плане уже были охарактеризованы выше. Некоторые из метафор активно используются в политических текстах, и их использование считается диагностичным для характеристики как индивидуального сознания автора текста, так и состояния общественного сознания. Например, в политических текстах часто встречается упоминавшаяся «военная метафора» в варианте ПОЛИТИЧЕСКОЕ ПРОТИВОСТОЯНИЕ – ЭТО ВОЙНА, проявляющаяся в таких выражениях, как война с бедностью, удар по губернатору, атака со стороны оппозиции, разгромная публикация и т.д. При использовании такой метафоры политическое противостояние, независимо от того, в какой форме оно реально ведется, переживается как война, что может, кстати, иметь последствия и для реальных форм политического взаимодействия. Между тем «военная метафора» – это не единственный способ описания политического процесса (и, шире, жизни вообще); они могут описываться с помощью, например, «транспортной метафоры» и/или связанной с ней «метафоры пути» (Мы все вместе вступили на трудную дорогу), «архитектурной метафоры» (государственное строительство, выстраивание властной вертикали) и ряда других. Метафорика политических текстов достаточно подробно изучалась Дж.Лакоффом и его последователями, в том числе и в рамках контент-аналитической методологии (работы А.Н.Баранова); было показано, что, например, возрастание частотности военной метафоры является одним из коррелятов усиления напряженности в обществе.

Не менее диагностичным может быть исследование динамики примеров и аналогий – так, в российских политических текстах до недавнего времени настойчиво повторялась аналогия (принадлежащая В.Янову), в рамках которой Россия сравнивалась с Веймарской республикой.

1.8. «Поэтические» единицы. Под таковыми имеются в виду допускающие количественное измерение средства художественной выразительности – например, каламбуров, аллитераций и т.п.

2. ЧАСТОТНЫЕ И СИСТЕМНЫЕ ХАРАКТЕРИСТИКИ В КОНТЕНТ-АНАЛИЗЕ

2.1 Единицы, категории и признаки. При том, что контент-анализ является в своей основе количественным методом, в нем, как уже говорилось, почти всегда присутствует и значительная качественная составляющая. В принципе это верно уже постольку, поскольку единицы контент-анализа, как видно из предыдущего раздела, чаще всего все же являются содержательными и их выделение основывается на семантических (смысловых) критериях; многие из единиц представляют собой обобщенные категории (это относится прежде всего к темам и идеологемам). Иными словами, контент-аналитик занимается количественным анализом качественных категорий. Но этим дело не исчерпывается. Во многих контент-аналитических проектах осуществляется не только оценка степени представленности в тексте тех или иных единиц, но и одновременная оценка этих единиц по тем или иным градуированным качественным шкалам. В частности, это могут быть предложенные Ч.Осгудом шкалы абстрактности (фактически – трудности для восприятия) того или иного содержания; расстояния до индивидуума (какие-то содержательные компоненты могут непосредственно касаться читателя или читателей, а какие-то могут представлять лишь досужий интерес). В сочетании с результатами собственно контент-анализа оценка использованных единиц анализа (тематических) по указанным шкалам дает трехмерную схему типа, например, той, что была предложена французским культурологом А.Молем. Очевидно, что при анализе могут быть использованы и другие шкалы, кроме того, единицы контент-анализа могут объединяться в различные более широкие категории.

2.2 «Фронтальный» и «рейдовый» контент-анализ. Контент-аналитические исследования можно разделить на два больших класса, которые, пользуясь вышеупомянутой «военной метафорой», можно назвать фронтальными и рейдовыми. Задачей фронтального контент-аналитического исследования является составление максимально более полного представления об информационном потоке – либо на моментальном срезе, либо на протяжении некоторого периода с целью оценки динамики. Это, так сказать, попытка получить объективизированный ответ на вопрос «Что пишут?» Единицы такого анализа в принципе могут быть любыми, но чаще всего в таковом качестве выступают либо тематические единицы, либо ключевые слова, реже оценки и пропозиции и еще реже макроструктурные единицы. Такой анализ обычно носит сугубо прикладной характер и ведется в режиме мониторинга. Поскольку целью его является составление общего представления о содержании СМИ и через него – об общественном сознании, он должен в идеале стремиться к возможно более широкому охвату информационного потока. На практике, однако, полный охват чаще всего бывает невозможен, да зачастую и не нужен. Тем самым на повестку дня контент-аналитического исследования встает проблема составления репрезентативной выборки – традиционная проблема эмпирического социологического исследования, которая при неудачном решении может полностью дискредитировать его результаты. Решается она в случае контент-анализа традиционными социологическими методами.

2.3 Обработка, презентация и интерпретация результатов. Кодирование данных при контент-анализе обычно осуществляется с помощью достаточно простых анкет или компьютерных программ, в которых фиксируется каждое появление в анализируемом тексте искомой единицы. (Проблема подготовки кодировщиков, очень важная в практическом плане, в настоящей статье не затрагивается.) Эта элементарная схема может быть усложнена многими разными способами. Прежде всего, наборы единиц с сопоставленными им количественными оценками, как правило, сопоставляются с другими количественными оценками тех же единиц. Это могут быть, например, результаты подсчета частотности упоминания одних и тех же тем для различных выпусков одного и того же печатного издания или одной и той же регулярно выходящей в эфир новостной программы (временные ряды); результаты аналогичного подсчета для различных изданий/программ или, скажем, обобщенных категорий изданий. Очевидно, что такие данные могут быть представлены с помощью разнообразных графических средств – диаграмм, графиков и т.д., обеспечивающих наглядность. Наглядность, следует заметить, важна не только для аналитика: наглядная диаграмма или впечатляющий график обладают большим потенциалом воздействия, особенно в обществе, привыкшем с почтением относиться к естественнонаучному инструментарию. Классификации зачастую бывают многомерными, и для представления это также могут использоваться различные формальные средства. На практике результаты контент-анализа чаще всего представляются рядами диаграмм, столбчатых или круговых, хотя понятно, что в распоряжении контент-аналитика имеется все разнообразие средств представления количественных данных. А также и качественных: для отображения отношений между единицами контент-анализа и результатов их категоризации используются такие стандартные средства отображения структур, как различные графы. Квантификация данных, естественно, создает необходимые предпосылки для применения к ним средств математического анализа. Помимо анализа частотного распределения, к ним относится анализ различного рода корреляций между переменными, ассоциаций, анализ сопряженности, кластерный анализ. Разумеется, весь этот инструментарий должен применяться корректно. Если при определении единиц контент-анализа и идентификации их в тексте добиться полной объективности возможно лишь в некоторых (как правило, не самых интересных) случаях, то при экспликации и обработке данных обеспечить следование строгим стандартам вполне возможно. Содержательная интерпретация результатов зависит от целей анализа; она является прежде всего творческим актом, результаты которого во многом предопределены политологической квалификацией и интуицией аналитиков. В ходе контент-аналитического исследования как для анализа текста, так и для последующей обработки его результатов может использоваться вычислительная техника. Второй тип использования не вызывает особых проблем: после квантификации, т.е. перевода данных в числовую форму, их математическая и, в частности, статистическая обработка может осуществляться многими разными программными средствами, в том числе стандартными статистическими пакетами типа SPSS. При анализе текста и последующем сохранении результатов этого анализа в базах данных могут использоваться специальные программы, предназначенные для целей лингвистических исследований. В частности, анализ метафорики в русских политических текстах велся с помощью разработанной в Институте русского языка РАН программы Dialex, способной осуществлять составление частотных словарей и конкордансов, а также поиск лексических единиц с их контекстами и сохранять его результаты в базе данных; в настоящее время завершается работа над более совершенной системой, предназначенной для решения тех же задач. Некоторая подсистема контент-анализа входит составной частью в отечественную систему прикладного анализа текстов ВААЛ. Имеется также ряд зарубежных контент-аналитических компьютерных систем, а также систем, потенциально применимых для целей контент-анализа – такова, в частности, система KEDS, разработанная Ф.Шродтом в Канзасском университете и используемая для анализа потока политических событий, отображаемых на ленте информационного агентства «Рейтер».

В социологическом исследовании. – Во второй главе дается характеристика контент-анализу, возможности его использования и технике проведения. – В третьей главе изучаются основные преимущества и недостатки контент-анализа по сравнению с опросом. При написании курсовой работы были изучены учебные материалы, монографии, публикации на страницах периодической печати. 1. Природа метода опроса в...

... – это перевод в количественные, показатели массовой текстовой (или записанной на пленку) информации с последующей статистической ее обработкой. Его основные операции были разработаны американскими социологами X. Лассуэллом и Б. Берельсоном. Важный вклад в развитие процедур контент-анализа внесли российские и эстонские социологи, особенно А.Н. Алексеев, Ю. Вооглайд, П. Вихалемм, Б.Л. Грушин, Т.М. ...

В сферу педагогических исследований; 5. Контент-анализ не является универсальным средством получения информации и обладает как определенными достоинствами, так и ограничениями; 6. Контент-анализ вещания радиокорпорации «Авторадио» регистрирует ряд тенденций: а) наличие установок по шкале «Любовь-агрессия»; б) наличие установок по шкале «Толерантность – нонтолерантность» в сексуальной сфере, ...

BC/NW 2013, №2 (23):10

BC / NW 2013, №2 (23):10.4

ТЕХНОЛОГИИ СОЗДАНИЯ И ОБРАБОТКИ ЦИФРОВОГО МЕДИА КОНТЕНТА. СОВРЕМЕННЫЕ СТАНДАРТЫ 3D-ВИДЕОКОНТЕНТА

Кушелев И.Ю.

(ФГБОУ ВПО "Национальный исследовательский университет "МЭИ")

1. Введение.

Основные понятия. Типология медиа контента. Тенденции.

Наблюдения за развитием информационных технологий за последние двадцать лет дает основания констатировать тот факт, что сфера информационной медиа среды переживает период существенных изменений, в результате которых классическая древовидная система распространения информации радикально меняет свою топологию, превращаясь в многомерное сообщество, в котором каждый может общаться с каждым или с выборочной группой или со всем сообществом одновременно . Возникают совершенно новые формы общения: форумы, блоги, социальные сети и т.д. . Конечно, эти процессы необходимо изучать и всячески анализировать, чтобы выявить закономерности и прогнозировать дальнейшее развитие процесса. Применим классический способ изучения сложного процесса - разобъем сложное на элементарные составляющие и выявим закономерности их участия в общем процессе.

1.1. Контент .

С понятием «контент» мы сталкиваемся ежедневно. Однако не каждый может дать правильное определение этому понятию. Что же такое «контент».

Контентом называется все информационное наполнение какого-либо ресурса электронного (сайт, электронный журнал, форум и т.п.) или классического - печатного (книга, газета, научный труд и т.д.). В переводе с английского языка «content» означает «содержание». К контенту можно отнести любое информационное наполнение: тексты, таблицы, изображения, видеоряд и т.д. Например эта статья также является контентом.

1.2. Медиа контент.

Всемирная информационная сеть (world wide web) развивается очень быстро. Развитие новых технологий приводит к тому, что очень быстро начинают меняться и способы представления информации. Если в начале развития информационных сетей основным передаваемым контентом был текст, то в настоящее время более эффективным и наглядным способом ее подачи является использование медиа контента, определим это понятие.

Термин медиа (от английского media), в зависимости от контекста, может означать следующее: Медиа данные - совокупность различных видов данных, содержащих дополнительную звуковую и визуальную информацию - графику, видео, анимацию (т. н. мультимедиа). Разделение мультимедиа контента на компоненты позволяет структурировать его в общем виде, исходя из восприятия пользователя ,. Однако при разработке мультимедиа продуктов требуется детальное описание контента в специальной терминологии, однозначно определяющей структурные единицы с учетом их технологических особенностей и функциональных возможностей.

Минимальной структурной единицей (термом) мультимедиа контента является медиаэлемент. Медиа элементы это элементарные составляющие, комбинирование которых и рождает мультимедиа контент.

Типологически можно выделить две категории медиаэлементов: статические и динамические. Первая категория - текст (символьная информация), графическое неподвижное изображение. К группе динамических (меняющихся во времени) медиаэлементов относятся: звуковой ряд, видеоряд.

Цифровые кодировки медиаэлементов имеют множество форматов, так что каждый медиаэлемент может быть представлен в нескольких форматах (так например статическое цифровое изображение может быть сохранено в стандартизированных типах графических файлов: bmp - bit map picture, jpeg - joint photographic experts group). Медиаэлемент любого формата располагается в одном компьютерном файле.

Структурная единица мультимедиа контента следующего, более высокого уровня – медиа комбинация объединяет в одном файле несколько динамических медиаэлементов. Медиа комбинация – это синхронизированная совокупность одинаковых или разных динамических медиаэлементов, размещаемых в одном компьютерном файле. Типичные примеры медиа комбинаций – стереозвук (например: wav - wave form audio format, mp3 - более точно, от англ. MPEG-1/2/2.5 Layer 3; но не MPEG-3), озвученные видео или анимация (например: avi - Audio Video Interleave чередование аудио и видео, mov - Apple QuickTime Movie).

Не следует путать медиа комбинации с динамическими медиаэлементами, в которые включена имитация статических. Например, фрагментом видео может быть статическое изображение или текст, получаемые путем повтора идентичных видеокадров, что не мешает отнесению всего видеофайла к динамическим медиаэлементам. Управление воспроизведением линейной динамической последовательности путем перемещения по оси времени не является взаимодействием с контентом, иными словами – контент медиа комбинаций не является интерактивным.

Объединение медиаэлементов и/или медиа комбинаций для одновременного воспроизведения определяется как мультимедиа композиция. С технологический точки зрения основное отличие композиции от элемента и комбинации заключается в использовании группы файлов, каждый из которых содержит некоторый медиаэлемент или медиа комбинацию. К мультимедиа композициям относится также 3D анимация, составляющие которой располагаются в нескольких файлах.

Если существует согласованный алгоритм представления медиаэлементов и медиа кобинаций – то такое представление уже является программным компонентом, реализующим размещение элементов медиа контента на экране, распределение во времени демонстрации аудиовизуальных элементов или при наступлении определенного события, их синхронизацию и т.д. Для интерактивной медиа композиции программный алгоритм определяет также ответные реакции на действия пользователя (оператора интерактивного медиа контента) . Однако, допускаются и неинтерактивные мультимедиа композиции, например, слайд-шоу или 3D анимация происходящие полностью в автоматическом режиме.

Интегрирующей, содержательно и функционально завершенной единицей мультимедиа контента является сцена. Мультимедиа сцена – полноэкранный интегральный терм (образ), объединяющий единым замыслом и логическими связями медиа элементы, медиа комбинации и мультимедиа композиции для представления определенной совокупности объектов и процессов в интерактивном алгоритме .

Мультимедиа сцена полностью занимает отведенное данному программному приложению поле контента, для построения сцены используется множество файлов, обязательным условием является интерактивность всех или части представляемых в сцене объектов и/или процессов.

Динамично обновляемый медиа контент вызывает большой интерес для интернет-аудитории. Именно поэтому он широко используется для привлечения к интернет - ресурсам новых пользователей и удерживания уже имеющихся. Интерес пользователей к медиа контенту возрос еще и благодаря существенному увеличению скорости доступа к ресурсам интернета, стандартизации конечных пользовательских устройств и соответствующих программных сред разработчиков приложений и контента. В парке настольных персональных компьютерных систем – семейство OS Windows, Mac OS и Linux; на мобильных платформах – iOS, android и windows phone. Выдержки из статистики компании Apple на конец сентября 2013 года подтверждают высокий рост в процессе создания и дальнейшего потребления медиа контента: если на начало 2012 года в магазине AppStore было выложено 750 000 мобильных приложений то на сентябрь 2013 года их количество выросло до 950 000, что интересно 50 000 новых приложений появились лишь за два последних месяца . Общее количество загрузок приложений из AppStore превысило 40 миллиардов на январь 2013 года, из них 20 миллиардов скачиваний приходится на 2012 год.

В настоящее время, каждую минуту на ресурсе YouTube загружается 35 часов видеоконтента или более 50 000 часов в месяц. В месяц на Youtube загружается пользовательского видео больше, чем произведено всеми телевизионными каналами и студиями США с момента начала их работы. Для сравнения: в начале 2008 года в YouTube загружалось 10 часов в минуту. Объем рынка цифрового контента в мире в 2008 г. превышал 700 млрд. долл. США, в России - 2,5 млрд. долл. В 2011 г. объем мирового рынка оценивается более, чем в 1 трлн. долл. США, в России – 5 млрд. долл. США . Растет объем контента, передаваемого через сети мобильной связи: объем передаваемого трафика в российских сотовых сетях с введением формата 3G удвоился.

Таким образом, понимание закономерностей создания и распространения медиа контента является одной из основ для понимания того, как развиваются и будут развиваться массовые коммуникаци.

В следующем разделе мы более подробно рассматрим типология контента и его создателей, а также возможности распространения медиа контента.

(Продолжение следует )

Список литературы :

1. Capitalising on Convergence: Delivering Value and Driving Growth in the Digitally Converged World, Intellect, 2005.

2. The Network Society: A Shift in Cognitive Ecologies? by Mathew Wall-Smith, 2010.

3. The Death of “e” and the Birth of the Real New Economy, Peter Fingar and Ronald Aronica, 2000.

4. Digital Radio Broadcast Bureau, DAB Digital Sales Top 3 Million, 2 May 2006.

5. Computing: BBC’s IT outsourcing may be start of trend, Daniel Thomas, 2 March 2005.

6. Facing Piracy: Digital Theft in the Filmed Entertainment Industry, Deloitte MCS UK Ltd., 2004.

7. APP Empire, Chad Mureta, John Wiley & Sons, Inc., 2013.

8. iPhone and iPad APPS marketing, Jeffrey Hughes, QUE, 2012.