Ссылка для цитирования: Полуэхтова И.А. Исследования аудитории и медиапотребления в цифровой среде: методологические и практические проблемы // Медиаскоп. 2016. Вып. 4. Режим доступа: http://www.mediascope.ru/2199
© Полуэхтова Ирина Анатольевна
доктор социологических наук, профессор кафедры теории и экономики СМИ факультета журналистики МГУ имениМ.В.Ломоносова, руководитель отдела социологических исследований в Аналитическом центре «Видео Интернешнл» (г. Москва, Россия), IPoluehtova@vi.ru
Аннотация
В статье рассматриваются некоторые методологические и практические вопросы исследований аудитории в условиях развития новых, цифровых, инструментов фиксации медиапотребления, дополнивших традиционные социологические опросы. Рассматриваются негативные последствия роста числа источников аудиторных данных и сложившейся практики их использования, ведущие к «замусориванию» публичного пространства противоречивыми цифрами, искажающими реальную картину медиапотребления. Автор обращает внимание на методологические различия технической аудиторной статистики («больших данных») и социологических данных (результатов репрезентативных выборочных опросов), рассматривает гибридные и single-source методики как оптимальные решения для исследований кроссплатформенного медиапотребления, прежде всего индустриальных измерений аудитории.
Ключевые слова: аудитория, измерения аудитории, «большие данные», медиапотребление, медиаизмерения, онлайн-исследования, интернет-статистика, цифровая среда, фрагментация.
Цифровые технологии трансформировали практики медиапотребления, размыв привычные представления о медиа как каналах, и сделали медиаконтент доступным на различных технологических платформах, пользовательских устройствах (экранах) и потребительских сервисах. Аудитория получила значительно более широкие возможности выбора не только контента, но и способов его потребления. Практики медиапотребления стали более индивидуализированными и вариативными, а аудитория − еще более фрагментированной. Новый виток фрагментации связан с «рассыпанием» массовой аудитории в двух «измерениях». Во-первых, в «пространстве» (place shifting): распределение аудитории по множеству каналов доставки, платформ и экранов, на которых доступен один и тот же контент. Во-вторых, во времени (time shifting): доступность контента «по запросу», возможность «отложенного» во времени просмотра телепередач, прослушивания подкастов и пр. В ответ на вызовы цифровизации модернизируется методический аппарат исследований аудитории и медиапотребления. Сами цифровые технологии предоставили новые инструменты сбора, обработки и хранения эмпирических данных о поведении аудитории (цифровая «статистика»), которые рассматриваются как альтернатива традиционным социологическим методам. Эти изменения порождают проблемы не только методологического, но и практического характера, связанные с «производством» и использованием аудиторных данных разными субъектами рынка, перестройкой систем индустриальных измерений аудитории и т.п.
«Цифровое изобилие»: количество и качество данных
Как ни странно это может показаться на первый взгляд, одна из основных проблем практического состояния современных медиаисследований – огромное количество данных о медиапотреблении, циркулирующих на рынке. В эпоху аналоговых медиа едва ли не единственным источником количественных показателей медиапотребления были специальные социологические исследования. Их можно условно разделить на два типа. Во-первых, так называемые измерения аудитории (или рейтинговые исследования), которые позволяют установить, сколько человек смотрели ту или иную телепередачу, слушали ту или иную радиостанцию в определенное время, читали тот или иной журнал и т.п. Во-вторых, исследования бюджета времени, позволяющие замерить затраты времени на медиапотребление в рамках суточного бюджета времени, а также оценить распределение этих временных затрат между отдельными медиа (телевидение, радио, пресса). Долгое время социологам удавалось развивать и использовать свои методы исследований медиапотребления, оставаясь монополистами в этой сфере.
Появление цифровых технологий с каналом «обратной связи» от аудитории (Return Path Data, или RPD) принципиальным образом изменило ситуацию. Серверы интернет-компаний и телекоммуникационных провайдеров (мобильной связи, цифрового ТВ) накапливают огромный объем информации о характеристиках и поведении аудитории; эти данные являются побочным продуктом их основной деятельности, не требующим специальных усилий. При этом цифровые компании собирают гораздо более полную, точную и детализированную информацию о своей аудитории, чем социологические исследования, базирующиеся на выборочных опросах (в том числе индустриальные измерения аудитории). Не случайно эти «цифровые данные» получили название «большие данные», или «биг дата» (от англ. big data). Наряду с этим Интернет стал удобной площадкой для проведения онлайн-опросов (в том числе о медиапотреблении), причем не только профессиональных, но и любительских (пользовательских), и число их стало стремительно расти. Иными словами, источников аудиторных данных стало много, и количество «цифр», циркулирующих на рынке, многократно возросло. Их публикуют в Сети, в профессиональных изданиях, представляют на индустриальных конференциях (причем каждая компания оперирует «своими» данными). Можно сказать, что цифровые технологии способствовали формированию «цифрового изобилия» – не только в смысле неограниченного предложения цифрового контента, но и в смысле «изобилия цифр», отражающих процесс потребления этого контента. Аудиторные данные «фрагментируются», отражая процесс фрагментации медиа и аудитории (Napoli, 2011: 57).
Но проблема в том, что данные разнородны, фрагментарны, часто противоречивы. Из этих «фрагментов» невозможно сложить общую картину медиапотребления (или хотя бы его части – например, видеопотребления), поскольку «цифры» получены разными методами, для разных совокупностей, относятся к отдельным платформам или сервисам, отражают разные метрики (показатели) и т.п. В результате при огромном потоке аудиторных данных на российском рынке нет целостной картины и корректных количественных показателей медиапотребления в целом. Так, отсутствуют общепринятые, официальные данные о совокупном объеме (времени) медиапотребления, временных затратах на отдельные медиа (ТВ, радио, прессу, Интернет)1, распределении аудитории по разным платформам, экранам, способам потребления и т.п. Отсутствует также официальная статистика по развитию медиасреды (проникновению медийных технологий, оборудования и услуг), которая имеет непосредственное отношение к исследованиям медиапотребления, поскольку характер и практики медиапотребления зависят от медийной оснащенности населения.
На развитых рынках эти задачи решают индустриальные медиакомитеты или государственные регулирующие органы (министерства, комитеты по коммуникациям). Они разрабатывают стандарты и единую терминологию, собирают и систематизируют информацию по рынку, заказывают исследования, формируют единые базы данных и т.п. Так, в Великобритании источником официальной статистики по информационно-коммуникационным технологиям (ИКТ) и медиа является государственный медиарегулятор Offcom (Управление по коммуникациям)2. А European Audiovisual Observatory (EAO) выполняет эту функцию в масштабах объединенной Европы3.
В России статистика по медиарынку неупорядоченная, фрагментарная и противоречивая. В основном она представлена в отчетах консалтинговых агентств, специализирующихся на исследованиях IT, телекоммуникационного и медиарынков. Но данные консалтинговых компаний зачастую расходятся. Например, J'son & Partners Consulting и iKS-Consulting дают разные оценки абонентской базы платного телевидения, что объясняется различиями в методологии исследований (разное понимание услуги платного ТВ и определение ее границ, различия в методиках подсчета абонентов и т.п.). К таким расхождениям ведет, в частности, отсутствие общепринятой терминологии и стандартов, относящихся к инновационным технологиям и услугам. (Отметим, что «терминологический хаос» в медиаотрасли – еще одна проблема практики российских медиаисследований, заслуживающая отдельного рассмотрения.)
Таким образом, практическое состояние исследований медиарынка в целом (и медиапотребления, в частности) характеризуется ростом числа источников данных при отсутствии общепринятой официальной статистики развития медиасреды, проникновения технологий и услуг, а также взвешенной оценки объемов медиапотребления и его распределения по различным медиа, платформам и экранам.
Второй важный аспект «цифрового изобилия» – разное «качество» аудиторных данных, представленных на рынке. Речь в данном случае не столько о корректности, надежности и достоверности данных (хотя эти проблемы существуют, и они будут рассмотрены ниже), сколько о некорректном использовании и представлении этих данных. Сегодня огромное количество данных находится в открытом доступе и в готовом для использования виде, и каждый, кто хочет заняться аналитикой, может это сделать. Однако, «когда данные в Интернете легкодоступны, это создает возможности скорее для аналитиков-любителей, чем профессионалов» (Джапек, Крёйтер, Берг и др., 2015: 21). Но анализ и интерпретация аудиторных данных требует специальных (профессиональных, методических) знаний и навыков. Следствием любительской «аналитики» становится засорение публичного пространства некорректными интерпретациями, неверными выводами и ложными суждениями. Любой исследователь или менеджер, наверно, сталкивался с ситуацией, что найти нужную цифру в «замусоренном» информационном пространстве весьма сложно. Во всяком случае требуются дополнительные усилия и ресурсы (прежде всего, время), чтобы разобраться в обширном потоке цифр и их интерпретаций.
Некорректные интерпретации и выводы могут быть не только следствием отсутствия профессиональных знаний, но и результатом сознательных манипуляций. Дело в том, что обострение конкуренции на медиарынке сделало количественные показатели аудитории важным инструментом маркетинга. Зачастую они становятся главным аргументом и средством убеждения бизнес-партнеров и клиентов (рекламодателей, инвесторов). Особенно активно этим аргументом пользуются цифровые медиакомпании, тем более что «цифры» у них – «большие». Сотни тысяч «уникальных посетителей», миллионы просмотров, гигабайты трафика – выглядит весьма убедительно, на первый взгляд. Эти цифры могут произвести впечатление, если не знать некоторых методологических нюансов.
«Цифровая статистика» vs социологические данные
Интернет-счетчики, на которые обычно ссылаются как на самый точный источник «цифр» об интернет-аудитории, фиксируют не реальных людей, а технические параметры (IP- адреса, куки-файлы (cookie) и другие идентификаторы устройств и браузеров, с которых реальные люди выходят в Интернет. Например, один из основных показателей веб-аналитики при количественных оценках аудитории сайта − количество «уникальных посетителей» (или просто «уников»). Именно этот показатель в первую очередь показывают потенциальным рекламодателям или инвесторам как общепринятое измерение популярности веб-сайта. Однако этот показатель может сильно «преувеличивать» реальную аудиторию, поскольку это сумма технических «идентификаторов» (компьютеров, браузеров и т.п.), а не реальных людей. Так, с одного устройства (например, домашнего компьютера, планшета) в Сеть могут выходить разные члены семьи, которые будут учитываться интернет-счетчиками как один и тот же «уникальный посетитель». Но в последние годы получила развитие противоположная тенденция – все больше людей используют разные компьютерные устройства для выхода в Сеть. Например, утром выходят в Интернет с домашнего компьютера, в дороге − со смартфона через приложение, днем – с рабочего компьютера, вечером, лежа в постели – с планшета и т.п.). Все это ведет к многократному росту числа «уникальных посетителей», регистрируемых веб-статистикой. Так, в начале 2016 г. счетчики компании TNS регистрировали 876 млн «уникальных пользователей» Сети в месяц, при том что реальное число интернет-пользователей в России составляло только 86 млн человек. Таким образом, на каждого реального интернет-пользователя приходится в среднем 10 «уников». На практике это означает, что реальная аудитория популярных интернет-ресурсов (например, социальных сетей), которые пользователи могут посещать с разных устройств, может быть в несколько раз меньше, чем показатели интернет-статистики. Кроме того весьма проблематично верифицировать социально-демографические характеристики «уников». Иными словами, интернет-статистика дает искаженное представление об аудитории, понимаемой в традиционном плане – как совокупность реальных людей с определенными социально-демографическими характеристиками.
С другими «цифровыми данными» ситуация схожая. Например, компании-провайдеры цифрового платного телевидения (кабельного, спутникового и IPTV) собирают детальную информацию о телесмотрении своих абонентов с помощью телевизионных приставок (цифровых ТВ-тюнеров, или сет-топ-боксов − от анг. Set Top Box), которые с точностью до секунды фиксируют «использование» телевизора – включение и выключение, переключение по каналам. Однако эти «большие данные» не позволяют сказать, сколько человек смотрели этот телевизор, каковы их социально-демографические характеристики (телевизор могут смотреть разные члены семьи, гости, совместно и в одиночестве и т.п.) Чтобы перевести техническую информацию, собранную ТВ-тюнерами, в аудиторные показатели, используют математические методы моделирования. В частности, проводится процедура «профилизации» – определения социально-демографического профиля зрителя по характерным для разных социально-демографических групп телепредпочтениям и паттернам телесмотрения – времени просмотра, каналам, жанрам телепередач и т.п. Однако подобные методы определения объема и профиля аудитории телепередач вряд ли точнее и надежнее, чем традиционные технологии измерений телевизионной аудитории – репрезентативные панельные выборки с фиксацией телесмотрения панелистов с помощью электронных приборов – пиплметров (от англ. peoplemeter).
Иными словами, цифровая аудиторная статистика («большие данные») и социологические опросы – две разные методологии «учета» аудитории и два типа аудиторных «метрик». Поэтому прямое сравнение, например, трафика интернет-сайта (уникальные посетители) и аудитории телепрограммы (выраженной в рейтингах), которое можно встретить в некоторых публикациях, методически некорректно. У этих цифр разная природа.
Однако на эти методологические различия обратят внимание только специалисты, поэтому манипулировать общественным мнением с помощью «цифр» легко. Там, где фигурирует Интернет, часто встречаются «передергивания», некорректная интерпретация аудиторных данных с целью, например, подчеркнуть его популярность и принизить значимость и влиятельность традиционных медиа. Подобные «цифровые» диффамации – отражение возросшей конкуренции за рекламные бюджеты, в которой, видимо, все средства хороши. Причем для подобных манипуляций используется не только «цифровая статистика», но и традиционные социологические данные, в том числе результаты индустриальных измерений аудитории. Нередко их можно встретить в деловых СМИ.
«Цифровые» диффамации в СМИ
Деловую журналистику сегодня невозможно представить без привлечения эмпирических данных, придающих анализу обоснованность и убедительность. Однако не всегда эти данные корректно используются. Используя неточные формулировки и смещая акценты, журналист может манипулировать сознанием читателей.
Показательны в этом отношении две публикации в газете «Ведомости». В июле 2016 г. был опубликован материал под названием «Телевизионный король и виртуальная королева». В тексте утверждалось, что телевидение как медиа и рекламоноситель стремительно утрачивает прежние позиции, все больше «проигрывая» Интернету. В качестве доказательства автор использует «цифры», отмечая, что, «по данным TNS, в городах с населением свыше 700 000 человек хотя бы раз в день Интернетом пользуется почти 80% жителей. Это огромный охват для медиа, его отставание от ТВ (более 98% жителей) уже далеко не критично»4.
Приведенные цифры сомнений не вызывают, так как автор ссылается на официального «измерителя» аудитории – исследовательскую компанию TNS. Но только вряд ли обычный читатель придаст особое значение тому, что эти цифры иллюстрируют ситуацию конкуренции ТВ и Интернета только в мегаполисах (свыше 700 тыс. жителей). Но в этих городах проживает лишь четверть россиян, но и именно здесь и сосредоточена большая часть пользователей Интернета. А среди «неучтенных» автором 75% россиян, проживающих во «второй» и «третьей» России5, ситуация иная: там только половина жителей пользуется Интернетом, а телевизор, как и в мегаполисах, смотрят практически все (98%). И в этой – другой – России отставание Интернета от ТВ все еще «критично». Так, отбирая «нужные» цифры и замалчивая другие, автор искажает реальную картину и вводит в заблуждение читателей.
Другой пример «цифровой» диффамации в отношении телевидения − публикация с первоначальным названием «Обогнал телевизор» (май 2012 г.). В ней, также со ссылкой на данные TNS, сообщалось, что в апреле 2012 г. среднесуточная аудитория «Яндекса» впервые оказалась выше, чем у «Первого канала» (в аудитории от 12 до 54, в городах с населением более 100 000 человек)6. Но в стремлении к сенсационности автор переходит тонкую грань «корректной» подачи и использования социологических данных, заявляя, что «Яндекс» «обогнал телевизор», то есть телевидение в целом. Это, безусловно, сильное преувеличение, так как аудитория «Первого канала» составляет менее 20% от аудитории всего телевидения, А значит, суточная аудитория телевидения в целом в 4−5 раз превышала (и превышает) аудиторию «Яндекса» и вынесенное в первоначальный заголовок утверждение не соответствует действительности. Но именно это утверждение, а не сами цифры и прочие методические нюансы воспримет и запомнит массовый читатель. Так, предлагая неточную интерпретацию данных, упакованную в яркую и запоминающуюся формулировку, автор распространяет неверную информацию, наносящую ущерб репутации телевидения как медиа и рекламоносителя.
Дело не только в заголовке статьи (который редакция не случайно почти сразу заменила на более корректный – «"Яндекс" стал первой «кнопкой страны»), но и в интерпретации социологических данных. Сравнение среднесуточных охватов интернет-портала и телевизионного канала методически некорректно. На это обратили внимание эксперты (маркетологи, социологи), развернувшие дискуссию после выхода публикации. Дело в том, что медиапотребление традиционно «измеряется» не только количеством людей, обратившихся к медиа (охват), но и временными затратами на медиа, так как считается, что продолжительность контакта отражает степень вовлеченности аудитории, качество контакта и, в конечном счете, эффективность информационного (в том числе рекламного) воздействия. Поэтому сравнивать среднесуточные охваты «Яндекса» и «Первого канала» (также телевидения и Интернета в целом, как в первой публикации) некорректно. Ведь это сравнение не учитывает, что (согласно данным того же TNS) «Первый канал» зрители смотрят больше часа в день, а на «Яндекс» заходят только на 10 минут, чтобы посмотреть погоду, пробки, расписание телепрограмм, проверить почту, найти нужную информацию. Другие эксперты отмечали также, что «Яндекс» – не СМИ, он не производит собственные новости, а только распространяет чужие: «Яндекс» или Mail.ru невозможно сравнивать по эффективности с телеканалами, − отмечал Сергей Пискарев (бывший в то время президентом АКАР), – они не управляют контентом»7. А аналитик «ВТБ капитала» Анастасия Обухова добавила, что сравнивать ТВ и Интернет как медиа нельзя, потому что «у них слишком разное ценообразование и таргетирование аудитории»8.
Опасность и вред подобных журналистских «сенсаций» состоит в том, что рядовой читатель, не знакомый с методологией социологических исследований, примет эту информацию за «чистую монету» − ведь она «освящена» цифрами официального измерителя! Далее эта информация будет распространяться по принципу «испорченного телефона», обрастая все более искаженными интерпретациями, поддерживая и распространяя мифы о медиапотреблении, базирующиеся на некорректных интерпретациях социологических данных.
Еще одним источником эмпирических артефактов, ведущих к формированию искаженных представлений о современном медиапотреблении, стали онлайн-опросы.
Онлайн-опросы в исследованиях медиапотребления
Безусловно, Интернет существенно расширил возможности проведения эмпирических исследований и сбора данных, в том числе о медиапотреблении. Онлайн-опросы приобрели большую популярность и в академической, и в индустриальной среде. Все исследовательские компании, занимающиеся маркетинговыми исследованиями, используют этот инструмент. Методика CAWI (Computer-Assisted Web Interviewing) уже входит в стандартный набор методов маркетинговых исследований наряду с личными (Face-to-Face) интервью и телефонными опросами CATI (Computer-Assisted Telephone Interviewing). Однако у социологов отношение к онлайн-опросам неоднозначное. Эта методика находится в центре научных дискуссий (Филиппова, 2001; Шашкин, Девятко, Давыдов (ред.), 2010; Насретдинова, 2014). Наряду с методическими вопросами обсуждаются проблемы, связанные с практикой проведения онлайн-исследований.
Дело в том, что онлайн-опросы, как наиболее простой и доступный способ сбора эмпирических данных, используют не только профессионалы, но и обычные пользователи («любители»). Появилось много платформ, позволяющих самостоятельно формировать и проводить опросы в Сети (например, Survio, Simpoll, PollService и др.), а также сервисов по проведению платных онлайн-опросов (оплачивающих участие респондентов в опросах) – например, abcpoll.ru, anketer.org, anketolog.ru, anketka.ru и др., которые активно используются для проведения маркетинговых исследований9. Действительно, для маркетинга онлайн-опросы – почти идеальный инструмент обратной связи с потребителями, поскольку они позволяют оперативно и за гораздо меньшие деньги (по сравнению с традиционными заказными (Ad Hoc) исследованиями) получить мнения, отклики целевой аудитории. Но использование этого метода для проведения масштабных социологических исследований, репрезентирующих большую и неоднородную социальную группу, предполагающих получение точных количественных характеристик (например, аудитории и практик медиапотребления), требует серьезной методологической проработки и строгого соблюдения методических процедур. Иначе легко получить некорректные результаты.
Есть несколько «болевых точек» методологии и методики такого типа медиаисследований. Прежде всего, вопросы репрезентативности. Это отдельная тема, которая получила отражение в ряде научных публикаций (подр. см.: Шашкин, Девятко, Давыдов (ред.), 2010: 249−259; 287−294). В них, в частности, подчеркивается, что выборка из пользователей Интернета нерепрезентативна по отношению к населению страны или даже региона. Мнения интернет-пользователей будут отличаться от мнения остального населения. Кроме того в онлайн-опросах участвуют, как правило, наиболее активные и любопытные пользователи Интернета. Такой самоотбор (Self-Selection) осложняет контроль соответствия между выборкой и генеральной совокупностью и может вести к смещению выборки. Даже если ограничить генеральную совокупность только интернет-пользователями, выборка может оказаться смещенной в сторону аудитории тех сайтов, посетители которых приглашались к опросу. А если участие в онлайн-опросе оплачивается, то возрастает еще и вероятность умышленной дезинформации, что ведет к получению некорректных результатов. Если респондент заинтересован в получении вознаграждения или просто желает «улучшить» результат опроса (например, при тестировании), он пытается дать социально ожидаемый ответ. Чаще других такие ответы дают «тренированные» респонденты, использующие «низкозатратные» стратегии заполнения анкет. Кроме того, пользователи Интернета могут давать ложные ответы, выбирая их случайным образом, рассматривая опрос как игру, развлечение. Так как все сведения о себе пользователи Сети сообщают добровольно, оценить надежность социально-демографических данных потенциальных респондентов, их мотивацию, добросовестность, искренность ответов проблематично.
Вторая проблемная зона и «очаг» возникновения некорректных данных – методические ошибки инструментария (формулировок вопросов и ответов, шкал и т.п.). Особенно ярко это проявляется в любительских (пользовательских) опросах. Создание методически корректной анкеты требует специальных знаний, которыми не обладают рядовые пользователи. Вместе с тем кажущаяся простота и легкость создания анкеты на специальных ресурсах (наподобие Survio) делает онлайн-опросы весьма привлекательным инструментом для сбора эмпирических данных (например, для учащихся, студентов, аспирантов в рамках подготовки учебных заданий, написания курсовых, дипломных работ и диссертаций). Но результаты любительских опросов, к сожалению, часто оказываются несостоятельными с методической точки зрения. Не выдерживают критики ни выборка, ни инструментарий, ни интерпретация и представление результатов. Хуже всего то, что результаты подобных методически некорректных «исследований» публикуются, становясь частицей информационного мусора, в котором найти корректные, релевантные проблеме данные становится просто невозможно. Интернет-ресурсы пестрят «цифрами», которые базируются на онлайн-опросах, при этом часто непонятно – кого опросили, как отбирали, какую совокупность отражает выборка, какой инструментарий использовался и т.п. Подобная «эмпирика» засоряет не только Интернет, но проникает также и в деловые СМИ, и в научные публикации.
В целом сложившаяся практика проведения онлайн-опросов девальвирует сам инструмент, приводит к утрате интереса к онлайн-исследованиям со стороны тех, кто за них платит, а также и тех, кто в них участвует. Исследователям приходится сокращать анкеты, искать новые формы мотивации респондентов и т.п. Вместе с тем этот инструмент может быть весьма полезным и эффективным в исследованиях современного медиапотребления. В качестве примеров можно привести британское исследование The Consumer's Digital Day10 и аналогичный российский проект Media Box11, которые представляют собой современную модификацию традиционных дневниковых исследований бюджета времени и медиапотребления (7-онлайн-дневник). Эта методика позволяет получить оценку объемов медиапотребления с детализацией по экранам и способам/практикам медиапотребления. Но, как и любое онлайн-исследование, оно не репрезентирует все население. Эта особенность онлайн-исследований ограничивает возможности их применения в индустриальных измерениях аудитории, несмотря на такие преимущества, как оперативность, дешевизна, технологичность и т.п.
Индустриальные измерения аудитории в цифровой среде
Измерения аудитории занимают особое место в медиаиндустрии, обеспечивая медиабизнес аудиторными данными, которые выполняют функцию валюты на рынке аудиторий (Napoli, 2003; Webster, 2006). Цифровизация медиа потребовала пересмотра методологического аппарата медиаизмерений (методик и технологий сбора и обработки данных), а также решения ряда практических проблем, связанных с их организацией, согласованием интересов всех заинтересованных сторон, дополнительных финансовых инвестиций и т.п.
Традиционные, сложившиеся в эпоху аналоговых медиа методы и технологии измерений аудитории СМИ базируются на классической социологической методологии эмпирических исследований. Это массовые опросы, которые проводятся на больших репрезентативных выборках. Методы и инструменты сбора данных о медиапотреблении могут быть различными (от самозаполнения анкеты, личного (face-to-face) или телефонного интервью до специальных методик, когда регистрация медиапотребления происходит с помощью специальных дневников или электронных приборов-счетчиков (ТВ-метров, пипл-метров и т.п.). Но в любом случае это выборочный опрос (на сменяемой или панельной выборке) представителей генеральной (исследуемой) совокупности. Для телевизионных измерений – методически и технологически самых сложных – в 1980-е гг. международным исследовательским сообществом были утверждены (и опубликованы в соответствующем документе − GGTAM)12 определенные методические правила и принципы, которые стали «золотым стандартом» индустриальных телеизмерений.
Однако субъектам индустрии, по заказу которых проводятся такие исследования (рекламодателям, рекламным агентствам, самим СМИ), свойственно с недоверием относиться к их результатам, особенно если они «показывают» невысокие рейтинги их СМИ. И прежде всего критике подвергается «выборочный» характер этих исследований. Объемы выборок всегда кажутся недостаточными. Сомнению подвергается также корректность и репрезентативность выборки – ее соответствие реальности, отсутствие «перекосов», связанных с разной степенью достижимости разных категорий населения, их готовностью отвечать на вопросы анкеты, пустить к себе в дом исследователей с непонятными «приборчиками» и т.п. Измеренная аудитория, как показал Ф. Наполи (2003: 23), является лишь формой «аудиторного продукта», который массмедиа производят совместно с измерительной компанией. И эта измеренная аудитория может рассматриваться лишь как некоторая оценка объемов реальной аудитории. «Проблема связана не только с тем, что измерения проводятся по выборке, соответствие реальности которой может варьироваться. Вопрос состоит в том, что в процессе оценки/анализа телеаудитории рекламодатель имеет дело с тремя разными ее типами: предсказанной, измеренной и реальной. Можно только предполагать различия между ними, однако оценить степень и глубину этих различий довольно трудно» (Вартанова, 2011: 16−17).
Чтобы снять напряженность между «измерителями» и их клиентами, время от времени проводятся аудиты системы телевизионных измерений. Например, в России аудит телевизионной панели TNS проводился четыре раза: в 1999, 2002, 2005, 2012 гг.13. Другая радикальная мера – смена исследовательской компании-измерителя через процедуру тендера, которую проводят Медиакомитеты или Объединенные индустриальные комитеты, уполномоченные индустрией14. Но выигравшая тендер исследовательская компания создает свою систему измерений на тех же принципах выборочного репрезентативного опроса, с использованием стандартных методов и инструментов социологического исследования: опрос (face-to-face интервью или CATI), дневниковая панель или пипл-метровая панель.
В условиях цифровой среды одна из основных методологических и практических проблем медиаизмерений – возможности использования цифровой статистики («биг дата») в системах индустриальных измерений. В отличие от выборочных опросов, эти новые инструменты (вэб-аналитика, PRD) позволяют собирать сплошные и детальные данные. Казалось бы, они должны вытеснить выборочные опросы из рейтинговых исследований. Однако на практике возможности их применения оказываются ограниченными. Во-первых, за рамками «цифровых измерений» остается весьма значительная часть населения, которая пока не охвачена Интернетом (чуть меньше 50% населения) и/или не пользуется услугами цифрового платного телевидения (63% городских домохозяйств15). Во-вторых, «цифровые измерения» априори не охватывают всех медиа. Чтение печатных СМИ (бумажных газет и журналов), как и прослушивание эфирного радио, не фиксируется цифровыми инструментами и может быть измерено только с помощью опросов. Ограничено применение «биг дата» и в измерениях телевизионной аудитории. С помощью цифровых ТВ-тюнеров, имеющих канал «обратной связи» (RPD – Return Path Data), операторы платного ТВ могут собирать точные и детализированные данные о телесмотрении в домохозяйствах своих абонентов, но … только «своих». Подобные измерения (несмотря на их «сплошной» характер) покрывают ограниченную совокупность зрительской аудитории и не могут быть использованы в качестве индустриальных измерений, которые должны репрезентативно представлять всю аудиторию в целом. Кроме того, RPD-данные, как было указано выше, не содержат информации о количестве зрителей и их социально-демографических параметрах, а алгоритмы моделирования (профилизации) с целью переведения технических данных в аудиторные метрики, во-первых, пока несовершенны, во-вторых, по определению предполагают статистическую ошибку.
Некоторое время назад индустрия пришла к пониманию, что оптимальной технологий медиаизмерений в цифровой среде являются гибридные методики. Суть их состоит в интеграции сильных сторон традиционных выборочных опросов и «больших данных», получаемых интернет-счетчиками или цифровыми тюнерами. В первом случае речь идет о подробной демографии на небольшой выборке, во втором – о большом массиве данных, фиксирующих действия пользователей, включая выбор телепрограмм и сервисов (Назаров, 2015: 77). Появляется возможность обработки данных с цифровых устройств (телеприставок, ресиверов, тюнеров, серверов), что обеспечивает, таким образом, совмещение данных, полученных по каналу обратной связи от абонентов цифрового ТВ, с пипл-метрической панелью (Shabbab, Marks, 2010). Все мировые лидеры в области индустриальных измерений – компании Nielsen (США), TNS/Kantar (Великобритания), GfK (Германия), Mediametrie (Франция) – движутся в этом направлении, предлагая рынку свои технологические решения. Примерами могут служить проекты Dovetail в Великобритании и GoogleNugaro, реализуемый в ряде европейских стран (Назаров, 2015: 81−85).
Второй «цифровой вызов» для систем индустриальных телеизмерений – диверсификация каналов дистрибуции и потребления телевизионного контента. Потребители получают возможность обращения к отдельным медиапродуктам (программам), а не пакетным предложениям, минуя жесткую привязку к сетке программ (Proulx, Shepatin, 2012: 182−184). Скажем, сериал можно посмотреть не только по телевизору во время его «живой» трансляции в эфире телеканала, но и в другое время, удобное для зрителя, – на сайте телеканала или онлайн-кинотеатра и не обязательно на экране телевизора. Аудитория одного и того же сериала оказывается рассеянной по разным платформам и экранам, и перед исследователями стоит непростая задача − измерить эту «рассеянную» аудиторию. В этих условиях индустрии, как считает В.П. Коломиец (2014: 222), «необходимо перейти от измерения аудитории телевизионных каналов к измерению телевизионного контента вне зависимости от среды его распространения…». Оптимальным решением для этого представляется технология сингл-сорс-исследования (single source) , когда на одной выборке происходит регистрация всех медиаактивностей человека.
Таким образом, в цифровой среде новым стандартом для индустриальных телеизмерений становятся сингл-сорс-исследования, использующие гибридную технологию сбора данных (панельные выборки и «большие данные»). Такие системы измерений уже созданы на некоторых развитых рынках. Например, в США компания Nielsen реализует проект Neilsen Total Rating – сингл-сорс-исследование кроссплатформенного измерения телепросмотра, включающее измерение линейного («живого») просмотра телепередач, а также просмотр телеконтента «по запросу» на различных платформах и экранах, включая DVR (цифровой видеорекордер), сервисы VOD операторов платного телевидения, телевизионные приставки с выходом в Интернет (Roku, Apple TV, Xbox), компьютеры, планшеты и смартфоны. В результате просмотр телеконтента «после эфира» (в течение следующих 7 и 30 дней) учитывается системой измерений, и эта измеренная «нелинейная» аудитория включается в суммарный (тотал) рейтинг.
Однако организовать и проводить на регулярной основе многоплатформенное синг-сорс-измерение – технически и практически сложная задача. Тут помимо всего требуется еще и некая консолидация участников медиаиндустрии и рекламного рынка, готовность договариваться. На российском медиарынке это получается плохо (безуспешный опыт проведения тендеров на выбор компании для измерений телевизионной аудитории – яркое тому свидетельство). Поэтому в России пока делаются только первые шаги в направлении создания системы многоплатформенных телевизионных измерений. Есть, в частности, субпанель TNS для измерения просмотра телевизионных программ на компьютере в панели ТВ-измерений. Но это, конечно, не захватывает всего телепотребления, которое происходит и на других платформах и экранах (например, в приложениях на СМАРТ ТВ, планшетах и смартфонах). На индустриальном уровне эта проблема в России пока не решена.
В 2002 г. председатель совета директоров компании GMI (Global Market Insite, Inc.) Роба Монстера, анализируя технологические тренды в маркетинговых исследованиях, прогнозировал, что использование цифровых технологий в исследовательских целях приведет к созданию системы управления знаниями, единой информационной базы данных: «Такие интегрированные базы обеспечат доступ к целостным данным, а неразорванным массивам, как это происходит сегодня <…> Ключевыми при этом станут возможности сбора и доставки данных сплошным потоком через единый концентратор, где они будут интегрироваться с различными слоями метаданных. В результате можно будет создавать репрезентативные международные access-панели» (цит. по: Monster, Pettit, 2002: 268). Практика показала, что ожидания, порожденные технологическими трендами, не оправдались. Фактически мы имеем огромное количество разнообразных и противоречивых данных, что привело к девальвации «цифр» как средства аргументации и принятия бизнес-решений. Как это ни парадоксально, но в условиях избытка информации принять бизнес-решение еще труднее, чем в ее отсутствии, так как менеджеру приходится задействовать дополнительные ресурсы (прежде всего, время), чтобы проанализировать «поток» данных и разобраться в них. Складывается впечатление, что отсутствие релевантных технологическим возможностям и состоянию медиасреды исследований становится сдерживающим фактором развития медиабизнеса. Вероятно, будущее все же за использованием пассивно собранных данных, а не опросных методик. Но вполне возможно, что то, что видится сегодня как перспектива, не оправдается, как не оправдался прогноз, сделанный Монстером в 2002 г.
Примечания
Библиография
Вартанова Е.Л. Цифровое телевидение и трансформация медиасистем. О необходимости междисциплинарных подходов к изучению современного ТВ // Вестн. Моск. ун-та. Сер. 10, Журналистика. 2011. № 4. С. 6−26.
Джапек Л., Крёйтер Ф., Берг М. и др. Отчет AAPOR о больших данных / Американская ассоциация исследователей общественного мнения. Мат-лы V социологической Грушинской конф. 12 февраля 2015 / пер. с англ. Д. Рогозина, А. Ипатовой, Е. Вьюговской / предисл. Д. Рогозина. М.: American Association for Public Opinion Research, 2015. Режим доступа: http://wciom.ru/fileadmin/file/nauka/grusha2015/AAPOR_big_data.pdf
Коломиец В.П. Медиасоциология: теория и практика /Научная монография/ Аналитический центр Vi. М.: ООО «НИПКЦ Восход-А», 2014.
Назаров М.М. Измерения аудитории ТВ в современной мультиэкранной среде (практики зарубежных рынков). М.: ООО «НИПКЦ Восход-А», 2015.
Насретдинова М.М. Виды выборок для онлайн-опросов // Психология, социология и педагогика. 2014. № 9. Режим доступа: http://psychology.nauka.ru/2014/09/3517 (дата обращения: 23.06.2016).
Онлайн-исследования в России 2.0. / под ред. А.В. Шашкина, И.Ф. Девятко, С.Г. Давыдова. М., РИЦ «Северо-Восток», 2010.
Филиппова Т.В. Интернет как инструмент социологического исследования // Социологические исследования. 2001. № 9. С. 115–122.
Napoli Ph.M. (2003) Audience Economics: Media Institutions and the Audience Marketplace. New York: Columbia University Press.
Napoli Ph.M.(2011) Audience Evolution: New Technologies and Transformation of Media Audiences. New York: Columbia University Press.
Monster R.W., Pettit R.C. (2012) Market Research in the Internet Age: Leveraging the Internet for Market Measurement and Consumer Insight. New York: John Wiley and Sons, Inc.
Proulx M., Shepatin S. (2012) Social TV: How Marketers Can Reach and Engage Audiences by Connecting Television to the Web, Social Media, and Mobile. New Jersey: John Wiley & Sons, Inc.
Shabbab G., Marks R. Horses for Courses – RPD or Peoplemeter? Five years on from Montreal WAM. ESOMAR TV Conference. Berlin, October, 2010. Режим доступа: http://www.warc.com/Security/Login/Paywall.aspx?OriginalUrl=/Content/ContentViewer.aspx?ID=cd1d571c-9648-46d2-846d-02e8724512a5&MasterContentRef=cd1d571c-9648-46d2-846d-02e8724512a5
Webster J.B. (2006) Rating Analysis. Theory and practice of Audience Research. New Jersey: Lawrence Erlbaum.