Факторы читательского предпочтения аудитории деловых онлайн-СМИ (на примере сайта РБК)

Скачать статью
Шароян С.В.

аспирантка кафедры теории и экономики СМИ факультета журналистики МГУ имени М.В. Ломоносова, г. Москва, Россия

e-mail: siranush.sharoyan@gmail.com

Раздел: Социология журналистики

Возможность точно и быстро измерять предпочтения аудитории, поя­вившаяся у средств массовой информации благодаря развитию инструмен­тов веб-аналитики, в корне меняет работу редакций онлайн-изданий и их отношения с аудиторией. Журналисты и редакторы, изучая веб-метрики, все больше узнают о вкусах своих потребителей и пытаются адаптиро­ваться к ним. А умение грамотно анализировать и интерпретировать эти данные становится ключевым для выживания СМИ в условиях растущего экономического давления. При этом научных исследований о предпочтениях аудитории СМИ, основанных на анализе данных, полученных с помощью си­стем веб-аналитики, в России до сегодняшнего дня не было. Данная статья представляет результаты анализа самых популярных ма­териалов одного из крупнейших российских онлайн-СМИ — сайта РБК, еже­месячная аудитория которого превышает 25 миллионов читателей. Статья основана на анализе более тысячи материалов, которые в течение года с июля 2015 г. набрали наибольшее количество просмотров. Автор впервые в россий­ской научной практике делает регрессионный анализ, позволяющий оценить влияние различных факторов на потенциальную популярность статьи среди читателей сайта. Результаты анализа показывают, что на потенциальное количество просмотров сильнее всего влияют попадание материала в опреде­ленные рубрики, количество слов в заголовке и наличие в нем слов-маркеров, жанровая принадлежность и количество перепостов в социальных сетях.

Ключевые слова: веб-метрики, веб-аналитика, аудитория СМИ, измерение аудитории, онлайн-журналистика, новости, статьи

Веб-аналитика и СМИ

Исследователи средств массовой информации на протяжении десятилетий изучают процесс создания новостей, акцентируя осо­бое внимание на том, как журналисты и редакторы фильтруют и трансформируют множество событий, о которых они узнают в те­чение дня, в ограниченное количество материалов, выбирая толь­ко ту информацию, которая, на их взгляд, достойна освещения. Сам процесс отбора обозначается английским термином «gatekeeping», который можно перевести как «контроль доступа» (Shoemaker, 1991), и его значение сложно переоценить: результат отбора тем формирует повестку дня и оказывает сильное влияние на взгляды аудитории (Shoemaker, Vos, 2009).

Единого рецепта для выбора тем и создания хорошего материа­ла, конечно, нет. Но существует, например, пять критериев, кото­рые воспроизводятся в разных журналистских кругах, преподают­ся в школах журналистики и обсуждаются в профессиональных журналах: это своевременность, релевантность, близость к аудито­рии, сенсационность и наличие конфликта (Schultz, 2007). При этом редакторы и журналисты, вырабатывая эти критерии и оце­нивая любую информацию по ним, полагались, в первую очередь, на «внутреннее чувство», в то время как интересы и предпочтения аудитории часто оставались без внимания (Boczkowski, Peer, 2011).

Ситуацию изменило внедрение в СМИ веб-аналитики - си­стем сбора, измерения, анализа и интерпретации информации о посетителях веб-сайтов, которую используют для улучшения и оптимизации самих сайтов и их контента. История веб-аналитики началась в середине 1990-х, когда владельцы сайтов смогли уста­навливать простые счетчики, показывающие количество прос­мотров страницы: каждый раз, когда на сайт заходил новый посе­титель, число на счетчике увеличивалось на единицу.

С развитием технологий возможности веб-аналитики стали почти безграничными. Сейчас СМИ могут получить практически любую информацию о своей аудитории: от данных о том, сколько людей просмотрели материал, до того, когда и откуда читатели приходят на каждую страницу, как долго ее изучают, куда уходят потом и т.д. (Kaushik, 2009). Интересно, что все это не требует ни­каких усилий со стороны аудитории, активность пользователей регистрируется независимо от того, осознает это читатель или нет. Статистика, основанная на записи онлайн-активности посетите­лей, используется для выделения паттернов поведения аудитории и выявления тенденций (McGregor, 2007).

Теперь руководство большинства редакций онлайн-СМИ начи­нает утренние совещания с краткой сводки о самых популярных материалах предыдущего дня (Peters, 2010), а редакторы сайтов в режиме реального времени корректируют положение новостей на веб-страницах, ориентируясь на количество просмотров той или иной истории (Lee at al, 2014). Эти изменения приводят к появле­нию «повестки аудитории» (Anderson, 2011), меняя устоявшиеся представления об односторонности массовой коммуникации, «контроле доступа», самостоятельном выборе повестки дня редак­цией и степени влияния аудитории на медиаконтент (Singer, 2011).

Таким образом, появление систем веб-аналитики в средствах массовой информации побудило их сотрудников «увидеть свою аудиторию, осознать ее размер и желания, позволив вместо смут­ных впечатлений об их предпочтениях получить точные количест­венные данные» (Napoli, 2010). Тем не менее, научных исследова­ний предпочтений аудитории и факторов, влияющих на эти предпочтения, на сегодняшний день в России нет. Научная новиз­на работы заключается в том, что автор, проанализировав мате­риалы, которые набирали наибольшее количество просмотров в одном из крупнейших онлайн-изданий России - сайте РБК (www. rbc.ru), выделяет факторы, которые влияют на интерес аудитории к материалам, измеряет степень этого влияния и выделяет среди многочисленных количественных данных тенденции и тренды.

Автор впервые в российской научной практике проводит рег­рессионный анализ популярных материалов, который позволяет объяснить, какие факторы влияют на читаемость статей в целом, анализируя каждую статью не как нечто целостное, но как набор отдельных элементов (заголовка, лида, основного текста), пытаясь измерить влияние на популярность материалов каждого из них. Для этого нужно ответить на два вопроса:

Вопрос 1. Какие материалы оказываются самыми читаемыми на сайте РБК?

Вопрос 2. Какие факторы оказывают влияние на популярность материалов?

Данные и методология

Веб-аналитика становится неотъемлемой частью жизни любой редакции. При этом пока главные вопросы, на которые она может дать ответ, — чего хочет аудитория от СМИ, какие материалы ка­жутся ей наиболее интересными, что влияет на просматривае- мость — пока остаются без ответа. Проанализировав наиболее по­пулярные материалы сайта РБК, который входит в тройку самых популярных онлайн-СМИ России с ежемесячной аудиторией пре­вышающей 25 млн читателей, можно приблизиться к получению ответов на эти вопросы.

Работа автора основана на анализе более тысячи материалов с сайта РБК (www.rbc.ru), которые за год с 1 июля 2015 г. по 31 июня 2016 г. еженедельно набирали наибольшее количество просмотров. Для составления выборки определялись двадцать самых популяр­ных статей за каждую неделю выбранного периода (т.е. статей, ко­торые за неделю с момента публикации набирали наибольшее ко­личество просмотров). Анализ именно популярных материалов позволил понять, какие статьи имеют наибольшее количество просмотров.

Данные собирались с помощью системы веб-аналитики AT In­ternet. Несмотря на то, что руководство РБК установило и другие системы веб-аналитики, такие как Google Analytics и Яндекс.Ме- трика, именно показатели счетчика AT Internet департамент мар­кетинга и руководство сайта в рассматриваемый период использо­вали как основной для того, чтобы отследить поведение аудитории сайта. Каждое утро встречи в редакции начинались с обсуждения данных по трафику сайта в целом и читаемости отдельных статей.

Руководство редакции (главный редактор, его заместители и ре­дакторы отделов) каждое утро получали отчет о двадцати самых читаемых и пяти самых нечитаемых статьях за предыдущий день с указанием нескольких ключевых характеристик для каждой из них: количестве просмотров, среднем времени чтения и источни­ках трафика. Доступ к этим отчетам могли получить и другие со­трудники редакции, например журналисты, которым было инте­ресно, как аудитория взаимодействует с их материалами.

Среди данных, которые позволяет получить счетчик AT Inter­net, есть, например, информация о посещаемости каждого мате­риала, среднем времени, которое читатели проводили за его чте­нием, поведении после - покинули они сайт или перешли по одной из гиперссылок на сайте, предлагающих ознакомиться с другими материалами (об источниках трафика, количестве пере­постов и т.д.). Помимо этих данных, автор также выявил для ана­лиза факторы, которые теоретически могли оказывать влияние на интерес аудитории к отдельным статьям.

Так, одним из наиболее значимых факторов, определяющих интерес к материалу, является его тематика. В первую очередь, она отражается в рубрике, в которую попадает материал. На сайте РБК существует 6 тематических рубрик: «политика», «экономика», «финансы», «технологии и медиа», «бизнес» и «свое дело».

Кроме того, тематика материала отражается в его заголовке, поэтому автор подробно анализировал заголовки выбранных статей. Для начала все заголовки были разделены на четыре типа, согласно делению, которое существует в редакции РБК. Первый тип заголовка - «новостной» - коротко и максимально подробно обозначает, какая информация содержится в статье. Это классиче­ский пример заголовка новости, построенной по принципу пере­вернутой пирамиды - все самое важное читатель узнает уже из первых строк, авторы статей с такими заголовками надеются, что читатель заинтересуется обозначенной проблемой и откроет мате­риал, чтобы прочитать подробности. Приведем пример такого за­головка: «Сеть Kira Plastinina получила десятки исков на общую сумму в 45 млн руб»1.

Второй тип заголовка - «открытый». Его цель - заинтриговать читателя, поэтому автор пытается сохранить в таком заголовке ин­тригу. Например: «ЦБ отозвал лицензию у двух банков»2. Боль­шинству читателей, у которых есть депозиты в банках, скорее все­го, будет интересно, не об их ли банке идет речь. Другой пример: «“Когалымавиа” назвала "единственную разумную причину разру­шения" А321»3. Что это за проблемы - из заголовка непонятно, но, теперь мы знаем, что они есть, и нам интересно, о чем пойдет речь в статье. Открытый заголовок - это почти всегда выбор авто­ра, ведь для таких заметок можно было бы легко подобрать соот­ветствующие новостные заголовки, которые звучали бы, напри­мер, так: «ЦБ отозвал лицензии у Эл Банка и Мострансбанка»; «“Когалымавиа” назвала внешнее воздействие единственной воз­можной причиной крушения А321».

Третий тип заголовка - «двухчастный». Он обычно использует­ся в неновостных жанрах, материалах, где автор пытается проана­лизировать и объяснить какие-то события, тренды и т. д. Первая часть в таком заголовке - более образная, метафоричная, вторая - более содержательная, дающая читателю понять, о чем пойдет речь в статье. Нередко такие заголовки используются в авторских колонках, и тогда первая часть может отражать отношение автора к тому, о чем написан материал. Приведем несколько примеров таких заголовков: «За Сирию, за Асада: когда и зачем Москва ре­шила воевать», «Удар на $44 млрд: во сколько может обойтись конфликт России и Турции»4; «Новая реальность: что ожидает россиян и бизнес после обвала рубля»5.

Наконец, четвертый тип заголовка - это «заголовок-цитата». Чаще всего используется для обозначения интервью, например: «Вагит Алекперов — РБК: «У нефтяников сейчас не остается ни­каких денег»6. Но бывают и исключения, когда таким заголовком обозначают, например, общее настроение или самое яркое выска­зывание из нескольких выступлений, например: «Мы не нуждаем­ся в лекциях»: как страны ЕС бунтуют против правил союза»7.

Заголовки выбранных материалов были также проанализирова­ны по их тональности, чтобы можно было определить, есть ли ка­кая-то зависимость от того, хорошая эта новость или плохая, и ее читаемостью. По этому принципу выделено три типа заголовка: негативные («Центральный банк отозвал лицензию у двух бан­ков»), нейтральные («Греф предсказал скорый отказ клиентов Сбербанка от пластиковых карт») и позитивные («Порошенко предложил объявить в Донбассе перемирие на Пасху»).

Наконец, была проанализирована и зависимость читаемости статьи от длины заголовков и наличия в них слов-маркеров, привле­кающих внимание читателей. Для того чтобы выделить такие сло­ва, автор проанализировал тексты заголовков и выявил наиболее часто встречающиеся слова (приложение 1). Как оказалось, это слова «Путин» (178 раз), «Сирия» (106 раз), «Украина» (94 раза), «Россия» (88 раз), «США» (69 раз). Автор также проанализировал вероятное влияние этих слов на популярность статьи среди чита­телей сайта РБК.

Еще один «тематический» фактор, влияние которого анализи­ровал автор, — это попадание материалов в сюжеты, которые ре­дакция РБК создавала, когда происходили какие-то важные собы­тия, требующие долгого освещения с помощью большого количества материалов. К таким сюжетам в анализируемый пери­од относились, например, «Война в Сирии», «Украинский кри­зис», «Валютный кризис» и т.д. Названия сюжетов отражаются в верхней части сайта РБК, и, открывая любой из них, читатель по­падает на страницу со всеми материалами по интересующей его теме — от коротких новостей до развернутых аналитических статей и авторских колонок.

Анализировалась и общественная значимость материала с точки зрения формирования общественной повестки. Исследователи Reuters Institute так описывают разделение на «жесткие» и «мяг­кие» новости (hard/soft news): первые обычно относятся к важней­шим для общественной жизни темам, таким как политика, эконо­мика, международные отношения и т.д. В то время как «мягкие» новости менее значимы с общественной точки зрения, к ним от­носят, например, материалы о стиле жизни (lifestyle), развлечени­ях и т.д.

Кроме того, автор рассматривал в качестве одного из факторов «эксклюзивность» материалов. Речь идет об имеющей обществен­ную значимость информации, которую журналисту удалось до­быть раньше всех.

Еще один важный фактор, влияющий на читаемость материа­ла, — его жанровая принадлежность. Под журналистскими жанрами подразумеваются «устойчивые типы публикаций, объединенных сходными содержательно-формальными признаками» (Тертыч­ный, 2000). Издание чаще всего работает с небольшим числом форматов (Амзин, 2013). Поэтому при анализе выбранных статей автор взял за основу жанровое разделение, которое принято в РБК. В результате, среди анализируемых материалов оказались статьи девяти жанров:

♦ новость — короткое сообщение, построенное по принципу перевернутой пирамиды и содержащее ответы на шесть ос­новных вопросов (кто? что? где? когда? почему? каким образом?);

♦ заметка - сообщение, содержащее, помимо описания сути события и ответов на основные вопросы, подробный рас­сказ о нем с деталями и бэкграундом;

♦ фичер - история, написанная от третьего лица, но дающая возможность пережить случившееся (Колесниченко, 2008);

♦ интервью - жанр, который представляет собой диалог ре­портера с одним человеком или несколькими, представля­ющими интерес для зрителей или читателей;

♦ расследование - «материал, основанный, как правило, на собственной работе и инициативе, на важную тему, кото­рую отдельные лица и организации хотели бы оставить в тайне» (Уллмен, 1998);

♦ репортаж - освещение события/мероприятия непосредст­венно с места событий;

♦ онлайн-трансляция - относительно новый жанр интернет- журналистики, который выходит не единым материалом, а небольшими отрывками, при этом предлагая «максимально документальную передачу и максимально жесткое совпаде­ние вещания по времени с тем, что происходит» (Лосева, 2016);

♦ фотогалерея - жанр, представляющий собой объединенные в одной статье фотографии с места события, которое имело яркую визуальную составляющую;

♦ мнение - жанр, представляющий собой высказывание при­глашенного эксперта на злободневную тему.

Следующий фактор, который анализировался автором, всегда остается под пристальным вниманием руководства РБК - это источники трафика. Анализировались два основных источника, которые приносят сайту РБК большую часть просмотров - пря­мые заходы, заходы с новостных агрегаторов. При прямых заходах пользователи переходят на сайт из «закладок», сделав ее стартовой страницей или набрав прямой адрес сайта в адресной или поиско­вой строке. Такой тип поведения считается наиболее ценным и интерпретируется как относящийся к сверхлояльной аудитории, ядру медиаресурса (Лосева, 2016). Второй источник - новостные агрегаторы, в основном Яндекс Новости и Новости Google. При благополучном стечении обстоятельств трафик с агрегаторов спо­собен удвоить суточную аудиторию даже такого крупного интер­нет-СМИ, как РБК.

Анализировались также показатели лояльности пользователей: внутренние переходы, время, проведенное за чтением статьи, и количество перепостов статей в социальных сетях. Внутренние пе­реходы отражают долю посетителей сайта, которые не покидают его, прочитав один материал (показатель отказов), а переходят на другие статьи по расположенным на странице ссылкам. В свою очередь, глубина прочтения говорит о высоком уровне вовлеченно­сти аудитории и активном взаимодействии с ресурсом. Чтобы рас­считать этот показатель, автор вычислял время, которое бы потре­бовалось на прочтение статьи среднестатистическому читателю. Для этого он делил количество слов в каждом материале на сред­нее количество слов, которое человек может прочесть за минуту (120), получив предполагаемое время чтения. Наконец, для опре­деления вовлеченности читателей среднее время чтения, которое все читатели, открывшие статью, провели за ее просмотром, дели­лось на предполагаемое время чтения. Чем выше показатель, тем интереснее материал. О том, что статья показалась читателям ин­тересной и полезной, говорят и перепосты в социальных сетях - с их помощью пользователи пытаются привлечь внимание друзей к заинтересовавшему их материалу.

Наконец, автор попытался найти зависимость количества просмотров материалов от дня недели, в который они были опу­бликованы, и времени публикации.

Для анализа влияния различных факторов на читаемость статьи было решено провести регрессионный анализ. Используя данный метод и удалив 10% аномальных наблюдений (чтобы избавиться от проблемы аномальных наблюдений), удалось получить много ин­тересных и статистически значимых результатов. Мы предлагаем линейную модель с константой:

бвапвпиви5.png

Где:

•        Words - количество слов в заголовке;

•        Big topic - индикатор того, что тема попала в большой сю­жет;

•        Reposts — количество репостов статьи в соцсетях;

•        Key words — наличие ключевых слов в заголовке (Путин, Сирия, Россия, Украина, США);

•         Soft — общественная значимость;

•        G — жанр статьи;

•        MD — тон заголовка;

•        R — рубрика;

•        CV — включает ряд стандартных для подобных исследова­ний контрольных переменных для исключения проблемы эндогенности:

- месяц публикации статьи (m: );

- день публикации статьи (d: 7);

- время публикации статьи, 12 двухчасовых интервалов (t: );

- предположительное время чтения статьи (est_read);

- показатель внутренних переходов (ent_rate);

- количество прочтений от пользователей, пришедших через прямой трафик (drct_traff);

- количество прочтений от пользователей, пришедших по ссылкам с новостных аггрегаторов (indrct_traff).

В данной модели выполняются все необходимые условия для выполнения регрессии:

1. Топ статей определяется случайным образом, исключительно исходя из предпочтений читателей сайта РБК.

2. Были учтены все возможные измеряемые количественные факторы, которые могли повлиять на читаемость материа­лов.

3. Входящие в модель переменные независимы друг от друга.

4. Условие нулевого математического ожидания ошибок вы­полняется автоматически, так как модель имеет константу.

В заключение стоит отметить, что из-за включения в выбор­ку только статей, попавших в список самых читаемых, некор­ректно обобщать оценки, полученные в данной работе, без по­правки на смещение. С высокой долей вероятности полученные в данной работе оценки смещены вверх, из чего можно сделать вывод о более низком влиянии исследуемых факторов на читае­мость статей. Чтобы определить смещение, необходимы допол­нительные данные, достать которые на данном этапе не пред­ставляется возможным. Однако полученные оценки хорошо отражают влияние факторов на читаемость популярных статей и являются состоятельными, несмещенными и лучшими оцен­ками в классе линейных.

Результаты анализа

Как отмечалось выше, веб-аналитика нужна, в первую очередь, для того, чтобы анализировать существующие в поведении аудито­рии веб-сайтов тренды. Созданная автором модель помогает по­нять, какие факторы влияют на читаемость статей на одном из ос­новных онлайн-СМИ России — сайте РБК.

В анализируемую выборку попало больше тысячи статей. Из них больше половины — 53% относились к рубрике «политика», еще 14% — к «обществу», по 10% — к «бизнесу» и «финансам», 9% — к «экономике». Меньше всего популярных статей оказалось в ру­брике «технологии и медиа» — всего 4%, причем среднее количество прочтений материалов этой рубрики также оказалось минималь­ным — 346 тысяч просмотров (против 385 тысяч просмотров в сред­нем по выборке) (см. табл. 1).

бвапвпиви6.png

Среднее количество слов в заголовке анализируемых материа­лов составило 8,5 слов. Среди них оказалось 53% материалов с «новостными» заголовками, 32% материалов с «открытыми» заголовками, 11% материалов с «двухчастными» заголовками и только в 4% статей использовались «заголовки-цитаты». При этом боль­шинство статей имеют или негативный (51%), или нейтральный (40%) заголовок, на материалы, которые имеют позитивные заго­ловки приходится только 9% анализируемых статей (см. табл. 2).

бвапвпиви7.png

В выборку попали материалы девяти жанров, причем подавля­ющее большинство — 67% относилось к жанру «новости». Также в выборке много заметок (24%). Все это неудивительно, учитывая, что именно эти жанры являются базовыми для сайта РБК и требу­ют меньше всего времени на создание. Остальные жанры либо требуют долгой работы для написания материала (например, рас­следования или фичер), либо используются только тогда, когда происходят какие-то выходящие из ряда вон события (например, онлайн-трансляции и фоторепортажи), поэтому их в выборке меньше (см. табл. 3).

бвапвпиви8.png

Стоит отметить, что статьи публикуются достаточно равномер­но в течение рабочего дня. Большая часть материалов, получив­ших максимальное количество просмотров, была опубликована в промежуток с 10 утра до 18 часов вечера (54%), меньше всего — с полуночи до 8 утра (6,7%). Публикации по рабочим дням также довольно равномерно распределены. При этом в выходные вышло только 10% материалов, которые попали в выборку (см. табл. 4).

бвапвпиви9!.png

Средняя глубина прочтения анализируемых материалов соста­вила 6 минут, средний процент внутренних переходов с этих мате­риалов - 63% (т.е. только 37% людей, которые просмотрели мате­риал из выборки, уходят с сайта РБК, остальные продолжают чтение, перейдя по одной из предложенных ссылок).

Для статей, попавших в выборку, средний показатель прямых пе­реходов составляет 12%, переходов из новостных агрегаторов - 20%. Только 14% попавших в выборку статей оказались эксклюзивными, при этом 70% материалов оказались общественно значимыми. Сред­нее количество перепостов анализируемых статей - 628.

Таким образом, отвечая на поставленный выше Вопрос 1 о том, какие материалы оказываются самыми читаемыми на сайте РБК, можно отметить, что это в основном новости и заметки, связан­ные с общественной и политической тематикой. Чаще всего это материалы с негативными или нейтральными заголовками, боль­шинство из них затрагивают общественно значимые вопросы.

Дальнейшие результаты регрессионного анализа, проведенного автором, можно увидеть в таблице 5. Стоит отметить, что в своих выводах автор фокусируется только на тех факторах, которые ока­зались значимыми по итогам используемой модели (иначе говоря, выводы, приведенные далее, верны в 90-99% случаев). Остальные факторы получились статистически незначимыми, то есть полу­ченной оценке можно доверять менее чем в 90% случаев. Однако это не означает, что они не влияют на количество прочтений. При получении более полных данных (например, данных по всем ста­тьям РБК, а не только по попавшим в список самых читаемых) эти факторы также могут стать значимыми.

бвапвпиви11.png

Как мы видим, попадание статьи в рубрики «экономика» и «биз­нес» при прочих равных увеличивает количество просмотров. Если материал относится к рубрике «бизнес», его откроют на 6,1% (или на 23,6 тысячи) больше читателей сайта, если к экономике - на 4,8% (или на 18,7 тысяч). Попадание в остальные рубрики - поли­тика, общество, технологии и медиа, бизнес и свое дело - не дает статистически значимых результатов. При этом, как показал ана­лиз, попадание материалов в крупные тематические сюжеты на по­пулярность материала на сайте РБК не влияет. Влияние обществен­ной значимости на просматриваемость материалов минимальна: анализ показывает, что при прочих равных условиях статьи, кото­рые относятся к незначимым, просматривают на 0,2% меньше.

Как показал регрессионный анализ, тип заголовка не оказыва­ет особого влияния на показатель просмотров. Незначимым ока­зался и фактор «тональности» заголовка. Согласно модели, стати­стически значимое влияние оказывает только негативный тон, но и оно оказывается почти неощутимым - всего 0,2%. Такое низкое влияние на читаемость подтверждает, что люди больше ориенти­руются на контент, чем на настроение. Стоит отметить, что каждое новое слово в заголовке незначительно уменьшает количество просмотров. По прогнозам модели, добавление каждого нового слова к заголовку статьи на сайте РБК уменьшает количество просмотров на 0,2% (или на ~900 прочтений).

Слова-маркеры в заголовке влияют на количество просмотров. Так, слово «Путин» в заголовке увеличивает, а «Украина» незначи­тельно уменьшает читаемость статьи. Наличие слова «Путин» в за­головке при прочих равных факторах увеличивает количество про­чтений на 3% (или 11,4 тысячи прочтений). В то же время «Украина» незначительно (~1%, или 3 тысячи прочтений) умень­шает количество прочтений при прочих равных. Такие результаты, можно объяснить тем, что люди не хотят пропустить новости о со­бытиях, связанных с президентом страны Владимиром Путиным, так как на подсознательном уровне воспринимают их как важные, и автоматически открывают их, когда видят фамилию президента в заголовке. В то же время тематика Украины значительно утоми­ла читателя, и некоторые новости по этой теме могут намерено пропускаться. Остальные выделенные автором слова-маркеры - «Россия», «США» и «Сирия» - не оказывали статистически зна­чимого эффекта на количество просмотров.

Жанр «мнение» значительно увеличивает читаемость статьи. Анализ показал, что в аудитория РБК предпочитает статьи в жанре «мнение». При прочих равных их прочитает на ~25% больше чита­телей (или ~96,6 тыс. просмотров), чем другие материалы на сай­те. Эта находка ещё раз подтверждает устоявшееся мнение, что се­годня аудитория веб-сайтов отдает предпочтение не «журналистике факта», а «журналистике мнений».

Анализ показывает, что каждый репост статьи, при прочих рав­ных факторах, увеличивает количество прочтений в 2,5 раза. Учи­тывая, что среднее количество репостов у анализируемых статей равно 628, можно сделать вывод, что в среднем благодаря репостам статьи читают на полторы тысячи человек больше. Этот вывод сов­падает с интуицией: каждый репост статьи увеличивает число лю­дей, которые узнают о существовании статьи, следовательно, увели­чивается количество потенциальных читателей. Поэтому активное продвижение статьи в социальных сетях приносит прирост в коли­честве прочтений, хотя и не очень значимый.

Таким образом, отвечая на Вопрос 2 о том, какие факторы ока­зывают влияние на популярность материалов, можно отметить, что положительное влияние на количество просмотров при про­чих равных оказывает попадание в рубрики «экономика» и «биз­нес», слово «Путин» в заголовке, принадлежность материала к жанру «мнение» и большое количество репостов. Отрицательное влияние оказывает слово «Украина» в заголовке, добавление но­вых слов, которые делают заголовки чересчур длинными, и низкая общественная значимость материалов.

Заключение

Появившиеся два десятилетия назад системы веб-аналитики сегодня могут рассказать почти все об аудитории онлайн-изданий. Открывая любую страницу, посетитель оставляет «цифровой след», который позволяет владельцам сайта, имеющим доступ к веб-метрикам, понять, как он ее нашел (зайдя на сам сайт, увидев ссылку в одном из новостных агрегаторов или в социальных сетях и т.д.), как долго просматривал, покинул ли сайт после прочтения материала или решил продолжить изучение других статей на сай­те, поделился ли прочитанным с друзьями и т.д. Благодаря таким «следам», редакции и руководство средств массовой информации получили возможность очень точно и быстро измерять предпочте­ния своей аудитории.

Такая возможность имеет важное значение для любого СМИ, ведь от количества просмотров зависит экономическая состоя­тельность подавляющего большинства изданий. Поэтому в выиг­рыше оказываются редакции, которые лучше понимают свою ау­диторию и ее предпочтения, выраженные уже не в смутных интуитивных ощущениях, а в четких количественных показателях.

Приблизиться к пониманию аудитории помогает анализ самых популярных материалов одного из крупнейших веб-сайтов стра­ны. С его помощью мы можем понять, какие же статьи пользуют­ся наибольшей популярностью. Работа автора основана на анали­зе более тысячи материалов с сайта РБК (www.rbc.ru), которые за год с 1 июля 2015 г. по 31 июня 2016 г. еженедельно набирали наи­большее количество просмотров. Для осуществления анализа ав­тор также выявил факторы, которые теоретически могли оказы­вать влияние на интерес аудитории к отдельным статьям - от рубрики и типа заголовка до попадания статьи в один из крупных тематических сюжетов и ее общественной значимости. Получен­ные данные обрабатывались с помощью регрессионного анализа, а сделанные выводы оказались верны в 90-99% случаев. Перечи­слим основные итоги:

• несмотря на то что большинство статей, попавших в выбор­ку, были посвященны политическим и общественным со­бытиям, регрессионный анализ показал, что попадание в рубрики «бизнес» и «экономика» при прочих равных увели­чивает потенциальное количество просмотров;

• попадание материалов в крупные тематические сюжеты, тип заголовка, его тон, а также жанровая принадлежность практи­чески не влияют на популярность статей на сайте РБК;

• при этом добавление каждого нового слова к заголовку ста­тьи уменьшает количество просмотров, но незначительно: при переходе большинство читателей ориентируется на контент заголовка, а не на количество слов в нем;

• значимое влияние оказывает наличие слов-маркеров. На­пример, слово «Путин» в заголовке при прочих равных факторах увеличивает количество прочтений на 3%, а слово «Украина» незначительно (~1%,) уменьшает количество прочтений.

Примечания

1 http://www.rbc.ru/business/22/07/2015/55af9b1e9a79470b7922870d

2 http://www.rbc.ru/finances/05/05/2016/572ae14e9a79475fee178fbc

3 http://www.rbc.ru/society/02/11/2015/563730199a7947cf10134658

4 http://www.rbc.ru/politics/30/09/2015/560bffdd9a794744eb92da3b

5 http://www.rbc.ru/economics/20/01/2016/569f8f9c9a79474677892137

6 http://www.rbc.ru/interview/business/20/01/2016/569fa24f9a79475cf2473e51

7 http://www.rbc.ru/photoreport/06/07/2016/577bbf789a79475798cd46eb

Библиография

Амзин А. Новостная интернет-журналистика. М.: Аспект-пресс, 2011.

Колесниченко А.В. Практическая журналистика: учеб. пособие. М.: Изд-во Моск. ун-та, 2008.

Кройчик Л.Е. Система журналистских жанров // Основы творческой деятельности журналиста / ред.-сост. С.Г. Корконосенко. СПб: Знание, СПбИВЭСЭП, 2000.

Лосева Н. Аудитория новых медиа // Как новые медиа изменили жур­налистику. Екатеринбург: Гуманитарный университет, 2016.

Мелихов Д., Сарматов И. Веб-аналитика: шаг к совершенству. К.: Ана­литик Интеллект Сервис, 2010.

Тертычный А.А. Жанры периодической печати. Учебное пособие. М.: Аспект Пресс, 2000.

Уллмен Дж. Журналистские расследования: современные методы и техника. М., 1998.

Яковлев А., Довжиков А. Веб-аналитика: основы, секреты, трюки. СПб.: БХВ-Петербург, 2010.

Anderson C. W. (2011) Between creative and quantified audiences: Web metrics and changing patterns of newswork in local US newsrooms. Journalism 12 (5).

Boczkowski P. J. (2004) Digitizing the news: Innovation in online newspapers. Cambridge, MA: MIT Press.

Boczkowski PJ., Peer L. (2011) The choice gap: The divergent online news preferences ofjour-nalists and consumers. Journal of Communication 61 (5).

Gans H. J. (2004) Deciding what’s news: A study of CBS Evening News, NBC Nightly News, Newsweek, and TIME. New York, NY: Pantheon.

Garber M. (2011) Newsbeat, Chartbeat’s news-focused analytics tool, places its bets on the entrepreneurial side of news orgs. Nieman Journalism Lab.

Hamilton J. (2004) All the News That’s Fit to Sell: How the Market Transforms Information into News. Princeton University Press.

Kaushik A. (2009) Web Analytics 2.0: The Art of Online Accountability and Science of Customer Centricity. Sybex.

Lee A. M., Lewis S.C., Powers M. (2014) Audience clicks and news place­ment: A study of time-lagged influence in online journalism. Communication Research 41 (4): 505–530.

Lowrey W. (2009) Institutional roadblocks: Assessing journalism’s response to changing audiences. Journalism and citizenship: New agendas.

McGregor P. (2007) Tracking the online audience. Metric data start a subtle revolution. Journalism studies 8 (2).

Napoli P. M. (2010) Audience evolution: New technologies and the transforma­tion of media audiences. New York, NY Columbia University Press.

Schultz I. (2007) The journalistic gut feeling: Journalistic doxa, news habitus and orthodox news values. Journalism Practice 1 (2).

Shoemaker P. J. (1991) Gatekeeping. Newbury Park, CA: SAGE. 

Shoemaker P. J., Vos T. P. (2009) Gatekeeping theory. New York, NY: Routledge.

Singer J.B. (2010) Quality control: Perceived effects of user-generated content on newsroom norms, values and routines. Journalism Practice 4 (2).


Поступила в редакцию 21.04.2017