Робото-журналистика: вкалывают роботы, счастлив ли человек? | Статьи | Главная

Робото-журналистика: вкалывают роботы, счастлив ли человек?

(№1 [304] 25.01.2016)

Автор: Андрей Мирошниченко

http://texterra.ru/blog/roboto-zhurnalistika-vkalyvayut-roboty-schastliv-chelovek.html

Кибер-журналист против био-журналиста: пока ничья

В мае 2015 года Скотт Хорсли (Scott Horsley), корреспондент NPR в Белом доме и бывший бизнес-журналист, бросил дерзкий вызов пишущему алгоритму Wordsmith компании Automated Insights. «Мы хотели узнать, – пишет NPR, – как наше лучшее перо покажет себя против машины». Поскольку NPR – радио, то био-журналист был достаточно тренирован для быстрого письма. По условиям соревнования, оба противника должны были дождаться публикации финансового отчета сети кафе Denny’s и – вперед... При этом у Скотта было преимущество – ведь он был постоянным клиентом Denny’s. У него там даже была любимая официантка, Женевьев, которая знала наизусть его заказ: сэндвич из яичницы с беконом. Не помогло. Хотя… как судить.

(Скот Хорсли состязается с роботом. Источник: An NPR Reporter Raced A Machine To Write A News Story. Who Won? NPR, May 29, 2015)

Робот управился за две минуты, Скот Хорсли – за семь с небольшим. NPR публикует обе заметки и предлагает читателю своего рода тест Тьюринга – определить, какой текст сгенерирован роботом, а какой – человеком.

(Журналистский «тест Тьюринга». Источник: An NPR Reporter Raced A Machine To Write A News Story. Who Won? NPR, May 29, 2015)

Робот написал, конечно же, левую заметку. В ней очевидно выше плотность цифр, и она суше по стилю. Тогда как Скот, вспомнив то ли меню, то ли Женевьев, подпустил немного необязательной для финансового отчета лирики. Например, вставил фразу: «Рост продаж показывает, что потребители не прочь раскрыть свои бумажники ради блинчиков, яиц и картофельных оладий».

Формально словарь робота больше, поскольку должен включать в себя весь словарный запас языка (это свыше 1 млн слов для английского языка). Словарь образованного англоговорящего человека может достигать 100 тысяч слов. Но робот должен использовать наиболее частотные слова, что и делает его язык «суше». Кроме того, словарь этого робота ограничен еще и финансовой специализацией. Ему и «в голову» не могло прийти, что можно использовать в финансовом отчете кулинарные или спортивные названия (grand slam). Человек же, наоборот, частотностью не ограничен и волен использовать сколь угодно редкие и вычурные слова, расширяя контекст и образность. Более того, человек-писатель потому и писатель, что использует оригинальные образы. Роботу для финансового отчета это просто не нужно.

«But that could change», это может измениться, – пишет NPR. Если хозяин решит скормить Wordsmith массивы более раскованных текстов NPR и слегка подкрутит алгоритм, то «Словесный кузнец» быстро перестроит свою лексику, точнее – расширит границы и принципы ее применения. Это все настраивается.

Кто победил в соревновании? Робот написал быстрее, деловитее. Скот Хорсли, как это ни банально, – медленнее, но человечнее. Аудитория этой заметки – финансисты. Ценна ли для них лирическая вставка про кошельки и блинчики? Покуда читатели еще люди, а не роботы, то, наверное, да, ценна.

В общем, ничья. Хотя две минуты против семи… Для радио, для новостей финансового рынка – это может оказаться критично.

Есенинское состязание жеребенка с паровозом проводилось и в академической среде. В 2012 году Кристер Клирвал (Christer Clerwall), профессор медиа и коммуникаций из университета Карлстад (Швеция), попросил 46 студентов прочитать два спортивных отчета – один написанный роботом, и один – человеком. Человеческая заметка была сокращена до размеров роботической, но и роботическая слегка поправлена редактором: заголовок, лид, первые абзацы – как это обычно делает редактор в СМИ. Студентам было поручено оценить материалы по ряду критериев: объективность, доверие, аккуратность, занудность, интересность, ясность, удовольствие читать, полезность, цельность и т.п.

Результаты показали, что одна заметка выигрывала в одних параметрах, другая – в других. Человеческий текст получил больше баллов по критериям «хорошо написано», «приятно читать». Роботический текст, тоже предсказуемо, получил больше баллов по критериям «объективность», «четкое описание», «аккуратность» и т.п. То есть снова ничья.

Но самое главное, что выявило исследование шведского профессора, – что различия между средним текстом био-журналиста и средним текстом кибер-журналиста незначительны. Это критически важный фактор для оценки будущего и уже настоящего робото-журналистики. Кибер-скептики все время говорят, что робот не может написать лучше человека. Но это неверный подход. «А может, заметке робота не обязательно быть «лучше»? Что если она будет просто достаточно хорошей?» – делится профессор Клирвал своими опасениями с Wired.

Робото-журналистика, третья угроза

Интернет освободил частное авторство. Миллионы людей сами информируют друг друга обо всем на свете. Что самое страшное – бесплатно, но с большим желанием. Да, в интернете полно хлама, но мы потребляем информацию, тщательно подобранную под наши интересы. Контент в сети фильтруется не перед публикацией, а после – в ходе распространения, благодаря вирусному редактору. В результате старые СМИ лишены монополии на формирование повестки. Так что дело не ограничится смертью газет. Интернет угрожает старым СМИ не столько переходом с бумаги на цифру, сколько вовлечением аудитории в авторство.

Другая угроза традиционной журналистике – корпоративные СМИ и прочий контент-маркетинг. Корпорации ведь тоже получили возможность авторства. А значит, им все меньше нужны традиционные СМИ как посредник. Корпорации могут теперь и сами.

И если в среде авторов-любителей контент «улучшается» за счет сотрудничества (вирусный редактор), то корпорации улучшают свою медийность из-за конкуренции за внимание публики. В гонке медийных вооружений они переманивают у СМИ профессионалов, применяют инновации и, что самое главное, переходят от прямой рекламы к социально-значимой тематике. Ведь брендам нужна аудитория: реклама лишь тратит аудиторию, а контент способен ее собирать. И хотя широкой публике эти процессы не очень заметны, но медийность корпораций, развиваясь, наносит традиционным СМИ не меньший ущерб, чем блогосфера.

Однако блогосфера и корпоративная журналистика хотя бы состоят из людей. На несчастную журналистику надвигается третья угроза, бездушная, нечеловеческая. Если блогосфера лишает СМИ подписки, корпорации лишают рекламы, то алгоритмы грозят отнять профессию.

(Источник: Robot Journalism, the Third Threat, by Andrey Miroshnichenko. Human as Media blog, August 18, 2015)

Еще недавно тема робото-журналистики была сильно зарубежной. И в самом деле, тем, кто знаком с бытом российских редакций, довольно трудно представить себе новостные алгоритмы в их обиходе. Но в конце октября «Яндекс» объявил, что создает информагентство, где новости станут писать роботы. Среди редакторов, изможденных борьбой с интернетом и убытками, эта тема вызвала новый приступ смутной тревоги и, конечно, неприятия. «Ну, окей, – говорят те, кто немного знаком с проблемой, – роботы когда-нибудь будут писать спортивные заметки, финансовую аналитику или обзоры погоды. Но на большее они неспособны».

Неверная оценка. Роботы не то что «когда-нибудь будут» писать о погоде, финансах или спорте – они уже вовсю делают это сейчас, причем в умопомрачительных объемах. Соответственно, вопрос в том, будут ли они «способны на большее». Сразу ответ: да.

Заметка о землетрясении и тектонические сдвиги

Это землетрясение вошло в историю журналистики. 17 марта 2014 года в 6.25 утра журналист и программист The Los Angeles Times Кен Швенке (Ken Schwencke) был разбужен подземными толчками. Он подбежал к компьютеру, где в издательской системе его уже ожидала заметка, написанная его алгоритмом Quakebot. Кен пробежал заметку глазами и нажал кнопку «Опубликовать». Так LAT стала первым СМИ, написавшем о землетрясении, – через 3 минуты после толчка. Робот-журналист опередил своих био-коллег.

Алгоритм Quakebot, написанный Кеном Швенке, к тому времени существовал уже два года. Quakebot подключен к ленте американской службы геомониторинга. Из нее он мгновенно берет исходные данные – место, время, амплитуду, сравнивает эти данные с предыдущими землетрясениями в этом районе, тем самым автоматически определяя историческую значимость события. Данные помещаются в подходящий шаблон, и заметка готова. Робот загружает ее в издательскую систему и посылает редактору уведомление. На Пулитцера заметка явно не тянет, зато редактор уже через несколько минут после события имеет готовую публикацию. Остается добавить, что землетрясения входят в перечень горячих новостей Лос-Анджелеса. На сайте Los Angeles Times есть целый раздел Earthquakes, который пополняется роботом-юнкором.

В той же Los Angeles Times робот ведет и другую рубрику – криминальную хронику Homicide Report, причем с 2007 (!) года. Как только полицейский coroner вывешивает в свою базу (она, очевидно, публична) рапорт о чьей-то насильственной смерти, робот берет все данные, помещает их на карту, относит к категориям по расе, полу, причине смерти, участии полицейских и т.п., и публикует заметку с простенькой шаблонной формулировкой в ленту. Далее, если событие того заслуживает, журналист добирает информацию и дописывает развернутую криминальную заметку. А если нет – то нет.

____________________