О чем речь?

Один из первых примеров визуализации большого объема данных можно встретить уже в 1821 году. Появившееся в тот год английское издание The Guardian выпустило разворот со сведенными данными по стоимости обучения мальчиков и девочек в школах Манчестера.

Сегодня департаменты дата-исследований существуют во многих крупных мировых изданиях — The GuardianThe Washington PostThe New York TimesFinancial Times и др.

Зачем (и кому) это нужно?

Журналистика данных (data-journalism) — направление в журналистике, в основе которого лежит сбор, анализ и обработка данных для создания медиаматериалов.

Цель остается прежней — предоставить информацию читателям и рассказать о важных событиях или явлениях. В качестве источника используются не мнения экспертов или пресс-релизы, а данные. Основная задача дата-журналиста — превратить их в понятную историю и красивый визуальный продукт. Технологии и современные инструменты визуализации помогают создават интерактивные карты, графики, и даже персонализированные элементы.

Инструментарий, который используют дата-журналисты, достаточно универсален: навыки работы с данными будут полезны не только в СМИ, но и при работе с корпоративными медиа, клиентскими рассылками при создании отчетов для презентации вовне — то есть везде, где необходимо представить большой объем данных наглядно и убедительно.

Где лежат открытые данные?

Пользователи до сих пор с трудом представляют, какой объем информации на самом деле они оставляют на хранение сайтам компаний, сервисам, онлайн-магазинам. Не обязательно даже открывать браузер, чтобы оставить свой цифровой след, — достаточно установить на телефон простой шагомер, и данные обо всех ваших перемещениях окажутся тщательно зафиксированы на сервере где-то за океаном.

Есть и более фундаментальные данные — например, те, что генерируются государственными органами. Результаты выборов, данные о покупках и перемещении — все это может быть использовано в медиаматериалах.

В России действует закон, согласно которому каждое министерство обязано выкладывать часть своих информационных данных в открытый доступ. Таким образом, любой человек может проверить реестр памятников культурного наследия на сайте Минкульта или каталог пестицидов на сайте Министерства сельского хозяйства. Вопрос только в том, сможет ли исследователь задать правильные вопросы и сделать выводы.

Что искать?

Данные можно собирать для конкретной темы. Дата-журналистика — это своего рода исследование: данные помогают журналисту подтвердить или опровергнуть выбранную гипотезу.

Но история может возникнуть и из готового набора данных. Например, дата-журналист, исследуя массив данных, может увидеть тенденцию или контраст, заметить неожиданные выбросы или обнаружить на первый взгляд невидимые связи. Начиная свое исследование, дата-журналист может заранее не знать, что именно он ищет. Иногда достаточно правильного вектора, а интересный угол зрения появится в процессе.

Что делать с собранными данными?

Собранные данные непременно нужно очистить. Даже если речь идет об официальной выгрузке, всегда найдется место несоответствиям или ошибкам. Корректному анализу мешают пропуски, дубли, аномальные или противоречивые значения, ошибки ввода и т. д.

После этого исследователь погружается в аналитику. На данном этапе уже важно хорошо понимать, кто целевая аудитория вашего исследования и что вы хотите ей рассказать.

Когда все инсайты найдены, а выводы сделаны, нужно подготовить качественную визуализацию проекта, взять комментарии у экспертов, которые ответят на вопрос «Почему?», и «упаковать» историю.

4 дневный интенсив для медиатренеров (ТоТ) по дата-журналистике помог журналистам, блогерам, аналитикам и медиаменеджерам научиться работать с данными и создавать с их помощью продукты для медиа. В основе программы лежит идея о том, что можно работать с данными и визуализацией, не будучи программистом или дизайнером. В ходе занятий участники научились видеть истории в данных, заниматься парсингом (сбором), очисткой и анализом данных самостоятельно, обрабатывать и визуализировать данные без навыков программирования, собирать на основе полученных результатов истории.