Графики, которые убеждают всех
Об авторе
Я думаю, инфографика и визуализация данных завораживали меня с раннего детства. У нас дома были детские энциклопедии издательства «Росмэн». Обычно они полны инфографики: вулканы в разрезе, схема Солнечной системы и тому подобное. Подростком я увлекался футболом и футбольной статистикой. Интернет тогда был совсем не развит, и мы с братом создавали свои собственные энциклопедии футбольных чемпионатов, вели турнирные таблицы, рисовали схемы игр на вылет, считали голы, пасы и желтые карточки. Потом эта система перешла и на компьютерные игры.
Когда в 17 лет я поступил в медицинскую академию, то плотно познакомился с одним из наиболее старых жанров инфографики – атласом анатомии. После окончания ВУЗа я стал работать врачом. Казалось, инфографика забыта. Но и во время работы врачом я создавал базы данных пациентов и рисовал схемы лечения.
Вот, например, результаты одного дня профилактических осмотров. Осмотры показаны на пленке ЭКГ (сама ЭКГ никакого отношения к визуализации данных не имеет). Это результаты самого легкого дня – последнего. В первый день было 130 осмотров, потом 112, потом 88. А в последний, изображенный на картинке, – всего 44.
Точка – начало приема. Точка с кружочком – прием с ЭКГ. В предыдущие дни я тоже фиксировал тех, кто приходил. Но оптимальную форму визуализации нашел только в последний день.
В 27 лет я ушел из медицины, поменял ряд других специальностей и окончательно остановился на инфографике и визуализации данных. Год в Санкт-Петербурге руководил мини-студией, специализирующейся на медицинской инфографике. Затем переехал в Москву и стал работать редактором в Студии инфографики сайта РИА.ру. За 2,5 года работы там выпустил больше 50 проектов, завоевал вместе с коллегами несколько международных премий, отточил навыки информационного дизайнера и столкнулся со всем спектром задач по визуализации данных. Во время работы в Студии у меня было правило: «При создании каждого нового проекта осваивать один новый инструмент или прием». Это позволило в короткие сроки овладеть массой различных техник и подходов к визуализации данных.
Мы делали в РИА масштабные проекты, но меня все больше стали привлекать простые графики и диаграммы – оказалось, что они не так просты. Чем больше я погружался в это, тем чаще замечал неудачные, перегруженные, непонятные визуализации данных вокруг. Тогда я создал в Telegram канал «Чартомойка» (chart по-английски – диаграмма), где стал проводить разборы попадавшихся мне графиков.
После ухода из РИА я консультировал бизнес, маркетинг, медиа и НКО в отношении визуализации данных. Работал с крупными компаниями над проектами, связанными с инфографикой и визуализацией данных. В качестве руководителя отдела дата-спецпроектов в РБК занимался в том числе датавиз-дирекшеном – обращал внимание на неочевидные нюансы при визуализации числовой информации.
Последние четыре года много преподаю визуализацию данных и презентации, оценил сотни (может быть, даже тысячи) студенческих работ. С 2019 года преподаю визуализацию данных и дата-сторителлинг на магистерской программе «Журналистика данных» в Высшей школе экономики.
В 2018 году я посчитал и даже визуализировал свои образовательные активности, получилось всего около 70: тренинги, лекции, вебинары. В конце концов, кажется, мне удалось выработать систему обучения и донесения знаний о визуализации данных.
Эта тема не кажется мне узкоспециальной. Она может и должна преподаваться в старших классах школы или на начальных курсах вузов. Умение визуализировать числовую и нечисловую информацию и создавать презентации – один из наиболее распространенных и востребованных сегодня soft skills в самых разных сферах.
Итогом моего погружения в сферу визуализации данных стала эта книга. Хочется надеяться, что для кого-то она станет отправной точкой в повышении культуры графического представления числовой информации и будет способствовать появлению более грамотных и эффективных графиков в нашей стране.
Александр Богачев
Введение
Многие думают, что умеют делать графики в Excel и презентации в PowerPoint. На самом деле 95 % (или даже больше) графиков, которые ежедневно тысячами производят во всем мире, ужасны. Непонятно, кто в этом виноват. Ведь люди учатся на том, что видят вокруг. А вокруг – неудачные, слабые, перегруженные графики, непонятные, не доносящие никакой конкретной мысли. Сделаны они в популярных офисных программах. Все их видят и считают «крутыми», другие люди тоже хотят делать именно так. Производители софта идут навстречу и встраивают подобные шаблоны в свои программы. А большинство людей (и это нормально) пользуется тем, что предлагается по умолчанию. Круг замыкается. На самом деле авторов этих графиков не в чем упрекнуть: они хотят сделать «лучше», «красивее», «ярче».
В докомпьютерную эпоху над каждым графиком, перед тем как его нарисовать, нужно было подумать. Прежде всего решить, нужен он или нет, стоит ли тратить на него столько усилий. И, если нужен, то как сделать его оптимальным образом, максимально наглядно. Сейчас большинство, как говорилось выше, пользуется стандартными настройками программ типа Excel, а график создается буквально за долю секунды. Но насколько этот график и слайд на его основе хороши?
Главное – не просто сделать график, даже корректный. Ваша задача – убедительно и наглядно донести до читателей то, что вы нашли в данных. Сообщение, ключевую мысль или даже историю, которая в них есть. Программа, которая строит график, не знает и не может знать этой истории. Ее можете и должны знать вы.
Однажды я читал статью про биткоин-фермы. Авторы объясняли, что биткоин не так уж безопасен, как принято думать. Оказывается, биткоин-фермы (места, где создается биткоин) объединяются в пулы. Больше 50 % всего производимого биткоина – на совести всего четырех пулов, которые к тому же находятся в одной стране – Китае. Стоит получить контроль над этими четырьмя пулами – и можно вносить фальшивые платежные операции. Эту мысль в статье иллюстрировал чудовищный график:
Кольцевая диаграмма перегружена цветами, выносками, значениями. Скорее всего, она сделана очень быстро, за несколько минут. Но стоит немного ее перекрасить, не меняя остальной информации, – и график начинает рассказывать эту историю, помогая тексту или даже частично заменяя его:
Здесь по-прежнему слишком много лишней информации и не очень аккуратное оформление. Но даже в таком виде этот график гораздо понятнее передает главное сообщение.
Визуализация данных – мощный инструмент для решения различных задач. Важно понимать, какую именно задачу вы пытаетесь решить этим инструментом. Что именно вам нужно показать, рассказать, кого и в чем убедить, какое решение помочь принять?
В этой книге вы не найдете конкретных рекомендаций, как сделать тот или иной график, – с этим легко справятся справка к программе и интернет. Эта книга дает универсальные принципы, которые превратят ваш график из яркой, но, по сути, невнятной картинки в мощный инструмент донесения вашего сообщения. Вы научитесь делать свое сообщение очевидным адресату.
Визуализация данных эффективна настолько, насколько она преподносит данные в понятной для нашего мозга манере. Большинство ошибок в графиках возникает из-за непонимания того, как работают наше зрение, внимание и восприятие в целом. Мелочей здесь нет: подготовка данных, выбор типа представления информации, оформление, заголовки, подписи, аннотации и другое. Все это в совокупности позволяет сделать график корректным, эстетичным и эффективным. Обсуждению данных вопросов и посвящена эта книга. Прочитав ее, вы сможете по-новому взглянуть на создание даже самого простого графика или диаграммы.
Для кого эта книга? Для тех, кто не чувствует уверенности в себе, когда его просят сделать график или несколько диаграмм. Для аналитиков, менеджеров, маркетологов, предпринимателей, студентов, бакалавров, магистрантов и аспирантов, ученых. Для всех, чья жизнь так или иначе соприкасается с визуализацией данных.
Успешный, эффективный график требует знаний из разных сфер: статистики, аналитики, дизайна, собственно визуализации данных и даже журналистики. В этой книге вы найдете основы этих дисциплин и познакомитесь с пошаговым подходом к созданию эффективных, убеждающих графиков.
Глава 1
Пример было/стало. Общее понимание процесса
В большинстве случаев люди не задаются вопросом, как им сделать более наглядный, эффективно работающий или рассказывающий историю график. Они рады тому, что из их цифр в офисной программе в принципе получился хоть какой-то график. К нему применяются те варианты оформления, которые настроены по умолчанию, график вставляется в презентацию, работа кажется выполненной.
Было/стало
Вот типичный график, который мы часто видим в презентациях:
С одной стороны, автор явно старался: слайд выглядит ярким и привлекает взгляд. Применены стандартные шаблоны оформления диаграмм из Excel и PowerPoint.
Но давайте зададим несколько вопросов, чтобы понять, насколько нагляден этот слайд:
1) Представлены ли на нем данные? Да, доля твердых сыров в каждом году графически закодирована углами секторов круговой диаграммы.
2) Насколько точно визуализированы данные? Не очень точно.
Круговая диаграмма сама по себе не особо наглядна: человеческий глаз плохо оценивает разницу площадей и углов. Здесь проблема усугубляется тем, что круговые диаграммы сделаны псевдотрехмерными и показаны в перспективе. Это еще больше искажает форму секторов и кодируемые ими значения.
3) Удобно ли сравнивать данные? Нет, неудобно.
Основное, что хотелось бы сравнить, – доли продаж разных сыров по годам. Это сложно сделать, потому что сектора круговой диаграммы не очень точно представляют данные. Чтобы понять, какой сектор какому сыру соответствует, нужно постоянно сверяться с легендой. А затем проводить мыслительную операцию, пытаясь понять, выросла доля этого сыра или уменьшилась.
4) Очевидны ли выводы? Нет. Что нам нужно понять – сейчас неясно.
Давайте начнем пошагово улучшать этот слайд.
Сначала уберем псевдотрехмерность, проверим, станет ли нагляднее:
Теперь углы секторов более точно показывают значения. Но все же в этой ситуации круговая диаграмма – не самый наглядный способ визуализации. Давайте поменяем его на линейный график:
Кажется, в этом что-то есть! Мы просто изменили вид визуализации – и содержание сразу же стало очевиднее. Мы видим, доля продаж каких сыров выросла и насколько, а каких – упала. Попробуем убрать все, что отвлекает от самих линий и подписей к ним.
Для начала уберем тень:
Поменяем фон на белый:
Уберем агрессивную контрастную сетку:
Значения подписаны возле концов линий. Значит, шкалу тоже можно убрать:
Сдвинем график в левую часть слайда и разместим значения слева и справа от линий:
Нам по-прежнему неудобно сверять цвета с легендой. Давайте поместим названия сыров рядом с линиями:
Теперь попробуем приглушить цвета. Так мы будем обращать внимание на наклон линий, а не на цвет. Именно наклон характеризует, выросла доля или уменьшилась:
Уже почти то, что нужно! Сделаем заголовок более осмысленным:
Теперь зарифмуем заголовок и сам график, сделав более контрастными соответствующие линии:
Забыли важную информацию – источник данных:
Теперь заменим шрифт и расставим блоки более аккуратно.
Точнее и корректнее сформулируем заголовок. В заголовке выделим тем же оттенком синего названия соответствующих сыров:
Теперь попробуем ответить на те же вопросы, которые мы задавали в начале:
1) Представлены ли на слайде данные? Да, данные представлены графически.
2) Насколько точно визуализированы данные? Данные визуализированы точно.
3) Удобно ли сравнивать данные? Да, стало гораздо удобнее.
Этот тип графика называется slope chart – наклонный график. По направлению и степени наклона линий мы мгновенно считываем, увеличилась доля или нет и в какой мере. Мы видим, у каких сыров в каждом году доля больше и насколько, какое место занимает каждый из них. Удобству и скорости сравнения помогают подписи названий сыров возле самих линий. Так нам не нужно тратить время, чтобы сверять цвета с легендой.
4) Очевидны ли выводы? Да, выводы очевидны.
При этом слайд максимально чистый, на нем нет ничего лишнего, что отвлекало бы внимание, каждая деталь играет свою роль. Заголовок помогает сразу считывать график в нужном ключе.
Давайте попробуем понять, что именно мы поменяли, чтобы сделать этот график лучше.
Мы подобрали наиболее подходящий способ визуализации исходя из того, что хотим показать. Убрали лишние, чрезмерно контрастные и отвлекающие внимание элементы. Ввели наглядное цветовое кодирование. Постарались сделать очевидной главную мысль, добавив акценты. Дополнительно подчеркнули это в заголовке.
Именно эти приемы и то, как они работают, мы будем подробно обсуждать дальше.
Этапы работы
Главная задача этой книги – показать каждому, что цель графиков и диаграмм – не просто представить данные визуально, а убедительно и эффективно донести идею, передать сообщение, рассказать историю.
Как в таком случае будет строиться работа над графиком?
Чтобы передать сообщение, нужно сначала его сформулировать. Но перед этим необходимо понять, в рамках какой более глобальной задачи вы осуществляете эту работу, ее формат. Например, вы работаете с данными для подготовки ежеквартального оперативного отчета руководству. Или же у вас «молодая развивающаяся компания», и вы готовите презентацию для питч-сессии с инвесторами. В обоих случаях вы будете стараться насытить презентации разными смыслами, так как преследуете разные цели.
Определившись с задачей и форматом, вы начинаете формулировать сообщение. Для этого вы всеми возможными и нужными способами проводите анализ данных и сочетаете его с собственными знаниями о том, что происходит в нужной сфере. При необходимости подключаете экспертов, чтобы понимать контекст, в котором живут ваши данные.
Следующий этап – найти оптимальную визуальную форму для передачи сообщения. Нужно определиться с типом графика, который окажется максимально наглядным.