Куратор раздела

Визуализация и сторителлинг
Зачем аналитику визуализация данных?
Визуализация данных - это графическое представление каких-либо данных, проще говоря, была таблица с миллионами строк и десятками колонок, а стал дашборд из нескольих графиков. Визуализация - важный инструмент аналитика для понимания, анализа и передачи информации. Аналитик работает с большими объёмами данных, в которых сложно увидеть закономерности, тренды или аномалии, пока эти данные представлены в виде таблиц. Визуализация помогает преобразовать эти данные в наглядные образы — графики, диаграммы, дашборды, которые позволяют быстрее и точнее интерпретировать информацию.

Также визуализацию в работе называют BI (Business Intelligence) - совокупность технологий, процессов и инструментов для сбора, обработки, анализа и визуализации данных компании с целью получения ценных инсайтов, повышения эффективности принятия бизнес-решений и увеличения прибыли. Проще говоря, всё, что крутится вокруг визуализации данных: конкретные BI-инструменты, готовые дашборды, данные, на основе которых строятся дашборды и т.д.
BI-аналитик - аналитик, специализирующийся именно на визуализации. В его задачах будет больше работы с графиками, чем у обычного Аналитика данных.
Вот как выглядит типичная таблица, в которой копается аналитик:

Просто смотря на строчки, ты можешь ответить на вопрос Что происходит в этих данных?
Скорее всего нет. А вот как выглядит дашборд, построенный на основе похожей таблицы:

ℹ️ Инфо Данные скрывают много интересного, если их визуализировать. Вот для этого и нужна визуализация аналитику.
Одна из задач аналитика - понятным языком объяснить результаты своей работы бизнес-пользователям. Бизнес-пользователь в компании - это далёкий от технологий и IT человек, например, работник отдела бухгалтерии, финансов, маркетинга, продаж. От таких пользователей часто поступают задачи аналитику в духе "Посчитай, как прошла наша рекламная акция в этом месяце". DoD (Definition Of Done, критерий готовности) будет не csv-выгрузка или таблица в БД (хотя и такое бывает), а дашборд в BI системе с графиками, которые будут отвечать на вопрос бизнеса. И чем понятнее, удобнее и информативнее будет такой дашборд, тем проще будет пользователям принимать свои решения на основе данных, не погружаясь в детали SQL-запросов или структуру баз данных.
Как визуализация помогает в работе?
- Ускоряет анализ: вместо просмотра тысяч строк в таблице можно за секунды увидеть тренд на графике.
- Повышает точность решений: визуальные данные помогают избежать поспешных или ошибочных выводов, так как показывают контекст и динамику.
- Упрощает коммуникацию: отчёт с графиками понятен даже тем, кто далёк от аналитики.
- Помогает выявлять аномалии: резкие скачки или падения на графиках легко заметить, а в таблице — нет.
- Поддерживает data-driven культуру: когда данные доступны и понятны, компания начинает принимать решения на их основе, а не по интуиции.
Процесс создания BI-отчёта
BI-отчёт, сами графики - финальный этап всего процесса визуализации, всего он состоит их следующих шагов:
-
Сбор требований
- Уточните, на какие вопросы дашборд должен помочь ответить и для кого (например: отдел продаж хочет узнать, как изменилась конверсия за месяц, или отдел маркетинга, какие каналы привлекают больше всего клиентов).
- Согласуйте ключевые метрики (KPI) и период анализа. Например, необходим дашборд с данными за последнюю неделю и на нём должна быть отражена конверсия из клика на рекламное объявление в покупку товара.
-
Создание таблиц (подготовка данных)
- На основе требований напишите SQL-запросы или ETL-процесы, которые извлекают все необходимые для работы данные в витрину, на основе которой будут строиться графики.
- Агрегируйте данные: посчитайте суммы, средние, конверсии, динамику.
-
Создание графиков
- На основе подготовленных таблиц выберите подходящие типы визуализации (подробнее далее).
- Постройте графики, соблюдая принципы простоты и ясности.
- Добавьте подписи, легенды, единицы измерения.
-
Тестирование и финализация
- Покажите отчёт заинтересованной стороне, соберите обратную связь.
- Убедитесь, что он действительно отвечает на поставленные вопросы.
Основные виды графиков
Линейный график
Для отображения динамики во времени (например, рост выручки по месяцам). По горизонтали обычно идёт временная шкала (секунда/день/год), по вертикали - выбранная метрика (сумма продаж, кол-во пользователей).
!!! warning "Внимание" Не используйте линейный график для анализа категорий, только для временных рядов, то есть как меняется метрика спустя время.

Столбчатая диаграмма
Для сравнения категорий (например, продажи по регионам).

Круговая диаграмма
Для показа долей в целом, в сумме все доли дают 100% от метрики. Например, разделение на мужчин и женщин.
!!! warning "Внимание" Не используйте круговую диаграмму, если категорий >5, иначе становится сложно визуально определить, какая категория больше другой.

!!! example "Пример" Это - хорошая круговая диаграмма.

!!! example "Пример" Это - плохая, так делать не нужно.
KPI
Key Performance Indicator, Ключевой Показатель Эффективности, а по-человечески, достигли мы цели или нет. Если цель - увеличение метрики и мы её достигли, график будет зелёный/синий, не достигли - красный. И наоборот, если цель - уменьшить метрику.

!!! info "Инфо" На этом графике обратный пример: количество преступлений должно быть меньше, поэтому при уменьшении метрики число окрашивается в синий, при увеличении - в красный.
Таблица / Сводная таблица
Обычная таблица с колонками и строками. В сводной таблице данные агрегированы по срезам, что позволяет проще анализировать данные без дополнительных усилий.

!!! info "Инфо" Эксель - тоже BI.
Тепловая карта
Для визуализации интенсивности. Значения отображаются с помощью цветовой шкалы, от теплых (высокие значения) до холодных (низкие значения). Например, количество кликов на сайте, зоны, в которые пользователи кликали больше всего, будут подсвечены красным тёплым, где меньше - синим холодным.

Гистограмма
Для анализа распределения данных (например, распределение населения по возрасту). Отличается от столбчатой диаграммы тем, что в столбчатой можно выбрать метрику для сравнения (продажи, сумма, среднее), в гистограмме сравнивается только количество чего-либо.
!!! warning "Внимание" Гистограмма отображает только количество записей в каждой категории, без других метрик.

Диаграмма рассеяния
Тип графика, который визуализирует взаимосвязь между двумя числовыми переменными, отображая каждую пару значений в виде точки на декартовой плоскости. Он используется для выявления корреляции, обнаружения выбросов и понимания распределения данных. То есть сравниваются взаимосвязи двух величин.

Карта
Географический ландшафт с какими-либо отметками. Например, карта города с отметками любимых ресторанов.

Видов графиков гораздо больше (диаграмма Санкея, хордовая диаграмма, воронка, пузырьковая, Ганта), но пригождаются они в очень специфичных случаях.
!!! info "Инфо" Столбчатая, круговая, линейная диаграммы и сводная таблица закрывают 90% потребностей в визуализации.

Как правильно делать дашборды?

!!! warning "Внимание" Точно не так.
Если график - это 1 визуализация одного процесса/метрики, то дашборд - это набор графиков на одной странице, который рассказывает историю про конкретный бизнес/продукт/контекст. Основные принципы составления дашбордов:
- Простота и ясность: избегайте перегруженности. Каждый элемент должен иметь смысл. Не нужно пихать 100500 графиков на дашборд без цели. Каждый график на своём месте и реально нужен. Сами графики должны выглядеть максимально понятно, без надписей, перебивающих друг друга, без бесполезных 3D графиков, которые ничего не дают, но усложняют восприятие.
- Фокус на важные метрики: выбирайте только те показатели, которые действительно необходимы для принятия решений, избегая перегрузки информацией. Если вы делаете дашборд по продажам, скорее всего никому не нужен на нём график, который отображает среднее время сессии в приложении.
- Иерархия информации: важные метрики — вверху или слева (по правилу F-образного чтения). Человек просматривает текст/дашборд всегда сверху-вниз слева-направо, в соответствии с этим правилом и расставляйте графики. Наверху слева - основная метрика, внизу справа - дополнительная.
- Единый стиль: используйте одинаковые цвета, шрифты, форматы чисел. Разноцветные буквы и разнообразие шрифтов - это дополнительная когнитивная нагрузка для пользователя дашборда, ему должно быть максимально комфортно читать ваши графики.
- Интерактивность: Все любят фильтрацию и сортировку. Если в дашборде можно фильтровать по дате, региону, категории - это поможет пользователям глубже анализировать данные, а сортировка поможет отобразит самые важные значения.
- Интуитивность: чем проще понять дашборд, тем лучше. Если график называется "Выручка", то пользователь интуитивно подумает, что при положительной выручке график устремится вверх, если это не так - вы что-то сделали неверно. Также и с цветами: зелёный - всё хорошо, проблем нет, KPI выполнен, красный - проблема/поломка/обратить внимание, не наоборот.
- Документация: добавьте краткое описание методологии расчёта метрик, чтобы избежать недопонимания, или общее описание контекста дашборда, чтобы отобразить проблему, которую решает дашборд, его ценность.
Разбор качественного дашборда
Для наглядности рассмотрим дашборд, который вполне могут где-то использовать. Разберём его плюсы и что можно было бы улучшить.

Плюсы дашборда
- Сначала самое важное: Верхний KPI-блок дает быстрый обзор ключевых чисел (продажи, скидки, товары в пути, заявки). Эти метрики отмечены красным цветом как самые ключевые и понятные для бизнеса - бабкибабкибабки.
- Разнообразие визуализаций: Графики, пай-чарты, карты и показатели в одном дашборде дают разные ракурсы анализа. И каждый график отвечает на разные вопросы: круговая диаграмма сравнивает категории, карта отображает разницу по регионам и не нужно вспоминать, где находится Ростов.
- Интерактивность: Есть фильтры по региону, федеральному округу и другим измерениями для более детальной аналитики по конкретным сущностям.
- От общего к частному: Верхний блок — основные показатели, средний блок — сводные индикаторы (выручка, база клиентов), нижний — детальный анализ.
- Наглядные сравнения: Гистограммы по времени (цены, суммы продаж) с наложением предыдущих периодов хорошо отражают динамику.
- Единообразие цветов, шрифтов и размеров: Все графики раскрашены одной спокойной палитрой, все подписи имеют один шрифт и кегль, размеры графиков одинаковые. Когнитивная нагрузка минимальная, пользователь не отвлекается на визуал.
- Текстовая информация: Все графики, категории и метрики подробно (но без наложения текста) подписаны, можно легко сказать, что отображает каждый график.
Минусы и возможности улучшения
- Перегруженность: Много визуальных элементов, дашборд получился очень большим, возможно, можно что-то убрать, чтобы облегчить восприятие.
- Много категорий на пай-чарте: круговая диаграмма содержит 10 категорий, трудно сравнивать категории между собой. Также они неотсортированы по метрике, что ещё больше усложняет чтение графика.