Зарегистрируйтесь, чтобы продолжить обучение

Визуализация Введение в дата-аналитику

Анализ данных считается удобным и очень полезным инструментом, ведь он позволяет видеть взаимосвязи между элементами. Эти взаимосвязи помогают нам принимать решения на основе информации, не полагаясь только на интуицию.

В уроке «Первая бизнес-задача» мы работали с таблицей по продажам канцелярского магазина с января по март 23 года. В ней содержались данные о трех категориях продуктов: тетради в клетку с 12 листами, тетради в линейку с 12 листами и карандаши. Анализируя их продажи, мы посчитали статические показатели: общий объем продаж, средний чек, валовую выручку.

Эти измерения по-своему полезны, однако они многое скрывают. Например, с первого взгляда на них мы не можем определить, плавно ли шли продажи месяц за месяцем. Не зная этой динамики продаж, мы не сможем отследить проблемы: например, мы не увидим, что основная выручка приходится на зиму, а летом она стремится к нулю.

Что делать в таком случае? Как отследить неравномерную динамику продаж? Для начала нужно скрыть лишние данные — так таблица станет нагляднее.

Сейчас в нашей таблице слишком много данных. Возьмем для примера таблицу продаж за март:

1

Представим, что нам нужно посчитать средний чек. Чтобы подсчитать его, нам не нужны данные о проданных товарных единицах. Мы можем скрыть их, и так мы быстрее считаем требуемый ответ.

Скрывать лишние данные можно двумя способами:

  • С помощью сводных таблиц (pivot tables)
  • С помощью стандартных графиков

Оба способа мы изучим в этом уроке.

Сводные таблицы

Сводными называют таблицы, которые содержат не сырые данные, а уже обработанные — например, сумму покупок или средний чек. Другими словами, они обобщают ваши данные и рассказывают, какая картина была в общем.

Чтобы построить сводную таблицу, нужно выделить таблицу с сырыми данными:

2

Затем мы переходим на вкладку «Вставка» и выбираем «Сводные таблицы»:

3

Дальше откроется меню с выбором страницы для вставки таблицы:

4

Так будет выглядеть чистая страница с новой сводной таблицей:

5

Для настройки сводной таблицы мы будем использовать «Редактор сводной таблицы». Он находится справа:

6

Представим, что мы хотим посмотреть выручку от продаж по клиентам. Для этого можно выбрать «Имя клиента” в качестве строки»:

7

Затем мы выбираем «Наименование продукта» в качестве столбца:

8

Еще нужно выбрать «Сумму» в качестве значений. В итоге мы получим таблицу ниже:

9

Сразу бросается в глаза, что каждый клиент покупал строго одну категорию товаров. Вернемся к изначальной таблице. Там это было не видно:

10

Если не вглядываться, сложно быстро оценить, кто и что покупал. В случае сводных таблиц, все намного проще.

У нас есть информация из столбца, который мы используем в качестве значений. Мы можем выбирать тип агрегации — сумму, среднее или что-то другое. По умолчанию выбрана сумма:

11

Для обзора вариантов нажимаем на кнопку рядом с SUM и видим список доступных функций.

Теперь сделаем таблицу посложнее. Для начала создадим лист в Google Sheets и скопируем в него данные за все три месяца продаж. Назовем его «1 квартал»:

12

Затем создаем сводную таблицу на основе данных листа «1 квартал». Далее мы выводим сумму продаж в разрезе клиента и товара, но уже помесячно.

Давайте посмотрим, в каком месяце и сколько денег принес каждый товар в отдельности. Для этого нужно выбрать два поля в качестве столбца, причем в определенном порядке:

13

Сузим нашу таблицу. Например, мы хотим посмотреть на динамику выручки только от карандашей. Тогда нужно выбрать поле «Наименование продукта» в разделе «Фильтры»:

14

Еще нужно оставить галочку только напротив значения «Карандаш» и нажать «Ок» после этого:

15

Тогда мы получим нашу первую динамику продаж в формате сводной таблицы:

16

Стандартные графики

Анализ табличных данных занимает гораздо больше времени, чем просмотр готовой картинки с анализом. Потому бизнес-пользователи очень ценят емкие и информативные визуализации, которые создают аналитики данных или BI-аналитики.

Построим график на основе созданной выше таблицы с динамикой продаж карандаша за 1 квартал. Для этого выделим месяцы и суммы продаж в созданной сводной таблице:

17

В разделе «Вставка» выберем пункт «Диаграмма»:

18

Мы заранее сузили диапазон значений для построения графика, поэтому на выходе мы получили красивую круговую диаграмму с процентами продаж карандашей, купленных Сидоровым С.С. с января по март:

19

Справа от нее находится меню, в котором можно выбрать диапазон данных для диаграммы:

20

Используя редактор, можно настроить таблицу так, как вам удобно.

Еще существует множество других типов графиков в Google Sheets. Подробнее почитать о них можно в официальной справке Google.

Выводы

В этом уроке мы поговорили о ключевом назначении анализа данных — выявлении закономерностей. Проще всего выявить эти закономерности с помощью сводных таблиц и графиков, которые вы научились строить сегодня.

Открыть доступ

Курсы программирования для новичков и опытных разработчиков. Начните обучение бесплатно

  • 130 курсов, 2000+ часов теории
  • 1000 практических заданий в браузере
  • 360 000 студентов
Отправляя форму, вы принимаете «Соглашение об обработке персональных данных» и условия «Оферты», а также соглашаетесь с «Условиями использования»

Наши выпускники работают в компаниях:

Логотип компании Альфа Банк
Логотип компании Aviasales
Логотип компании Yandex
Логотип компании Tinkoff