Введение в ИИ

Теория: Анализ

Нередко мы работаем с данными, и это касается не только аналитиков. Личный бюджет, банковская выписка, список заказов или отчёт по проекту — всё это примеры, где нужно что-то подсчитать, сравнить или сгруппировать.

Раньше для этого требовались формулы и специальные знания: как посчитать среднее, как отфильтровать строки или построить сводную таблицу. Теперь достаточно сформулировать задачу обычным языком. Можно спросить: «Покажи, в каком месяце траты были максимальными», или «Сколько заказов пришло из каждой категории?».

ИИ понимает такие запросы и выполняет вычисления без сложных команд. Он объясняет, что именно было сделано, показывает результат и помогает сформулировать выводы. Работа с таблицами становится ближе к разговору, чем к программированию.

Вы вставляете фрагмент таблицы:

idгородпокупкипол
1Москва3женский
2Санкт-Петербург0мужской
3Москва1мужской

И спрашиваете:

Какие города самые активные по покупкам? Есть ли разница между полами?

ИИ ответит, что больше всего покупок в Москве, и предположит, что можно сравнить средние значения по полу. Он подскажет, как сгруппировать данные и на какие столбцы обратить внимание.

Вставлять таблицу можно в любом виде — хоть из Excel, хоть из PDF, хоть скопированную из почты. Даже если визуально всё выглядит как каша и отступы съехали, ИИ всё равно поймёт структуру. Главное — чтобы были заголовки и хотя бы пара строк с данными. Если данных много, то их можно сохранить и подключить как файл, в таком случае ИИ сможет их обработать.

Прикрепление файлов к ChatGPT

Для дальнейших примеров, мы возьмем табличку с фильмами. В ней достаточно много данных, чтобы поэкспериментировать.

idназваниежанррейтинггодпросмотрыбюджет (млн $)выручка (млн $)
1Властелин колецфэнтези9.02001125000093871
2Матрицафантастика8.7199998000063466
3Началофантастика8.82010870000160836
4Аватарфантастика7.9200915000002372847
5Интерстелларфантастика8.62014940000165677
6Паразитыдрама8.6201951000011266
7Джокердрама8.52019720000551074
8Гарри Поттерфэнтези8.120011400000125974
9Шреканимация8.0200199000060488
10Король Леванимация8.51994110000045968
11Холодное сердцеанимация7.520139500001501290
12Зеленая милядрама9.1199988000060286
13Побег из Шоушенкадрама9.3199413200002573
14Титаникдрама7.8199716000002002187
15Безумный Макс: Дорога яростибоевик8.12015670000150379

Быстрый обзор данных

Давайте начнём с простых примеров. У нас есть таблица с фильмами — десятки строк, разные жанры, годы, бюджеты и сборы. Прежде чем углубляться в аналитику, стоит задать несколько элементарных вопросов, чтобы почувствовать данные и увидеть общую картину.

Например, можно спросить:

Какие жанры встречаются чаще всего?

ИИ сразу посчитает количество фильмов каждого жанра и покажет распределение. Это поможет понять, на что в таблице сделан акцент.

Анализ таблицы фильмов в ChatGPT. Жанры

Другой простой вопрос:

Какой фильм собрал наибольшую выручку?

Мы увидим, что «Аватар» и «Титаник» заметно выделяются, а значит, это потенциальные аномалии или «точки интереса».

И ещё пример:

В каком году вышло больше всего фильмов из списка?

Такой вопрос помогает найти пики активности и увидеть, как распределены фильмы по времени.

Визуализация

ChatGPT подсказывает, что данные можно сразу визуализировать. Если мы согласимся, то получим красивый график, который можно гибко настроить и скачать.

Анализ таблицы фильмов в ChatGPT. Визуализация

ИИ покажет столбчатую диаграмму: у драм и фантастики столбцы выше остальных, а боевик и анимация заметно меньше. Такой график сразу отражает баланс жанров в таблице.

Ещё пример:

Нарисуй график выручки и бюджета по каждому фильму.

Получится диаграмма с двумя столбцами для каждой строки: бюджет и выручка. Сразу видно, где выручка сильно превышает затраты (например, у «Аватара» или «Титаника»), а где проекты оказались менее прибыльными.

Можно строить и динамику:

Покажи изменение среднего рейтинга фильмов по годам.

ИИ выведет линейный график, на котором точки будут идти от «Короля Льва» и «Побега из Шоушенка» в 90-х к «Джокеру» и «Паразитам» в 2019 году. Это наглядно демонстрирует, что высокие рейтинги есть как у старых фильмов, так и у новых.

Визуализации можно настраивать — выбирать цвета, менять подписи, сохранять картинки для презентаций. Благодаря этому таблица превращается в понятный набор графиков, с которыми проще работать и обсуждать данные.

Подсчёты и агрегирование

Когда базовые вопросы заданы, полезно перейти к подсчётам. Это помогает увидеть обобщённую картину и сравнить разные группы между собой.

Например:

Посчитай общее количество просмотров по каждому жанру.

ИИ суммирует столбец «просмотры» внутри жанров и покажет, что у фантастики и фэнтези аудитория особенно большая.

Другой запрос:

Какой средний рейтинг у фильмов разных жанров?

Результат позволит увидеть, что драмы в среднем получают более высокие оценки, а у анимации разброс шире.

Можно спросить и про деньги:

Как соотносится средняя выручка и средний бюджет по жанрам?

ИИ покажет соотношение, из которого станет понятно, какие жанры чаще «окупаются» — например, анимация при меньшем бюджете иногда приносит огромную кассу, тогда как дорогие фантастические фильмы не всегда показывают такой результат.

Такие агрегированные показатели позволяют быстро понять, где скрываются закономерности, а где — исключения.

Построение простых гипотез

ИИ может проверить простые идеи — какие факторы могут влиять на рейтинг, популярность или сборы фильмов. Такие гипотезы не требуют сложной статистики, достаточно задать прямые вопросы.

Например:

Зависит ли выручка от жанра?

ИИ сгруппирует данные по жанрам и покажет, что у фантастики и драмы больше кассовых хитов, а анимация при меньшем бюджете иногда приносит очень высокую выручку.

Другой вопрос:

Есть ли связь между бюджетом и рейтингом?

Ответ покажет, что крупнобюджетные фильмы вроде «Аватара» или «Титаника» не обязательно получают самые высокие оценки, тогда как драмы с умеренным бюджетом вроде «Побега из Шоушенка» имеют лучшие рейтинги.

Можно проверить и по времени:

Как меняется средний рейтинг фильмов по годам?

ИИ построит временной ряд и покажет, что высокие оценки есть как у старых фильмов («Побег из Шоушенка» 1994 года), так и у новых («Паразиты» 2019 года).

Такие быстрые гипотезы помогают не только заметить закономерности, но и понять, какие переменные стоит сравнивать дальше — бюджет и выручку, жанр и количество просмотров, год выпуска и рейтинг.

Формулировка аналитических запросов

Когда первые выводы сделаны, можно переходить к более точным вопросам. Здесь важно правильно сформулировать запрос — тогда ИИ сможет применить нужные методы: сгруппировать данные, построить фильтр или даже сгенерировать SQL-запрос.

Например:

Покажи топ-5 фильмов с самым высоким соотношением выручка/бюджет.

ИИ рассчитает коэффициент и отсортирует фильмы. Так можно быстро найти самые «окупаемые» проекты.

Другой запрос:

Отфильтруй только фильмы с рейтингом выше 9.

Результат покажет «Побег из Шоушенка» и «Зелёную милю» — сразу видно, какие картины считаются шедеврами.

Можно задать и комбинированный вопрос:

Среди фильмов после 2010 года какие жанры показывают самые высокие рейтинги?

ИИ отфильтрует строки по году, сгруппирует по жанрам и посчитает средние значения.

Такие запросы удобно использовать как в разговорной форме, так и в формате привычных инструментов: SQL, Excel-формул или пайплайнов в BI-системах. Разница в том, что ИИ помогает построить формулировку, а не заставляет держать в голове синтаксис.

Генерация описаний

После того как таблица изучена и сделаны подсчёты, можно попросить ИИ сформулировать краткое описание — своего рода мини-отчёт. Это полезно, если нужно быстро объяснить коллегам результаты анализа или вставить текст в презентацию.

Например:

Составь описание данных по жанрам.

ИИ напишет: «В выборке преобладают драмы и фантастика. У драм самые высокие рейтинги, а у фантастики — наибольшая аудитория. Анимационные фильмы реже встречаются, но отличаются высокой окупаемостью».

Другой запрос:

Сформулируй основные выводы про бюджеты и выручку.

ИИ ответит: «Крупнобюджетные фильмы не всегда показывают лучшие рейтинги. Однако именно они чаще всего приносят миллиардные сборы. В то же время относительно недорогие проекты, как «Паразиты», могут стать кассовыми и получить высокие оценки критиков».

Можно пойти ещё дальше:

Составь краткий обзор для слайда презентации.

ИИ выдаст связный текст с ключевыми цифрами и сравнениями, который можно использовать без дополнительной обработки.

Такая автоматическая генерация описаний экономит время и помогает быстро переходить от чисел к понятным выводам.

Проверка интерпретации

ИИ умеет находить закономерности и формулировать выводы, но всегда важно убедиться, что они корректны. Ошибка может появиться из-за неточных данных, неверного вопроса или слишком смелой интерпретации.

Например:

ИИ говорит, что у фантастики самые большие сборы. А так ли это, если учитывать только фильмы после 2010 года?

При уточнении условий может оказаться, что лидирует уже другой жанр. Это показывает, как важно проверять гипотезы под разными углами.

Ещё один способ проверки:

Сравни вывод ИИ с расчётами вручную.

Можно взять пару фильмов, посчитать средние значения или соотношение «выручка/бюджет» самому и убедиться, что результат совпадает.

А если данные взяты из внешнего источника (например, из базы фильмов или Excel-отчёта), полезно сверить полученные цифры с документацией или исходными таблицами.

Такая перепроверка помогает убедиться, что выводы опираются на факты, а не на случайные совпадения или ошибки в интерпретации.

Ограничения

Работа с ИИ делает анализ данных быстрее и удобнее, но у этого подхода есть важные ограничения.

Во-первых, ИИ может ошибаться в вычислениях или неправильно интерпретировать вопрос. Если задать расплывчатый запрос («какой фильм самый успешный»), он может выбрать фильм по рейтингу, хотя на самом деле речь шла о кассовых сборах.

Во-вторых, многое зависит от качества исходных данных. Если в таблице есть пропуски, дубликаты или ошибки, ИИ построит выводы на их основе. Например, если у фильма указан нулевой бюджет, итоговый анализ окупаемости окажется искажённым.

В-третьих, ИИ иногда «придумывает» данные. Это случается, если таблица неполная или вопрос двусмысленный. Например, он может добавить несуществующие строки или вывести усреднённые значения там, где данных на самом деле не хватало.

Кроме того, ИИ не всегда знает контекст. Он не понимает бизнес-целей компании или специфики отрасли. Для него «успешный фильм» — это набор чисел, а не культурное явление или маркетинговый кейс.

Наконец, ИИ не заменяет полноценный статистический и экспертный анализ. Он помогает сформулировать гипотезы, подсчитать агрегаты, подготовить визуализацию или черновой отчёт. Но окончательные решения требуют проверки вручную, работы с исходными инструментами (SQL, Excel, BI-системы) и учёта предметной области.

Поэтому лучший подход — использовать ИИ как ускоритель работы: он экономит время, подсказывает направления анализа и упрощает подготовку отчётов. Но ответственность за корректность интерпретации всегда остаётся за человеком.

Рекомендуемые программы

Завершено

0 / 8