Привет, дорогой друг!
Как может помочь обучение на Hexlet участию в хакатоне по Data Scienсe? Да очень просто. Главное подобрать правильный хакатон. На который хватит ваших сил и рвения, благо, сейчас их предостаточно.
Недавно мы с другом увидели рекламу о запуске нестандартного хакатона "NEW DATA TECH", который организовала платформа Digital Leader. Нестандартность заключалась в том, что заданием на работу было:
- Сформулировать оригинальную/смешную/креативную гипотезу.
- Выбрать датасет.
- Проанализировать данные.
- Визуализировать результат.
По сути - пустое поле для полета фантазии. Основной момент, который зацепил, это необязательность серьезной математической или научной обоснованности гипотезы, да и самой работы.
Грубо говоря задание звучало так, ребята, сделайте что-то прикольное, по возможности красивое и умное. Забегу сразу вперед, мы выбрали что-то одно :D
При работе над проектом нужно было использовать открытые данные, найденные в сети, или собранные самостоятельно. В основном именно в этом, как мне кажется, и была трудность у многих ребят — найти прикольный датасет и сформулировать не менее прикольную гипотезу к нему.
Идея пришла практически сразу, нужно сделать что-то про велосипедистов, ну знаете, пристрастие к педальному другу и все дела. Поиски интересного датасета заняли немалое количество времени. Итогами поиска стал данный веб-ресурс, на котором ребята собирают данные об авариях из официальных источников ГИБДД, так что данным можно доверять. Но, к сожалению, открытых API у данного ресурса нет. А если делать ручной веб-скрейпинг, то это как-то скучно, долго — мы же все-таки не зря учили на Хекслете JS, верно?
Да, наконец, мы пришли к тому, что обучение дало свои плоды — написали скрипт, который вы можете посмотреть вот тут. С его помощью мы собрали данные о количестве ДТП с участием велосипедистов в Москве, на каждый день в промежутке с начала 2015 года по конец 2019 года.
Образовались два вопроса, первый довольно банальный: когда безопаснее ездить на велосипеде, летом или зимой? А второй, чуть более интересный, какой день недели самый травмоопасный для велосипедиста?
Для ответа на первый вопрос мы просто посчитали данные помесячно и сделали простой график. Для второго вопроса мы посчитали количество ДТП подневно, разбивая промежуток на 5 лет. Далее вычислили среднее значение и медиану у числовых рядов, которые у нас образовались.
Вроде бы готово.
Осталось только как-то интересно стилизовать или визуализировать. Вспомнилась старая классная игра, в которую многие из нас играли, ещё на кнопочных телефонах (да, такие были) - Gravity Defied.
Собственно, придумано - сделано. Результаты и полная работа тут. Не садитесь в среду на велосипед, во всяком случае в Москве! Кстати, победитель хакатона выбирается зрительским (онлайн) голосованием, и я не могу не попросить у вас, членов коммьюнити Hexlet, помощи.
Голосовать за нашу работу, а так же увидеть полученные у нас графики, можно кликнув сюда. Нужно нажать на сердечко и зайти через гугл или соцсеть.
Так как до конца голосования остался 1 день, важен каждый голос, и твой, мой дорогой друг, тоже. Спасибо! Вариант