Еженедельно обновляемые блоги и инструменты для специалистов по обработке данных.

Наука о данных

Определение проблемы науки о данных

towardsdatascience.com
Ключевым навыком Data Scientist является способность определить, является ли проблема проблемой Data Science, и если да, то какой. Формулировка проблемы включает в себя цель прогнозирования и идеальный результат или использование.

Настройка параметров SVM — к науке о данных

towardsdatascience.com
Метод опорных векторов — один из самых популярных алгоритмов классификации. Подход SVM к классификации данных элегантен, интуитивно понятен и включает в себя очень классную математику. В этом уроке…

5 метрик оценки классификации, которые должен знать каждый специалист по данным

towardsdatascience.com
Все мы создали модели классификации. Много времени мы пытаемся повысить точность наших моделей. Но действительно ли нам нужна точность как показатель производительности нашей модели? Просто скажи ноль все…

Инжиниринг данных

Анализ настроений в Твиттере в режиме реального времени для улучшения бренда и отслеживания тем (глава 3/3)

towardsdatascience.com
В этом учебном пособии вы узнаете, 1) как развернуть всю аналитику данных с аналитикой на платформе облачных приложений Heroku и 2) как перенести визуализацию данных на основе Plotly на аналитическую панель управления…

Рекурсивное преобразование ответов BigQuery JSON API

towardsdatascience.com
Скажите вместе со мной: С вложенным JSON сложно работать!. Я прав? Несомненно! Теперь, когда мы разобрались с этим, позвольте мне просто сказать, что я полностью верю в JSON. Это логично, это…

Все, что должен знать специалист по данным об управлении данными*

towardsdatascience.com
Чтобы стать настоящим специалистом по обработке и анализу данных, или тем, кого многие блоггеры и работодатели называют единорогом, вы должны освоить каждый шаг процесса обработки данных — от хранение ваших данных, чтобы…

Программирование

Python: 7 важных причин, почему вы должны использовать Python

medium.com
Согласно последнему индексу сообщества программистов TIOBE, Python входит в десятку самых популярных языков программирования 2017 года. Python — это язык программирования общего назначения и высокого уровня. Ты сможешь…

30 полезных фрагментов Python, которые вы можете выучить за 30 секунд или меньше

towardsdatascience.com
Python представляет собой один из самых популярных языков, который многие люди используют в науке о данных и машинном обучении, веб-разработке, написании сценариев, автоматизации и т. д. Если вы читаете это, значит, это…

Трюки Python 101, что должен знать каждый новый программист.

towardsdatascience.com
Python популярен как никогда, и люди ежедневно доказывают, что Python — очень мощный и простой в освоении язык. Это то, что я хотел бы знать о Python, когда начинал.

BI и аналитика

Переосмысление анализа экспериментов в Netflix — технический блог Netflix

medium.com
Еще один день, еще один заказной скрипт для анализа A/B теста. Возможно, вы делали это раньше и у вас есть старый сценарий. Если он новый, его настройка, вероятно, займет некоторое время, верно? Нет…

Плюсы и минусы таксономий диаграмм

medium.com
Надежная отправная точка для изучения Dataviz или ненужное творческое ограничение?

Пять типов людей, использующих визуализацию

medium.com
Визуализация способна раскрыть невероятную ценность для своих пользователей, но для этого требуется гармония между типом визуализации и типом пользователя.