Публикации по теме 'deep-dives'


Простое и полное руководство по A / B-тестированию
Практические руководства Полное руководство по проектированию, реализации и подводным камням A / B-тестирования Сквозное A / B-тестирование ваших экспериментов в области Data Science для нетехнических и технических специалистов с примерами и реализацией Python A / B-тестирование, также называемое сплит-тестированием , основанное на рандомизированных контрольных испытаниях в статистике, является одним из самых популярных способов для предприятий протестировать новые функции UX,..

99 уроков по анализу данных от топ-5 из 5 задач Kaggle Analytics
(Большой) мастер-класс: как подойти к задаче Kaggle Analytics Я должен согласиться с критиками: задачи аналитики Kaggle лишь отдаленно связаны с написанием реальных отчетов по анализу данных. Но мне они нравятся, потому что они могут многому вас научить основам рассказывания истории с помощью данных. Проблемы Kaggle Analytics лишь отдаленно связаны с написанием реальных отчетов об анализе данных. Но [...] они могут многому вас научить […]. Эта статья изначально должна была..

Process Mining для оценки поведения пользователей приложения на основе данных о посещаемости
Углубленное введение в библиотеку python pm4py Некоторое время назад я написал статью , описывающую некоторые полезные запросы, которые можно запустить по данным события потока кликов, чтобы собрать некоторые полезные идеи. Эту статью можно считать ее естественным преемником, поскольку (а) мы будем работать над набором данных аналогичного типа (поток кликов) и (б) с той же основной мотивацией (собрать некоторые идеи). Однако мы переключимся с грубой аналитики, такой как..

Прогнозирование оттока клиентов с помощью текста и интерпретируемости
Промышленные записки Прогнозирование оттока клиентов с помощью текста и возможности интерпретации Предсказание, если клиенты захотят уйти, и понимание того, почему. Авторы Даниэль Херкерт , Тайлер Мюлленбах Репозиторий кода, сопровождающий это сообщение в блоге, можно найти здесь . Отток клиентов, потеря текущих клиентов - проблема, с которой сталкивается широкий круг компаний. При попытке удержать клиентов в интересах компании сосредоточить свои усилия на клиентах, которые..

Оценка F1
Все, что вам нужно знать о счетах F1 в машинном обучении. С примером применения оценки F1 в Python. Представляем счет F1 В этой статье вы узнаете о счете F1. Оценка F1 - это показатель машинного обучения, который можно использовать в моделях классификации. Несмотря на то, что существует множество показателей для моделей классификации, в этой статье вы узнаете, как рассчитывается оценка F1 и какие преимущества дает ее использование. Оценка f1 - это предлагаемое улучшение двух..

Обработка нехватки данных при создании приложений для машинного обучения
Практические приемы для запуска приложения с нуля Дефицит данных - это когда а) имеется ограниченное количество или полное отсутствие помеченных обучающих данных, или б) недостаток данных для данной метки по сравнению с другими метками (также известный как дисбаланс данных). Более крупные технологические компании, как правило, имеют доступ к большому количеству данных, хотя могут столкнуться с дисбалансом данных. Небольшие технологические компании обычно страдают от ограниченной..

Анализ журналов путешествий цифровых кочевников с помощью Neo4j Graph Data Science
Используйте платформу Neo4j Graph Data Science для анализа моделей путешествий цифровых кочевников и прогнозирования новых возможных маршрутов. Пару дней назад я наткнулся на сетевые визуализации журналов путешествий , сделанные Pieter Levels на его сайте NomadList . NomadList - это веб-сайт, который создает инфраструктуру, чтобы помочь цифровым кочевникам жить в любой точке мира и общаться с единомышленниками. Поэтому я спросил Питера в Твиттере, может ли он поделиться базовыми..