Публикации по теме 'data-cleaning'


Профилирование данных — Первое свидание с вашими данными
Знай свои данные — один из фундаментальных принципов надежной науки о данных. Другое название этого — профилирование данных. Я просто называю это первое свидание с вашими данными . Здесь мы расширяем профилирование данных, объясняя следующие четыре шага к получению информации о ваших данных: (1) предварительный просмотр и выбор данных; (2) очистка и подготовка данных; (3) выбор функций и проектирование; и (4) типизация данных для нормализации и преобразования...

Пометка документов временными метками после события
Тематическое исследование Мы хотим использовать свободный текст в медицинских записях, чтобы предсказать, когда у пациента разовьется сепсис. Мы знаем, каким пациентам в конечном итоге был выставлен счет за диагноз сепсис, но мы не хотим включать записи, которые были написаны после того, как у пациента развился сепсис, иначе мы можем обнаружить бесполезные предикторы, такие как «начал курс антибиотиков для лечения». лечение сепсиса». При подозрении на сепсис данные больше не..

Делаем науку о данных ориентированной на данные
Готовность данных - ключ к успеху проектов в области науки о данных. Радка Ерсакова Это кросс-пост из Блога инженерных исследований Института Алана Тьюринга, национального института науки о данных и искусственного интеллекта Великобритании. Вступление Источником многих общих проблем в проектах по науке о данных является большее внимание моделированию, чем данным. Успех проекта в области науки о данных во многом определяется данными и сложным процессом их подготовки для..