Публикации по теме 'analytics-vidhya'


Прецизионная классификация рака молочной железы с использованием нейронных сетей
Введение 1.1 Предыстория 1.2 Цели Сбор и обработка данных 2.1 Источник данных и описание 2.2 Загрузка и исследование данных 2.3 Предварительная обработка данных Исследовательский анализ данных 3.1 Обзор набора данных 3.2 Анализ отсутствующих значений 3.3 Статистические показатели 3.4 Целевое распределение переменных Разработка функций 4.1 Извлечение признаков 4.2 Выбор функций 4.3 Масштабирование функций Построение модели нейронной сети 5.1 Архитектура..

Модель линейной регрессии в наборе данных о продолжительности поездки в такси в Нью-Йорке с использованием Python
Анурадха прошла курс Прикладное машинное обучение и представляет свой проект в популярном наборе данных NYC Taxi Trip Duration. Это продолжение предыдущей истории исследовательского анализа данных на том же наборе данных. Если вы еще не проверяли его, я настоятельно рекомендую вам сначала проверить это. Он может быть найден здесь". Использованный набор данных можно скачать здесь . Здесь мы продолжим с того места, где мы уехали. Краткий обзор выполненного EDA. Загрузили..

Тест на нормальность с Python в науке о данных
Тест Шапиро-Уилка, тест Андерсона-Дарлинга, критерий К-квадрата Д’Агостино Содержание: - Тест Шапиро-Вилка Тест Андерсона-Дарлинга К-квадрат Д’Агостино 1. Тест Шапиро-Вилка. Тест Шапиро – Уилка - это тест на нормальность в частотной статистике . Его опубликовали в 1965 году Сэмюэл Сэнфорд Шапиро и Мартин Уилк . Тест Шапиро-Уилка используется для вычисления статистики W, которая проверяет, происходит ли случайная выборка x1, x2,…, xn (конкретно) из нормального..

5 лучших проектов GitHub по науке о данных и обсуждения на Reddit
Ознакомьтесь с основными разработками в области машинного обучения и обработки данных с открытым исходным кодом за апрель 2019 г. Введение Наука о данных — это постоянно развивающаяся область. Как специалисты по данным, мы должны держать руку на пульсе новейших алгоритмов и фреймворков, появляющихся в сообществе. Я считаю GitHub отличным источником знаний в этом отношении. Платформа помогает мне быть в курсе последних тенденций науки о данных. Я также могу искать и загружать код..