Публикации по теме 'data-analysis'


Быстрое погружение в Pandas для науки о данных
Pandas - это библиотека Python с открытым исходным кодом, построенная на основе NumPy . Это позволяет выполнять быстрый анализ, а также очистку и подготовку данных. Легко представить себе Pandas, просто взглянув на него как на версию Microsoft Excel для Python. Что мне нравится в Pandas, так это то, что он может хорошо работать с данными из самых разных источников, таких как; Лист Excel, файл csv, файл sql или даже веб-страницу. Установка Pandas Если у вас есть Anaconda , вы..

Визуализация данных нам на помощь!
Разные виды сюжетов, которые могут пригодиться! В моей статье Анализ для всего? вы узнали, что такое анализ данных и какие шаги предпринимаются для его выполнения. В моей предыдущей статье вы познакомились со статистикой, необходимой для начала анализа данных. Что ж, на этот раз я решил изменить свои статьи, добавив больше «технического» содержания. ДА, мы собираемся обсудить коды Python, функции и математику, которая за ними стоит. Эй, подождите, не надо уже всем скучать!..

Что делает местоположение плохим для гостя Airbnb?
Исследование показателей местоположения Airbnb Введение Я разработал этот проект как завершающий этап получения сертификата IBM Data Science Professional Certificate. Помимо получения информации о том, что делает местоположение плохим для гостя Airnbn, я смог применить многое из того, что узнал на протяжении всей специализации. Есть много улучшений, которые я хочу сделать, и я должен обновлять этот проект, поскольку у меня есть больше времени. В целом, однако, я могу сказать, что..

Как я предсказывал выживаемость на «Титанике»
Это был мой первый шаг к соревнованиям по KAGGLE . Здесь я делюсь своим подходом к решению титанического набора данных на kaggle , и в итоге я получил точность 79,90. Цель: выяснить, какие люди, скорее всего, выживут. В частности, с помощью машинного обучения мы прогнозируем, кто из пассажиров пережил трагедию. Форма: 891 ряд, 9 элементов. В этом посте я акцентировал внимание на настройке параметров и том, как я добился такой точности, без особого проектирования функций, но с..

База данных v0.4
Первоначально опубликовано 22 сентября 2016 г. Databench v0.4 выпущен . Это серьезное изменение по сравнению с веткой v0.3. Все документации , примеры и демо обновлены. Установите новую версию с помощью pip install --upgrade databench Вот основные моменты: Миграция с Flask на Tornado и вместе с этим переход с шаблонов Jinja2 на шаблоны Tornado. С этим новым бэкендом поддерживаются Python 2.7, 3.4 и 3.5 . В предыдущей версии было много зависимостей, и основная..

Изучите свою деятельность в Uber с помощью R: как анализировать и визуализировать историю ваших личных данных
Узнайте, как вы используете приложение Uber, используя копию своих данных. Возможно, дорогой читатель, вы слишком молоды, чтобы помнить, что раньше единственный способ запросить конкретную транспортную услугу, например, такси, - это поднять руку, чтобы подать сигнал доступному водителю, который, увидев вас, остановится, если он не занят, чтобы отвезти вас к месту назначения, не предварительно спросив, как далеко вы идете, чтобы оценить, принимать ли задание или нет. И без звезд, чтобы..

Введение в моделирование временных рядов в глубоком обучении для начинающих
Люди могут построить что угодно в своем воображении с помощью технологий в современном мире. В древности к людям, способным делать прогнозы, относились как к одаренным людям, благословленным Богом. Но в современном контексте мы можем делать прогнозы со значительными доказательствами в поддержку прогноза. Когда мы рассматриваем приложения для глубокого обучения, они имеют огромный диапазон от простой классификации, регрессионных моделей до обработки изображений, рендеринга видео,..