Публикации по теме 'analytics'


Использование анализа логистической регрессии для прогнозирования погашения кредита Lending Club с использованием R
В этом исследовании мы предскажем, вернет ли заемщик кредит или нет, и если нет, то какие факторы, влияющие на это решение, являются статистически значимыми. Сначала мы проведем некоторый описательный анализ, а затем запустим некоторые модели логистической регрессии, оптимизируем их, получим их скорректированные значения R в квадрате, а затем запустим эти модели на данных обучения и тестирования и получим оценки точности для наилучшей выбранной модели. Мы будем прогнозировать переменную..

Вы все еще используете JupyterLab?
В городе Data Science появился новый продукт премиум-класса. Он имеет превосходную помощь при кодировании, отладку и многое другое ... Стоит ли переходить? Любите их или ненавидите, одно можно сказать наверняка - Jupyter Notebooks фактически стали стандартом для Data Science. Пока продукт неплохой, но есть и недостатки. Многие из них были устранены JupyterLab с добавлением вкладок , диспетчера расширений , тем и редактора ярлыков . Как активный пользователь JupyterLabs, я..

Искусство инженерии данных и ETL
Инжиниринг данных — это самый важный и первый шаг к науке о данных. Он сочетает в себе как часть сбора данных, так и часть анализа. Все ваши гипотезы и скрытые тенденции проверяются данными. Это очень похоже на общение с данными и получение ответов . Например, вы спрашиваете свой набор данных о диабете: «Эй, это заболевание чаще поражает мужчин или женщин?», и данные ваших хороших друзей всегда найдут для вас ответ. Всегда . Но чтобы сделать данные вашим партнером в анализе, вам..

Как вы можете спасти свою фирму финансовых услуг от потери права выкупа?
Как вы можете спасти свою фирму финансовых услуг от потери права выкупа? В последние годы неработающие активы стали серьезной головной болью для банковских организаций. Согласно недавнему отчету, безнадежные кредиты достигли нового максимума в 9,8 крор. Если экономический цикл не восстановится достаточно быстро, количество безнадежных кредитов может увеличиться в геометрической прогрессии в ближайшем будущем. Хотя на крупные корпоративные дома приходится основная часть NPA,..

Как аналитика делает диск лучше
Как аналитика делает диск лучше Это обновленная версия моей публикации All Analytics за 2016 год. Я включил изображения из презентации, которых нет в исходной публикации. Если бы когда-либо и существовал боевой клич при найме профессионалов-аналитиков, он, безусловно, был бы самым громким из заявлений исследователей, стоящих за автономными транспортными средствами. Данные, полученные от этих транспортных средств, генерируют тонны данных, которые интерпретируются для управления..

Планирование экспериментов в области науки о данных
Наука о данных Планирование экспериментов в области науки о данных Процесс проектирования экспериментов по сбору данных Введение Данные играют центральную роль в науке о данных и машинном обучении. Чаще всего мы предполагаем, что данные, которые будут использоваться для анализа или построения моделей, легко доступны и бесплатны. Иногда у нас может не быть данных, и получить полный набор данных либо невозможно, либо сбор данных занимает слишком много времени. В этом случае нам..

Ускорьте свой исследовательский анализ данных с помощью профилирования Pandas
Получите интуитивное представление о структуре ваших данных с помощью всего одной строчки кода Вступление При первом импорте нового набора данных первое, что нужно сделать, - это получить представление о данных. Это включает в себя такие шаги, как определение диапазона конкретных предикторов, определение типа данных каждого предиктора, а также вычисление количества или процента пропущенных значений для каждого предиктора. Библиотека pandas предоставляет множество чрезвычайно..