Публикации по теме 'data-analysis'


Параметры в R Markdown
Учебник | R | Параметры R Markdown Гибкая отчетность с R Markdown Использование параметров для быстро воспроизводимого анализа Все мы были на собрании, на котором кто-то спрашивает: «Можете ли вы провести этот анализ еще раз для другого периода времени», или: «Можете ли вы запустить его для группы B вместо группы A», или «можете ли вы прислать мне это? анализ, чтобы я мог поиграть с ним? " Есть некоторые проблемы, с которыми мы часто сталкиваемся, пытаясь выполнить эти запросы...

Практический анализ данных с помощью Pandas: Global Terrorism Database
Pandas Groupby & Crosstab и Folium & Basemap Глобальная база данных по терроризму (GTD) ведется Национальным консорциумом по изучению терроризма и реагированию на терроризм (START). Файл базы данных, используемый в этой записной книжке, можно скачать со страницы Kaggle (доступен в формате .csv). Он состоит из данных о террористических атаках во всем мире с 1970 по 2017 , включая более 180 000 атак и 100 характеристик. GTD определяет терроризм как - «Угроза или фактическое..

Объяснение линейной регрессии (в R)
Объяснение остатков, суммы квадратов остатков, простой линейной регрессии и множественной линейной регрессии с кодом на R Линейная регрессия - одна из первых концепций, которые мы изучаем в области науки о данных и машинного обучения. Тем не менее, многих смущает линейная регрессия и связанная с ней общая терминология. В этой статье мы шаг за шагом исследуем линейную регрессию. Мы обсуждаем остатки, сумму квадратов остатков (или ошибок), простую и множественную линейную регрессию и..

Не просто делайте заметки - превращайте их в статьи и делитесь ими с другими
Интервью с Алексеем Григорьевым, автором книги Machine Learning Bookcamp Серия интервью, посвященных невероятной работе писателей в области науки о данных и их пути письма. Хотя мудро учиться на опыте, разумнее учиться на опыте других . - Рик Уоррен Приведенная выше цитата Рика Уоррена подчеркивает важность обучения у других. В контексте науки о данных это еще более важно. Многие из нас (включая меня) получили огромную пользу от работы других. Будь то программное..

Учебник по обнаружению аномалий: скрытая сторона машинного обучения
Учебник по обнаружению аномалий: скрытая сторона машинного обучения Сложная и обычно необучаемая задача Аномалии постоянно попадают в данные, и их важно распознавать. Будь то попытка взлома или тролль, позволить аномалиям появляться и действовать незамеченными или игнорироваться было бы фатальным. Тем не менее, к сожалению, многие курсы по науке о данных не охватывают всесторонне применения алгоритмов для обнаружения аномалий. Эта сторона машинного обучения особенно неинтересна,..

5 привычек, которым я научился у успешных специалистов по данным в Microsoft
Если подадут заявку, они навсегда изменят вашу карьеру С тех пор, как я начал свою карьеру в области науки о данных в 2016 году, я всегда хотел продолжать учиться и улучшать свои знания по основным аспектам науки о данных. Развитие и опыт - это важные качества хорошей работы , а не только зарплата. Я отвлекся от поиска работы и начал искать опыт работы с данными. С настойчивостью я получил возможность выступить в Microsoft - я правильно знаю, огромная. Команда Microsoft Data..

Последний блог, который вы прочитаете на SVM
Простое, но всестороннее чтение о машине опорных векторов Производительность большинства алгоритмов обучения с учителем в большинстве случаев очень похожа. Однако более важным является масштаб доступных данных и навыки, которыми вы обладаете, такие как разработка признаков или методы регуляризации. Метод опорных векторов или SVM иногда упрощает изучение линейных и нелинейных сложных функций. Давайте теперь попробуем понять, что такое SVM Мы возьмем пример, чтобы..