Публикации по теме 'statistical-analysis'


Разгадка загадки: всегда ли предвзятость и дисперсия конкурируют в машинном обучении?
Введение В постоянно развивающейся сфере машинного обучения и статистического моделирования широко распространенной задачей является достижение тонкого баланса между предвзятостью и дисперсией. Эти два компонента являются основными источниками ошибок, которые могут помешать точной экстраполяции алгоритмов обучения с учителем за пределы их обучающих наборов данных. Рассмотрим финансовое учреждение, пытающееся предсказать риск дефолта по кредиту на основе характеристик клиента. Модель с..

Уменьшение размерности: почему и как?
Мы должны сначала понять размерность, чтобы ясно определить уменьшение размерности. В задачах машинного обучения и классификации на результат классификации влияют различные факторы, свойства которых называются признаками. Эти количества объектов или атрибутов в наборе данных называются измерениями. В данном наборе данных может быть любое количество функций или атрибутов. Часто используется слишком много измерений (функций), чтобы сделать окончательный прогноз в реальных задачах машинного..

Центральная предельная теорема: объясняется просто.
Когда я начал читать о машинном обучении, коммуникациях, концепциях статистики, я встретил много людей, хвалящих гауссовское распределение. появления), которая представляет собой колоколообразную кривую. Причина, по которой распределение Гаусса (нормальное распределение) стало настолько популярным, - это Центральная предельная теорема . Прежде чем пытаться понять CLT, вам следует уяснить три вещи. Распределение вероятности: речь идет о том, как значения случайной..

Статья 4: Роль человеческого наблюдения в автоматизации ИИ
В моей предыдущей статье о трещинах в автоматизированной интегральной схеме Статья 3: Призрачный поиск в пространстве состояний ИИ Сегодня я изучил концепцию поиска в пространстве состояний и был очень впечатлен ее применением на платформах ИИ, таких как… medium.com Я обсуждал использование автоматизации ИИ в отчетах об инцидентах . В ситуациях, которые повторяются в организации, таких как пожар, кража и т. д., автоматизация ИИ имеет..

Тестирование значимости для науки о данных - с реализацией Python
A / B-тестирование - это эксперимент с двумя группами, чтобы установить, какая из двух обработок, например, продукт, обработка и процесс, лучше. В случае, если одна из групп включает стандартное лечение или отсутствие лечения, она называется контрольной группой. В A / B-тесте есть субъект, который обычно случайным образом назначается для лечения. Субъектами обычно являются люди во многих формах, такие как субъект клинических испытаний или посетитель сети. Одним из важных моментов при..