Публикации по теме 'feature-selection'


5 простых способов предотвратить переоснащение
Переобучение происходит, когда модель изучает детали и шум в обучающих данных до такой степени, что это негативно влияет на производительность модели на новых данных. Переобучение — очень распространенная проблема, особенно при работе с любыми моделями прогнозирования на основе дерева. К счастью, существуют различные методы, которые помогают нам не попасть в эту ловушку. Удержание Мы оставляем от 20% до 40% данных для тестирования, а не используем все наши данные для обучения...

Лучшие методы выбора функций и разработки
Существует множество способов, с помощью которых ученые, работающие с данными, могут выбирать и разрабатывать функции для повышения производительности своих моделей машинного обучения. В этом эссе мы рассмотрим некоторые из лучших методов выбора функций и проектирования. Выбор признаков — это процесс выбора наиболее релевантных признаков из данных для использования в модели. Это важно, потому что это может помочь уменьшить шум в данных и повысить точность модели. Существует множество..

4 способа усилить выбор функций для вашей следующей модели машинного обучения
Плюс советы по работе с категориальными, числовыми и смешанными данными. Что такое выбор признаков? Выбор функций в машинном обучении — это выбор наиболее важных функций или столбцов в наборе данных. В вашем наборе данных много столбцов, и вы хотите увидеть, какие из них оказывают наибольшее влияние? Вы хотите отказаться от тех, которые не приносят большой ценности? Выполняя выбор функций, вы не только уменьшаете объем данных , которые необходимо обработать для ускорения..

Снижение размерности для машинного обучения
Это моя первая статья о среде. Здесь я дам краткий обзор того, что такое уменьшение размерности, зачем оно нам нужно и как это сделать. Что такое уменьшение размерности? Уменьшение размерности - это просто процесс уменьшения размерности вашего набора функций. Ваш набор функций может быть набором данных с сотней столбцов (то есть функциями) или массивом точек, составляющих большую сферу в трехмерном пространстве. Снижение размерности - это уменьшение количества столбцов до, скажем,..

Когда данные — проклятие для обучения
Данные и обучение похожи на лучших друзей, возможно, обучение слишком зависит от данных, чтобы их можно было назвать друзьями. Когда данных слишком много, обучение обходится дорого, поэтому это больше похоже на отношения между девушкой и парнем. Что ж, не запутайтесь и не беспокойтесь о том, как я сравниваю данные и обучение, это просто мое описание того, что называется уменьшением размерности в машинном обучении. Если серьезно, в этом блоге мы рассмотрим, что такое «проклятие..

«MRMR» объяснил, как именно вы хотели, чтобы кто-то вам объяснил
Хотите улучшить свой выбор функций? «Максимальная релевантность - минимальная избыточность» (он же MRMR) - это алгоритм, используемый платформой машинного обучения Uber для поиска «минимально-оптимального» подмножества функций. MRMR (аббревиатура от Maximum Relevance - Minimum Redundancy ) - это алгоритм выбора функций, который приобрел новую популярность после публикации в 2019 году этой статьи инженерами Uber: Авторы показывают, как - благодаря MRMR - они достигли отличных..

Выбор функций Почему и как объясняется (Часть 1)
понимать влияние избыточности функций и мер обнаружения Машинное обучение - это не только модные модели и сложные алгоритмы оптимизации. Многие Кагглеры, включая меня, счастливы признать поражение, если победитель использовал более продвинутую модель или разработал некоторые блестящие функции, но лишь немногие решились принять поражение в этой ситуации - побежденные простой моделью, обученной с меньшим количеством функций. Да, не все практики признают роль минимализма в обучении моделей...