Публикации по теме 'grid-search'


Настройка гиперпараметров с помощью поиска по сетке и случайного поиска
Как настроить гиперпараметры в Python и почему вам это должно быть небезразлично Наброски Цель этой статьи - объяснить, что такое гиперпараметры и как найти оптимальные с помощью поиска по сетке и случайного поиска, которые представляют собой разные алгоритмы настройки гиперпараметров. Мы рассмотрим концептуальное объяснение как поиска по сетке, так и случайного поиска, чтобы вы могли понять, какой из них лучше (спойлер, это случайный поиск), а также то, что они делают. Затем мы можем..

Вопросы по теме 'grid-search'

Как избежать использования estimator_params при использовании RFECV, вложенного в GridSearchCV?
В настоящее время я работаю над устранением рекурсивных функций (RFECV) в поиске по сетке (GridSearchCV) для методов на основе дерева с использованием scikit-learn. Для этого я использую текущую версию для разработчиков на GitHub (0.17), которая...
1953 просмотров

ValueError: недопустимая модель параметра для оценщика CountVectorizer при использовании параметров GridSearch
У меня есть конвейер sklearn, который выполняет классификацию текста с использованием двух типов функций: стандартные функции tfidf, созданные с помощью CountVectorizer () и TfidfTransformer () (TfidfVectorizer ()), и некоторые лингвистические...
4441 просмотров
schedule 06.03.2023

Настройка гиперпараметров случайного леса scikit-learn с использованием GridSearchCV
Я пытаюсь использовать случайный лес для своей проблемы (ниже приведен пример кода для наборов данных Boston, а не для моих данных). Я планирую использовать GridSearchCV для настройки гиперпараметров, но каков должен быть диапазон значений для...
11118 просмотров

Поиск по сетке над кубом/сферой в R^n
Я пытаюсь реализовать поиск по сетке (на Python, если это имеет значение) по сфере в R^n , где n неизвестно. Входные данные включают радиус и центр сферы, а также гиперпараметр theta , который управляет разрешением сетки. Я хотел бы выразить...
555 просмотров
schedule 12.06.2022

Вложенные циклы for с использованием многопроцессорности
У меня есть быстрый вопрос относительно многопроцессорности в python. Я провожу поиск в довольно большой сетке по трем параметрам, и вычисления занимают около 14 часов. Я хотел бы сократить это время выполнения, используя многопроцессорность....
962 просмотров
schedule 08.07.2022

Керас: Недостаточно памяти при поиске по сетке гиперпараметров
Я запускаю несколько вложенных циклов для поиска по сетке гиперпараметров. Каждый вложенный цикл проходит через список значений гиперпараметров, а внутри самого внутреннего цикла создается последовательная модель Keras, которая каждый раз оценивается...
6230 просмотров

Как использовать log_loss в GridSearchCV с метками нескольких классов в Scikit-Learn (sklearn)?
Я пытаюсь использовать аргумент log_loss в параметре scoring GridSearchCV , чтобы настроить этот мультиклассовый (6 классов) классификатор. Я не понимаю, как задать параметр label . Даже если бы я дал ему sklearn.metrics.log_loss , он бы...
4532 просмотров

Измените форму pandas.Df для использования в GridSearch
Я пытаюсь использовать несколько столбцов функций в GridSearch с Pipeline. Итак, я передаю два столбца, для которых хочу выполнить TfidfVectorizer, но у меня возникают проблемы при запуске GridSearch. Xs =...
302 просмотров

Scikit-Lean GridSearchCV n_jobs! = 1 замораживание
Я запускаю поиск по сетке в случайных лесах и пытаюсь использовать n_jobs, отличные от одного, но ядро ​​зависает, загрузка ЦП отсутствует. С n_jobs = 1 все работает нормально. Я даже не могу остановить команду с помощью ctl-C, и мне приходится...
1726 просмотров

Как элегантно передать лучшие параметры Sklearn GridseachCV другой модели?
Я нашел набор лучших гиперпараметров для моего оценщика KNN с помощью Grid Search CV: >>> knn_gridsearch_model.best_params_ {'algorithm': 'auto', 'metric': 'manhattan', 'n_neighbors': 3} Все идет нормально. Я хочу обучить свой...
11368 просмотров

Извлеките лучший конвейер из GridSearchCV для cross_val_predict
Как я могу извлечь лучший конвейер из подгонки GridSearchCV , чтобы я мог передать его cross_val_predict ? Прямая передача подходящего объекта GridSearchCV приводит к тому, что cross_val_predict снова запускает поиск по всей сетке, я просто...
3634 просмотров

Как выполнить простой поиск по сетке с помощью Apache Spark
Я попытался использовать класс GridSearch Scikit Learn для настройки гиперпараметров моего алгоритма логистической регрессии. Однако GridSearch, даже при параллельном использовании нескольких заданий, требует буквально дней для обработки, если...
4392 просмотров

Стоит ли метод поиска по сетке для нейронных сетей?
Я успешно попытался применить метод GridSearch для поиска лучших параметров SVM, и теперь я хотел бы применить его к нейронным сетям ( MLPClassifier ), чтобы найти лучшую архитектуру (т.е. количество слоев и нейронов / слой), лучшую активацию...
487 просмотров

Случайный лесной классификатор
Я пытаюсь создать классификатор случайного леса для биномиальной классификации. Может ли кто-нибудь объяснить, почему мои оценки точности меняются каждый раз, когда я запускаю эту программу? Результаты варьируются от 68% до 74%. Кроме того, я...
1774 просмотров

Почему GridSearchCV в scikit-learn порождает так много потоков
Вот вывод pstree моего текущего работающего GridSearch, мне любопытно посмотреть, какие процессы происходят, и есть кое-что, что я пока не могу объяснить. ├─bash─┬─perl───20*[bash───python─┬─5*[python───31*[{python}]]] │ │...
2188 просмотров

GridSearchCV для количества нейронов
Я пытаюсь самостоятельно научиться выполнять поиск по сетке по количеству нейронов в базовых многослойных нейронных сетях. Я использую GridSearchCV и KerasClasifier для Python, а также Keras. Приведенный ниже код очень хорошо работает для других...
3007 просмотров
schedule 15.07.2023

Явное указание наборов тестов / поездов в GridSearchCV
У меня есть вопрос о параметре cv в GridSearchCV sklearn. . Я работаю с данными, в которых есть временной компонент, поэтому я не думаю, что случайное перемешивание в рамках перекрестной проверки KFold кажется разумным. Вместо этого я...
12362 просмотров
schedule 30.10.2022

Альтернативные модели в Pipeline для GridSearchCV
Я хочу построить конвейер в sklearn и протестировать разные модели с помощью GridSearchCV. Приведу пример (не обращайте внимания на то, какие именно модели выбраны): reg = LogisticRegression() proj1 = PCA(n_components=2) proj2 = MDS() proj3 =...
3968 просмотров

Пользовательские преобразователи и GridSearch — ValueError в Pipeline
Я пытаюсь оптимизировать гиперпараметры в конвейере scikit-learn с несколькими пользовательскими преобразователями, но продолжаю получать сообщение об ошибке: from sklearn.model_selection import TimeSeriesSplit from sklearn.model_selection import...
1135 просмотров
schedule 08.02.2023

Экземпляр RandomForestClassifier еще не установлен. Перед использованием этого метода вызовите 'fit' с соответствующими аргументами
Я пытаюсь обучить модель дерева решений, сохранить ее, а затем перезагрузить, когда она мне понадобится позже. Однако я продолжаю получать следующую ошибку: Этот экземпляр DecisionTreeClassifier еще не установлен. Перед использованием этого...
18477 просмотров