Публикации по теме 'grid-search'
Настройка гиперпараметров с помощью поиска по сетке и случайного поиска
Как настроить гиперпараметры в Python и почему вам это должно быть небезразлично
Наброски
Цель этой статьи - объяснить, что такое гиперпараметры и как найти оптимальные с помощью поиска по сетке и случайного поиска, которые представляют собой разные алгоритмы настройки гиперпараметров. Мы рассмотрим концептуальное объяснение как поиска по сетке, так и случайного поиска, чтобы вы могли понять, какой из них лучше (спойлер, это случайный поиск), а также то, что они делают. Затем мы можем..
Вопросы по теме 'grid-search'
Как избежать использования estimator_params при использовании RFECV, вложенного в GridSearchCV?
В настоящее время я работаю над устранением рекурсивных функций (RFECV) в поиске по сетке (GridSearchCV) для методов на основе дерева с использованием scikit-learn. Для этого я использую текущую версию для разработчиков на GitHub (0.17), которая...
1953 просмотров
schedule
08.09.2022
ValueError: недопустимая модель параметра для оценщика CountVectorizer при использовании параметров GridSearch
У меня есть конвейер sklearn, который выполняет классификацию текста с использованием двух типов функций: стандартные функции tfidf, созданные с помощью CountVectorizer () и TfidfTransformer () (TfidfVectorizer ()), и некоторые лингвистические...
4441 просмотров
schedule
06.03.2023
Настройка гиперпараметров случайного леса scikit-learn с использованием GridSearchCV
Я пытаюсь использовать случайный лес для своей проблемы (ниже приведен пример кода для наборов данных Boston, а не для моих данных). Я планирую использовать GridSearchCV для настройки гиперпараметров, но каков должен быть диапазон значений для...
11118 просмотров
schedule
27.05.2022
Поиск по сетке над кубом/сферой в R^n
Я пытаюсь реализовать поиск по сетке (на Python, если это имеет значение) по сфере в R^n , где n неизвестно.
Входные данные включают радиус и центр сферы, а также гиперпараметр theta , который управляет разрешением сетки. Я хотел бы выразить...
555 просмотров
schedule
12.06.2022
Вложенные циклы for с использованием многопроцессорности
У меня есть быстрый вопрос относительно многопроцессорности в python.
Я провожу поиск в довольно большой сетке по трем параметрам, и вычисления занимают около 14 часов. Я хотел бы сократить это время выполнения, используя многопроцессорность....
962 просмотров
schedule
08.07.2022
Керас: Недостаточно памяти при поиске по сетке гиперпараметров
Я запускаю несколько вложенных циклов для поиска по сетке гиперпараметров. Каждый вложенный цикл проходит через список значений гиперпараметров, а внутри самого внутреннего цикла создается последовательная модель Keras, которая каждый раз оценивается...
6230 просмотров
schedule
19.06.2022
Как использовать log_loss в GridSearchCV с метками нескольких классов в Scikit-Learn (sklearn)?
Я пытаюсь использовать аргумент log_loss в параметре scoring GridSearchCV , чтобы настроить этот мультиклассовый (6 классов) классификатор. Я не понимаю, как задать параметр label . Даже если бы я дал ему sklearn.metrics.log_loss , он бы...
4532 просмотров
schedule
01.04.2022
Измените форму pandas.Df для использования в GridSearch
Я пытаюсь использовать несколько столбцов функций в GridSearch с Pipeline. Итак, я передаю два столбца, для которых хочу выполнить TfidfVectorizer, но у меня возникают проблемы при запуске GridSearch.
Xs =...
302 просмотров
schedule
03.07.2023
Scikit-Lean GridSearchCV n_jobs! = 1 замораживание
Я запускаю поиск по сетке в случайных лесах и пытаюсь использовать n_jobs, отличные от одного, но ядро зависает, загрузка ЦП отсутствует. С n_jobs = 1 все работает нормально. Я даже не могу остановить команду с помощью ctl-C, и мне приходится...
1726 просмотров
schedule
24.02.2024
Как элегантно передать лучшие параметры Sklearn GridseachCV другой модели?
Я нашел набор лучших гиперпараметров для моего оценщика KNN с помощью Grid Search CV:
>>> knn_gridsearch_model.best_params_
{'algorithm': 'auto', 'metric': 'manhattan', 'n_neighbors': 3}
Все идет нормально. Я хочу обучить свой...
11368 просмотров
schedule
26.06.2022
Извлеките лучший конвейер из GridSearchCV для cross_val_predict
Как я могу извлечь лучший конвейер из подгонки GridSearchCV , чтобы я мог передать его cross_val_predict ?
Прямая передача подходящего объекта GridSearchCV приводит к тому, что cross_val_predict снова запускает поиск по всей сетке, я просто...
3634 просмотров
schedule
27.05.2023
Как выполнить простой поиск по сетке с помощью Apache Spark
Я попытался использовать класс GridSearch Scikit Learn для настройки гиперпараметров моего алгоритма логистической регрессии.
Однако GridSearch, даже при параллельном использовании нескольких заданий, требует буквально дней для обработки, если...
4392 просмотров
schedule
25.04.2023
Стоит ли метод поиска по сетке для нейронных сетей?
Я успешно попытался применить метод GridSearch для поиска лучших параметров SVM, и теперь я хотел бы применить его к нейронным сетям ( MLPClassifier ), чтобы найти лучшую архитектуру (т.е. количество слоев и нейронов / слой), лучшую активацию...
487 просмотров
schedule
22.07.2022
Случайный лесной классификатор
Я пытаюсь создать классификатор случайного леса для биномиальной классификации. Может ли кто-нибудь объяснить, почему мои оценки точности меняются каждый раз, когда я запускаю эту программу? Результаты варьируются от 68% до 74%. Кроме того, я...
1774 просмотров
schedule
20.11.2022
Почему GridSearchCV в scikit-learn порождает так много потоков
Вот вывод pstree моего текущего работающего GridSearch, мне любопытно посмотреть, какие процессы происходят, и есть кое-что, что я пока не могу объяснить.
├─bash─┬─perl───20*[bash───python─┬─5*[python───31*[{python}]]]
│ │...
2188 просмотров
schedule
27.04.2023
GridSearchCV для количества нейронов
Я пытаюсь самостоятельно научиться выполнять поиск по сетке по количеству нейронов в базовых многослойных нейронных сетях. Я использую GridSearchCV и KerasClasifier для Python, а также Keras. Приведенный ниже код очень хорошо работает для других...
3007 просмотров
schedule
15.07.2023
Явное указание наборов тестов / поездов в GridSearchCV
У меня есть вопрос о параметре cv в GridSearchCV sklearn. .
Я работаю с данными, в которых есть временной компонент, поэтому я не думаю, что случайное перемешивание в рамках перекрестной проверки KFold кажется разумным.
Вместо этого я...
12362 просмотров
schedule
30.10.2022
Альтернативные модели в Pipeline для GridSearchCV
Я хочу построить конвейер в sklearn и протестировать разные модели с помощью GridSearchCV.
Приведу пример (не обращайте внимания на то, какие именно модели выбраны):
reg = LogisticRegression()
proj1 = PCA(n_components=2)
proj2 = MDS()
proj3 =...
3968 просмотров
schedule
04.12.2022
Пользовательские преобразователи и GridSearch — ValueError в Pipeline
Я пытаюсь оптимизировать гиперпараметры в конвейере scikit-learn с несколькими пользовательскими преобразователями, но продолжаю получать сообщение об ошибке:
from sklearn.model_selection import TimeSeriesSplit
from sklearn.model_selection import...
1135 просмотров
schedule
08.02.2023
Экземпляр RandomForestClassifier еще не установлен. Перед использованием этого метода вызовите 'fit' с соответствующими аргументами
Я пытаюсь обучить модель дерева решений, сохранить ее, а затем перезагрузить, когда она мне понадобится позже. Однако я продолжаю получать следующую ошибку:
Этот экземпляр DecisionTreeClassifier еще не установлен. Перед использованием этого...
18477 просмотров
schedule
06.08.2023