Вопросы по теме 'sklearn-pandas'

Sklearn SVM: SVR и SVC, получение одинакового прогноза для каждого ввода
Вот вставка кода: образец кода SVM Я проверил пару других ответов на эту проблему ... и похоже, что эта конкретная итерация проблемы немного отличается. Во-первых, мои входные данные нормализованы, и у меня есть пять входов на точку. Все...
8099 просмотров
schedule 21.06.2023

Как построить график коэффициента корреляции между каждым атрибутом набора данных и целевым атрибутом с помощью Python
Я новичок в Python, и мне нужно построить график между коэффициентом корреляции каждого атрибута с целевым значением. У меня есть входной набор данных с огромным количеством значений. Я предоставил образец значения набора данных, как показано ниже....
6134 просмотров

Как получить список бесполезных функций с помощью sklearn?
У меня есть набор данных для создания классификатора: dataset = pd.read_csv(sys.argv[1], decimal=",",delimiter=";", encoding='cp1251') X=dataset.ix[:, dataset.columns != 'class'] Y=dataset['class'] Я хочу выбрать только важные функции,...
612 просмотров

TypeError: неподдерживаемые типы операндов для *: 'PCA' и 'float'
РЕДАКТИРОВАТЬ: Вот заголовок csv данных: Fresh Milk Grocery Frozen Detergents_Paper Delicatessen 0 12669 9656 7561 214 2674 1338 1 7057 9810 9568 1762 3293 1776 2 6353 8808 7684 2405 3516...
1094 просмотров
schedule 21.05.2022

Объедините Sklearn TFIDF с дополнительными данными
Я пытаюсь подготовить данные для контролируемого обучения. У меня есть данные Tfidf, которые были сгенерированы из столбца в моем фрейме данных под названием «объединенный». vect = TfidfVectorizer(stop_words='english', use_idf=True, min_df=50,...
5112 просмотров
schedule 24.04.2023

Прогноз всегда одинаков при использовании Sci-kit Learn SVM
У меня есть набор данных, в котором я пытаюсь предсказать, какая ДНК представляет собой запись данных по составу ДНК. Например, строка ATTAG...ACGAT может быть преобразована в EI . Возможные выходные значения: EI , IE или N . Набор данных...
1674 просмотров

Многовариантная / множественная линейная регрессия в Scikit Learn?
У меня есть набор данных (dataTrain.csv и dataTest.csv) в файле .csv в этом формате: Temperature(K),Pressure(ATM),CompressibilityFactor(Z) 273.1,24.675,0.806677258 313.1,24.675,0.888394713 ...,...,... И может построить регрессионную модель и...
27754 просмотров

Как функции ранжируются в RFECV в scikit Learn (sklearn)?
Я использовал рекурсивное устранение признаков и перекрестную проверку (rfecv), чтобы найти лучший показатель точности для нескольких имеющихся у меня признаков (m = 154). rfecv = RFECV(estimator=logreg, step=1, cv=StratifiedKFold(2),...
4115 просмотров

Фитинг по классификации MLP
Я новичок в машинном обучении и работаю над приложением Python, которое классифицирует покерные руки с использованием набора данных, фрагменты которого я опубликую. Кажется, это не работает хорошо. И я получаю следующую ошибку: Traceback (most...
845 просмотров

Удаление строк с дублирующимся столбцом pandas dataframe (Python)
У меня есть csv, который я прочитал с помощью pandas и создал фрейм данных. Фрейм данных выглядит так: description title lorem ipsum A ipsum lorem A dolor sit amet C amet sit dolor B Он имеет 1034 строки и 2 столбца...
6754 просмотров
schedule 29.09.2023

экспортировать модель в PMML
У меня есть помеченные данные, пара категориальных переменных и две двоичные целевые переменные. заголовок например; column_1,column_2,column_3,column_4,target_1,target_1 как экспортировать в PMML? единственный пример, который я нашел, -...
1009 просмотров
schedule 14.07.2023

Сходство Жаккара для текстов в фрейме данных pandas
Я хочу измерить сходство jaccard между текстами в pandas DataFrame. Точнее, у меня есть несколько групп сущностей, и есть текст для каждой сущности в течение определенного периода времени. Я хочу проанализировать сходство текста (здесь сходство...
2867 просмотров

Обратное кодирование метки дает ошибку
Я закодировал свои категориальные данные в числовые данные с помощью кодировщика меток. data['Resi'] = LabelEncoder().fit_transform(data['Resi']) Но я, когда пытаюсь найти, как они отображаются внутри, используя...
6977 просмотров

Преобразование столбца Pandas Dataframe в одну горячую метку
У меня есть кадр данных pandas, подобный этому: Col1 ABC 0 XYZ A 1 XYZ B 2 XYZ C Используя функцию pandas get_dummies() в столбце ABC, я могу получить следующее: Col1 A B C 0 XYZ 1 0 0 1 XYZ 0 1 0 2...
11378 просмотров

Перекрестная проверка для Sklearn 0.20+?
Я пытаюсь выполнить перекрестную проверку и получаю сообщение об ошибке: «Найдены входные переменные с несовместимым количеством выборок: [18, 1]». Я использую разные столбцы в фрейме данных pandas (df) в качестве функций, а последний столбец - в...
1952 просмотров

Sklearn: как получить среднеквадратичную ошибку при классификации данных обучения
Я пытаюсь решить некоторые проблемы классификации, используя sklearn впервые в Python, и мне было интересно, как лучше всего рассчитать ошибку моего классификатора (например, SVM) исключительно на данных обучения. Мой пример кода для расчета...
2515 просмотров

Уменьшить размер рассола TfidfVectorizer
Мне нужно стандартизировать некоторые параметры для построения векторов на основе текста. Вот почему я пытаюсь собрать TfidVectorizer из группы текстовых документов. На основе этих параметров мне нужно векторизовать новые текстовые документы, и их...
362 просмотров

Использование CountVectorizer Sklearn для поиска нескольких строк не по порядку
Можно ли использовать CountVectorizer для определения наличия набора слов в корпусе независимо от порядка? Он может делать упорядоченные фразы: Как я могу использовать sklearn CountVectorizer с mutliple строки? Тем не менее, в моем случае...
1025 просмотров

Создание выходов случайного леса, таких как логистическая регрессия
Я спрашиваю о размерах и т. Д. Я пытаюсь реализовать эту удивительную работу со случайным лесом https://www.kaggle.com/allunia/how-to-attack-a-machine-learning-model/notebook И логистическая регрессия, и случайный лес взяты из sklearn, но когда я...
1040 просмотров

Как исправить этот пользовательский преобразователь в sklearn?
Я написал этот простой пользовательский преобразователь, который заполняет na в определенных столбцах 0. Когда я использую fit_transform в своем наборе данных, он не заполняет na в указанных столбцах. Мне не удалось увидеть проблему в моем коде....
141 просмотров