Вопросы по теме 'sklearn-pandas'
Sklearn SVM: SVR и SVC, получение одинакового прогноза для каждого ввода
Вот вставка кода: образец кода SVM
Я проверил пару других ответов на эту проблему ... и похоже, что эта конкретная итерация проблемы немного отличается.
Во-первых, мои входные данные нормализованы, и у меня есть пять входов на точку. Все...
8099 просмотров
schedule
21.06.2023
Как построить график коэффициента корреляции между каждым атрибутом набора данных и целевым атрибутом с помощью Python
Я новичок в Python, и мне нужно построить график между коэффициентом корреляции каждого атрибута с целевым значением. У меня есть входной набор данных с огромным количеством значений. Я предоставил образец значения набора данных, как показано ниже....
6134 просмотров
schedule
20.08.2022
Как получить список бесполезных функций с помощью sklearn?
У меня есть набор данных для создания классификатора:
dataset = pd.read_csv(sys.argv[1], decimal=",",delimiter=";", encoding='cp1251')
X=dataset.ix[:, dataset.columns != 'class']
Y=dataset['class']
Я хочу выбрать только важные функции,...
612 просмотров
schedule
08.06.2023
TypeError: неподдерживаемые типы операндов для *: 'PCA' и 'float'
РЕДАКТИРОВАТЬ:
Вот заголовок csv данных:
Fresh Milk Grocery Frozen Detergents_Paper Delicatessen
0 12669 9656 7561 214 2674 1338
1 7057 9810 9568 1762 3293 1776
2 6353 8808 7684 2405 3516...
1094 просмотров
schedule
21.05.2022
Объедините Sklearn TFIDF с дополнительными данными
Я пытаюсь подготовить данные для контролируемого обучения. У меня есть данные Tfidf, которые были сгенерированы из столбца в моем фрейме данных под названием «объединенный».
vect = TfidfVectorizer(stop_words='english', use_idf=True, min_df=50,...
5112 просмотров
schedule
24.04.2023
Прогноз всегда одинаков при использовании Sci-kit Learn SVM
У меня есть набор данных, в котором я пытаюсь предсказать, какая ДНК представляет собой запись данных по составу ДНК. Например, строка ATTAG...ACGAT может быть преобразована в EI . Возможные выходные значения: EI , IE или N . Набор данных...
1674 просмотров
schedule
26.11.2022
Многовариантная / множественная линейная регрессия в Scikit Learn?
У меня есть набор данных (dataTrain.csv и dataTest.csv) в файле .csv в этом формате:
Temperature(K),Pressure(ATM),CompressibilityFactor(Z)
273.1,24.675,0.806677258
313.1,24.675,0.888394713
...,...,...
И может построить регрессионную модель и...
27754 просмотров
schedule
30.07.2022
Как функции ранжируются в RFECV в scikit Learn (sklearn)?
Я использовал рекурсивное устранение признаков и перекрестную проверку (rfecv), чтобы найти лучший показатель точности для нескольких имеющихся у меня признаков (m = 154).
rfecv = RFECV(estimator=logreg, step=1, cv=StratifiedKFold(2),...
4115 просмотров
schedule
15.10.2023
Фитинг по классификации MLP
Я новичок в машинном обучении и работаю над приложением Python, которое классифицирует покерные руки с использованием набора данных, фрагменты которого я опубликую. Кажется, это не работает хорошо. И я получаю следующую ошибку:
Traceback (most...
845 просмотров
schedule
07.05.2024
Удаление строк с дублирующимся столбцом pandas dataframe (Python)
У меня есть csv, который я прочитал с помощью pandas и создал фрейм данных. Фрейм данных выглядит так:
description title
lorem ipsum A
ipsum lorem A
dolor sit amet C
amet sit dolor B
Он имеет 1034 строки и 2 столбца...
6754 просмотров
schedule
29.09.2023
экспортировать модель в PMML
У меня есть помеченные данные, пара категориальных переменных и две двоичные целевые переменные.
заголовок например;
column_1,column_2,column_3,column_4,target_1,target_1
как экспортировать в PMML? единственный пример, который я нашел, -...
1009 просмотров
schedule
14.07.2023
Сходство Жаккара для текстов в фрейме данных pandas
Я хочу измерить сходство jaccard между текстами в pandas DataFrame. Точнее, у меня есть несколько групп сущностей, и есть текст для каждой сущности в течение определенного периода времени. Я хочу проанализировать сходство текста (здесь сходство...
2867 просмотров
schedule
27.02.2022
Обратное кодирование метки дает ошибку
Я закодировал свои категориальные данные в числовые данные с помощью кодировщика меток.
data['Resi'] = LabelEncoder().fit_transform(data['Resi'])
Но я, когда пытаюсь найти, как они отображаются внутри, используя...
6977 просмотров
schedule
18.07.2022
Преобразование столбца Pandas Dataframe в одну горячую метку
У меня есть кадр данных pandas, подобный этому:
Col1 ABC
0 XYZ A
1 XYZ B
2 XYZ C
Используя функцию pandas get_dummies() в столбце ABC, я могу получить следующее:
Col1 A B C
0 XYZ 1 0 0
1 XYZ 0 1 0
2...
11378 просмотров
schedule
13.07.2023
Перекрестная проверка для Sklearn 0.20+?
Я пытаюсь выполнить перекрестную проверку и получаю сообщение об ошибке: «Найдены входные переменные с несовместимым количеством выборок: [18, 1]».
Я использую разные столбцы в фрейме данных pandas (df) в качестве функций, а последний столбец - в...
1952 просмотров
schedule
01.12.2022
Sklearn: как получить среднеквадратичную ошибку при классификации данных обучения
Я пытаюсь решить некоторые проблемы классификации, используя sklearn впервые в Python, и мне было интересно, как лучше всего рассчитать ошибку моего классификатора (например, SVM) исключительно на данных обучения.
Мой пример кода для расчета...
2515 просмотров
schedule
15.03.2022
Уменьшить размер рассола TfidfVectorizer
Мне нужно стандартизировать некоторые параметры для построения векторов на основе текста. Вот почему я пытаюсь собрать TfidVectorizer из группы текстовых документов. На основе этих параметров мне нужно векторизовать новые текстовые документы, и их...
362 просмотров
schedule
29.12.2022
Использование CountVectorizer Sklearn для поиска нескольких строк не по порядку
Можно ли использовать CountVectorizer для определения наличия набора слов в корпусе независимо от порядка?
Он может делать упорядоченные фразы: Как я могу использовать sklearn CountVectorizer с mutliple строки?
Тем не менее, в моем случае...
1025 просмотров
schedule
08.11.2022
Создание выходов случайного леса, таких как логистическая регрессия
Я спрашиваю о размерах и т. Д. Я пытаюсь реализовать эту удивительную работу со случайным лесом https://www.kaggle.com/allunia/how-to-attack-a-machine-learning-model/notebook
И логистическая регрессия, и случайный лес взяты из sklearn, но когда я...
1040 просмотров
schedule
05.04.2022
Как исправить этот пользовательский преобразователь в sklearn?
Я написал этот простой пользовательский преобразователь, который заполняет na в определенных столбцах 0. Когда я использую fit_transform в своем наборе данных, он не заполняет na в указанных столбцах. Мне не удалось увидеть проблему в моем коде....
141 просмотров
schedule
14.04.2023