Статьи по тематике sklearn-pandas

Вопросы по теме 'sklearn-pandas'

Sklearn SVM: SVR и SVC, получение одинакового прогноза для каждого ввода

Вот вставка кода: образец кода SVM Я проверил пару других ответов на эту проблему ... и похоже, что эта конкретная итерация проблемы немного отличается. Во-первых, мои входные данные нормализованы, и у меня есть пять входов на точку. Все...

8099 просмотров

python scikit-learn sklearn-pandas

21.06.2023

Как построить график коэффициента корреляции между каждым атрибутом набора данных и целевым атрибутом с помощью Python

Я новичок в Python, и мне нужно построить график между коэффициентом корреляции каждого атрибута с целевым значением. У меня есть входной набор данных с огромным количеством значений. Я предоставил образец значения набора данных, как показано ниже....

6134 просмотров

python pandas numpy scikit-learn sklearn-pandas

20.08.2022

Как получить список бесполезных функций с помощью sklearn?

У меня есть набор данных для создания классификатора: dataset = pd.read_csv(sys.argv[1], decimal=",",delimiter=";", encoding='cp1251') X=dataset.ix[:, dataset.columns != 'class'] Y=dataset['class'] Я хочу выбрать только важные функции,...

612 просмотров

python pandas scikit-learn sklearn-pandas feature-selection

08.06.2023

TypeError: неподдерживаемые типы операндов для *: 'PCA' и 'float'

РЕДАКТИРОВАТЬ: Вот заголовок csv данных: Fresh Milk Grocery Frozen Detergents_Paper Delicatessen 0 12669 9656 7561 214 2674 1338 1 7057 9810 9568 1762 3293 1776 2 6353 8808 7684 2405 3516...

1094 просмотров

python scikit-learn sklearn-pandas

21.05.2022

Объедините Sklearn TFIDF с дополнительными данными

Я пытаюсь подготовить данные для контролируемого обучения. У меня есть данные Tfidf, которые были сгенерированы из столбца в моем фрейме данных под названием «объединенный». vect = TfidfVectorizer(stop_words='english', use_idf=True, min_df=50,...

5112 просмотров

pandas numpy sklearn-pandas

24.04.2023

Прогноз всегда одинаков при использовании Sci-kit Learn SVM

У меня есть набор данных, в котором я пытаюсь предсказать, какая ДНК представляет собой запись данных по составу ДНК. Например, строка ATTAG...ACGAT может быть преобразована в EI . Возможные выходные значения: EI , IE или N . Набор данных...

1674 просмотров

python pandas numpy scikit-learn sklearn-pandas

26.11.2022

Многовариантная / множественная линейная регрессия в Scikit Learn?

У меня есть набор данных (dataTrain.csv и dataTest.csv) в файле .csv в этом формате: Temperature(K),Pressure(ATM),CompressibilityFactor(Z) 273.1,24.675,0.806677258 313.1,24.675,0.888394713 ...,...,... И может построить регрессионную модель и...

27754 просмотров

python pandas scikit-learn sklearn-pandas

30.07.2022

Как функции ранжируются в RFECV в scikit Learn (sklearn)?

Я использовал рекурсивное устранение признаков и перекрестную проверку (rfecv), чтобы найти лучший показатель точности для нескольких имеющихся у меня признаков (m = 154). rfecv = RFECV(estimator=logreg, step=1, cv=StratifiedKFold(2),...

4115 просмотров

python machine-learning scikit-learn sklearn-pandas

15.10.2023

Фитинг по классификации MLP

Я новичок в машинном обучении и работаю над приложением Python, которое классифицирует покерные руки с использованием набора данных, фрагменты которого я опубликую. Кажется, это не работает хорошо. И я получаю следующую ошибку: Traceback (most...

845 просмотров

python machine-learning neural-network scikit-learn sklearn-pandas

07.05.2024

Удаление строк с дублирующимся столбцом pandas dataframe (Python)

У меня есть csv, который я прочитал с помощью pandas и создал фрейм данных. Фрейм данных выглядит так: description title lorem ipsum A ipsum lorem A dolor sit amet C amet sit dolor B Он имеет 1034 строки и 2 столбца...

6754 просмотров

python dataframe sklearn-pandas

29.09.2023

экспортировать модель в PMML

У меня есть помеченные данные, пара категориальных переменных и две двоичные целевые переменные. заголовок например; column_1,column_2,column_3,column_4,target_1,target_1 как экспортировать в PMML? единственный пример, который я нашел, -...

1009 просмотров

python sklearn-pandas pmml

14.07.2023

Сходство Жаккара для текстов в фрейме данных pandas

Я хочу измерить сходство jaccard между текстами в pandas DataFrame. Точнее, у меня есть несколько групп сущностей, и есть текст для каждой сущности в течение определенного периода времени. Я хочу проанализировать сходство текста (здесь сходство...

2867 просмотров

python pandas scikit-learn sklearn-pandas similarity

27.02.2022

Обратное кодирование метки дает ошибку

Я закодировал свои категориальные данные в числовые данные с помощью кодировщика меток. data['Resi'] = LabelEncoder().fit_transform(data['Resi']) Но я, когда пытаюсь найти, как они отображаются внутри, используя...

6977 просмотров

python pandas numpy scikit-learn sklearn-pandas

18.07.2022

Преобразование столбца Pandas Dataframe в одну горячую метку

У меня есть кадр данных pandas, подобный этому: Col1 ABC 0 XYZ A 1 XYZ B 2 XYZ C Используя функцию pandas get_dummies() в столбце ABC, я могу получить следующее: Col1 A B C 0 XYZ 1 0 0 1 XYZ 0 1 0 2...

11378 просмотров

python pandas sklearn-pandas one-hot-encoding

13.07.2023

Перекрестная проверка для Sklearn 0.20+?

Я пытаюсь выполнить перекрестную проверку и получаю сообщение об ошибке: «Найдены входные переменные с несовместимым количеством выборок: [18, 1]». Я использую разные столбцы в фрейме данных pandas (df) в качестве функций, а последний столбец - в...

1952 просмотров

python machine-learning scikit-learn sklearn-pandas cross-validation

01.12.2022

Sklearn: как получить среднеквадратичную ошибку при классификации данных обучения

Я пытаюсь решить некоторые проблемы классификации, используя sklearn впервые в Python, и мне было интересно, как лучше всего рассчитать ошибку моего классификатора (например, SVM) исключительно на данных обучения. Мой пример кода для расчета...

2515 просмотров

python pandas scikit-learn sklearn-pandas

15.03.2022

Уменьшить размер рассола TfidfVectorizer

Мне нужно стандартизировать некоторые параметры для построения векторов на основе текста. Вот почему я пытаюсь собрать TfidVectorizer из группы текстовых документов. На основе этих параметров мне нужно векторизовать новые текстовые документы, и их...

362 просмотров

python-3.x pickle size sklearn-pandas tfidfvectorizer

29.12.2022

Использование CountVectorizer Sklearn для поиска нескольких строк не по порядку

Можно ли использовать CountVectorizer для определения наличия набора слов в корпусе независимо от порядка? Он может делать упорядоченные фразы: Как я могу использовать sklearn CountVectorizer с mutliple строки? Тем не менее, в моем случае...

1025 просмотров

python-3.x scikit-learn sklearn-pandas countvectorizer

08.11.2022

Создание выходов случайного леса, таких как логистическая регрессия

Я спрашиваю о размерах и т. Д. Я пытаюсь реализовать эту удивительную работу со случайным лесом https://www.kaggle.com/allunia/how-to-attack-a-machine-learning-model/notebook И логистическая регрессия, и случайный лес взяты из sklearn, но когда я...

1040 просмотров

python scikit-learn sklearn-pandas logistic-regression random-forest

05.04.2022

Как исправить этот пользовательский преобразователь в sklearn?

Я написал этот простой пользовательский преобразователь, который заполняет na в определенных столбцах 0. Когда я использую fit_transform в своем наборе данных, он не заполняет na в указанных столбцах. Мне не удалось увидеть проблему в моем коде....

141 просмотров

python machine-learning scikit-learn sklearn-pandas

14.04.2023

Вопросы по теме 'sklearn-pandas'

Похожие вопросы