Публикации по теме 'categorical-data'


Категориальные признаки в машинном обучении
Категорийные переменные обычно представляются как «строки» или «категории» и имеют конечное число. Например, если вы пытаетесь прогнозировать доход, в наборе данных обычно будут такие функции, как образование, возраст, пол, город и т. д. Эти функции могут принимать такие значения, как: Можем ли мы не использовать данные как есть? Не совсем! Поскольку большинство моделей машинного обучения принимают только числовые переменные, предварительная обработка категориальных..

Способы обработки категориальных данных перед обучением моделей машинного обучения внедрению.
Реализованы популярные техники с использованием Python В своих последних блогах я объяснил типы пропущенных значений и различные способы обработки непрерывных и категориальных пропущенных значений с помощью реализации. После обработки отсутствующих значений в наборе данных следующим шагом была обработка категориальных данных. В этом блоге я объясню различные способы обработки категориальных функций / столбцов вместе с реализацией с использованием Python. Введение. Все..

Как создать категориальную кодировку, которая сэкономит вам массу времени
Сравнение различных стратегий категориального кодирования, обычно используемых в конвейерах предварительной обработки моделей машинного обучения. Это руководство призвано помочь вам выбрать правильную стратегию для вашего приложения. Введение В этом посте будут обсуждаться различные стратегии кодирования категориальных переменных в качестве этапа предварительной обработки, необходимого для разработки надежных моделей машинного обучения. Кодировать категориальные переменные считается..

Руководство по проектированию функций для начинающих… (часть 1)
Привет, ребята, я суровый Джайн. В этом блоге я собираюсь обсудить все необходимые шаги (наиболее распространенные) для комплексной разработки функций в машинном обучении. Инжиниринг признаков — это важный этап в конвейере машинного обучения, однако этот этап редко рассматривается сам по себе. Здесь вы узнаете как теоретическую, так и практическую реализацию этапов разработки функций. "Возможно, я не расскажу обо всех методах, но эти методы помогут вам понять, что такое..

Вопросы по теме 'categorical-data'

Как преобразовать непрерывную переменную в дискретную в R?
У меня есть переменная, которая кодирует идентификатор группы: d <- data.frame(group = c(0,1,0,2,1,3,2,0,1,2), x=c(1.2,2.3,3.2,2.1,1.3,1.5,2.3,0.4,1.3,1.7)) Когда я пытаюсь использовать его в ggplot2 для создания коробчатых диаграмм, я...
34728 просмотров
schedule 10.10.2023

Справочная группа для фиктивного кодирования
Есть ли способ явно указать, какую группу взять в качестве эталонной группы для фиктивного кодирования при моделировании с помощью функции lm в R с использованием категориальных переменных??
1046 просмотров
schedule 18.03.2023

MCA в FactoMineR
Я рисую график MCA с помощью FactoMine R. У меня есть таблицы данных, которые выглядят так: Met Aa Fn Pg Pi Tf Smut Ssob An Csput C1 High N.S. N.S. N.S. High N.S. High High N.S. C2 High...
1295 просмотров

Преобразование коэффициентов в числовые значения в R
У меня есть коэффициенты в R, которые представляют собой диапазоны заработной платы в форме $100,001 - $150,000 , over $150,000 , $25,000 и т.д., и я хотел бы преобразовать их в числовые значения (например, преобразование коэффициента $100,001 -...
35729 просмотров
schedule 14.03.2022

Можно ли комбинировать xticlabels со splot?
У меня есть такие данные: 0 FRANCK -0.46 0 JUSSE -1.41 1 JUSSE -0.13 1 FRANCK -2.10 и я хочу сделать 3D-график, но мне нужно показать категории (или метки): splot "map.gnu" using 1:2:3:yticlabels(2) with points palette pointsize 3...
151 просмотров
schedule 07.12.2022

Объект «w» не нашел ошибку в факторном анализе с пакетом «psych»
Много вопросов по факторному анализу на этих страницах. Я просмотрел их, но ничего не похоже, так что, надеюсь, кто-то может помочь. Я провожу факторный анализ по некоторым вопросам опроса, в которых я ожидаю появления некоторых скрытых...
1052 просмотров
schedule 22.01.2023

Таблица - условный цвет фона
Я пытаюсь построить условный фон на основе категориальной переменной в Tableau. Например, график федеральных фондов; вы можете увидеть линейную диаграмму с двумя цветами фона. Вы можете видеть, что серый цвет занимает всю высоту диаграммы:...
3303 просмотров

Создание фиктивных наборов в MATLAB для статистики
я рассматриваю создание фиктивных наборов в MATLAB, сначала я создал массив случайных величин с 10 экземплярами min = 5 и max = 10, и вот мой код r = (10-5).*rand(10,1) + 5; Пожалуйста, мне нужна помощь в том, как создать следующее; 1: создать...
143 просмотров
schedule 18.09.2022

Как указать переменную в пандах как порядковую / категориальную?
Я пытаюсь запустить алгоритм машинного обучения для набора данных с помощью scikit-learn. В моем наборе данных есть некоторые функции, похожие на категории. Как одна функция - это A , у которой есть значения 1,2,3 , определяющие качество...
23565 просмотров

Как мы можем измерить расстояние сходства между категориальными данными?
Как мы можем измерить расстояние сходства между категориальными данными? Пример: Пол: Мужской, Женский Числовые значения: [0–100], [200–300] Строки: Профессионалы, новички и т. д.,... Заранее спасибо.
12716 просмотров
schedule 25.05.2022

Категориальные и числовые характеристики - Категориальная цель - Scikit Learn - Python
У меня есть набор данных, содержащий как категориальные, так и числовые столбцы, и мой целевой столбец также категориальный. Я использую библиотеку Scikit в Python34. Я знаю, что Scikit необходимо преобразовать все категориальные значения в...
3909 просмотров

Использование «категориального» dtype Pandas с sklearn
Есть ли в sklearn какая-либо поддержка для использования типа данных Categorical Panda непосредственно в подгонке моделей? Из того, что я видел, sklearn не поддерживает этот тип данных, что вызывает сожаление, потому что категориальный тип данных...
2778 просмотров

Извлечение уникальных строк из строковой переменной фактора
У меня есть переменная, которая содержит имена актеров. (actor=structure(c(4L, 1L, 6L, 2L, 5L, 3L), .Label = c("Christian Bale, Tom Hardy, Anne Hathaway, Gary Oldman", "Jamie Foxx, Christoph Waltz, Leonardo DiCaprio, Kerry Washington", "Jennifer...
79 просмотров
schedule 07.06.2023

Как кластеризовать последовательные категориальные данные в R
Рассмотрим набор данных, в котором пользователи могут выбирать из 3 действий, и у нас есть данные для выбора их первых 10 действий. Пример данных: for (i in 1:10) { # sample from list of 3 strings using a set probability x <- sample(...
806 просмотров
schedule 02.03.2023

Преобразование категориальных значений в двоичные с использованием панд
Я пытаюсь преобразовать категориальные значения в двоичные значения с помощью pandas. Идея состоит в том, чтобы рассматривать каждое уникальное категориальное значение как характеристику (т. е. столбец) и присваивать 1 или 0 в зависимости от того,...
36803 просмотров

Как отобразить числовые значения категориальных меток в выводе с использованием синтаксиса spss
Мне было интересно, есть ли способ показать числовые значения, связанные с категориями номинальной переменной, когда мы создаем таблицы или частоты в синтаксисе SPSS. Я хотел бы использовать что-то похожее на то, что делает аргумент , nolab в...
1795 просмотров
schedule 26.12.2022

Использование функции ifelse в R для перекодирования уровней категориальной переменной
Я должен использовать функцию «ifelse» в R для декодирования значений, используемых в переменной. Используемый фрейм данных — танец. Переменная — Тип. Из комментариев, которые я получил, вот что у меня есть: ifelse(dance$Type=="Swg","Swing",...
4289 просмотров
schedule 21.10.2023

Категориальные переменные в MultinomialNB Python
Я новичок в Python, и вот простой вопрос о настройке X_train в MultinomialNB. Итак, я хочу предсказать цель ("A1", "A2,..." A5"), используя две категориальные функции : день недели с 7 уникальными значениями ("Mon" , "Вт", "Ср", "Чт", "Пт",...
506 просмотров

Регрессия с новыми уровнями факторов в тестовом наборе — как изящно игнорировать ошибку
Может ли R каким-либо образом «изящно» игнорировать ошибки, которые обычно приводят к полному сбою прогноза, когда в тестовом наборе появляются новые уровни факторов? Обычно, если есть только одно неверное значение, вся операция не работает. Чтобы...
560 просмотров

Как распечатать вероятности категориального исхода с помощью xgboost?
У меня есть тренировочный набор, который выглядит как Name Day Area X Y Month Night ATTACK Monday LA -122.41 37.78 8 0 VEHICLE Saturday CHICAGO -1.67 3.15 2 0 MOUSE Monday...
2568 просмотров
schedule 24.07.2023