Вопросы по теме 'dummy-variable'

Разделить строковый столбец на несколько фиктивных переменных
Как относительно неопытный пользователь пакета data.table в R, я пытался преобразовать один текстовый столбец в большое количество индикаторных столбцов (фиктивных переменных), где 1 в каждом столбце указывает на то, что определенная подстрока была...
1676 просмотров
schedule 10.06.2023

Скрыть некоторые коэффициенты в сводке регрессии, но по-прежнему возвращать колл, r-квадрат и другие сводные данные.
Мой вопрос похож на этот one , однако мне интересно вернуть все остальные результаты , а не только коэффициенты. Вот пример кода, чтобы сделать мой вопрос более понятным. data=as.data.frame(matrix(rnorm(50*50),50,50))...
4352 просмотров
schedule 16.11.2022

Создайте факторные переменные для целых чисел года в r
У меня есть набор данных панели, как показано ниже. Но фактический набор данных насчитывает несколько тысяч наблюдений. Я хочу создать 14 заводов в виде новой колонки «Год_дум» за 1984-1998 годы (15 лет). Я искал создание фиктивных переменных в r,...
103 просмотров
schedule 01.04.2022

Несоответствие фиктивного кода Rapidminer
Я пытаюсь использовать нейронную сеть, обучая ее на trainData, а затем тестируя на testData, как это сделал бы любой. Однако данные требуют фиктивного кодирования некоторых номинальных признаков в числовые. Когда я это делаю, она обучает нейронную...
94 просмотров

Каковы плюсы и минусы get_dummies (Pandas) и OneHotEncoder (Scikit-learn)?
Я изучаю различные методы преобразования категориальных переменных в числовые для классификаторов машинного обучения. Я наткнулся на pd.get_dummies метод и sklearn.preprocessing.OneHotEncoder() и хотел посмотреть, чем они отличаются по...
52200 просмотров

Создайте новую категориальную переменную на основе подмножества данных
У меня есть кадр данных, который выглядит так: cnt bnk qst ans 1 Country 1 Bank 1 q1 1 2 Country 2 Bank 2 q1 1 3 Country 3 Bank 3 q1 3 4 Country 4 Bank 4 q1 1 5 Country 1 Bank 1 q2 1 6 Country 2 Bank 2 q2 2 7...
88 просмотров

Создание фиктивной переменной со многими условиями (R)
Мой набор данных выглядит примерно так ID YOB ATT94 GRADE94 ATT96 GRADE96 ATT 96 ..... 1 1975 1 12 0 NA 2 1985 1 3 1 5 3 1977 0 NA 0 NA 4 ...... (ATTXX - фиктивная...
2916 просмотров
schedule 19.03.2022

Работа с ничьей с использованием ранга (R)
Я пытаюсь создать фиктивную переменную для того, родился ли ребенок первым, и одну, если ребенок родился вторым. Мои данные выглядят примерно так ID MID CMOB CYRB 1 1 1 1991 2 1 7 1989 3 2 1 1985 4...
705 просмотров
schedule 11.03.2023

Как создать переменную, принимающую значение X+1, если событие не происходит за X периодов?
Как я могу создать новую переменную, которая принимает значение X+1, если событие не происходит в течение X периодов времени? Конкретно у меня есть данные о многих людях за 12 лет. На вопрос они могли ответить да (1) или нет (0). Меня волнует,...
49 просмотров
schedule 19.09.2022

R - Заменить наблюдения фиктивными, если они находятся в верхнем x% от var
У меня есть некоторые данные в большом фрейме данных (около 80x300), который выглядит примерно так: dum <- data.frame(id=c("a", "b", "c", "d", "e"), v1=c(2, 7, 8, 5, 0), v2=c(9, 2, 4, 6, 1),...
66 просмотров

Классификационный манекен R
В большом наборе данных по акциям США у меня есть целочисленная переменная, содержащая коды SIC. https://www.sec.gov/info/edgar/siccodes.htm Я хотел бы создать фиктивную переменную, указывающую основную группу из 50 , то есть переменную,...
374 просмотров
schedule 05.06.2022

dplyr: Фильтр за годы до отмеченного периода времени
Я хочу иметь список манекенов для разных стран и отмечать годы за два года до тех лет, которые отмечены. Данные выглядят так library(tidyverse) df <- tribble( ~year, ~country, ~occurrence, #--|--|---- 2003, "USA", 1, 2004, "USA",...
125 просмотров
schedule 12.08.2022

Исправление «TypeError» в регрессии Пуассона (с использованием Python)
Я запускаю регрессию Пуассона в Python, и она выдает следующую ошибку: TypeError: from_formula() принимает как минимум 4 аргумента (даны 3) Как я могу это исправить? Мой код выглядит следующим образом: from...
73 просмотров

Преобразование строки в фиктивные закодированные переменные
Вот данные PlayerID, Characters, Win or Lose Я могу сделать так, чтобы это выглядело так 8PYPY0LLQ,valkyrie5 , chr_witch4 , hog_rider5 , zapMachine1 , mega_minion3 , baby_dragon2 , bomber7 , skeleton_horde1, 0 Или вот так...
785 просмотров
schedule 14.11.2022

Преобразование столбца pandas из строк, разделенных запятыми, в фиктивные переменные
В моем фреймворке данных у меня есть категориальная переменная, которую я хотел бы преобразовать в фиктивные переменные. Однако в этом столбце есть несколько значений, разделенных запятыми: 0 'a' 1 'a,b,c' 2 'a,b,d' 3 'd' 4 'c,d'...
5454 просмотров
schedule 23.05.2022

Сгенерируйте фиктивные переменные из фрейма данных
У меня есть data.frame со следующими свойствами: list1 <- c(145540,145560, 157247, 145566) list2 <- c(166927, NA, NA, NA) list3 <- c(145592, 145560, 145566, NA) df <- data.frame(list1, list2, list3) Я хотел бы создать фиктивные...
415 просмотров
schedule 05.12.2023

Создание фиктивных переменных в SAS из категориальной переменной
Я хочу создать фиктивную переменную для категориальной переменной в SAS. Категориальная переменная включает информацию о сайтах и ​​принимает такие значения, как Манила, Рабат и т. Д., Всего существует около 50 различных сайтов. Каким будет наиболее...
1256 просмотров

Панды создают фиктивные функции для каждой строки в словаре списков
Реализация следующей логики для целей разработки функций. Простой подход прост, но интересно, есть ли более эффективное решение, о котором может подумать каждый. Идеи приветствуются, если вам не хочется реализовывать весь код! Возьмите этот...
236 просмотров
schedule 07.01.2023

Сгенерируйте все возможные манекены в соответствии со значениями var в r
У меня есть такой кадр данных: df <- data.frame(V1=c("a,b,c,d,e,f","a,b,c","e,f","b,d","a,e")) Я хочу сгенерировать все возможные манекены по категориям в var V1 , примерно так: df$a <- c(1,1,0,0,1) df$b <- c(1,1,0,1,0) df$c...
47 просмотров
schedule 13.12.2022

преобразовать дату в фиктивную переменную в R
у меня есть этот набор данных df=structure(list(Data = structure(c(4L, 5L, 6L, 7L, 8L, 9L, 10L, 1L, 2L, 3L), .Label = c("01.01.2018", "02.01.2018", "03.01.2018", "25.12.2017", "26.12.2017", "27.12.2017", "28.12.2017", "29.12.2017",...
819 просмотров
schedule 11.03.2022