Я пытаюсь преобразовать категориальные значения в двоичные значения с помощью pandas. Идея состоит в том, чтобы рассматривать каждое уникальное категориальное значение как характеристику (т. е. столбец) и присваивать 1 или 0 в зависимости от того, был ли конкретный объект (т. е. строка) отнесен к этой категории. Ниже приведен код:
data = pd.read_csv('somedata.csv')
converted_val = data.T.to_dict().values()
vectorizer = DV( sparse = False )
vec_x = vectorizer.fit_transform( converted_val )
numpy.savetxt('out.csv',vec_x,fmt='%10.0f',delimiter=',')
Мой вопрос: как сохранить преобразованные данные с именами столбцов?. В приведенном выше коде я могу сохранить данные с помощью функции numpy.savetxt
, но это просто сохраняет массив, а имена столбцов теряются. В качестве альтернативы, есть ли более эффективный способ выполнить вышеуказанную операцию?