Есть ли в sklearn какая-либо поддержка для использования типа данных Categorical Panda непосредственно в подгонке моделей? Из того, что я видел, sklearn не поддерживает этот тип данных, что вызывает сожаление, потому что категориальный тип данных одновременно кодирует категориальные данные и содержит схему отображения данных. Кроме того, категориальное кодирование — это просто проблема обработки/обработки данных, поэтому кажется более естественным, что Pandas будет обрабатывать ее.
Примечание
Я понимаю, что есть несколько методов кодирования категориальных переменных в Pandas и sklearn - это не то, о чем я спрашиваю.
categorial
были добавлены кpandas
совсем недавно — когда разрабатывалсяscikit-learn
, этого типа данных не существовало. Я не уверен, есть ли план по внедрениюcategorial
данных в scikit-learn — возможно, на этот вопрос могут ответить только разработчики. - person cel   schedule 15.06.2015categorical
dtype, как уже сказал @cel. Но он тоже не очень хорошо работает, даже внутри панд много чего с ним странно себя ведет. Я бы посоветовал использовать его с причинами и сообщать об ошибках непосредственно на github. - person firelynx   schedule 16.06.2015