У меня есть pandas
фрейм данных, и я хотел бы предсказать значения столбца A по значениям в столбцах B и C. Вот игрушечный пример:
import pandas as pd
df = pd.DataFrame({"A": [10,20,30,40,50],
"B": [20, 30, 10, 40, 50],
"C": [32, 234, 23, 23, 42523]})
В идеале у меня было бы что-то вроде ols(A ~ B + C, data = df)
, но когда я смотрю примеры из библиотек алгоритмов, таких как scikit-learn
, кажется, что данные загружаются в модель со списком строк вместо столбцов. Это потребовало бы от меня переформатирования данных в списки внутри списков, что, похоже, в первую очередь противоречит цели использования панд. Каков наиболее питонический способ запустить регрессию OLS (или любой алгоритм машинного обучения в целом) для данных в кадре данных pandas?