Этот очень простой фрагмент кода,
# imports...
from lifelines import CoxPHFitter
import pandas as pd
src_file = "Pred.csv"
df = pd.read_csv(src_file, header=0, delimiter=',')
df = df.drop(columns=['score'])
cph = CoxPHFitter()
cph.fit(df, duration_col='Length', event_col='Status', show_progress=True)
выдает ошибку:
Отслеживание (последний вызов последним): файл «C: / Users /.../ predictor.py», строка 11, в cph.fit (df, duration_col = 'Length', event_col = 'Status', show_progress = True)
Файл "C: \ Users \ ... \ AppData \ Local \ conda \ conda \ envs \ hrpred \ lib \ site-packages \ lifelines \ fitters \ coxph_fitter.py", строка 298, соответствует self._check_values (df)
Файл "C: \ Users \ ... \ AppData \ Local \ conda \ conda \ envs \ hrpred \ lib \ site-packages \ lifelines \ fitters \ coxph_fitter.py", строка 323, в _check_values cols = str (list (X .columns [low_var]))
Файл "C: \ Users \ ... \ AppData \ Local \ conda \ conda \ envs \ hrpred \ lib \ site-packages \ pandas \ core \ indexes \ base.py", строка 1754, в _ _ getitem _ _
результат = getitem (ключ)
IndexError: логический индекс не соответствует индексированному массиву по измерению 0; размер равен 88, но соответствующий логический размер равен 76
Однако когда я печатаю сам df, все в порядке. Как видите, все внутри библиотеки. И примеры библиотеки работают нормально.
df.columns
,df[column1].dtype
,sum(df[column1].isnull())
иsum(df[column1].notnull())
(для каждого столбца). Похоже, что индексы не выравниваются, что заставляет меня задаться вопросом о значениях null / NaN. - person TCAllen07   schedule 26.04.2018