Я хотел бы рассчитать скользящий наклон y_value по x_value, используя cuML LinearRegression.
Пример данных (фрейм данных cuDF):
| date | x_value | y_value |
| ------ | ------ | ---- |
| 2020-01-01 | 900 | 10 |
| 2020-01-01 | 905 | 15 |
| 2020-01-01 | 910 | 15 |
| 2020-01-01 | 915 | 15 |
| 2020-01-02 | 900 | 30 |
| 2020-01-02 | 905 | 40 |
| 2020-01-02 | 910 | 50 |
| ------ | ------ | ------ |
Простая функция для использования LinearRegression:
def RollingOLS(x, y):
lr = LinearRegression(fit_intercept = True, normalize = False, algorithm = 'svd')
reg = lr.fit(x, y)
return reg.coef_
Что бы я хотел сделать:
data.groupby('date').rolling(2).apply(RollingOLS, x=x_value, y=y_value)
Однако я получаю сообщение об ошибке: NotImplementedError: Handling UDF with null values is not yet supported
. Есть ли способ побороть эту ошибку? Спасибо.