Поправка:
Если у меня есть DataFrame pandas, который включает 5 столбцов Col1
и Col2
и Col3
и Col4
и Col5
, и мне нужно получить максимальный коэффициент корреляции Пирсона между (Col2
, Col3
) и (Col2
, Col4
) и (Col2
, Col5
), учитывая значения в Col1
Модифицированные значения для Col2
, полученные по следующей формуле:
df['Col1']=np.power((df['Col1']),B)
df['Col2']=df['Col2']*df['Col1']
где B
— изменяющаяся переменная (одно значение), чтобы получить максимальный коэффициент корреляции Пирсона между (новыми значениями Col2
, Col3
) и (новыми значениями Col2
, Col4
) и (новыми значениями Col2
, Col5
).
Обновлять:
В приведенной выше таблице, содержащей 5 столбцов, как я упоминал выше, корреляция между коэффициентом между (Col2
,Col3
) и (Col2
,Col4
) и (Col2
,Col5
) показана под таблицей.
Мне нужно изменить значения Col2
на основе двух упомянутых уравнений, где изменяющееся значение равно B
.
Итак, вопрос в том, как получить наилучшее значение B
, которое дает новый коэффициент корреляции, больший или равный его аналогу (старому)?
Обновление 2:
Кол1, Кол2, Кол3, Кол4, Кол5
2,0.051361397,2618,1453,1099
4,0.053507779,306,153,150
2,0.041236151,39,54,34
6,0.094526419,2755,2209,1947
4,0.079773397,2313,1261,1022
4,0.083891415,3528,2502,2029
6,0.090737243,3594,2781,2508
2,0.069552772,370,234,246
2,0.052401789,690,402,280
2,0.039930675,1218,846,631
4,0.065952096,1706,523,453
2,0.053064126,314,197,123
6,0.076847486,4019,1675,1452
2,0.044881545,604,402,356
2,0.073102611,2214,1263,1050
0,0.046998526,938,648,572
df = pd.read_clipboard(sep=',')
. - person Cleb   schedule 28.04.2019