Как следует из названия, я пытаюсь применить функцию к каждой паре столбцов фрейма данных при некоторых условиях. Я попытаюсь проиллюстрировать это. Мой df имеет форму:
Code | 14 | 17 | 19 | ...
w1 | 0 | 5 | 3 | ...
w2 | 2 | 5 | 4 | ...
w3 | 0 | 0 | 5 | ...
Код соответствует определенному месту в прямоугольной сетке, а ws — это разные слова. Я хотел бы применить меру косинусного сходства между каждой парой столбцов только (ОТРЕДАКТИРОВАНО!) если сумма элементов в одном из столбцов пары больше 5.
Желаемый результат будет примерно таким:
| [14,17] | [14,19] | [14,...] | [17,19] | ...
Sim |cs(14,17) |cs(14,19) |cs(14,...) |cs(17,19)..| ...
cs является результатом косинусного сходства для каждой пары столбцов. Есть ли подходящий способ сделать это?
Любая помощь будет оценена :-)
cs(14,17)
, ниcs(14,19)
и т. д., потому что в столбце «14» нет элемента, который больше 5. А вы что-нибудь пробовали? Не могли бы вы предоставить код и примеры, которые не помогли? - person danielhadar   schedule 19.07.2016