РЕДАКТИРОВАТЬ:
Вот заголовок csv данных:
Fresh Milk Grocery Frozen Detergents_Paper Delicatessen
0 12669 9656 7561 214 2674 1338
1 7057 9810 9568 1762 3293 1776
2 6353 8808 7684 2405 3516 7844
3 13265 1196 4221 6404 507 1788
4 22615 5410 7198 3915 1777 5185
Я вижу ошибку:
TypeError: unsupported operand type(s) for *: 'PCA' and 'float'
Код:
from sklearn.decomposition import PCA
log_data = np.log(data)
# TODO: Apply PCA to the good data with the same number of dimensions as features
pca = PCA(n_components=4)
# TODO: Apply a PCA transformation to the sample log-data
pca_samples = pca.fit(log_data)
# Generate PCA results plot
pca_results = rs.pca_results(good_data, pca)
display(pd.DataFrame(np.round(pca_samples, 4), columns = pca_results.index.values))
Он жалуется на последнюю строчку
данные взяты из CSV, который, как было показано, работает нормально.
StringIO
и загрузите его как часть вашего примера. - person Paul H   schedule 03.10.2016rs
? И строкаnp.log
, вызывающая ошибку, не отображается. Есть ли что-то еще в этом сценарии? - person tdelaney   schedule 03.10.2016pca_samples
- этоPCA
объект (см. PCA.fit ()), поэтомуnp.round(pca_samples, 4)
не удается. Вероятно, это проблема ... хотя трассировка стека, показывающая сбой вnp.round
, была бы полезна. - person tdelaney   schedule 03.10.2016