Я пытаюсь понять PCA, находя практические примеры в Интернете. К сожалению, большинство учебников, которые я нашел, на самом деле не показывают простых практических приложений PCA. После долгих поисков я наткнулся на это
Это хороший простой учебник. Я хочу воссоздать результаты в Matlab, но учебник находится в R. Я пытался воспроизвести результаты в Matlab, но пока безуспешно; Я новичок в Матлабе. Я создал массивы следующим образом:
Price = [6,7,6,5,7,6,5,6,3,1,2,5,2,3,1,2];
Software = [5,3,4,7,7,4,7,5,5,3,6,7,4,5,6,3];
Aesthetics = [3,2,4,1,5,2,2,4,6,7,6,7,5,6,5,7];
Brand = [4,2,5,3,5,3,1,4,7,5,7,6,6,5,5,7];
Затем в своем примере он делает это
data <- data.frame(Price, Software, Aesthetics, Brand)
Я сделал быстрый поиск в Интернете, и это, по-видимому, преобразует векторы в таблицу данных в коде R. Итак, в Matlab я сделал это
dataTable(:,1) = Price;
dataTable(:,2) = Software;
dataTable(:,3) = Aesthetics;
dataTable(:,4) = Brand;
Теперь это следующая часть, в которой я не уверен.
pca <- princomp(data, cor=TRUE)
summary(pca, loadings=TRUE)
Я попытался использовать функцию PCA Matlab
[COEFF SCORE LATENT] = princomp(dataTable)
Но мои результаты совсем не совпадают с показанными в туториале. Мои результаты
COEFF =
-0.5958 0.3786 0.7065 -0.0511
-0.1085 0.8343 -0.5402 -0.0210
0.6053 0.2675 0.3179 -0.6789
0.5166 0.2985 0.3287 0.7321
SCORE =
-2.3362 0.0276 0.6113 0.4237
-4.3534 -2.1268 1.4228 -0.3707
-1.1057 -0.2406 1.7981 0.4979
-3.6847 0.4840 -2.1400 1.0586
-1.4218 2.9083 1.2020 -0.2952
-3.3495 -1.3726 0.5049 0.3916
-4.1126 0.1546 -2.4795 -1.0846
-1.7309 0.2951 0.9293 -0.2552
2.8169 0.5898 0.4318 0.7366
3.7976 -2.1655 -0.2402 -1.2622
3.3041 1.0454 -0.8148 0.7667
1.4969 2.9845 0.7537 -0.8187
2.3993 -1.1891 -0.3811 0.7556
1.7836 -0.0072 -0.2255 -0.7276
2.2613 -0.1977 -2.4966 0.0326
4.2350 -1.1899 1.1236 0.1509
LATENT =
9.3241
2.2117
1.8727
0.5124
Тем не менее, результаты в учебнике
Importance of components:
Comp.1 Comp.2 Comp.3 Comp.4
Standard deviation 1.5589391 0.9804092 0.6816673 0.37925777
Proportion of Variance 0.6075727 0.2403006 0.1161676 0.03595911
Cumulative Proportion 0.6075727 0.8478733 0.9640409 1.00000000
Loadings:
Comp.1 Comp.2 Comp.3 Comp.4
Price -0.523 0.848
Software -0.177 0.977 -0.120
Aesthetics 0.597 0.134 0.295 -0.734
Brand 0.583 0.167 0.423 0.674
Может ли кто-нибудь объяснить, почему мои результаты так сильно отличаются от учебника. Я использую неправильную функцию Matlab?
Кроме того, если вы можете предоставить какие-либо другие хорошие простые практические приложения PCA, было бы очень полезно. Все еще пытаюсь разобраться во всех концепциях PCA, и мне нравятся примеры, где я могу кодировать и сам видеть результаты, поэтому я могу поиграть с этим, я считаю, что учиться таким образом легче.
Любая помощь приветствуется!!