Публикации по теме 'principal-component'


Как применить анализ основных компонентов (PCA) к реальному набору данных: данные кардиотокографии в R…
В этой статье показано, как применять PCA для создания новых выбранных функций (меньше, чем исходных функций) для будущего машинного обучения. Набор данных, используемый для этой статьи, представляет собой набор данных Cardiotocogaphy. Пожалуйста, прочитайте статью ниже, чтобы узнать больше о наборе данных и о том, как выполнить для него EDA. https://phuongdelrosario.medium.com/uci-cardiotocography-data-set-fetal-states-classification-part-1-data-summary-and-eda-e0cec8a61eff Полный..

Неконтролируемое обучение
Здравствуйте, я дам вам информацию о неконтролируемом обучении :) Самый короткий и общий ответ на то, что такое обучение без учителя, можно сказать, что обучение без учителя — это тип обучения без зависимой переменной, и мы применяем этот тип обучения к связанным наборам данных. Независимые переменные не могут быть связаны ни с одной зависимой переменной. Наша главная цель — сосредоточиться на определенных сегментах наблюдения в наборе данных. Мы сгруппируем их в соответствии с..

Наука о данных: снижение сложности с помощью анализа основных компонентов.
Присоединяйтесь к Medium по моей реферальной ссылке — apply.math.coding Получите доступ ко всем моим историям и тысячам других на Medium от других авторов. По моему глубокому убеждению, Medium — это… medium.com Эта история является частью моей серии Наука о данных .

PCA в матричных платформах
В этом посте мы покажем PCA, выполненный с использованием спектрального разложения (собственного анализа) ковариационной матрицы, а также с факторизацией SVD. Мы сделаем это с помощью языка R. R R — это свободный язык программирования (он же полный по Тьюрингу ) и статистическая среда. У него есть ряд особенностей, поскольку он наследует многие идеи из LISP и потому, что он был разработан в сообществе статистики с упором на тех, кто плохо знаком с программированием и использует..

Текст песни и исследование гимна
Использование кластеризации kMeans, PCA и машинного обучения Введение / TL; DR Этот проект исследует кластеризацию с использованием немаркированных данных, собранных из текстов песен для 80 лучших песен Billboard всех времен, а также переводов большинства национальных гимнов со всего мира. Я буду использовать kMeans, анализ основных компонентов (PCA), TfidVectorizer и исследовательский анализ, чтобы изучить группы кластеров и обнаружить интересные закономерности или тенденции в данных...

Снижение размерности в контролируемой структуре и частичная регрессия методом наименьших квадратов
Автор - Сурадип Чакраборти Пространство большого размера и удивительное поведение большинства показателей расстояния в этом пространстве Я всегда был очень увлечен концепциями многомерного пространства и его последствиями в области машинного обучения. Как мы знаем, по мере увеличения размерности пространства признаков количество конфигураций может расти экспоненциально, и, таким образом, количество конфигураций, охватываемых наблюдением, уменьшается. Вышеупомянутое объяснение..