Публикации по теме 'dimensionality-reduction'


t-SNE: за математикой
Будучи одним из наиболее обсуждаемых алгоритмов уменьшения размерности в последние годы, особенно для визуализаций, я подумал, что мне нужно время, чтобы помочь другим развить интуицию относительно того, что на самом деле делает t-SNE. Разработанный в 2008 году Лоренс ван дер Маатенс и Джеффри Хинтон, t-распределенное стохастическое соседнее встраивание в отличие от анализа главных компонентов (PCA) - это нелинейный метод, используемый для визуализации данных более высоких измерений в..

PCA (анализ основных компонентов)
PCA (анализ основных компонентов) — это метод уменьшения размерности, используемый в машинном обучении и анализе данных. Он работает путем выявления закономерностей корреляции между переменными в наборе данных и преобразования данных в новый набор переменных, называемых основными компонентами. PCA можно использовать для уменьшения количества измерений в наборе данных, сохраняя при этом как можно больше исходной информации. Основные этапы выполнения АКП следующие: Стандартизируйте..

Небольшое интервью с PCA
Я: Итак, мисс PCA, расскажите, пожалуйста, о себе, чем вы зарабатываете на жизнь? PCA: Ну, я специалист по уменьшению размерности данных. Люди нанимают меня для проецирования высокоразмерных данных на низкоразмерное подпространство. Я: Хорошо! Итак, каковы ваши руководящие принципы, как вы осуществляете эту трансформацию? PCA: проецируя исходные данные на подпространство более низкого измерения, я стараюсь сохранить как можно больше различий в данных. Более того, я всегда..

Понимание уменьшения размерности
Иногда ваши данные имеют множество функций. На самом деле, если у вас их больше трех, полезная визуализация и понимание могут быть затруднены. В контексте машинного обучения большое количество признаков также может привести к проклятию размерности и возможности переобучения . Введите это семейство алгоритмов: уменьшение размерности . Основной целью алгоритма уменьшения размерности является уменьшение количества признаков ваших входных данных. Формально это отображение из..

Снижение размерности для машинного обучения
Это моя первая статья о среде. Здесь я дам краткий обзор того, что такое уменьшение размерности, зачем оно нам нужно и как это сделать. Что такое уменьшение размерности? Уменьшение размерности - это просто процесс уменьшения размерности вашего набора функций. Ваш набор функций может быть набором данных с сотней столбцов (то есть функциями) или массивом точек, составляющих большую сферу в трехмерном пространстве. Снижение размерности - это уменьшение количества столбцов до, скажем,..

Наука о данных: снижение сложности с помощью анализа основных компонентов.
Присоединяйтесь к Medium по моей реферальной ссылке — apply.math.coding Получите доступ ко всем моим историям и тысячам других на Medium от других авторов. По моему глубокому убеждению, Medium — это… medium.com Эта история является частью моей серии Наука о данных .

Когда данные — проклятие для обучения
Данные и обучение похожи на лучших друзей, возможно, обучение слишком зависит от данных, чтобы их можно было назвать друзьями. Когда данных слишком много, обучение обходится дорого, поэтому это больше похоже на отношения между девушкой и парнем. Что ж, не запутайтесь и не беспокойтесь о том, как я сравниваю данные и обучение, это просто мое описание того, что называется уменьшением размерности в машинном обучении. Если серьезно, в этом блоге мы рассмотрим, что такое «проклятие..