Публикации по теме 'hierarchical-clustering'


Неконтролируемое обучение
Здравствуйте, я дам вам информацию о неконтролируемом обучении :) Самый короткий и общий ответ на то, что такое обучение без учителя, можно сказать, что обучение без учителя — это тип обучения без зависимой переменной, и мы применяем этот тип обучения к связанным наборам данных. Независимые переменные не могут быть связаны ни с одной зависимой переменной. Наша главная цель — сосредоточиться на определенных сегментах наблюдения в наборе данных. Мы сгруппируем их в соответствии с..

ML: иерархическая кластеризация
Существует множество алгоритмов кластеризации, но иерархическая кластеризация широко используется в областях биоинформатики из-за ее концепции. В этом посте я объясню иерархическую кластеризацию. Иерархическая кластеризация Есть много способов начать иерархическую кластеризацию. В нашем примере каждая точка данных будет использоваться в качестве начальных кластеров точек. Затем мы сравниваем расстояния между точками данных и объединяем их, когда они являются ближайшими. Это будет..

Вопросы по теме 'hierarchical-clustering'

Иерархии тегов и обработка
Это реальная проблема, связанная с маркировкой элементов в целом (и да, это относится и к StackOverflow, и нет, это не вопрос о StackOverflow). Вся проблема с тегами помогает группировать похожие элементы, какими бы они ни были (шутки, сообщения в...
3358 просмотров
schedule 28.07.2022

Извлечение доминирующих/наиболее часто используемых цветов из изображения
Я хотел бы извлечь из изображения наиболее часто используемые цвета или, по крайней мере, основные тона. Не могли бы вы порекомендовать мне, как я могу начать с этой задачи? или указать мне аналогичный код? Я ищу его, но безуспешно.
3080 просмотров

Как пометить конечные узлы разрезанной дендрограммы?
Я использовал следующий код, чтобы вырезать дендрограмму на определенной высоте. Проблема, с которой я столкнулся, заключается в том, что когда я вырезаю дендрограмму, я не могу понять, как добавить метки к узлам. Как я могу вырезать дендрограмму с...
2839 просмотров

Пользовательская метрика расстояния в R для агломерационной кластеризации
Можем ли мы определить пользовательскую функцию расстояния для агломерационной кластеризации в R? Кроме того, я хотел бы предотвратить объединение двух кластеров, когда определенное условие не выполняется. Возможно ли это в R? Кроме того,...
323 просмотров

Ошибка с многомасштабной иерархической кластеризацией в R
Я выполняю иерархическую кластеризацию с помощью пакета R под названием pvclust , который основан на hclust за счет включения начальной загрузки для расчета уровней значимости для полученных кластеров. Рассмотрим следующий набор данных с 3...
5256 просмотров

Как преобразовать текстовые файлы в формат .arff (weka)
Пожалуйста, посоветуйте мне, как преобразовать текстовые файлы в формат .arff (weka), потому что я хочу выполнить кластеризацию данных для 1000 текстовых файлов. С уважением
7215 просмотров

Алгоритм агломерационной кластеризации, который сохраняет порядок точек данных?
Мне нужна реализация иерархической кластеризации (желательно в Matlab), которая сохраняет порядок моих точек данных. Например, я не хочу, чтобы он выводил что-то вроде этого (((1, 5), (2, 3)), 4) Я почти уверен, что для этого есть лучший...
145 просмотров

Есть ли эффективный способ кластеризации графа по сходству Жаккара?
Существует ли эффективный способ кластеризации узлов в графе с использованием подобия Жаккара, чтобы в каждом кластере было не менее K узлов? Сходство Жаккара между узлами i и j : Пусть S будет множеством соседей i , а T будет множеством...
588 просмотров

Матрица расстояния/близости в иерархической кластеризации
Я новичок в Weka и пытаюсь выполнить иерархическую кластеризацию. У меня есть симметричная матрица расстояния/близости: a b c d a 0 0.1 0.3 0.2 b 0.1 0 0.7 0.4 c 0.3 0.7 0 0.9 d 0.2...
366 просмотров

Получите метки данных с одинаковым цветом в scipy дендрограмме
Я выполнил иерархическую кластеризацию, используя scipy , и следующая моя дендрограмма. Теперь мне нужно получить надписи на листьях определенного цвета. Например: мне нужно найти метки для красного, синего, зеленого и т. Д. Любая помощь по этому...
1860 просмотров

Иерархическая кластеризация с R
Учтите несколько моментов: A = (1, 2.5), B = (5, 10), C = (23, 34), D = (45, 47), E = (4, 17), F = (18, 4) Как я могу выполнить для них иерархическую кластеризацию с помощью R? Я прочитал этот пример Cluster Analysis но я не уверен, как...
865 просмотров

API-интерфейс Carrot2 FoamTree
Я работаю над Carrot2 FoamTree API, особенно над большой иерархической кластеризацией, и мне нужно знать, есть ли способ опубликовать конечный узел в виде гиперссылки, которая при нажатии открывает ссылку в новом окне?
358 просмотров

Кластеризация связанных квадратов в MATLAB
Предположим, что есть сетка, окрашенная по определенному шаблону: Как видите, эти 62 красных квадрата объединены в три разные группы (кластеры). Вы можете скачать данные по следующей ссылке. Нажмите здесь, чтобы загрузить координаты сетки...
74 просмотров

Применение hclust к списку матриц расстояний
Я попытался найти ответ на этот вопрос, но не смог его найти: Пытаясь выполнить кластеризацию, специфичную для каждого идентификатора пользователя в моем наборе данных (их 385), я вычислил евклидовы расстояния между каждым пользователем и вектор...
1094 просмотров

Предлагаемые примеры байесовского иерархического моделирования (с использованием трех уровней) в WinBUGS/R
Я использую WinBUGS/R для разработки байесовской иерархической модели с тремя уровнями, но я изо всех сил пытаюсь найти достойные примеры кода. Кто-нибудь может предложить некоторые, пожалуйста? Я новичок в WinBUGS, но не в многоуровневом...
1858 просмотров

Типичный экземпляр кластера - иерархическая кластеризация
Я использую метод агломеративного иерархического кластера для кластеризации набора данных. Набор данных, который я использую для кластеризации, - это траектории. Я использую специальную функцию расстояния, чтобы оценить расстояние между...
371 просмотров

Использование R для очистки продуктов с ошибками в таксономии
У меня есть миллион записей, содержащих поле под названием product, которое заполняется пользователями, использующими свободный текст. Иногда поле пустое, иногда оно содержит такие вещи, как batteries или laptop , иногда оно содержит что-то вроде...
119 просмотров

Как сделать график сгруппированных логических переменных в R?
У меня есть набор данных, который полностью состоит из логических переменных. Точно так же, как преобразованный набор данных о животных ниже, только с большим количеством столбцов. #...
1365 просмотров

Как рассчитать энтропию кластеризации? Рабочий пример или программный код
Я хотел бы рассчитать энтропию этой примерной схемы http://nlp.stanford.edu/IR-book/html/htmledition/evaluation-of-clustering-1.html Кто-нибудь может объяснить шаг за шагом с реальными значениями? Я знаю, что существует неограниченное...
14204 просмотров

Индекс Дэвиса-Будена и максимальное отношение
Проверка индекса Дэвиса-Булдина — это, в основном, соотношение внутри кластерного разброса и между кластерными расстояниями. Мы повторяем это для всех кластеров и, наконец, берем maximum . Мой вопрос здесь: почему максимум, а не минимум? Спасибо.
179 просмотров