Предпочтительные форматы визуализации облака тегов

Из любопытства мне хотелось бы узнать, какие форматы облаков тегов лучше всего подходят для обнаружения все большего и большего (релевантного) контента?

Я знаю 3 формата, но не знаю, какой из них лучший.

1) восхитительный - цветовая штриховка

2) стандартный с вариациями размера шрифта -

3) Тот, что на этом сайте - цифры, показывающие важность / использование.

Итак, какие из них вы предпочитаете? и почему?

Изменить: благодаря приведенным ниже ответам я теперь гораздо лучше понимаю методы визуализации облака тегов.

4) Параллельные облака тегов - простое использование параллельных координат. техника. Я считаю его более организованным и читаемым.

5) диаграмма Ворони - более полезна для определения взаимосвязей тегов и принятие решений на их основе. Не служит нашей цели поиска релевантного контента.

6) Интеллектуальные карты - они хороши и могут использоваться для пошаговой фильтрации контента.

Здесь я нашел еще несколько интересных приемов - http://www.cs.toronto.edu/~ccollins/research/index.html


person Arpit Tambi    schedule 06.08.2009    source источник


Ответы (4)


Я действительно думаю, что это зависит от содержания информации и аудитории. То, что относится к одному, не имеет отношения к другому. Если аудитория более специализирована, то они с большей вероятностью будут думать в том же духе, но поставщик контента все равно должен будет анализировать ее и обслуживать.

Есть также несколько путей, которыми человек может пойти, чтобы «узнать больше». Возьмем, к примеру, тег «DNS». Вы можете перейти к более конкретным деталям, таким как «UDP Port 53» и «MX Record», или вы можете пойти боком, используя такие термины, как «IP-адрес», «Имя хоста» и «URL». Диаграмма Вороного показывает кластеры, но не обрабатывает случай, когда общие термины могут быть связаны со многими понятиями. Сопоставление имени хоста с DNS, HTTP, SSH и т. Д.

Я заметил, что в некоторых облаках тегов обычно есть один или два элемента, которые намного больше других. Такого рода вещам может служить ментальная карта, в которой одна центральная концепция имеет другие, исходящие от нее.

Для случаев большого количества «основных тем», когда ментальная карта не подходит, есть параллельные координаты, но это озадачило бы многих пользователей сети.

Я думаю, что если бы мы нашли чрезвычайно хорошо организованный способ сортировки кластеров тегов при сохранении связей между общностью и особенностями, это было бы в некоторой степени полезно для исследований ИИ.

С точки зрения того, что я лично предпочитаю, я считаю, что числовой подход хорош, потому что редко используемые теги по-прежнему представлены в удобочитаемом размере шрифта. Я также думаю, что SO делает это таким образом, потому что у них гораздо больше тегов, чем требуется для облака среднего размера по стандарту.

person Omniwombat    schedule 21.08.2009
comment
Спасибо, добавил в тему поподробнее. - person Arpit Tambi; 22.08.2009

Я бы выбрал второй вариант из перечисленных вами выше.

  • 1 - Человеческий глаз распознает и воспринимает разницу в размерах гораздо более эффективно, чем цвет, когда цветовая шкала находится в одном и том же спектре (т.е. различные синие цвета в отличие от отдельных отдельных цветов).

  • 3 - Требует, чтобы пользователь отсканировал полный список и математически сравнил каждое отдельное число во время сканирования. Никаких реальных значимых отношений между тегами без большой работы со стороны пользователей.

Итак, переходя к пункту 2, необходимо принять во внимание несколько соображений:

  • Держите теги в алфавитном порядке. Это дает пользователю еще один метод поиска и устанавливает известную взаимосвязь между ними (при условии, что они знают алфавит!). Если они не заказаны, то найти хотя бы одну - просто чушь.
  • Если сравнение размеров абсолютно необходимо (обычно это не так, поскольку каждый уровень можно увеличивать на определенный процент или количество пикселей), используйте моноширинный шрифт. В противном случае некоторые комбинации букв могут оказаться больше, чем они есть на самом деле.
  • Не включайте запятые, трубы или другие разделители. У вас уже будет много данных на небольшой площади - не нужно загромождать их мусором. Разместите теги, конечно, с приличным отступом. Только не удваивайте количество визуальных элементов, добавляя не только данные.
  • Установите минимальный / максимальный размер шрифта и масштаб между ними. Бывают ситуации, когда один тег может быть настолько популярным, что визуально может показаться экспоненциально большим, чем другие. Точно так же вы не хотите, чтобы тег в конечном итоге рендерил 1 пиксель! Установите мин. / Макс. И при необходимости отрегулируйте их.
person Mark Hurd    schedule 21.08.2009
comment
Спасибо, добавил в тему поподробнее. - person Arpit Tambi; 22.08.2009

Диаграмма Ворони с измененным размером - показывает, какие теги связаны между собой

person Justin    schedule 21.08.2009
comment
Спасибо, добавил в тему поподробнее. - person Arpit Tambi; 22.08.2009

Мой любимый формат облака тегов - это формат Wordle. Он выглядит великолепно, и он также довольно хорошо справляется с размещением большого количества тегов на небольшом пространстве.

person Shawn Simister    schedule 23.08.2009
comment
спасибо, очень понравился их дизайн. Хотел бы использовать их в своем резюме. Однако я сомневаюсь, что они решают нашу задачу по обнаружению контента. - person Arpit Tambi; 23.08.2009