Дерево решений – это инструмент принятия решений, который позволяет вам, аналитику данных, принимать решения на основе ключевых вопросов, которые вы можете задать себе.

Имея так много вариантов визуализации, которые вы можете выбрать, как решить, какой способ лучше всего представить ваши данные?

Дерево решений – это инструмент для принятия решений, который позволяет вам, аналитику данных, принимать решения на основе ключевых вопросов, которые вы можете задать себе. Каждый вопрос в решении визуализации tree поможет вам принять решение о критических функциях вашей визуализации. Ниже приведен пример базового дерева решений, которое поможет вам принять решение, основанное на данных, о том, какая визуализация является лучшим способом рассказать вашу историю. Обратите внимание, что существует много различных типов деревьев решений, которые различаются по сложности и могут предоставить более подробные решения.

Начните со своей истории

Начните с оценки типа имеющихся у вас данных и ответьте на ряд вопросов, чтобы определить лучший визуальный источник:

  • В ваших данных есть только одна числовая переменная? Если у вас есть данные с одной непрерывной числовой переменной, то гистограмма или график плотности являются лучшими методами построения ваших категориальных данных. В зависимости от вашего типа данных в этом случае даже может подойти столбчатая диаграмма. Например, если у вас есть данные о росте группы студентов, вы захотите использовать гистограмму, чтобы визуализировать количество студентов в каждом диапазоне роста:

  • Имеется ли несколько наборов данных? В случаях, когда речь идет о нескольких наборах данных, рассмотрите линейную или круговую диаграмму для точного представления ваших данных. Линейная диаграмма соединяет несколько наборов данных одной непрерывной линией, показывая, как числа менялись с течением времени. Круговая диаграмма удобна для разделения целого на несколько категорий или частей. Например, когда вы измеряете квартальные показатели продаж вашей компании. Ниже приведены примеры этих данных, нанесенных как на линейную, так и на круговую диаграмму.

  • Вы измеряете изменения с течением времени? Линейный график обычно подходит для отображения тенденций во времени. Однако, когда изменения больше, гистограмма является лучшим вариантом. Если, например, вы измеряете количество посетителей Нью-Йорка за последние 6 месяцев, данные будут выглядеть так:

  • Нужно ли показывать отношения между данными? Если у вас есть две переменные для одного набора данных, важно указать, как одна влияет на другую. Переменные, которые хорошо сочетаются друг с другом, лучше всего изображать на точечной диаграмме. Однако, если точек данных слишком много, взаимосвязь между переменными может быть скрыта, поэтому в этом случае тепловая карта может быть лучшим представлением. Если вы измеряете численность населения во всех 50 штатах США, ваши точки данных будут состоять из миллионов, поэтому вы должны использовать тепловую карту. Если вы просто пытаетесь показать взаимосвязь между количеством часов, потраченных на учебу, и их влиянием на оценки, ваши данные будут выглядеть так:

Дополнительные ресурсы

Пример дерева решений, используемый в этом чтении, является одним из многих. Существует несколько деревьев решений с различными уровнями детализации, которые вы можете использовать для принятия визуальных решений. Если вам нужна более подробная информация о дополнительных визуальных параметрах, изучите следующие ресурсы:

  • От данных к визуализации: это отличный анализ большого дерева решений. С помощью этого всеобъемлющего выбора вы можете искать на основе имеющихся у вас данных или щелкать каждый графический пример для определения и правильного использования.
  • Выбор лучшей диаграммы: это видео на YouTube, состоящее из двух частей, поможет избавиться от догадок при выборе диаграммы данных. В зависимости от типа данных, которые вы хотите проиллюстрировать, вы узнаете, когда использовать, а когда следует избегать, а также несколько примеров передового опыта. Часть 2 этого видео содержит еще больше примеров различных диаграмм, гарантируя наличие диаграммы для каждого типа данных.

Спасибо