Публикации по теме 'data-analysis'


Возможности SQL Агрегированные оконные функции с данными Disney
СРЕДН(), СЧЁТ(), МАКС(), МИН(), СУММ() Оконные функции позволяют нам выполнять операции и отображать результаты для каждой строки, в отличие от обычных операций SQL, которые объединяют несколько строк на основе вашего запроса. Обычные агрегатные функции SQL необходимы для разбиения нескольких строк на решения. Эти функции, например, могут отображать среднее значение нескольких строк и выводить одно числовое значение или отображать количество экземпляров в группе строк. В..

Участки Бара в Сиборн
Что мы будем изучать сегодня? В этой статье мы узнаем, как интерпретировать данные с помощью гистограммы с помощью Seaborn . Гистограмма — это наиболее распространенный инструмент визуализации, который использует столбцы для сравнения данных по категориям. Он показывает связь между числовой и категориальной переменной. Размер полосы представляет ее числовое значение. Почему важно учиться? Существуют различные причины для использования гистограммы, что делает необходимым..

Комбо-диаграммы с Seaborn и Python
Наложение двух графиков на одну диаграмму вступление Библиотеки, код и визуальные элементы будут ниже, но сначала я хотел бы кратко рассказать, почему я решил поделиться этим со всеми в этом сообществе. Если вы просто хотите перейти к руководству, просто пропустите введение. Во время работы некоторые из моих коллег, которые используют Excel в качестве основного инструмента, любят пытаться найти способы, в которых Excel является лучшим инструментом, чем Python. Из-за того, что они..

Исследовательские работы по объяснению искусственного интеллекта (XAI), часть 2
Объяснимый искусственный интеллект для определения температуры выхлопных газов турбовентиляторных двигателей ( arXiv ) Автор: Мариос Кефалас , Хуан де Сантьяго Рохо-младший , Астерис Апостолидис , Дирк ван ден Херик , Бас ван Штайн , Томас Бэк Аннотация: моделирование на основе данных является обязательным инструментом в различных промышленных приложениях, включая многие приложения в секторах аэронавтики и коммерческой авиации. Эти модели отвечают за предоставление..

t-SNE: за математикой
Будучи одним из наиболее обсуждаемых алгоритмов уменьшения размерности в последние годы, особенно для визуализаций, я подумал, что мне нужно время, чтобы помочь другим развить интуицию относительно того, что на самом деле делает t-SNE. Разработанный в 2008 году Лоренс ван дер Маатенс и Джеффри Хинтон, t-распределенное стохастическое соседнее встраивание в отличие от анализа главных компонентов (PCA) - это нелинейный метод, используемый для визуализации данных более высоких измерений в..

Исследовательский анализ данных классификационных задач с помощью Tableau
Исследовательский анализ данных с помощью Tableau В машинном обучении исследовательский анализ данных или EDA часто является первым, что мы делаем, чтобы познакомиться с новым набором данных. Он выполняется для того, чтобы сделать общие наблюдения за данными, обобщить их, изучить некоторые основные тенденции или выявить скрытые связи между переменными. Инструменты визуализации данных, такие как Qlik или Tableau, помогают лучше ориентироваться в новых данных и популярным образом..

Зачем изучать язык программирования Python
Если вы планируете погрузиться в мир программирования, вам может быть интересно, почему вы должны изучать Python. Существует множество языков программирования, каждый из которых имеет свои преимущества и недостатки. Так что же отличает Python от остальных? Вот несколько причин, по которым изучение Python может быть для вас хорошим выбором. Python легко освоить Одна из основных причин, по которой люди предпочитают изучать Python, заключается в том, что его относительно легко..