Публикации по теме 'data-science'


Анализ настроений в отношении финансовых новостей с помощью трансферного обучения
Прогнозирование настроений в заголовках финансовых новостей с помощью нескольких строк кода Анализ тональности  – это приложение для обработки естественного языка (NLP), которое включает определение эмоционального тона или тональности текста. Используя анализ настроений, предприятия и организации могут получить ценную информацию о том, как их аудитория относится к их продуктам или услугам, а также к их конкурентам. Анализ настроений может быть мощным инструментом в мире финансовых..

Демистификация модулей и пакетов в Python
Модули и пакеты — это ядро ​​любого крупного проекта. Я покажу несколько советов, связанных с ними, например, как организовать пакеты и создать пространства имен. Когда я проверяю сложные проекты на Github, я обычно теряюсь среди бесконечного количества папок и исходных файлов. Авторы этих отчётов считают их кастомизацию довольно очевидной для себя, и это вполне понятно; К сожалению, я изо всех сил пытаюсь иметь такое же представление о структурировании различных папок и исходных..

Прием данных
Что такое прием данных? Как это делается с помощью скриптов python? Согласно Кембриджскому словарю , данные означают информацию, особенно факты или числа, собранные для изучения и рассмотрения и использования для помощи в принятии решений, или информацию в электронной форме, которая может быть сохранена и использована компьютером . Проглатывание означает «процесс всасывания питательных веществ или лекарств в организм при их употреблении в пищу или питье». Следовательно, прием..

Модели ИИ теперь могут получить доступ к языкам, отличным от английского.
Ученые из Университета Ватерлоо разработали модель искусственного интеллекта , которая позволяет ПК обрабатывать более широкий набор человеческих диалектов. Это значительный шаг вперед в этой области, учитывая количество диалектов, от которых часто отказываются в системе программирования. Африканские диалекты регулярно не учитываются исследователями ПК, что привело к ограничению возможностей обработки естественного языка (NLP) на суше. Новая диалектная модель была создана группой..

Освоение основ статистики для науки о данных - от начального до продвинутого уровня - часть 3
Статистика  – это раздел математики, который занимается сбором, анализом, интерпретацией и представлением числовых данных. В науке о данных статистика используется для извлечения идей и значимой информации из больших объемов данных. В этой статье мы рассмотрим предварительную статистику. Если вы пропустили часть 1 и часть 2, вы можете найти ее здесь. Основы статистики для науки о данных — от основ до продвинутого уровня — часть 1 Основы статистики для науки о данных..

Полное руководство по прогнозированию временных рядов с использованием Sklearn, Pandas и Numpy
Практическое руководство и платформа для использования любой модели scikit-learn для прогнозирования временных рядов в Python. Введение Существует много так называемых традиционных моделей для прогнозирования временных рядов, таких как семейство моделей SARIMAX , экспоненциальное сглаживание или BATS и TBATS . Однако очень редко мы упоминаем наиболее распространенные модели машинного обучения для регрессии, такие как деревья решений, случайные леса, повышение градиента или..

Понимание Debiasing Framework, часть 2 (ИИ)
MTMD: многомасштабное обучение временной памяти и эффективная система устранения смещения для прогнозирования тренда акций (arXiv) Автор: Минцзе Ван , Мингзе Чжан , Цзяньсюн Го , Вейцзя Цзя . Аннотация: В последнее время методы машинного обучения показали перспективность прогнозирования тренда акций. Однако изменчивый и динамичный характер фондового рынка затрудняет прямое применение методов машинного обучения. Предыдущие методы обычно используют временную информацию об..