COVID 19 TWITTER АНАЛИЗ НАСТРОЕНИЙ

Это анализ настроений Covid 19 в отношении разнообразного характера твитов, чтобы проанализировать различные эмоции широкой публики по отношению к covid 19. Эти настроения подразделяются на положительные, отрицательные и нейтральные твиты.

Анализ настроений, также известный как анализ мнений, представляет собой метод обработки естественного языка, который используется для анализа и определения эмоционального тона или настроения фрагмента текста. Целью этого анализа является выявление и извлечение из текстовых данных субъективной информации, такой как отношения, мнения, эмоции и намерения, и их классификация по различным категориям, таким как положительные, отрицательные или нейтральные. Этот анализ предназначен для понимания и интерпретации мнений и отношения людей к вакцинам против COVID-19 для принятия решений. Анализ настроений может выполняться с использованием различных методов, включая системы на основе правил, алгоритмы машинного обучения и модели глубокого обучения.

В этом проекте я использовал обработку естественного языка (NLP) для анализа твитов и их классификации на положительные, отрицательные и нейтральные твиты. Существуют различные модели, которые можно использовать для точной настройки предварительно обученных моделей, таких как BERT, roBERTa, alBERT и DistilBERT. В этом анализе настроений в Твиттере DistilBERT использовался для точной настройки помеченного набора данных твитов, чтобы предсказать настроение данного твита.

DistilBERT — это уменьшенная и более быстрая версия модели BERT (представления двунаправленного кодировщика от преобразователей), которая предварительно обучена на больших объемах текстовых данных. В этом анализе настроений в Твиттере DistilBERT использовался для точной настройки помеченного набора данных твитов, чтобы предсказать настроение данного твита. Модель была настроена так, чтобы классифицировать твиты по трем категориям: положительные, отрицательные или нейтральные, в зависимости от тона сообщения. DistilBERT принимает необработанный текст твита в качестве входных данных, а на выходе представляет собой прогнозируемую метку тональности для этого твита. Точно настроенная модель DistilBERT использовалась в приложении Gradio, чтобы пользователи могли вводить твит и получать в качестве вывода прогнозируемую метку тональности.

Во-первых, все необходимые библиотеки должным образом установлены, а ключевые библиотеки импортированы. Наборы данных были загружены, обучены и протестированы.

Затем проверяются нулевые значения, а данные поезда разбиваются на обучающие и проверочные наборы и настраиваются модель distilBERT.

Затем были загружены предварительно обученные данные, запущена окончательная оценка, и код доступа от Hugging Face используется для входа в Hugging Face.

После точной настройки предварительно обученной модели приложение Gradio строится с удобным интерфейсом, в котором входные тексты можно использовать для прогнозирования выраженного настроения.

Когда приложение Gradio запущено на ноутбуке, следующим шагом будет создание нового пространства на Hugging Face. Hugging Face отлично работает в области обработки естественного языка (NLP), которая разработала мощную и удобную платформу для создания, обучения и развертывания современных моделей NLP. Их платформа построена на основе популярных фреймворков PyTorch и TensorFlow и включает в себя широкий спектр предварительно обученных моделей, которые можно настроить под конкретные задачи, а также инструменты для обучения пользовательских моделей с нуля.

Hugging Face используется, потому что предоставляет мощную и удобную платформу для создания и развертывания моделей НЛП.

Навигация по Hugging Face похожа на GitHub с различными файлами, такими как ReadMe, gitattributes, файл приложения и файлы требований, как показано ниже.

Чтобы развернуть приложение Gradio в пространстве Hugging Face, файл приложения должен быть оснащен необходимыми импортированными библиотеками и кодами.

Когда все остальное готово, следующим шагом будет выполнение фиксации изменений в файле main и развертывание приложения. Виола! Идет разбег

Чтобы протестировать приложение, были добавлены некоторые комментарии, чтобы увидеть, были ли результаты точно предсказаны как положительные, отрицательные или нейтральные.

Вы можете проверить мой GitHub с более подробной информацией об этом проекте со всеми необходимыми файлами и наборами данных. Это также Ссылка на приложение. Вы можете попробовать и дайте мне знать, что вы думаете.

Подключаемся и в LinkedIn. Было бы приятно связаться с вами.