Статьи по тематике nltk

Публикации по теме 'nltk'

Детектор спам-смс в FlaskApp

spam-sms-dectector.herokuapp.com Привет мир, В этом посте я расскажу вам, как нам следует классифицировать спам-смс с помощью машинного обучения. Прежде всего, представьтесь. Меня зовут « Йогеш Нил , я студент 3-го курса BCA и живу в Сурате, Индия. В машинном обучении нам требуется набор данных классификации смс-спама. Я загрузил набор данных в kaggle, но я поставлю ссылку на репозиторий github, чтобы вы получили все материалы в одном месте...

Резюме извлечения статьи с использованием экспериментальных методов НЛП

Извлечение резюме — это метод получения значимой и полной информации из текста с акцентом на разделы, которые передают полезную информацию, и без потери общего смысла текста. Извлечение резюме направлено на преобразование длинного текста в сокращенные версии, что облегчает его понимание. Используемые методы и библиотеки ● NumPy ● nltk ● Spacy ● газета3k ● Регулярные выражения Резюме Извлечение библиотекигазета3k. Используя газетную библиотеку, мы можем собрать полный текст..

Обнаружение фейковых новостей: предварительная обработка текста

С ростом количества фейковых новостей и дезинформации в Интернете становится все труднее отличить факты от вымысла. А поскольку машинное обучение и обработка естественного языка становятся все более популярными, обнаружение фейковых новостей служит отличным введением в НЛП. Google Cloud Natural Language API - отличная платформа для использования в этом проекте. Просто загрузите набор данных, обучите модель и используйте ее для прогнозирования новых статей. Но прежде чем мы..

Пролог к НЛТК

Это не должно быть учебником. Это всего лишь набор вещей, которые вы можете сделать, зная заранее, если планируете работать с Python NLTK. NLTK — это скорее набор инструментов для обучения, чем инструмент для фактической реализации проекта. В нем много дыр и пробелов, которые нужно заполнить, и вам нужно сделать каждый бит самостоятельно. В конечном итоге вы можете потратить больше времени на смешивание бетона, чем на строительство дороги. Требуется много предварительной обработки,..

Как машины понимают наш язык: введение в обработку естественного языка

Обработка естественного языка для меня одна из самых увлекательных областей науки о данных. Тот факт, что машина может понимать содержание текста с определенной точностью, просто завораживает, а иногда и пугает. Применение НЛП безгранично. Вот как машина классифицирует, является ли электронное письмо спамом, положительный или отрицательный отзыв, и как поисковая система определяет, к какому типу человека вы относитесь, на основе содержания вашего запроса, чтобы соответствующим образом..

Вопросы по теме 'nltk'

может ли NLTK/pyNLTK работать на каждом языке (т.е. не на английском) и как?

Как я могу указать NLTK обрабатывать текст на определенном языке? Время от времени я пишу специализированную процедуру NLP для тегирования POS, токенизации и т. д. в текстовом домене, отличном от английского (но все еще индуистско-европейского)....

8303 просмотров

python nlp nltk

03.03.2022

Анализ настроений с помощью NLTK Python для предложений с использованием образцов данных или веб-сервиса?

Я приступаю к проекту НЛП по анализу сантиментов. Я успешно установил NLTK для Python (кажется, отличное программное обеспечение для этого). Однако мне сложно понять, как его можно использовать для выполнения моей задачи. Вот моя задача: Я...

16688 просмотров

nlp classification nltk weka

22.03.2022

Поток кода Python не работает должным образом?

Я пытаюсь обрабатывать различные тексты с помощью регулярных выражений и NLTK Python, которые находятся по адресу http://www.nltk.org/book- . Я пытаюсь создать генератор случайного текста, и у меня возникла небольшая проблема. Во-первых, вот мой...

442 просмотров

python text parsing nltk

14.09.2022

Использование NLTK и WordNet; как преобразовать глагол простого времени в формы причастия настоящего, прошедшего или прошедшего времени?

Используя NLTK и WordNet , как преобразовать глагол простого времени в его форму причастия настоящего, прошедшего или прошедшего времени ? Например: Я хочу написать функцию, которая выдала бы мне глагол в ожидаемой форме, как показано ниже....

29707 просмотров

python nlp nltk wordnet

23.10.2022

Распознавание именованных объектов из личного справочника с использованием Python

Я пытаюсь распознавать именованные сущности в python, используя NLTK. Я хочу извлечь личный список навыков. У меня есть список навыков, и я хотел бы найти их в заявке и пометить навыки. Я заметил, что в NLTK есть тег NER для предопределенных тегов,...

2206 просмотров

python nlp named-entity-recognition nltk

08.04.2022

Как получить прошедшее время слова с помощью nltk и WordNet в Python?

Какие пакеты требуются для выполнения приведенных ниже команд? Код import nltk from nltk.corpus import wordnet v = 'go' present = present_tense(v) I got an error saying- Сообщение об ошибке NameError: имя present_tense не определено

4322 просмотров

python nltk wordnet

28.06.2022

что такое вывод MeCab и набор тегов?

Может ли кто-нибудь просветить меня по поводу вывода MeCab по умолчанию? какая аннотация выводит MeCab и где я могу найти набор тегов для морфо-анализатора http://mecab.sourceforge.net/ кто-нибудь может расшифровать этот вывод от MeCab?...

1727 просмотров

nlp translation nltk pos-tagger mecab

23.06.2023

Определение языка для очень короткого текста

Я создаю приложение для определения языка коротких текстов, в среднем ‹ 100 символов и содержащих сленг (например, твиты, пользовательские запросы, смс). Все библиотеки, которые я тестировал, хорошо работают с обычными веб-страницами, но не с очень...

4117 просмотров

nlp nltk language-detection

13.08.2022

Почему эти слова считаются игнорируемыми?

У меня нет формального опыта в обработке естественного языка, и мне было интересно, может ли кто-нибудь из НЛП пролить свет на это. Я играю с библиотекой NLTK , и я специально изучал функцию стоп-слов, предоставляемую этим пакетом: В [80]:...

1838 просмотров

machine-learning nlp nltk stop-words language-agnostic

13.09.2023

Может ли WordNetLemmatizer в Nltk выводить слова?

Я хочу найти основы слов с Wordnet . Есть ли у wordnet функция стемминга? Я использую этот импорт для своей основы, но он не работает должным образом. from nltk.stem.wordnet import WordNetLemmatizer WordNetLemmatizer().lemmatize('Having','v')

3565 просмотров

python nltk wordnet lemmatization stemming

12.01.2024

Преобразование нетегированных корпусов в тегированные (NLTK)

У меня есть корпус открытого текста, который я хочу пометить и сохранить, чтобы я мог использовать его в дальнейшем. Как лучше всего это сделать? Я уже сделал свой тегер, но я не могу найти способ изменить корпус, чтобы он не был беспорядочным.

646 просмотров

python nltk stop-words

08.08.2022

NLTK/NLP создает предметный классификатор «многие ко многим/многометочный»

У меня есть помеченный человеком корпус из более чем 5000 тематических индексированных документов в XML. Они различаются по размеру от нескольких сотен килобайт до нескольких сотен мегабайт. От коротких статей до рукописей. Все они были...

2473 просмотров

python machine-learning nlp nltk statistics

16.04.2024

Проблема с установкой Pip NLTK в Ubuntu с использованием Virtualenv

Для справки можно найти документацию по установке nltk, nltk здесь Есть ли способ установить nltk с помощью pip и virtualenv? Я установил зависимости с помощью pip в свой virtualenv, но когда я пытаюсь установить nltk, это не удается. Ошибка...

1875 просмотров

pip python ubuntu virtualenv nltk

12.03.2022

Извлечение конкретной информации из текста

Я хотел бы получить некоторые данные из текстового файла. Я решил сделать это с помощью Natural Language Toolkit , но я открыт для предложений, если есть лучший способ сделать это. Вот пример: Мне нужен рейс из Нью-Йорка, штат Нью-Йорк, в...

534 просмотров

python nltk

24.02.2023

извлечение фрагментов в python с помощью nltk

скажем, у меня есть тегированный корпус (например, коричневый корпус), и я хочу извлечь слова, которые помечены только «/ nn». Например : Daniel/np termed/vbd ``/`` extremely/rb conservative/jj ''/'' his/pp$ estimate/nn........

444 просмотров

python nlp nltk

22.02.2023

Извлечение слов с помощью nltk из немецкого текста

Я пытаюсь извлечь слова из немецкого документа, когда я использую следующий метод, как описано в учебнике nltk, мне не удается получить слова со специальными символами языка. ptcr = nltk.corpus.PlaintextCorpusReader(Corpus, '.*'); words =...

17362 просмотров

python nlp nltk text-mining

20.04.2023

семантический поисковик и навигатор

Привет, я прошел короткий курс искусственного интеллекта, и мы разработали чат-бота на основе AIML и python. У меня есть новая задача разработать какую-то форму семантической поисковой системы. Я хочу, чтобы люди могли перемещаться по данным или...

354 просмотров

text nlp nltk semantics aiml

05.05.2023

Клонирование корпуса в НЛТК?

Я пытаюсь создать свой корпус в НЛТК. Я читал часть документации по этому поводу, и это кажется довольно сложным ... все, что я хотел сделать, это «клонировать» корпус обзоров фильмов, но с моим собственным текстом. Теперь я знаю, что могу просто...

294 просмотров

python nlp nltk corpus

29.04.2022

Признание нетрадиционных именованных сущностей

Я пытаюсь разработать несколько нетрадиционную систему NER, которая помечает определенные многословные строки как отдельные единицы / токены. Есть много классных инструментов NER, но у меня есть несколько особых потребностей, из-за которых...

1261 просмотров

python nlp nltk stanford-nlp

19.04.2023

Проверка орфографии с автозаменой

У меня есть файл TSV (значения, разделенные табуляцией), в котором мне нужно проверить орфографию на наличие опечаток и комбинированных слов (например, «Я люблю тебя» и «Я люблю тебя»). Я установил Aspell на свой компьютер и могу запустить его...

4397 просмотров

python r nltk spell-checking aspell

25.02.2022