Публикации по теме 'nltk'


Детектор спам-смс в FlaskApp
spam-sms-dectector.herokuapp.com Привет мир, В этом посте я расскажу вам, как нам следует классифицировать спам-смс с помощью машинного обучения. Прежде всего, представьтесь. Меня зовут « Йогеш Нил , я студент 3-го курса BCA и живу в Сурате, Индия. В машинном обучении нам требуется набор данных классификации смс-спама. Я загрузил набор данных в kaggle, но я поставлю ссылку на репозиторий github, чтобы вы получили все материалы в одном месте...

Резюме извлечения статьи с использованием экспериментальных методов НЛП
Извлечение резюме — это метод получения значимой и полной информации из текста с акцентом на разделы, которые передают полезную информацию, и без потери общего смысла текста. Извлечение резюме направлено на преобразование длинного текста в сокращенные версии, что облегчает его понимание. Используемые методы и библиотеки ● NumPy ● nltk ● Spacy ● газета3k ● Регулярные выражения Резюме Извлечение библиотекигазета3k. Используя газетную библиотеку, мы можем собрать полный текст..

Обнаружение фейковых новостей: предварительная обработка текста
С ростом количества фейковых новостей и дезинформации в Интернете становится все труднее отличить факты от вымысла. А поскольку машинное обучение и обработка естественного языка становятся все более популярными, обнаружение фейковых новостей служит отличным введением в НЛП. Google Cloud Natural Language API - отличная платформа для использования в этом проекте. Просто загрузите набор данных, обучите модель и используйте ее для прогнозирования новых статей. Но прежде чем мы..

Пролог к ​​НЛТК
Это не должно быть учебником. Это всего лишь набор вещей, которые вы можете сделать, зная заранее, если планируете работать с Python NLTK. NLTK — это скорее набор инструментов для обучения, чем инструмент для фактической реализации проекта. В нем много дыр и пробелов, которые нужно заполнить, и вам нужно сделать каждый бит самостоятельно. В конечном итоге вы можете потратить больше времени на смешивание бетона, чем на строительство дороги. Требуется много предварительной обработки,..

Как машины понимают наш язык: введение в обработку естественного языка
Обработка естественного языка для меня одна из самых увлекательных областей науки о данных. Тот факт, что машина может понимать содержание текста с определенной точностью, просто завораживает, а иногда и пугает. Применение НЛП безгранично. Вот как машина классифицирует, является ли электронное письмо спамом, положительный или отрицательный отзыв, и как поисковая система определяет, к какому типу человека вы относитесь, на основе содержания вашего запроса, чтобы соответствующим образом..

Вопросы по теме 'nltk'

может ли NLTK/pyNLTK работать на каждом языке (т.е. не на английском) и как?
Как я могу указать NLTK обрабатывать текст на определенном языке? Время от времени я пишу специализированную процедуру NLP для тегирования POS, токенизации и т. д. в текстовом домене, отличном от английского (но все еще индуистско-европейского)....
8303 просмотров
schedule 03.03.2022

Анализ настроений с помощью NLTK Python для предложений с использованием образцов данных или веб-сервиса?
Я приступаю к проекту НЛП по анализу сантиментов. Я успешно установил NLTK для Python (кажется, отличное программное обеспечение для этого). Однако мне сложно понять, как его можно использовать для выполнения моей задачи. Вот моя задача: Я...
16688 просмотров
schedule 22.03.2022

Поток кода Python не работает должным образом?
Я пытаюсь обрабатывать различные тексты с помощью регулярных выражений и NLTK Python, которые находятся по адресу http://www.nltk.org/book- . Я пытаюсь создать генератор случайного текста, и у меня возникла небольшая проблема. Во-первых, вот мой...
442 просмотров
schedule 14.09.2022

Использование NLTK и WordNet; как преобразовать глагол простого времени в формы причастия настоящего, прошедшего или прошедшего времени?
Используя NLTK и WordNet , как преобразовать глагол простого времени в его форму причастия настоящего, прошедшего или прошедшего времени ? Например: Я хочу написать функцию, которая выдала бы мне глагол в ожидаемой форме, как показано ниже....
29707 просмотров
schedule 23.10.2022

Распознавание именованных объектов из личного справочника с использованием Python
Я пытаюсь распознавать именованные сущности в python, используя NLTK. Я хочу извлечь личный список навыков. У меня есть список навыков, и я хотел бы найти их в заявке и пометить навыки. Я заметил, что в NLTK есть тег NER для предопределенных тегов,...
2206 просмотров
schedule 08.04.2022

Как получить прошедшее время слова с помощью nltk и WordNet в Python?
Какие пакеты требуются для выполнения приведенных ниже команд? Код import nltk from nltk.corpus import wordnet v = 'go' present = present_tense(v) I got an error saying- Сообщение об ошибке NameError: имя present_tense не определено
4322 просмотров
schedule 28.06.2022

что такое вывод MeCab и набор тегов?
Может ли кто-нибудь просветить меня по поводу вывода MeCab по умолчанию? какая аннотация выводит MeCab и где я могу найти набор тегов для морфо-анализатора http://mecab.sourceforge.net/ кто-нибудь может расшифровать этот вывод от MeCab?...
1727 просмотров
schedule 23.06.2023

Определение языка для очень короткого текста
Я создаю приложение для определения языка коротких текстов, в среднем ‹ 100 символов и содержащих сленг (например, твиты, пользовательские запросы, смс). Все библиотеки, которые я тестировал, хорошо работают с обычными веб-страницами, но не с очень...
4117 просмотров
schedule 13.08.2022

Почему эти слова считаются игнорируемыми?
У меня нет формального опыта в обработке естественного языка, и мне было интересно, может ли кто-нибудь из НЛП пролить свет на это. Я играю с библиотекой NLTK , и я специально изучал функцию стоп-слов, предоставляемую этим пакетом: В [80]:...
1838 просмотров

Может ли WordNetLemmatizer в Nltk выводить слова?
Я хочу найти основы слов с Wordnet . Есть ли у wordnet функция стемминга? Я использую этот импорт для своей основы, но он не работает должным образом. from nltk.stem.wordnet import WordNetLemmatizer WordNetLemmatizer().lemmatize('Having','v')
3565 просмотров
schedule 12.01.2024

Преобразование нетегированных корпусов в тегированные (NLTK)
У меня есть корпус открытого текста, который я хочу пометить и сохранить, чтобы я мог использовать его в дальнейшем. Как лучше всего это сделать? Я уже сделал свой тегер, но я не могу найти способ изменить корпус, чтобы он не был беспорядочным.
646 просмотров
schedule 08.08.2022

NLTK/NLP создает предметный классификатор «многие ко многим/многометочный»
У меня есть помеченный человеком корпус из более чем 5000 тематических индексированных документов в XML. Они различаются по размеру от нескольких сотен килобайт до нескольких сотен мегабайт. От коротких статей до рукописей. Все они были...
2473 просмотров
schedule 16.04.2024

Проблема с установкой Pip NLTK в Ubuntu с использованием Virtualenv
Для справки можно найти документацию по установке nltk, nltk здесь Есть ли способ установить nltk с помощью pip и virtualenv? Я установил зависимости с помощью pip в свой virtualenv, но когда я пытаюсь установить nltk, это не удается. Ошибка...
1875 просмотров
schedule 12.03.2022

Извлечение конкретной информации из текста
Я хотел бы получить некоторые данные из текстового файла. Я решил сделать это с помощью Natural Language Toolkit , но я открыт для предложений, если есть лучший способ сделать это. Вот пример: Мне нужен рейс из Нью-Йорка, штат Нью-Йорк, в...
534 просмотров
schedule 24.02.2023

извлечение фрагментов в python с помощью nltk
скажем, у меня есть тегированный корпус (например, коричневый корпус), и я хочу извлечь слова, которые помечены только «/ nn». Например : Daniel/np termed/vbd ``/`` extremely/rb conservative/jj ''/'' his/pp$ estimate/nn........
444 просмотров
schedule 22.02.2023

Извлечение слов с помощью nltk из немецкого текста
Я пытаюсь извлечь слова из немецкого документа, когда я использую следующий метод, как описано в учебнике nltk, мне не удается получить слова со специальными символами языка. ptcr = nltk.corpus.PlaintextCorpusReader(Corpus, '.*'); words =...
17362 просмотров
schedule 20.04.2023

семантический поисковик и навигатор
Привет, я прошел короткий курс искусственного интеллекта, и мы разработали чат-бота на основе AIML и python. У меня есть новая задача разработать какую-то форму семантической поисковой системы. Я хочу, чтобы люди могли перемещаться по данным или...
354 просмотров
schedule 05.05.2023

Клонирование корпуса в НЛТК?
Я пытаюсь создать свой корпус в НЛТК. Я читал часть документации по этому поводу, и это кажется довольно сложным ... все, что я хотел сделать, это «клонировать» корпус обзоров фильмов, но с моим собственным текстом. Теперь я знаю, что могу просто...
294 просмотров
schedule 29.04.2022

Признание нетрадиционных именованных сущностей
Я пытаюсь разработать несколько нетрадиционную систему NER, которая помечает определенные многословные строки как отдельные единицы / токены. Есть много классных инструментов NER, но у меня есть несколько особых потребностей, из-за которых...
1261 просмотров
schedule 19.04.2023

Проверка орфографии с автозаменой
У меня есть файл TSV (значения, разделенные табуляцией), в котором мне нужно проверить орфографию на наличие опечаток и комбинированных слов (например, «Я люблю тебя» и «Я люблю тебя»). Я установил Aspell на свой компьютер и могу запустить его...
4397 просмотров
schedule 25.02.2022