Публикации по теме 'spacy'


Мне не удалось импортировать spacy на Kaggle, и вот как я решил проблему
Я провел последние пару дней, работая над библиотекой spacy, которая представляет собой библиотеку с открытым исходным кодом, используемую для преобразования слов в векторы в обработке естественного языка или НЛП. Сегодня я потратил несколько часов на решение сложной задачи. По какой-то причине я не мог получить пространство для установки и импорта на Kaggle, и все мои усилия по поиску правильного кода для облегчения этого не увенчались успехом. Я решил проверить код, который мне..

Тренировка собственного анализатора настроений с помощью spaCy
Привет народ!!! В этом блоге я собираюсь обсудить обучение анализатора настроений на основе LSTM с помощью spaCy. Недавно я работал над анализом настроений в твиттере и потратил довольно много времени на изучение уже доступных предварительно обученных моделей для этой цели. Я встречал библиотеки Python, такие как TextBlob , VaderSentimentAnalyser , Flair и т. Д. . Хотя эти библиотеки работают довольно хорошо, мы не можем настраивать их в соответствии с нашими потребностями...

Резюме извлечения статьи с использованием экспериментальных методов НЛП
Извлечение резюме — это метод получения значимой и полной информации из текста с акцентом на разделы, которые передают полезную информацию, и без потери общего смысла текста. Извлечение резюме направлено на преобразование длинного текста в сокращенные версии, что облегчает его понимание. Используемые методы и библиотеки ● NumPy ● nltk ● Spacy ● газета3k ● Регулярные выражения Резюме Извлечение библиотекигазета3k. Используя газетную библиотеку, мы можем собрать полный текст..

Spacy Pipelines: Одиссея для новичков
Привет читатели Создает ли у вас проблемы при обработке большого количества текстовых данных? Вы запускаете миллион записей за миллионы раз? Между запуском программы и получением результата проходит вечность? Вуаля (барабанная дробь): представляем просторные конвейеры Spacy: Введение в нашего спасителя в нескольких строках Spacy - это бесплатная библиотека Python с открытым исходным кодом. Он написан на Cython и создан для извлечения языковых функций и помощи в его обработке..

Med7 - система извлечения клинической информации на Python и spaCy
Краткий обзор В последние годы в области здравоохранения и биомедицинских исследований произошел значительный технологический прогресс, в основном благодаря доступности огромного количества цифровых данных, генерируемых пациентами, и демократизации современных алгоритмов компьютерных наук и инженерии. Такие фреймворки и библиотеки с открытым исходным кодом, среди прочего, как PyTorch , TensorFlow , fast.ai , spacy.io , scikit-learn и huggingface.co упростили использование..

Вопросы по теме 'spacy'

как spacy-io использует многопоточность без GIL?
Ссылаясь на этот пост Многопоточный НЛП со Spacy pipe , в котором говорится об этом, а здесь с https://spacy.io/ from spacy.attrs import * # All strings mapped to integers, for easy export to numpy np_array = doc.to_array([LOWER, POS,...
1808 просмотров
schedule 04.04.2023

Как использовать синтаксический анализатор / теггер SyntaxNet с API spaCy?
Я использую пакет Python spaCy для синтаксического анализа и тегирования текста и использую полученное дерево зависимостей и другие атрибуты для определения значения. Теперь я хотел бы использовать Parsey McParseface от SyntaxNet для...
2100 просмотров
schedule 20.08.2022

как использовать пространственный лемматизатор, чтобы привести слово к базовой форме
Я новичок в spacy и хочу использовать его функцию лемматизатора, но я не знаю, как ее использовать, например, в строки слов, которые вернут строку с базовой формой слова. Примеры: 'слова' => 'слово' «сделал» => «сделал» Спасибо.
59390 просмотров
schedule 06.08.2022

создать экземпляр EntityRecognizer, работающий на героку
Пытаюсь запустить spaCy на Heroku. Если я открою REPL с помощью heroku run python , я с радостью смогу import spacy и nlp=spacy.load('en') , но если я попытаюсь: from spacy.pipeline import EntityRecognizer Я получаю сообщение об ошибке:...
239 просмотров
schedule 31.12.2022

Найдите процент токенов, используемых двумя документами с пробелом
для nltk это будет что-то вроде: def symm_similarity(textA,textB): textA = set(word_tokenize(textA)) textB = set(word_tokenize(textB)) intersection = len(textA.intersection(textB)) difference =...
630 просмотров
schedule 10.04.2024

Как я могу предотвратить разбиение токенизатором spacy определенной подстроки при токенизации строки?
Как я могу предотвратить разбиение токенизатором spacy определенной подстроки при токенизации строки? В частности, у меня есть это предложение: После отмены регистрации папка ушла из оболочки. который токенизируется как [Once /...
3048 просмотров
schedule 03.05.2022

Ошибки импорта Spacy из Undefined Symbol
Я уже обращался к разработчикам на их странице проблем GitHub, но пока ничего не помогает https://github.com/explosion/spaCy/issues/855 Создал новый env с conda conda create -n spacy python=3.5 ipython а затем установите spacy (1.6.0) с...
811 просмотров
schedule 29.06.2023

Облегченные фреймворки НЛП для Python
В данный момент я использую spaCy для определения семантического сходства между двумя строками. Он работает хорошо и требует всего пару строк кода, а вся работа выполняется за кулисами: >>> import spacy >>> nlp =...
433 просмотров
schedule 02.04.2023

Можем ли мы использовать spacy с MXnet
Можем ли мы использовать spacy с MXnet для создания глубокой нейронной сети (NLP) Мы создаем приложение, используя mxnet. Как использовать spacy с Mxnet
133 просмотров
schedule 12.03.2023

Обновление словаря spaCy
Мне было интересно, можно ли обновить словарный запас spacys по умолчанию. Я пытаюсь сделать следующее: запустить word2vec на моем собственном корпусе с помощью gensim загрузить векторы в мою модель с помощью...
2119 просмотров
schedule 31.07.2023

Как добавить собственные существительные в качестве словаря к моделям Spacy?
Я использую Spacy 1.8.0 с Python, и я хотел бы использовать Spacy для анализа медицинских документов. Есть способ добавить новые типы сущностей в распознаватель именованных сущностей spacy. Однако можно ли добавить названия лекарств / препаратов в...
729 просмотров

Что Spacy использует для создания векторных представлений?
Что такое встроенный в Spacy метод создания векторных представлений? Я применил НЛП к своему корпусу, а затем использовал .similarity (косинусное сходство), чтобы отобразить документы, которые были «похожими». Однако я не уверен, какой метод spacy...
495 просмотров
schedule 07.09.2022

Как извлекать числа (вместе со сравнительными прилагательными или диапазонами)
Я работаю над двумя проектами НЛП на Python, и у обоих есть аналогичная задача по извлечению числовых значений и операторов сравнения из предложений, например следующего: "... greater than $10 ... ", "... weight not more than 200lbs ...", "......
4749 просмотров
schedule 24.12.2022

Как выполнить предварительную обработку текста с помощью spaCy?
Как выполнить шаги предварительной обработки, такие как удаление стоп-слов, удаление знаков препинания, выделение корней и лемматизация в spaCy с использованием python. У меня есть текстовые данные в файле csv, такие как абзацы и предложения. Я...
23475 просмотров
schedule 17.11.2022

Spacy и Sense2vec несовместимы
При установке sense2vec выполняется откат версии spacy до 0.101.0 . Ни одна из текущих spacy английских моделей не совместима с 0.101.0 и вызывает эту ошибку при попытке загрузки: super(Package, self).__init__(defaults=meta['package'])...
177 просмотров
schedule 30.03.2022

Типы моделей Spacy и сопоставление доступных функций
Просторные модели связаны с различными «типами», включая словарь, синтаксис, сущности и векторы. Способ сопоставления сущностей и векторов с функциями, доступными в документе, очевиден (распознавание сущностей и векторы слов), но как словарный...
63 просмотров
schedule 27.08.2023

Флаг spaCy 'IS_SPACE' не работает
Пытался сопоставить что-то вроде «125,00 долларов США за акцию» на spaCy, используя сопоставление на основе правил, как упомянуто здесь https://github.com/explosion/spaCy/issues/882 . Однако при испытании nlp = en_core_web_sm.load() matcher =...
610 просмотров
schedule 08.01.2023

AssertionError при попытке добавить новый объект с помощью сопоставителя на spaCy
Я пытаюсь сопоставить всю электронную почту, например, просмотреть текст в куче документов, и добавить его к пользовательской метке NER под названием «ЭЛЕКТРОННАЯ ПОЧТА». Вот код для тестового случая. nlp = spacy.load('en_core_web_sm') matcher =...
398 просмотров
schedule 21.05.2022

Разбор пространственной зависимости для Его слова
Как бы я мог различить «Его» слово в любом предложении как Определяющее или как местоимение в Пространстве, потому что, если я дам word.dep_ вместо «его» слова, оно даст как «возможность» (модификатор владения) в обоих случаях. Например: «Роналду...
141 просмотров
schedule 20.07.2022

Извлечение содержимого из документов
Я хочу извлечь содержимое из резюме с различными разделами, такими как навыки, сертификаты, опыт работы и т. д., с помощью НЛП и пометить их в соответствии с их категорией. Пока я могу написать базовые правила для извлечения текста по разным знакам...
481 просмотров