Публикации по теме 'spacy'
Мне не удалось импортировать spacy на Kaggle, и вот как я решил проблему
Я провел последние пару дней, работая над библиотекой spacy, которая представляет собой библиотеку с открытым исходным кодом, используемую для преобразования слов в векторы в обработке естественного языка или НЛП.
Сегодня я потратил несколько часов на решение сложной задачи. По какой-то причине я не мог получить пространство для установки и импорта на Kaggle, и все мои усилия по поиску правильного кода для облегчения этого не увенчались успехом.
Я решил проверить код, который мне..
Тренировка собственного анализатора настроений с помощью spaCy
Привет народ!!! В этом блоге я собираюсь обсудить обучение анализатора настроений на основе LSTM с помощью spaCy. Недавно я работал над анализом настроений в твиттере и потратил довольно много времени на изучение уже доступных предварительно обученных моделей для этой цели. Я встречал библиотеки Python, такие как TextBlob , VaderSentimentAnalyser , Flair и т. Д. . Хотя эти библиотеки работают довольно хорошо, мы не можем настраивать их в соответствии с нашими потребностями...
Резюме извлечения статьи с использованием экспериментальных методов НЛП
Извлечение резюме — это метод получения значимой и полной информации из текста с акцентом на разделы, которые передают полезную информацию, и без потери общего смысла текста. Извлечение резюме направлено на преобразование длинного текста в сокращенные версии, что облегчает его понимание.
Используемые методы и библиотеки
● NumPy ● nltk ● Spacy ● газета3k ● Регулярные выражения
Резюме Извлечение библиотекигазета3k.
Используя газетную библиотеку, мы можем собрать полный текст..
Spacy Pipelines: Одиссея для новичков
Привет читатели
Создает ли у вас проблемы при обработке большого количества текстовых данных? Вы запускаете миллион записей за миллионы раз? Между запуском программы и получением результата проходит вечность?
Вуаля (барабанная дробь): представляем просторные конвейеры
Spacy: Введение в нашего спасителя в нескольких строках
Spacy - это бесплатная библиотека Python с открытым исходным кодом. Он написан на Cython и создан для извлечения языковых функций и помощи в его обработке..
Med7 - система извлечения клинической информации на Python и spaCy
Краткий обзор
В последние годы в области здравоохранения и биомедицинских исследований произошел значительный технологический прогресс, в основном благодаря доступности огромного количества цифровых данных, генерируемых пациентами, и демократизации современных алгоритмов компьютерных наук и инженерии. Такие фреймворки и библиотеки с открытым исходным кодом, среди прочего, как PyTorch , TensorFlow , fast.ai , spacy.io , scikit-learn и huggingface.co упростили использование..
Вопросы по теме 'spacy'
как spacy-io использует многопоточность без GIL?
Ссылаясь на этот пост Многопоточный НЛП со Spacy pipe , в котором говорится об этом,
а здесь с https://spacy.io/
from spacy.attrs import *
# All strings mapped to integers, for easy export to numpy
np_array = doc.to_array([LOWER, POS,...
1808 просмотров
schedule
04.04.2023
Как использовать синтаксический анализатор / теггер SyntaxNet с API spaCy?
Я использую пакет Python spaCy для синтаксического анализа и тегирования текста и использую полученное дерево зависимостей и другие атрибуты для определения значения. Теперь я хотел бы использовать Parsey McParseface от SyntaxNet для...
2100 просмотров
schedule
20.08.2022
как использовать пространственный лемматизатор, чтобы привести слово к базовой форме
Я новичок в spacy и хочу использовать его функцию лемматизатора, но я не знаю, как ее использовать, например, в строки слов, которые вернут строку с базовой формой слова.
Примеры:
'слова' => 'слово'
«сделал» => «сделал»
Спасибо.
59390 просмотров
schedule
06.08.2022
создать экземпляр EntityRecognizer, работающий на героку
Пытаюсь запустить spaCy на Heroku. Если я открою REPL с помощью heroku run python , я с радостью смогу import spacy и nlp=spacy.load('en') , но если я попытаюсь:
from spacy.pipeline import EntityRecognizer
Я получаю сообщение об ошибке:...
239 просмотров
schedule
31.12.2022
Найдите процент токенов, используемых двумя документами с пробелом
для nltk это будет что-то вроде:
def symm_similarity(textA,textB):
textA = set(word_tokenize(textA))
textB = set(word_tokenize(textB))
intersection = len(textA.intersection(textB))
difference =...
630 просмотров
schedule
10.04.2024
Как я могу предотвратить разбиение токенизатором spacy определенной подстроки при токенизации строки?
Как я могу предотвратить разбиение токенизатором spacy определенной подстроки при токенизации строки?
В частности, у меня есть это предложение:
После отмены регистрации папка ушла из оболочки.
который токенизируется как [Once /...
3048 просмотров
schedule
03.05.2022
Ошибки импорта Spacy из Undefined Symbol
Я уже обращался к разработчикам на их странице проблем GitHub, но пока ничего не помогает https://github.com/explosion/spaCy/issues/855
Создал новый env с conda
conda create -n spacy python=3.5 ipython
а затем установите spacy (1.6.0) с...
811 просмотров
schedule
29.06.2023
Облегченные фреймворки НЛП для Python
В данный момент я использую spaCy для определения семантического сходства между двумя строками. Он работает хорошо и требует всего пару строк кода, а вся работа выполняется за кулисами:
>>> import spacy
>>> nlp =...
433 просмотров
schedule
02.04.2023
Можем ли мы использовать spacy с MXnet
Можем ли мы использовать spacy с MXnet для создания глубокой нейронной сети (NLP)
Мы создаем приложение, используя mxnet. Как использовать spacy с Mxnet
133 просмотров
schedule
12.03.2023
Обновление словаря spaCy
Мне было интересно, можно ли обновить словарный запас spacys по умолчанию. Я пытаюсь сделать следующее:
запустить word2vec на моем собственном корпусе с помощью gensim
загрузить векторы в мою модель с помощью...
2119 просмотров
schedule
31.07.2023
Как добавить собственные существительные в качестве словаря к моделям Spacy?
Я использую Spacy 1.8.0 с Python, и я хотел бы использовать Spacy для анализа медицинских документов. Есть способ добавить новые типы сущностей в распознаватель именованных сущностей spacy. Однако можно ли добавить названия лекарств / препаратов в...
729 просмотров
schedule
13.03.2023
Что Spacy использует для создания векторных представлений?
Что такое встроенный в Spacy метод создания векторных представлений? Я применил НЛП к своему корпусу, а затем использовал .similarity (косинусное сходство), чтобы отобразить документы, которые были «похожими». Однако я не уверен, какой метод spacy...
495 просмотров
schedule
07.09.2022
Как извлекать числа (вместе со сравнительными прилагательными или диапазонами)
Я работаю над двумя проектами НЛП на Python, и у обоих есть аналогичная задача по извлечению числовых значений и операторов сравнения из предложений, например следующего:
"... greater than $10 ... ",
"... weight not more than 200lbs ...",
"......
4749 просмотров
schedule
24.12.2022
Как выполнить предварительную обработку текста с помощью spaCy?
Как выполнить шаги предварительной обработки, такие как удаление стоп-слов, удаление знаков препинания, выделение корней и лемматизация в spaCy с использованием python.
У меня есть текстовые данные в файле csv, такие как абзацы и предложения. Я...
23475 просмотров
schedule
17.11.2022
Spacy и Sense2vec несовместимы
При установке sense2vec выполняется откат версии spacy до 0.101.0 . Ни одна из текущих spacy английских моделей не совместима с 0.101.0 и вызывает эту ошибку при попытке загрузки: super(Package, self).__init__(defaults=meta['package'])...
177 просмотров
schedule
30.03.2022
Типы моделей Spacy и сопоставление доступных функций
Просторные модели связаны с различными «типами», включая словарь, синтаксис, сущности и векторы. Способ сопоставления сущностей и векторов с функциями, доступными в документе, очевиден (распознавание сущностей и векторы слов), но как словарный...
63 просмотров
schedule
27.08.2023
Флаг spaCy 'IS_SPACE' не работает
Пытался сопоставить что-то вроде «125,00 долларов США за акцию» на spaCy, используя сопоставление на основе правил, как упомянуто здесь https://github.com/explosion/spaCy/issues/882 . Однако при испытании
nlp = en_core_web_sm.load()
matcher =...
610 просмотров
schedule
08.01.2023
AssertionError при попытке добавить новый объект с помощью сопоставителя на spaCy
Я пытаюсь сопоставить всю электронную почту, например, просмотреть текст в куче документов, и добавить его к пользовательской метке NER под названием «ЭЛЕКТРОННАЯ ПОЧТА». Вот код для тестового случая.
nlp = spacy.load('en_core_web_sm')
matcher =...
398 просмотров
schedule
21.05.2022
Разбор пространственной зависимости для Его слова
Как бы я мог различить «Его» слово в любом предложении как Определяющее или как местоимение в Пространстве, потому что, если я дам word.dep_ вместо «его» слова, оно даст как «возможность» (модификатор владения) в обоих случаях.
Например: «Роналду...
141 просмотров
schedule
20.07.2022
Извлечение содержимого из документов
Я хочу извлечь содержимое из резюме с различными разделами, такими как навыки, сертификаты, опыт работы и т. д., с помощью НЛП и пометить их в соответствии с их категорией. Пока я могу написать базовые правила для извлечения текста по разным знакам...
481 просмотров
schedule
13.08.2022