Распознавание именованных сущностей с использованием Python spaCy

Я хочу закодировать систему распознавания именованных сущностей с использованием пакета Python spaCy. Однако мне не удалось установить локальный язык внутри пакета spaCy. Есть ли кто-нибудь, кто может сказать мне, как установить или иным образом использовать мой местный язык?

Я пытался:

python -m spacy downloadxx_ent_wiki_sm?

Я ценю помощь!


person antie    schedule 21.07.2020    source источник
comment
Какой у вас местный язык?   -  person Raqib    schedule 21.07.2020
comment
Амхарский язык, на котором говорят в Эфиопии.   -  person antie    schedule 23.07.2020
comment
Ваша языковая модель уже упакована или просто сохранена в отдельной папке?   -  person nimbous    schedule 25.07.2020


Ответы (1)


spaCy поддерживает ограниченное количество языков с автономными моделями. Если ваш язык один из:

Китайский, датский, голландский, английский, французский, немецкий, греческий, итальянский, японский, литовский, норвежский, букмол, польский, португальский, румынский или испанский

Затем вы можете загрузить модель, сначала установив ее с помощью аналогичной команды, которую вы опубликовали, например:

# Lithuanian language
python -m spacy download lt_core_news_sm

# Japanese language
python -m spacy download ja_core_news_sm

Вам нужно будет запустить эту команду в командной строке (терминале). После того, как модель будет загружена и связана, вы можете импортировать ее следующим образом:

import spacy

# Loading the Japanese language model.
nlp = spacy.load("ja_core_news_sm")

spaCy также поддерживает многоязычную модель, которую вы можете попробовать использовать, если ваш язык не поддерживается его собственной моделью. Для этого вы можете сделать (похоже, вы уже пытались установить его в предоставленной команде):

# In command line
python -m spacy download xx_ent_wiki_sm

# In Python
import spacy
nlp = spacy.load("xx_ent_wiki_sm")

Однако не ожидайте современных результатов от использования многоязычной модели, поскольку она не обучается специально на одном языке, как другие модели.

person mabergerx    schedule 21.07.2020
comment
спасибо за ваш комментарий ... но как установить мою собственную языковую модель / пакет на python, например, установить пакет spacy. - person antie; 23.07.2020