Я использую пакет Python spaCy для синтаксического анализа и тегирования текста и использую полученное дерево зависимостей и другие атрибуты для определения значения. Теперь я хотел бы использовать Parsey McParseface от SyntaxNet для синтаксического анализа и тегирования зависимостей (что кажется лучше), но я хотел бы продолжать использовать spaCy API, потому что он очень прост в использовании и делает много вещей, которых не делает Parsey. SyntaxNet выводит теги POS и теги / дерево зависимостей в формате CoNLL:
- Боб _ СУЩЕСТВУЕТ NNP _ 2 nsubj _ _
- принес _ VERB VBD _ 0 ROOT _ _
- _ DET DT _ 4 det _ _
- пицца _ СУЩЕСТВИТЕЛЬНОЕ NN _ 2 dobj _ _
- в _ ADP IN _ 2 подготовка _ _
- Алиса _ СУЩЕСТВУЕТ NNP _ 5 pobj _ _
- . _. . _ 2 пункта _ _
и spaCy, похоже, может правильно читать формат CoNLL здесь < / а>. Но я не могу понять, где в API spaCy он берет строку с CoNLL-fromatted.