Я использовал Stanford Parser для анализа CFG. Я могу отобразить вывод в виде дерева, но мне действительно нужно количество тегов.
Так что я могу выйти, например (взято из другого запроса при переполнении стека):
(ROOT (S (NP (PRP$ My) (NN dog)) (ADVP (RB also)) (VP (VBZ likes) (NP (JJ eating) (NN sausage))) (. .)))
Но что мне действительно нужно, так это количество тегов, выводимых в файле CSV:
PRP - 1
JJ - 1
Возможно ли это с парсером Stanford, особенно если я хочу обработать несколько текстовых файлов, или мне следует использовать другую программу?