У меня есть список хорошо проанализированных документов, состоящих из нескольких абзацев (все абзацы разделены \n\n, а предложения разделены знаком "."), которые я хотел бы разбить на предложения вместе с номер, указывающий номер абзаца в документе. Например, ввод (два абзаца):
First sentence of the 1st paragraph. Second sentence of the 1st paragraph. \n\n
First sentence of the 2nd paragraph. Second sentence of the 2nd paragraph. \n\n
В идеале вывод должен быть:
1 First sentence of the 1st paragraph.
1 Second sentence of the 1st paragraph.
2 First sentence of the 2nd paragraph.
2 Second sentence of the 2nd paragraph.
Я знаком с пакетом Lingua::Sentences в Perl, который может разбивать документы на предложения. Однако это несовместимо с нумерацией абзацев. Поэтому мне интересно, есть ли альтернативный способ добиться вышеизложенного (документы не содержат сокращений). Любая помощь приветствуется. Спасибо!