Алгоритм разбиения текста на предложения легко разработать вручную/на основе регулярных выражений. Но игнорирование семантики в конечном итоге приведет к ошибкам синтаксического анализа при обработке больших объемов текста.
Я ищу решение корпоративного уровня, которое также анализирует семантику и дает точные результаты.
Целевой язык — EN.