Я использую средство поиска имен токенов OpenNLP для анализа неструктурированных данных, я создал корпус (тренировочный набор) из записей 4MM, но поскольку я создаю модель из этого корпуса с использованием API OpenNLP в Eclipse, процесс занимает около 3 часов, что составляет очень много времени. Модель строится с параметрами по умолчанию, то есть итерацией 100 и отсечкой 5.
Итак, мой вопрос в том, как я могу ускорить этот процесс, как я могу сократить время, затрачиваемое на процесс построения модели.
Причиной этого может быть размер корпуса, но я просто хотел знать, сталкивался ли кто-нибудь с такой проблемой, и если да, то как ее решить.
Пожалуйста, дайте какую-нибудь подсказку.
Заранее спасибо!
-Xms=512m -Xmx=2048m
- person Ramanan   schedule 19.11.2014