Я разрабатываю систему, в которой мне нужны Начальный кадр, Конечный кадр и Оценка сегментации для каждой фонемы в слове или предложении. Я использовал команду Sphinx-3: sphinx3_align, чтобы получить следующий результат (пример):
SFrm EFrm SegAScr Phone
0 21 -67327 SIL
22 37 -236740 AH SIL K b
38 41 -61028 K AH S i
42 56 -82368 S K EH i
57 67 -106366 EH S P i
68 86 -101908 P EH T i
87 106 -89226 T P SIL e
107 113 -82281 SIL
Total score: -827244
Проблема в том, что мне приходится запускать эту команду много раз, и это потребляет много памяти на моем сервере. Я пытался передать много входных данных в управляющий файл, но это требует много времени для обработки, и мое приложение не может иметь большое время отклика.
Итак, чтобы потреблять меньше памяти, поддерживая время отклика, я пытаюсь реализовать ту же систему в Sphinx-4. Таким образом, я мог бы вернуть результаты сразу после выравнивания, без необходимости выгружать приложение каждый раз, когда оно запускается.
Я сомневаюсь, что возможно ли иметь указанный выше вывод (аналогичный sphinx3_align) в Sphinx-4?