Я хотел бы программно проверить, можно ли произносить строку или нужно ли ее произносить.
Например, internationalization
можно прочитать, но i18n
не может и не hhdirgxzf
.
Я могу придумать некоторые простые эвристики, такие как проверка, содержит ли строка не-альфа-символы, но я надеюсь, что есть более надежный и научный способ сделать это. Существуют ли алгоритмические подходы, позволяющие оценить строку в зависимости от того, насколько легко ее произносить?
Связанный: Есть ли способ оценить сложность произношения слова?, однако у меня нет списка, и я не могу выполнить предварительный расчет.
Обновление на основе комментариев.
- Поскольку я говорю по-английски, меня интересует английский, но я мог представить алгоритм, основанный на способе звучания и говорения, а не на характеристиках конкретного языка.
- Под «произнесенным» я подразумеваю, что строка может быть прочитана естественным образом, можно произнести
hhdirgxzf
, но это не будет звучать ни одно слово естественного языка, ее нужно будет разбить. - Я имею в виду конкретный вариант использования, когда мне отправляют строки, и я хочу использовать базовую систему преобразования текста в речь, чтобы читать их вслух. Я хочу определить, какие лексемы в строке разрешить системе TTS произнести, а какие - по буквам, допуская ошибку в произношении, если не уверен.
i18n
, что-то вродеeye-ate-een-en
. Другой ваш пример немного сложнее, но я попробую ... - person High Performance Mark   schedule 29.08.2012i18n
- ›eye-eighteen-en
иhhdirgxzf
-›hud-er-gux-zuf
. - person aroth   schedule 29.08.2012hu-hu-der-gez-zof
- person High Performance Mark   schedule 29.08.2012