Публикации по теме 'linguistics'


66 слов охватывают 50% языка!?
В моей компании PAT мы работаем над заменой современных систем на те, которые понимают наш язык, как и люди. Было много дискуссий о том, насколько современные технологии приближаются к разумным существам, но поскольку язык занимает центральное место в жизни людей, не существуют ли фундаментальные ограничения в современных системах машинного обучения?

Консервирование канда - веселье с омонимами и векторами слов
Александра Веркаутерен, старший инженер NLU, Faction XYZ. Поскольку компания специализируется на понимании естественного языка, встраивание слов является одним из строительных блоков нашей технологии. Наши модели NLU должны быть способны правильно «понимать» то, что написано или сказано. Один из способов сделать это - использовать модель классификации намерений: когда пользователь вводит предложение, модель предсказывает намерение. Таким образом, точная классификация намерений имеет..

Глубокое обучение и NLU
Примечание. Я задокументировал следующее для моей недавно созданной системы понимания естественного языка с открытым исходным кодом (хотя в основном она устарела). Я рассматриваю понимание естественного языка (NLU) как процесс ввода произвольного текста (включая транскрипцию голоса в текст) произвольного размера с контекстом или без него и вывода кросс-лингвистически согласованного семантического представления (например, представление лямбда-исчисления ). Одна из основных причин,..

Вопросы по теме 'linguistics'

Создайте короткую удобочитаемую строку из более длинной строки
У меня есть требование заключить строку, например ... Вы бы подумали о том, чтобы стать роботом? Вам будет предоставлена ​​бесплатная ежегодная замена масла ». ... к чему-то гораздо более короткому, но все же идентифицируемому человеком...
761 просмотров
schedule 19.03.2022

Как исправить ошибку в библиотеке лингвистики в Rails 3.1 и Ruby 1.9.2
В моем приложении в последних версиях рельсов без проблем были следующие строки: gem 'linguistics' # in Gemfile Linguistics::use(:en, :installProxy => :en) # In environment.rb Недавно я обновился с Ruby 1.8.7 до Ruby 1.9.2 и использую...
476 просмотров

Создайте частотную таблицу, которая фиксирует популярные подстроки в строках определенной длины - Python
Я пытаюсь вычислить частотный анализ корпуса суахили, который я составляю. На данный момент это то, что у меня есть: import os import sys from collections import Counter import re path = 'C:\Python27\corpus\\' cnt = Counter() listing =...
235 просмотров
schedule 14.06.2022

Как использовать Qt Linguist для файла пользовательского интерфейса Qt?
Я использую лингвист Qt для перевода файла ui . Я получил файл ts с помощью lupdate и перевел эти слова и фразы. Теперь я хочу добавить его в свой код, но из его руководства я обнаружил, что мне нужно добавить tr() к каждому слову и фразе в...
5039 просмотров

Ищете корпоративное решение для разбиения текста на предложения
Алгоритм разбиения текста на предложения легко разработать вручную/на основе регулярных выражений. Но игнорирование семантики в конечном итоге приведет к ошибкам синтаксического анализа при обработке больших объемов текста. Я ищу решение...
169 просмотров
schedule 11.05.2023

Как обучить модель итальянского языка в OpenNLP на Hadoop?
Я хотел бы реализовать алгоритм обработки естественного языка на Hadoop для итальянского языка. У меня есть 2 вопроса; как я могу найти алгоритм поиска корней для итальянского языка ? как интегрироваться в hadoop ? вот мой код...
779 просмотров
schedule 24.12.2023

NLTK Генерация предложений без двух вхождений одного и того же слова в Python
Я использую этот код NLTK для создания предложений из demo_grammar (см. ниже), и проблема в том, что с такими грамматическими правилами, как NN или NN N, я получаю такие предложения, как «творение, создание, создание». Меня интересует только создание...
689 просмотров

У Stanford NLP POS Tagger есть проблемы с очень простыми фразами?
Я нашел примеры непоследовательного поведения в своем приложении с использованием Stanford NLP Parser / POS Tagger, и я смог воспроизвести его в Интернете http://nlp.stanford.edu:8080/corenlp/process . Я использую версию 3.60: Вот 3 проблемы,...
803 просмотров

Функция R, чтобы найти, какая из трех переменных больше всего коррелирует с другим значением?
Я провожу исследование, которое анализирует производительность динамиков и измеряет их средние значения F2. Что мне нужно, так это функция R, которая позволяет мне найти связь для этих значений F2 с 3 другими переменными, и если есть, то какая из них...
52 просмотров
schedule 21.03.2023

Очистка текстовой строки в python
Это продолжение этого вопроса . У меня есть эта строка; s = 'A ligeira raposa marrom ataca o cão preguiçoso Быстрая коричневая лиса прыгает через ленивую собаку +=' Хотелось бы сохранить русские буквы и убрать остальные. Следовательно, я...
101 просмотров
schedule 06.05.2023

Чтобы удалить непарные записи в кадре данных?
Столбец «Согласный» в моем фрейме данных «df» имеет два уровня с числами: 250 для «Geminate» и 214 для «Singleton». Поскольку Близнецов больше, как я могу удалить лишние записи для Близнецов, чтобы приравнять их к «Одиночкам»? Вывод должен быть...
54 просмотров
schedule 08.07.2023