Вопросы по теме 'phrase'

Java: сопоставление фраз в строке
У меня есть список фраз (фраза может состоять из одного или нескольких слов) в базе данных и входная строка. Мне нужно выяснить, какие из этих фраз появляются во входной строке. Есть ли эффективный способ выполнить такое сопоставление в Java?
2674 просмотров
schedule 16.12.2022

Сделать фразы перечисляемыми?
Я пишу пакет, который должен сделать некоторые настраиваемые фразы (например, набор названий городов) доступными извне. (например, обычное перечисление с именем «MyEnum», когда пользователь вводит «MyEnum», все его перечисляемые элементы будут...
33 просмотров
schedule 08.03.2023

Сопоставление ключевой фразы регулярного выражения PHP
У меня есть текстовое поле, в котором пользователь будет вводить ключевые слова или ключевые фразы, разделенные запятыми, а затем сервер будет использовать эти значения для проверки нескольких текстов на совпадения. Итак, в основном мне нужно...
224 просмотров
schedule 23.05.2022

Ошибка Solr 500 при поиске фразового запроса для поля text_general
получение ошибки запроса: LNm:"PersonLastName III" Ответ: "поле \"LNm\" было проиндексировано без данных о позиции; невозможно запустить PhraseQuery' Схема: <field name="LNm" type="text_general" indexed="true" stored="true"/>...
3504 просмотров
schedule 24.07.2023

Стэнфордский парсер — количество тегов
Я использовал Stanford Parser для анализа CFG. Я могу отобразить вывод в виде дерева, но мне действительно нужно количество тегов. Так что я могу выйти, например (взято из другого запроса при переполнении стека): (ROOT (S (NP (PRP$ My) (NN...
706 просмотров
schedule 18.12.2022

Сборка корпуса с фразами
У меня есть документы как: doc1 = very good, very bad, you are great doc2 = very bad, good restaurent, nice place to visit Я хочу разделить мой корпус с помощью , , чтобы мой последний DocumentTermMatrix стал: terms docs...
1055 просмотров
schedule 09.04.2022

предотвращение того, чтобы запрос фразы solr был выведен или лишен стоп-слов
Я пытаюсь проверить, возможно ли реализовать эту функцию с помощью Solr. У меня определено текстовое поле, и в анализаторе запросов я определил, среди прочего, StopFilterFactory и PorterStemFilterFactory . Я использую edsimax в качестве...
758 просмотров
schedule 27.05.2022

эластичный поиск точное совпадение фраз
Я новичок в ЕС. У меня возникли проблемы с поиском точных совпадений фраз. Предположим, что в моем индексе есть поле с именем movie_name. Предположим, у меня есть 3 документа со следующими значениями movie_name = Безумный Макс movie_name =...
4430 просмотров
schedule 21.09.2023

как найти документы, которые содержат только искомые слова в `solr`
Например, у меня есть коллекция solr , содержащая документы с полем "key_phrase". Я знаю, что легко найти все документы, содержащие все искомые слова в поисковом запросе. (т.е. используя mm =100% в edismax ) Однако я спрашиваю, как вернуть...
242 просмотров
schedule 17.05.2022

Как предотвратить разделение определенных слов или фраз и чисел в NLTK?
У меня проблема с сопоставлением текста, когда я токенизирую текст, который разбивает определенные слова, даты и числа. Как я могу предотвратить разделение некоторых фраз, таких как «бег в моей семье», «30-минутная прогулка» или «4 раза в день» во...
2316 просмотров
schedule 16.11.2023

Фраза Gensim, обрабатывающая предложение с большим количеством знаков препинания
Теперь я пытаюсь использовать gensim Phrases , чтобы выучить основу фразы/специального значения на моем собственном корпусе. Предположим, у меня есть корпус, связанный с маркой автомобиля, путем удаления знаков препинания и стоп-слов ,...
78 просмотров
schedule 15.09.2022

Есть ли предварительно обученная модель фраз Gensim?
Существует ли предварительно обученная модель Gensim Phrases ? Если нет, можно ли было бы реконструировать и создать модель фразы, используя предварительно обученное встраивание слов? Я пытаюсь использовать GoogleNews-vectors-negative300.bin с...
52 просмотров