Вопросы по теме 'phrase'
Java: сопоставление фраз в строке
У меня есть список фраз (фраза может состоять из одного или нескольких слов) в базе данных и входная строка. Мне нужно выяснить, какие из этих фраз появляются во входной строке.
Есть ли эффективный способ выполнить такое сопоставление в Java?
2674 просмотров
schedule
16.12.2022
Сделать фразы перечисляемыми?
Я пишу пакет, который должен сделать некоторые настраиваемые фразы (например, набор названий городов) доступными извне. (например, обычное перечисление с именем «MyEnum», когда пользователь вводит «MyEnum», все его перечисляемые элементы будут...
33 просмотров
schedule
08.03.2023
Сопоставление ключевой фразы регулярного выражения PHP
У меня есть текстовое поле, в котором пользователь будет вводить ключевые слова или ключевые фразы, разделенные запятыми, а затем сервер будет использовать эти значения для проверки нескольких текстов на совпадения.
Итак, в основном мне нужно...
224 просмотров
schedule
23.05.2022
Ошибка Solr 500 при поиске фразового запроса для поля text_general
получение ошибки запроса:
LNm:"PersonLastName III"
Ответ: "поле \"LNm\" было проиндексировано без данных о позиции; невозможно запустить PhraseQuery'
Схема:
<field name="LNm" type="text_general" indexed="true" stored="true"/>...
3504 просмотров
schedule
24.07.2023
Стэнфордский парсер — количество тегов
Я использовал Stanford Parser для анализа CFG. Я могу отобразить вывод в виде дерева, но мне действительно нужно количество тегов.
Так что я могу выйти, например (взято из другого запроса при переполнении стека):
(ROOT (S (NP (PRP$ My) (NN...
706 просмотров
schedule
18.12.2022
Сборка корпуса с фразами
У меня есть документы как:
doc1 = very good, very bad, you are great
doc2 = very bad, good restaurent, nice place to visit
Я хочу разделить мой корпус с помощью , , чтобы мой последний DocumentTermMatrix стал:
terms
docs...
1055 просмотров
schedule
09.04.2022
предотвращение того, чтобы запрос фразы solr был выведен или лишен стоп-слов
Я пытаюсь проверить, возможно ли реализовать эту функцию с помощью Solr.
У меня определено текстовое поле, и в анализаторе запросов я определил, среди прочего, StopFilterFactory и PorterStemFilterFactory .
Я использую edsimax в качестве...
758 просмотров
schedule
27.05.2022
эластичный поиск точное совпадение фраз
Я новичок в ЕС. У меня возникли проблемы с поиском точных совпадений фраз.
Предположим, что в моем индексе есть поле с именем movie_name. Предположим, у меня есть 3 документа со следующими значениями
movie_name = Безумный Макс
movie_name =...
4430 просмотров
schedule
21.09.2023
как найти документы, которые содержат только искомые слова в `solr`
Например, у меня есть коллекция solr , содержащая документы с полем "key_phrase".
Я знаю, что легко найти все документы, содержащие все искомые слова в поисковом запросе. (т.е. используя mm =100% в edismax )
Однако я спрашиваю, как вернуть...
242 просмотров
schedule
17.05.2022
Как предотвратить разделение определенных слов или фраз и чисел в NLTK?
У меня проблема с сопоставлением текста, когда я токенизирую текст, который разбивает определенные слова, даты и числа. Как я могу предотвратить разделение некоторых фраз, таких как «бег в моей семье», «30-минутная прогулка» или «4 раза в день» во...
2316 просмотров
schedule
16.11.2023
Фраза Gensim, обрабатывающая предложение с большим количеством знаков препинания
Теперь я пытаюсь использовать gensim Phrases , чтобы выучить основу фразы/специального значения на моем собственном корпусе.
Предположим, у меня есть корпус, связанный с маркой автомобиля, путем удаления знаков препинания и стоп-слов ,...
78 просмотров
schedule
15.09.2022
Есть ли предварительно обученная модель фраз Gensim?
Существует ли предварительно обученная модель Gensim Phrases ? Если нет, можно ли было бы реконструировать и создать модель фразы, используя предварительно обученное встраивание слов?
Я пытаюсь использовать GoogleNews-vectors-negative300.bin с...
52 просмотров
schedule
02.02.2023