Вопросы по теме 'trigram'

Функция plpgsql, вызывающая функцию сходства триграмм внутри, не использует индексы GIN или GIST.
Я хотел объединить PostgreSQL функции подобия Левенштейна и триграммы. Основное преимущество функции сходства триграмм заключается в том, что она может использовать индексы GIN или GIST и, таким образом, может быстро возвращать результаты нечеткого...
265 просмотров

Расчет верхних триграмм
У меня есть тестовый файл заголовков статей (test$title) и их общее количество репостов в социальных сетях (test$total_shares). Я могу найти наиболее часто используемые триграммы, используя команду: library(tau) trigrams = textcnt(test$title, n =...
157 просмотров
schedule 08.10.2022

Postgres word_similarity не сравнивает слова
"Возвращает число, указывающее, насколько первая строка похожа на наиболее похожее слово второй строки. Функция ищет во второй строке наиболее похожее слово, а не наиболее похожую подстроку. Диапазон результата равен нулю (что указывает на то, что два...
3080 просмотров
schedule 25.02.2023

Как создать составные индексы pg_trgm со столбцами даты
SELECT col1, max(date) as max_date FROM table WHERE col1 ILIKE 'name' GROUP BY col1 Здесь col1 — это varchar , а дата — это timestamp with time zone тип данных. Так создано расширение CREATE EXTENSION pg_trgm Затем попробовал следующие...
940 просмотров
schedule 01.05.2023

Реализация n-грамм в коде Python для мультиклассовой классификации текста
Я новичок в Python и работаю над многоклассовой текстовой классификацией контрактных документов в строительной отрасли. Я столкнулся с проблемами при реализации n-граммов в моем коде, который я создал, получив помощь из различных онлайн-источников....
1313 просмотров

Подсчет триграмм (трехбуквенная последовательность) в C?
Я пытаюсь подсчитать количество триграмм или последовательностей из трех букв в блоке текста. У меня уже есть код, который успешно подсчитывает количество биграмм (двухбуквенная последовательность) с использованием двумерного массива, но у меня...
121 просмотров
schedule 15.07.2023