Вопросы по теме 'similarity'

Сравнение изображений с php + gd
Как лучше всего сравнивать два изображения с помощью php и библиотеки Graphic Draw (GD) Library? ? Это сценарий: У меня есть изображение, и я хочу найти, какое изображение из данного набора наиболее похоже на него. Наиболее похожее...
6400 просмотров
schedule 06.08.2022

Сравнение струн с допуском
Я ищу способ сравнить строку с массивом строк. Выполнить точный поиск, конечно, довольно просто, но я хочу, чтобы моя программа допускала орфографические ошибки, пропущенные части строки и так далее. Есть ли какая-то структура, которая может...
50534 просмотров
schedule 01.05.2022

Lucene numDocs и doqFreq для пользовательского класса подобия
Я делаю приложение с Lucene (я новичок в этом) и столкнулся с некоторыми проблемами. В моем приложении используется библиотека Lucene 2.4.0 с пользовательской реализацией сходства (импортируется jar) В моем приложении я вычисляю doqFreq и numDocs...
1041 просмотров
schedule 15.11.2023

Измеряете сходство между двумя двоичными файлами?
У меня есть два файла с кодировкой G729, я взял их версию для ПК. Я хочу измерить сходство между этими двумя файлами. эти файлы представляют собой двоичные файлы, поэтому, как можно измерить сходство между двоичными файлами, я написал код на C,...
1592 просмотров
schedule 05.05.2023

Мера косинусного подобия, примененная к изображениям
Я пытаюсь работать над проектом, который требует от меня найти сходство между двумя изображениями. Может ли кто-нибудь помочь мне с кодом Matlab для применения косинусного подобия к изображениям или любой другой полезной информацией об этом. Спасибо!
2243 просмотров
schedule 16.08.2022

Алгоритм подобия текста Javascript
Я создаю веб-сайт, который должен собирать различные новостные ленты и хотел бы, чтобы тексты сравнивались на предмет сходства. Что мне нужно, так это какой-то алгоритм подобия текста новостей . Я знаю, что в php есть функция Similar_text, и я не...
12306 просмотров
schedule 16.04.2023

Как Stack Overflow отображает похожие вопросы, когда вы вводите новый вопрос?
Это одна из вещей, с которыми Stack Overflow и остальные сайты, работающие на этой платформе, очень хорошо справляются. Как только вы попытаетесь создать новый вопрос, появится небольшое окно, в котором будут показаны другие похожие вопросы. Как это...
568 просмотров
schedule 15.05.2023

поиск строк, похожих на заданные по ключевым словам, каждое ключевое слово имеет свою собственную «силу»
Этот вопрос для меня вызов, мой друг не может сказать мне, как это сделать, но он действительно хороший программист (я думаю). Пользователи могут помещать в базу данных предложения. Когда пользователь вводит предложение, оно сохраняется в таблице...
538 просмотров
schedule 17.07.2022

Анализировать текст (лемматизация, редактировать дистанцию)
Мне нужно проанализировать текст на наличие в нем запрещенных слов. Допустим, в черном списке есть слово: «Запретить». Слово имеет много форм. В тексте слово может быть, например: «запрещающий», «запрещенный», «запрещающий». Чтобы привести слово к...
2143 просмотров
schedule 21.02.2023

Есть ли что-то эквивалентное PrimeFaces для ASP.NET?
Я являюсь разработчиком ASP.NET уже много лет, но недавно я начал работать с некоторыми решениями PrimeFaces с JSF 2.0. Мне не на что жаловаться. Стоит подчеркнуть несколько моментов, которые мне понравились в PrimeFaces : множество компонентов,...
7981 просмотров
schedule 31.03.2022

Как применить подобный_текст к array_uintersect?
Этот вопрос относится к Ответ Франсуа Дешена на один из моих предыдущих вопросов. Я не знаю, как применить мою функцию проверки подобия текста к функции array_uintersect . Вот моя функция (открыта для идей по улучшению): function...
382 просмотров
schedule 22.02.2022

как классифицировать, но не использовать алгоритмы классификации или кластеризации?
У меня есть программа-краулер, которая ежедневно хранит спортивные данные от 7 информационных агентств. Ежедневно здесь хранится около 1200 спортивных новостей. Я хочу разделить новости за последние два дня на подкатегории. Итак, каждые два дня у...
1261 просмотров

Архитектура и основные компоненты механизма рекомендаций StumbleUpon
Я хотел бы знать, как stumbleupon рекомендует статьи для своих пользователей? Использует ли он нейронную сеть или какие-то алгоритмы машинного обучения, или он на самом деле рекомендует статьи на основе того, что «понравилось» пользователю, или...
2009 просмотров

Сравнение массивов строк на сходство
У меня есть сотни строк JSON. Каждый из них содержит массив из 15-20 слов, отсортированных по некоторому заранее заданному весу. Этот вес, если это стоит отметить, представляет собой количество раз, когда эти слова встречаются в некотором фрагменте...
4024 просмотров

Алгоритм поиска расстояния редактирования до всех подстрок
Даны 2 строки s и t . Мне нужно найти для каждой подстроки на s расстоянии редактирования (расстояние Левенштейна) до t . На самом деле мне нужно знать для каждой i позиции в s , каково минимальное расстояние редактирования для всех...
5318 просмотров

Как я могу настроить расстояние Левенштейна при классификации лингвистически похожих слов (например, времена глаголов, сравнения прилагательных, единственное и множественное число)
У меня нет идей о том, как выполнить эту задачу. Я подсчитываю частоту слова, на самом деле базовую форму слова (например, бег будет считаться бегом). Я просмотрел некоторые реализации расстояния Левенштейна (одна из реализаций, с которой я...
738 просмотров
schedule 15.11.2022

Методы определения акустического сходства (но не дактилоскопии)
Я ищу методы, которые работают на практике для определения некоторого акустического сходства между разными песнями. Большинство методов, которые я видел до сих пор (MFCC и т. Д.), Похоже, на самом деле нацелены только на поиск идентичных...
1294 просмотров
schedule 09.05.2023

филогенетическое сравнение деревьев
Я разработал новый алгоритм для сравнения филогенетического дерева (филогенетическое дерево - это просто бинарное дерево с корнями). В качестве входных данных у нас есть два дерева, мы хотим вычислить их процент сходства. один из примеров...
1325 просмотров

Лучший способ расчета схожести документов с помощью Lucene
Я индексирую набор документов с помощью Lucene, указывая TermVector во время индексирования. Затем я извлекаю термины и их частоту, читая индекс и вычисляя векторы оценок TF-IDF для каждого документа. Затем, используя векторы TF-IDF, я вычисляю...
6168 просмотров
schedule 02.03.2022

метрика подобия, используемая наивным байесовским классификатором Weka
Я хочу знать Метрика сходства, используемая наивным байесовским классификатором Weka. любая помощь?
417 просмотров