Вопросы по теме 'suffix-array'

strcmp для python или как эффективно (без копирования) сортировать подстроки при построении массива суффиксов
Вот очень простой способ построить массив суффиксов из строки в python: def sort_offsets(a, b): return cmp(content[a:], content[b:]) content = "foobar baz foo" suffix_array.sort(cmp=sort_offsets) print suffix_array [6, 10, 4, 8, 3, 7, 11,...
10086 просмотров
schedule 24.02.2023

Как сортировать суффиксы массива в блочной сортировке
Я читаю алгоритм сортировки блоков из статьи Берроуза и Уилера. Это шаг алгоритма: Предположим, что S = абракадабра Инициализируйте массив W из N слов W[0, ..., N - 1], чтобы W[i] содержал символы S'[i, ..., i + k - 1], расположенные так, что...
1360 просмотров

Реализация массива суффиксов в С++
#include<iostream> #include<string.h> #include<utility> #include<algorithm> using namespace std; struct xx { string x; short int d; int lcp; }; bool compare(const xx a,const xx b) { return a.x<b.x; } int...
3318 просмотров
schedule 23.04.2023

Каково значение сортировки суффиксов в массиве суффиксов?
Я знаю, что определение самого массива суффиксов состоит в том, что это отсортированный массив всех суффиксов строки. Но я пытаюсь понять, каково значение этой операции сортировки здесь? Предположим, мы создаем массив всех суффиксов строки и решили...
371 просмотров

Эффективный подсчет всех подстрок в отсортированном порядке
Вам дается строка, которая определяет частоту всех отсортированных подстрок (в порядке убывания) в соответствии с их частотой. Например: ababa {"a", "b", "a", "b", "a", "ab", "ba", "ab", "ba", "aba", "bab", "aba" "," абаб "," баба "," абаба "}....
352 просмотров

Найти все вхождения с помощью бинарного поиска в массиве суффиксов
Мне было интересно, есть ли реализованный способ получить все вхождения заданной подстроки и массива суффиксов. Я тестировал функцию, которую нашел здесь: https://hg.python.org/cpython/file/2.7/Lib/bisect.py с некоторыми изменениями. То, что я...
1717 просмотров
schedule 03.01.2024

Самая длинная общая подстрока через массив суффиксов: использование дозорного
Я читаю о (очевидно) хорошо известной проблеме самой длинной общей подстроки в серии строк и следил за этими двумя видео, в которых рассказывается о том, как решить проблему с использованием массивов суффиксов: (обратите внимание, что этот вопрос не...
75 просмотров