Что быстрее — INSTR или LIKE?

Если ваша цель состоит в том, чтобы проверить, существует ли строка в столбце MySQL (типа «varchar», «text», «blob» и т. д.), что из следующего быстрее/эффективнее/лучше использовать и почему?

Или есть какой-то другой метод, который превосходит любой из них?

INSTR( columnname, 'mystring' ) > 0

columnname LIKE '%mystring%'

mysql sql-like

Grekker 16.03.2010 источник

comment

Включение индекса полнотекстового поиска может быть быстрее, если ваши текстовые строки длинные. - kibibu 16.03.2010

comment

column regexp 'mystring' обычно быстрее лайка - Seth 16.03.2010

comment

Ваш вопрос получил не менее 5 голосов за тег like-operator. Могу ли я попросить вас предложить подобный sql в качестве синоним? - Kermit 02.04.2013

comment

в качестве альтернативы всему ниже REGEXP вы также можете попробовать POSITION ('mystring' in columnname) > 0 - Takedasama 20.07.2017

Ответы (4)

arrow_upward
57
arrow_downward

Полнотекстовый поиск абсолютно точно будет быстрее, как отметил кибибу в комментариях выше.

Однако:

mysql> select COUNT(ID) FROM table WHERE INSTR(Name,'search') > 0;
+-----------+
| COUNT(ID) |
+-----------+
|     40735 | 
+-----------+
1 row in set (5.54 sec)

mysql> select COUNT(ID) FROM table WHERE Name LIKE '%search%';
+-----------+
| COUNT(ID) |
+-----------+
|     40735 | 
+-----------+
1 row in set (5.54 sec)

В моих тестах они работают точно так же. Они оба нечувствительны к регистру и, как правило, выполняют сканирование всей таблицы, что обычно недопустимо при работе с высокопроизводительной MySQL.

Если вы не выполняете поиск по префиксу в индексированном столбце:

mysql> select COUNT(ID) FROM table WHERE Name LIKE 'search%';
+-----------+
| COUNT(ID) |
+-----------+
|         7 | 
+-----------+
1 row in set (3.88 sec)

В этом случае LIKE только с подстановочным знаком суффикса намного быстрее.

razzed 16.03.2010

comment

+1 за фактически проведенный эксперимент! Слишком много мудрости производительности основано на инстинкте - kibibu; 17.03.2010

comment

огромное улучшение и так очевидно думать об этом. Очень признателен! - wfolkerts; 22.06.2021

arrow_upward
16
arrow_downward

MySQL — INSTR против LOCATE против LIKE против REGEXP

Для меня INSTR и LOCATE работали быстрее всего:

# 5.074 sec
SELECT BENCHMARK(100000000,INSTR('foobar','foo'));

# 5.086 sec
SELECT BENCHMARK(100000000,LOCATE('foo','foobar')); 

# 8.990 sec
SELECT BENCHMARK(100000000,'foobar' LIKE '%foo%');

# 14.433 sec
SELECT BENCHMARK(100000000,'foobar' REGEXP 'foo'); 

# 5.5.35-0ubuntu0.12.10.2 
SELECT @@version;

pdolinaj 04.03.2014

comment

Я повторяю эти тесты и вижу аналогичные результаты! - Ragen Dazs; 01.04.2016

comment

Но выбор из таблицы, вероятно, может быть другим, особенно если у вас есть индекс, а запрос LIKE 'foo%' будет быстрее, чем INSTR. - endo64; 02.07.2018

arrow_upward
11
arrow_downward

В случае «переднего подстановочного знака» (то есть предиката «LIKE '%...'»), как здесь, кажется, INSTR и LIKE должны работать примерно одинаково.

Когда подстановочный знак не является "передним подстановочным знаком", подход LIKE должен быть быстрее, если только подстановочный знак не является очень избирательным.

Причина, почему тип подстановочного знака и его селективность имеют значение, заключается в том, что предикат с INSTR() систематически приводит к сканированию таблицы (SQL не может делать никаких предположений о семантике подстановочных знаков). INSTR), в результате чего SQL может использовать свое понимание семантики предиката LIKE, чтобы, возможно, использовать индекс, чтобы помочь ему проверить только сокращенный набор возможных совпадений.

Как указано в комментарии к самому вопросу, полный текстовый индекс будет намного быстрее. Разница зависит от конкретного распределения слов в тексте, а также от общего размера таблицы и т. д., но ожидайте от двух до десяти раз более быстрого.

Возможным недостатком использования полнотекстового индекса, помимо общих накладных расходов на создание такого индекса, является то, что если кто-то не очень тщательно настроит этот индекс (например, определите список стоп-слов, используя специальный синтаксис поиска, чтобы избежать флективных форм и подобное...), могут быть случаи, когда результаты, предоставленные FullText, не будут такими, как ожидалось. Например, при поиске «SAW» (инструмент для резки дерева) можно получить множество совпадений с записями, включающими глагол «видеть» в его различных спряженных формах.
Конечно, эти лингвистически осведомленные функции полнотекстовых индексов обычно можно переопределить, а также можно считать, что такие функции являются фактически преимуществом, а не недостатком. Я просто упоминаю об этом здесь, поскольку мы сравниваем это с простым поиском по подстановочным знакам.

mjv 16.03.2010

arrow_upward
3
arrow_downward

К тесту Раззеда добавить нечего. Но очевидно, что использование regexp требует гораздо большей вычислительной нагрузки, в отличие от того, на что указывает Сет в своем комментарии.

Следующие тесты предполагают, что вы установили query_caching в On в my.ini

query_cache_type = 1
query_cache_size = 64M

Тесты

Тайминги показывают среднюю производительность из трех измерений (с периодической очисткой кеша):

Нравится

SELECT * FROM `domain_model_offers` WHERE `description` LIKE '%inform%' LIMIT 0 , 30

Исходно: 0,0035 с
Кэшировано: 0,0005 с

РЕГЭКСП

SELECT * FROM `domain_model_offers` WHERE `description` REGEXP 'inform' LIMIT 0 , 30

Исходно: 0,01 с
Кэшировано: 0,0004 с

Результат

LIKE или INSTR определенно быстрее, чем REGEXP.

Хотя разница во времени кэширования минимальна, она, вероятно, достаточна для дальнейшего исследования.

В вероятно сконфигурированной системе MySQL полнотекстовое индексирование обычно всегда должно быть быстрее или, по крайней мере, на одном уровне с неиндексированным поиском. Поэтому используйте индексирование, особенно для длинных текстов на человеческом языке, независимо от прерывистого кода разметки.

Lorenz Lo Sauer 15.01.2014

Что быстрее — INSTR или LIKE?

Ответы (4)

Похожие вопросы