Рад, что вы используете мое программное обеспечение SPMF.
Поддержка последовательного шаблона – это количество последовательностей, содержащих этот последовательный шаблон.
Часто повторяющийся шаблон – это шаблон, который появляется как минимум в последовательностях "minsup" в базе данных последовательностей, где minsup – это параметр, заданный пользователем.
Частый закрытый последовательный шаблон — это частый последовательный шаблон, не включенный в другой последовательный шаблон, имеющий точно такую же поддержку.
Такие алгоритмы, как PrefixSpan, находят частые последовательные шаблоны. Такие алгоритмы, как BIDE+, находят частые закрытые последовательные шаблоны. BIDE+ обычно намного быстрее, чем PrefixSpan, потому что он использует методы сокращения, чтобы избежать создания всех последовательных шаблонов. Кроме того, набор закрытых шаблонов обычно намного меньше, чем набор последовательных шаблонов, поэтому BIDE+ также более эффективно использует память.
Еще одна важная вещь, которую нужно знать, это то, что закрытые последовательные шаблоны представляют собой компактное и без потерь представление всех последовательных шаблонов. Это означает, что набор замкнутых последовательных паттернов обычно намного меньше, но он без потерь, а значит, позволяет восстановить полный набор последовательных паттернов (отсутствие информации — потеря), что очень удобно.
Я могу привести простой пример.
Рассмотрим 4 последовательности:
a b c d e
a b d
b e a
b c d e
Допустим, minup = 2.
b c
является частым последовательным шаблоном, потому что он появляется в двух последовательностях (имеется поддержка 2). b c
не является закрытым последовательным шаблоном, поскольку он содержится в более крупном последовательном шаблоне b c d
, имеющем такую же поддержку.
b c d
имеет поддержку 2. Это также не закрытый последовательный шаблон, поскольку он содержится в более крупном последовательном шаблоне b c d e
, имеющем такую же поддержку. b c d e
является закрытым последовательным шаблоном, потому что он не включен ни в один другой последовательный шаблон, имеющий такую же поддержку.
Кстати, вы также можете ознакомиться с моим опросом о последовательном анализе шаблонов. Это дает хорошее введение в эту тему и различные алгоритмы.
person
Phil
schedule
26.04.2013