У меня есть миллионы файлов на локальных дисках (например, c, d, e) моей системы. Теперь для поиска файла мы можем использовать встроенные средства Windows или команды типа «найти» в linux. Если я хочу создать свою собственную программу поиска, которая должна сначала сканировать все каталоги и хранить информацию либо в каком-либо файле, либо в БД. Теперь, когда я хочу найти файл, нам сначала нужно загрузить информацию из БД или файла, а затем выполнить поиск.
Мне нужны предложения, чтобы решить, какую структуру данных использовать для хранения структуры каталогов, которую затем можно загрузить и запросить для данного имени файла.
Поскольку поиск основан на имени файла, я подумал об использовании Hashmap, где ключом будет имя файла, а значением будет полный путь. Использование Trie сделает поиск медленнее. Другая идея заключается в использовании инвертированного индекса. Но не уверен, что один раз лучше.
Спасибо.