Vim: как проиндексировать обычный текстовый файл?

Можно ли проиндексировать обычный текстовый файл (книгу) в vim, например:

1. This line contains the words : London, Berlin, Paris
2. In this line, I write about : New-York, London, Berlin
...
100. And, to conclude, my last comments about : New-York, Paris

и иметь этот результирующий индекс:

Berlin : 1
London : 1, 2
New-York : 2, ..., 100
Paris : 1, ..., 100

и, если возможно, каков метод маркировки? Я читал о ctags, но он, кажется, посвящен конкретным языкам (и, честно говоря, немного излишним для моих нужд).


person ThG    schedule 03.05.2011    source источник


Ответы (3)


Я позволил себе написать следующую функцию, основанную на использовании команды :g/STRING/# для получения совпадений. Я читаю результаты этой команды в список, а затем обрабатываю его, чтобы вернуть список совпадающих номеров строк:

function! IndexByWord( this_word )
    redir => result
    sil! exe ':g/' . a:this_word . '/#'
    redir END
    let tmp_list = split(strtrans(result),"\\^\@ *")
    let res_list = []
    call map(tmp_list, 'add(res_list,matchstr(v:val,"^[0-9]*"))')
    let res = a:this_word . ' : ' . string(res_list)
    let res = substitute(res, "[\\[\\]\\']", "", "g")
    echo res
endfunction

Таким образом, вы можете вызвать эту функцию для всех слов, которые пожелаете (или написать для этого скрипт) и направить вывод в файл. Возможно, не очень элегантно, но вполне самодостаточно.

Надеюсь, это поможет, а не помешает.

person Prince Goulash    schedule 03.05.2011
comment
превосходно, это сработало отлично, но только для одного слова (например: :call IndexByWord(Берлин). Как мне поступить, чтобы оно работало для массива слов (например: :call IndexByWord(Берлин, Лондон, Нью-Йорк, Париж). ) И какой может быть предел размера этого массива ? - person ThG; 03.05.2011
comment
@ThG: я взял на себя смелость добавить отдельный пост, в котором пересматривается функция Prince G, чтобы делать то, о чем вы здесь просите. (Конечно, принц Г — это тот, чей пост должен быть вашим ответом; мои исправления были небольшими.) - person Herbert Sitz; 03.05.2011

Вот исправленная версия функции, опубликованная принцем Гуляшем. Эта версия принимает список слов в качестве входных данных и возвращает отформатированную и алфавитную строку результата:

function! IndexByWord( wordlist )
    let temp_dict = {}
    for word in a:wordlist
        redir => result
        sil! exe ':g/' . word . '/#'
        redir END
        let tmp_list = split(strtrans(result),"\\^\@ *")
        let res_list = []
        call map(tmp_list, 'add(res_list,str2nr(matchstr(v:val,"^[0-9]*")))')
        let temp_dict[word]  = res_list
    endfor
    let result_list = []
    for key in sort(keys(temp_dict))
        call add(result_list, key . ' : ' . string(temp_dict[key])[1:-2])
    endfor
    return join(result_list, "\n")
endfunction

Один из способов вызвать это:

echo IndexByWord(['word1', 'word2', 'word3', etc])

Не должно быть проблем с длинным списком слов, хотя в этом случае вы, вероятно, захотите использовать переменную списка, и получение результатов, конечно, займет больше времени. Например:

let my_word_list = ['word1', 'word2', . . . 'word1000']
echo IndexByWord(my_word_list)
person Herbert Sitz    schedule 03.05.2011
comment
это сработало ! Большое спасибо вам и Принцу Гуляшу. Кстати, таким образом, у меня может быть много индексов для 1 текста: один для имен (IndexByNames), один для тем (IndexByTopics) и т. д.... объединяйте их в скрипт и добавляйте в конец текста... Еще раз спасибо - person ThG; 04.05.2011
comment
Спасибо за эти изменения - я рад, что вы смогли следовать моему коду! - person Prince Goulash; 04.05.2011
comment
и @Prince Goulash: кажется, я похвастался своими компетенциями: как я могу перенаправить результаты IndexByWord в конец проиндексированного файла? (как в настоящей книге, с настоящим указателем). заранее спасибо - person ThG; 08.05.2011

Посмотрите на ptx, возможно

:%!cut -d: -f2 | ptx -Ar

Будет выводить что-то вроде этого, если оно не изменено:

:1:                         London,   Berlin, Paris
:2:               New-York, London,   Berlin
:1:                                   London, Berlin, Paris
:2:                       New-York,   London, Berlin
:2:                                   New-York, London, Berlin
:4:                                   New-York, Paris
:1:                 London, Berlin,   Paris
:4:                       New-York,   Paris
:2:                            New-   York, London, Berlin
:4:                            New-   York, Paris

Я посмотрю, смогу ли я сделать и остальные шаги.

person sehe    schedule 03.05.2011