Я совершенно новичок в регулярном выражении. Я просто хочу знать, возможно ли это. (Извините, если объяснение запутанно или слишком сложно). Скажем, я просто хочу найти и заменить этот конкретный заголовок жирным шрифтом:
«Как обсуждалось в главе 1, пользователей финансовой отчетности можно отнести к категории поставщиков ресурсов. (пробел)(пробел)Пользователи и принятие решений(пробел)(пробел) Пример для этого. (пробел)(пробел)Характер и цель финансового анализа(пробел)(пробел) Мы установили, что финансовый анализ предполагает выражение цифр в финансовых отчетах в относительных величинах».
к этому :
«Как обсуждалось в главе 1, пользователей финансовой отчетности можно отнести к категории поставщиков ресурсов.
(новая строка) Пользователи и принятие решений (вкладка) Пример для этого.
< strong>(новая строка) Характер и цель финансового анализа (табуляция) Мы определили, что финансовый анализ предполагает выражение цифр, представленных в финансовой отчетности, в относительном выражении».
Поскольку мои знания о регулярных выражениях в настоящее время ограничены, я пытаюсь разбить их на 2 части:
1. чтобы найти ". (space)(space)Nature" :
[(.)]\s\s[(A-Z)]\w+
to \n$&
2. чтобы найти "анализ(пробел)(пробел) Мы" :
[(az)]\w+\s\s[(AZ)]
в ??
Итак, мой вопрос в том, можно ли просто определить 1 регулярное выражение для
. (пробел)(пробел)Пользователи и принятие решений(пробел)(пробел)
. (пробел)(пробел)Характер и цель финансового анализа(пробел)(пробел) Мы
и заменяем его приведенным выше примером?
Спасибо!
PS. Причина этого странного редактирования заключается в том, чтобы загрузить это в программное обеспечение для флэш-карт anki в виде txt без дальнейшего редактирования.
Мой нынешний метод может быть довольно трудоемким, если бы я редактировал весь текст из толстого учебника (который может содержать более 1000 правок на главу x20 или около того глав x5 учебников и более).
к вашему сведению, в anki и некоторых других программах для карточек табуляция является разделителем полей между передней частью/вопросом и задней частью/ответом.
Двойной пробел[ ][ ] используется для отделения определенного заголовка от одинарного пробела при использовании поиска и замены; который был предварительно установлен мной заранее.
Новая строка (\n) предназначена для добавления новых отдельных карточек.
Anki (и несколько других программ для карточек) поддерживает html, поэтому я обычно добавлял несколько карточек, копируя текст из pdf с помощью notepad++ и регулярных выражений, находил и заменял несколько заголовков или первых слов предложения в соответствии с вопросом/передней частью anki. карточка, а остальное становится ответной частью; а затем импортировать его в anki. Если бы можно было автоматизировать всю часть поиска, я бы сэкономил чертовски много времени!
[ ]{2}
? regex101.com/r/nR0xC8/1 Если я правильно понимаю вашу проблему, два последовательных пробела должны заменить новой строкой. - person Jan   schedule 30.04.2016