У меня проблема с написанием регулярного выражения python «не», чтобы идентифицировать определенный шаблон в тегах href.
Моя цель — заменить все вхождения DSS[a-z]{2}[0-9]{2} ссылкой href, как показано ниже, но без замены того же шаблона, встречающегося внутри тегов href.
Настоящее регулярное выражение:
replaced = re.sub("[^http://*/s](DSS[a-z]{2}[0-9]{2})", "<a href=\"http://test.com=\\1\">\\1</a>", input)
Мне нужно добавить это новое регулярное выражение с помощью оператора ИЛИ к существующему, которое у меня есть.
ИЗМЕНИТЬ:
Я пытаюсь использовать регулярное выражение только для простой операции. Я хочу заменить вхождения шаблона в любом месте html с помощью регулярного выражения, за исключением тех, которые встречаются внутри<a><\a>
.
[^http://*/s]
? Это не имеет никакого смысла. - person Tim Pietzcker   schedule 13.07.2011