php: преобразовать все относительные URL-адреса в абсолютные URL-адреса

может быть, это старый вопрос, но я пытаюсь в качестве личного эксперимента извлечь страницу из Интернета и сделать ее копию со всеми относительными URL-адресами, ссылками, href, src и т. д. с абсолютными URL-адресами

я использую CURL для получения страницы hte, и теперь у меня есть переменная $html, содержащая весь код.

И что; следующий шаг? Должен ли я использовать preg_replace? как?

Спасибо


person Francesco    schedule 12.02.2012    source источник
comment
Должен ли я использовать preg_replace? Если есть что-то, что вам определенно не нужно, это регулярное выражение. :-)   -  person PeeHaa    schedule 13.02.2012


Ответы (1)


Следующий шаг — поместить его в синтаксический анализатор HTML и пройтись по дереву, найдя и исправив атрибуты href в тегах a, атрибуты src в тегах img и т. д. и т. д. Парсер сможет повторно создать дерево в виде строки. как только вы закончите.

person staticsan    schedule 13.02.2012