Браузер командной строки с поддержкой рендеринга javascript, который выводит только визуализированный HTML

Мне нужен быстрый способ получить страницу с заданным URL-адресом, но получить не только простой HTML, но и HTML после выполнения javascript.

Я знаю CutyCapt, но для меня это медленно, для некоторых веб-страниц требуется более 10 секунд. Также мне неудобно использовать параметр --min-wait, так как он может возвращать пустые/не окончательные HTML-коды. Также кажется, что время от времени выдаются разные HTML-коды. Иногда он отображает элемент, созданный функцией javascript, иногда нет.

Есть ли альтернативы? Я хочу указать URL-адрес и вернуть обработанный html.


person Felipe Hummel    schedule 27.11.2010    source источник
comment
Почему вы думаете, что это возможно за меньшее время? Если это приложение занимает 10 секунд, кажется, что оно занимает 10 секунд. Конечно, вы не сможете сделать это за несколько миллисекунд. Браузеры и реализации JavaScript — сложные вещи.   -  person jwueller    schedule 28.11.2010
comment
Потому что такой браузер, как Chrome, может сделать это менее чем за 5 секунд! Кроме того, проблема, упомянутая в вопросе: также время от времени появляются разные HTML-коды. Иногда он отображает элемент, созданный функцией javascript, иногда нет.   -  person Felipe Hummel    schedule 28.11.2010
comment
Вы можете использовать WebKit и создать свой собственный. Не должно быть слишком сложно, если вы знаете, как использовать Qt.   -  person jwueller    schedule 28.11.2010


Ответы (1)


Вы можете взять текущую версию CutyCapt из репозитория svn и скомпилировать ее с помощью Qt 4.7.1 (или основную версию из Qt git репозиторий. Текущая реализация Webkit быстрее, чем версия 4.4.0, которая используется в скомпилированной версии CutyCapt. Если она по-прежнему недостаточно быстра, вы можете профилировать код и попытаться выяснить, можно ли его оптимизировать. .

person hmuelner    schedule 26.12.2010