Вопросы по теме 'html-parser'

Способ анализа HTML-документа в Ruby?
как класс DOMDocument в PHP, есть ли какой-либо класс в RUBY (т.е. основной RUBY) для анализа и получения значения элементов узла из документа HTML.
32546 просмотров
schedule 05.04.2022

Python: извлечение определенных данных с помощью парсера html
Я начал использовать HTMLParser в Python для извлечения данных с веб-сайта. Я получаю все, что хотел, кроме текста внутри двух тегов HTML. Вот пример тега HTML: <a href="http://wold.livingsources.org/vocabulary/1" title="Swahili"...
37076 просмотров

Многостраничная таблица синтаксического анализатора HTML в Java
я использую Jsoup в качестве анализатора html, чтобы получить все детали из таблицы на этом веб-сайте . С приведенным ниже кодом я могу получить данные только на первой странице. Любой совет? public static void main(String[] args) {...
496 просмотров
schedule 06.12.2022

Как пропустить повторяющийся контент из поиска с помощью простого синтаксического анализатора html dom
Я хочу пропустить определенный повторяющийся контент с HTML-страницы, используя простой класс HTML dom. Допустим как вы видите по этой ссылке: http://www.gutenberg.org/wiki/Category:Agriculture_Bookshelf Forestry приходит 2 раза. Один в...
402 просмотров

Поиск и замена содержимого между определенным тегом
#!/usr/bin/perl use strict; use warnings; my $html = q| <html> <head> <style> .classname{ color: red; } </style> </head> <body> classname will have a color property....
146 просмотров
schedule 19.01.2023

Найти Xpath элемента в содержимом html-страницы с помощью java
Я начинаю использовать выражение xpath, У меня есть ниже URL: http://www.newark.com/white-rodgers/586-902/contactor-spst-no-12vdc-200a-bracket/dp/35M1913?MER=PPSO_N_P_EverywhereElse_None который содержит html-контент страницы,...
1724 просмотров

Как получить ссылки из результатов поиска Google html в С#?
Я получил этот код, который выводит результаты поиска из Google в виде строки HTML: WebClient webClient = new WebClient(); string htmlString = webClient.DownloadString("http://www.google.com/search?q=" + searchQuery); Любая идея, как...
660 просмотров
schedule 25.05.2023

Html Parser извлекается с предыдущей веб-страницы
У меня есть скрипт, который загружает страницу и сохраняет кучу идентификаторов данных из нескольких контейнеров. Затем я хочу открыть новые URL-адреса, добавив указанные идентификаторы данных в конец URL-адресов. Для каждого URL-адреса я хочу найти...
58 просмотров
schedule 03.01.2023