Вопросы по теме 'html-parser'
Способ анализа HTML-документа в Ruby?
как класс DOMDocument в PHP, есть ли какой-либо класс в RUBY (т.е. основной RUBY) для анализа и получения значения элементов узла из документа HTML.
32546 просмотров
schedule
05.04.2022
Python: извлечение определенных данных с помощью парсера html
Я начал использовать HTMLParser в Python для извлечения данных с веб-сайта. Я получаю все, что хотел, кроме текста внутри двух тегов HTML. Вот пример тега HTML:
<a href="http://wold.livingsources.org/vocabulary/1" title="Swahili"...
37076 просмотров
schedule
17.07.2023
Многостраничная таблица синтаксического анализатора HTML в Java
я использую Jsoup в качестве анализатора html, чтобы получить все детали из таблицы на этом веб-сайте . С приведенным ниже кодом я могу получить данные только на первой странице. Любой совет?
public static void main(String[] args) {...
496 просмотров
schedule
06.12.2022
Как пропустить повторяющийся контент из поиска с помощью простого синтаксического анализатора html dom
Я хочу пропустить определенный повторяющийся контент с HTML-страницы, используя простой класс HTML dom. Допустим как вы видите по этой ссылке: http://www.gutenberg.org/wiki/Category:Agriculture_Bookshelf Forestry приходит 2 раза.
Один в...
402 просмотров
schedule
30.06.2022
Поиск и замена содержимого между определенным тегом
#!/usr/bin/perl
use strict;
use warnings;
my $html = q|
<html>
<head>
<style>
.classname{
color: red;
}
</style>
</head>
<body>
classname will have a color property....
146 просмотров
schedule
19.01.2023
Найти Xpath элемента в содержимом html-страницы с помощью java
Я начинаю использовать выражение xpath,
У меня есть ниже URL:
http://www.newark.com/white-rodgers/586-902/contactor-spst-no-12vdc-200a-bracket/dp/35M1913?MER=PPSO_N_P_EverywhereElse_None
который содержит html-контент страницы,...
1724 просмотров
schedule
26.07.2023
Как получить ссылки из результатов поиска Google html в С#?
Я получил этот код, который выводит результаты поиска из Google в виде строки HTML:
WebClient webClient = new WebClient();
string htmlString = webClient.DownloadString("http://www.google.com/search?q=" + searchQuery);
Любая идея, как...
660 просмотров
schedule
25.05.2023
Html Parser извлекается с предыдущей веб-страницы
У меня есть скрипт, который загружает страницу и сохраняет кучу идентификаторов данных из нескольких контейнеров. Затем я хочу открыть новые URL-адреса, добавив указанные идентификаторы данных в конец URL-адресов. Для каждого URL-адреса я хочу найти...
58 просмотров
schedule
03.01.2023