Вопросы по теме 'nokogiri'
Как перебирать таблицу и превращать строки в объекты с помощью nokogiri
Я хочу использовать nokogiri для циклического просмотра html и создания объекта, соответствующего каждой строке. Я могу определить корневые пути xpath, из которых я хочу, чтобы данные заполняли переменные объекта, но я не знаю, как сгруппировать их...
2604 просмотров
schedule
21.10.2022
Поиск текстового узла в xml с использованием проблемы xpath
Я использую рельсы и парсер Nokogiri. Мой xml выглядит следующим образом, и я пытаюсь отобразить текст «Биология: 08:00».
<rss version="2.0">
<channel>
<item>
<title>Biology: 08:00</title>...
497 просмотров
schedule
21.07.2022
Как использовать объявления xmlns с XPath в Nokogiri
Я использую Nokogiri::XML для анализа ответов от Amazon SimpleDB. Ответ примерно такой:
<SelectResponse xmlns="http://sdb.amazonaws.com/doc/2007-11-07/">
<SelectResult>
<Item>...
8430 просмотров
schedule
20.03.2022
Как создать XML с помощью Nokogiri::XML::Builder с дефисом в имени элемента?
Я пытаюсь создать XML-документ с помощью Nokogiri. В некоторых элементах есть дефисы. Вот пример:
require "nokogiri"
builder = Nokogiri::XML::Builder.new do |xml|
xml.foo_bar "hello"
end
puts builder.to_xml
Что производит:
<?xml...
17313 просмотров
schedule
17.07.2023
Удаление элементов ‹script› из HTML
Я использую Ruby с модулем Nokogiri и хочу получить содержимое тела без элементов скрипта.
Парсинг Nokogiri использует XPATH или CSS 3.0. XPATH я действительно не понимаю, и я не могу найти селектор CSS для достижения своих целей.
2532 просмотров
schedule
17.04.2023
Парсер Nokogiri pull (Nokogiri::XML::Reader) проблема с самозакрывающимся тегом
У меня есть огромный XML (> 400 МБ), содержащий продукты. Поэтому использование синтаксического анализатора DOM исключено, поэтому я попытался проанализировать и обработать его с помощью синтаксического анализатора извлечения. Ниже приведен фрагмент...
1706 просмотров
schedule
07.04.2023
Поиск XML и получение подмножества узлов в виде XML
Учитывая поисковый термин, как искать атрибуты узлов в XML и возвращать XML, который содержит только те узлы, которые соответствуют термину, а также их родителей на всем пути к корневому узлу.
Вот пример входного XML:
<root>
<node...
401 просмотров
schedule
13.03.2022
Как извлечь пару имени и значения атрибута из xml с помощью Nokogiri?
Пример:
<fruit name="mango"/>
Я хочу получить вывод как:
name="mango"
2825 просмотров
schedule
12.03.2022
Может ли Nokogiri искать теги ?xml-stylesheet?
Мне нужно проанализировать таблицу стилей XML:
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="/templates/xslt/inspections/disclaimer_en.xsl"?>
Используя Нокогири, я пробовал:...
568 просмотров
schedule
09.12.2022
XML в хэш-таблицу в Ruby: разбор списка исторических изобретений
Я хотел бы поглотить следующие данные об исторических изобретениях в удобную структуру данных Ruby:
http://yootles.com/outbox/inventions.xml
Обратите внимание, что все данные находятся в атрибутах XML.
Кажется, должно быть быстрое решение с...
934 просмотров
schedule
25.05.2022
Как расширить все атрибуты class= до style=?
Я анализирую ветки форума с помощью Nokogiri и помещаю их в RSS-канал. На самом форуме нет ни RSS, ни каких-либо других новостных лент.
Проблема, с которой я столкнулся, заключается в том, что элементы стилизованы с помощью классов CSS и с помощью...
228 просмотров
schedule
11.05.2022
Как редактировать docx с помощью nokogiri и rubyzip
Я использую комбинацию rubyzip и nokogiri для редактирования файла .docx. Я использую rubyzip для распаковки файла .docx, а затем использую nokogiri для анализа и изменения тела файла word/document.xml, но каждый раз, когда я закрываю rubyzip в...
4932 просмотров
schedule
23.02.2022
Проблема с незакрытым тегом img
данные представлены в формате HTML и отправлены на сервер, который выполняет некоторую предварительную обработку.
Он работает с атрибутом «src» тега «img».
После предварительной обработки и сохранения все предварительно обработанные теги «img»...
774 просмотров
schedule
29.05.2022
Как понизить версию libxml 2.7.8 до 2.7.6 в Ubuntu
Один из моих Rubygem (Nokogiri) был построен против libXML 2.7.6, но как только я обновил libXML до версии 2.7.8, мои программы выдают ошибки. Чтобы мои программы работали, мне нужно сделать много модификаций, а я не хочу их делать. Могу ли я...
2049 просмотров
schedule
01.09.2022
Нокогири: как найти выбранный вариант ‹выбрать›?
Мне нужно получить значение выбранного параметра HTML:
<select name="DisplayCurrency" id="DisplayCurrency" >
<option value="GBP" >Pounds Sterling</option>
<option value="EUR" selected="selected" >Euros</option>...
4915 просмотров
schedule
04.06.2022
Как разобрать XML и поместить все значения узлов с одинаковыми именами в массив
У меня есть XML, который я пытаюсь проанализировать и получить статус каждого из моих тестов сердцебиения, используя Nokogiri.
Вот мой код:
xml =
<a:HBeat>
<a:ElapsedTime>3 ms</a:ElapsedTime>
<a:Name>Service...
1216 просмотров
schedule
05.02.2023
XPath для поиска привязки с определенным доменом в этом HTML
У меня есть следующий HTML
<div id="profile-bio-full">
<p>Bla bla bla bla </p>
<p>Site: <a href="http://www.something.com" rel="nofollow">something.com</a></p>
<p>Facebook: <a...
1184 просмотров
schedule
06.02.2023
Ось XPath, получить все следующие узлы, пока
У меня есть следующий пример HTML:
<!-- lots of html -->
<h2>Foo bar</h2>
<p>lorem</p>
<p>ipsum</p>
<p>etc</p>
<h2>Bar baz</h2>
<p>dum dum dum</p>...
6323 просмотров
schedule
14.05.2022
Разобрать таблицу с помощью Nokogiri
Я хотел бы проанализировать таблицу с помощью Nokogiri. я делаю так
def parse_table_nokogiri(html)
doc = Nokogiri::HTML(html)
doc.search('table > tr').each do |row|
row.search('td/font/text()').each do |col|
p...
6448 просмотров
schedule
08.02.2023
Использование Nokogiri для создания элемента XML с пространством имен
Я использую Nokogiri, который создает XML. Я хочу иметь следующую структуру:
<content:encode>text</content>
Я пробовал этот код:
xml.content['encoded'] {xml.text "text"}
но это дает мне ошибку.
Как правильно это...
3166 просмотров
schedule
25.12.2022