Вопросы по теме 'nokogiri'

Как перебирать таблицу и превращать строки в объекты с помощью nokogiri
Я хочу использовать nokogiri для циклического просмотра html и создания объекта, соответствующего каждой строке. Я могу определить корневые пути xpath, из которых я хочу, чтобы данные заполняли переменные объекта, но я не знаю, как сгруппировать их...
2604 просмотров
schedule 21.10.2022

Поиск текстового узла в xml с использованием проблемы xpath
Я использую рельсы и парсер Nokogiri. Мой xml выглядит следующим образом, и я пытаюсь отобразить текст «Биология: 08:00». <rss version="2.0"> <channel> <item> <title>Biology: 08:00</title>...
497 просмотров
schedule 21.07.2022

Как использовать объявления xmlns с XPath в Nokogiri
Я использую Nokogiri::XML для анализа ответов от Amazon SimpleDB. Ответ примерно такой: <SelectResponse xmlns="http://sdb.amazonaws.com/doc/2007-11-07/"> <SelectResult> <Item>...
8430 просмотров
schedule 20.03.2022

Как создать XML с помощью Nokogiri::XML::Builder с дефисом в имени элемента?
Я пытаюсь создать XML-документ с помощью Nokogiri. В некоторых элементах есть дефисы. Вот пример: require "nokogiri" builder = Nokogiri::XML::Builder.new do |xml| xml.foo_bar "hello" end puts builder.to_xml Что производит: <?xml...
17313 просмотров
schedule 17.07.2023

Удаление элементов ‹script› из HTML
Я использую Ruby с модулем Nokogiri и хочу получить содержимое тела без элементов скрипта. Парсинг Nokogiri использует XPATH или CSS 3.0. XPATH я действительно не понимаю, и я не могу найти селектор CSS для достижения своих целей.
2532 просмотров
schedule 17.04.2023

Парсер Nokogiri pull (Nokogiri::XML::Reader) проблема с самозакрывающимся тегом
У меня есть огромный XML (> 400 МБ), содержащий продукты. Поэтому использование синтаксического анализатора DOM исключено, поэтому я попытался проанализировать и обработать его с помощью синтаксического анализатора извлечения. Ниже приведен фрагмент...
1706 просмотров
schedule 07.04.2023

Поиск XML и получение подмножества узлов в виде XML
Учитывая поисковый термин, как искать атрибуты узлов в XML и возвращать XML, который содержит только те узлы, которые соответствуют термину, а также их родителей на всем пути к корневому узлу. Вот пример входного XML: <root> <node...
401 просмотров
schedule 13.03.2022

Как извлечь пару имени и значения атрибута из xml с помощью Nokogiri?
Пример: <fruit name="mango"/> Я хочу получить вывод как: name="mango"
2825 просмотров
schedule 12.03.2022

Может ли Nokogiri искать теги ?xml-stylesheet?
Мне нужно проанализировать таблицу стилей XML: <?xml version="1.0" encoding="UTF-8"?> <?xml-stylesheet type="text/xsl" href="/templates/xslt/inspections/disclaimer_en.xsl"?> Используя Нокогири, я пробовал:...
568 просмотров
schedule 09.12.2022

XML в хэш-таблицу в Ruby: разбор списка исторических изобретений
Я хотел бы поглотить следующие данные об исторических изобретениях в удобную структуру данных Ruby: http://yootles.com/outbox/inventions.xml Обратите внимание, что все данные находятся в атрибутах XML. Кажется, должно быть быстрое решение с...
934 просмотров
schedule 25.05.2022

Как расширить все атрибуты class= до style=?
Я анализирую ветки форума с помощью Nokogiri и помещаю их в RSS-канал. На самом форуме нет ни RSS, ни каких-либо других новостных лент. Проблема, с которой я столкнулся, заключается в том, что элементы стилизованы с помощью классов CSS и с помощью...
228 просмотров
schedule 11.05.2022

Как редактировать docx с помощью nokogiri и rubyzip
Я использую комбинацию rubyzip и nokogiri для редактирования файла .docx. Я использую rubyzip для распаковки файла .docx, а затем использую nokogiri для анализа и изменения тела файла word/document.xml, но каждый раз, когда я закрываю rubyzip в...
4932 просмотров
schedule 23.02.2022

Проблема с незакрытым тегом img
данные представлены в формате HTML и отправлены на сервер, который выполняет некоторую предварительную обработку. Он работает с атрибутом «src» тега «img». После предварительной обработки и сохранения все предварительно обработанные теги «img»...
774 просмотров
schedule 29.05.2022

Как понизить версию libxml 2.7.8 до 2.7.6 в Ubuntu
Один из моих Rubygem (Nokogiri) был построен против libXML 2.7.6, но как только я обновил libXML до версии 2.7.8, мои программы выдают ошибки. Чтобы мои программы работали, мне нужно сделать много модификаций, а я не хочу их делать. Могу ли я...
2049 просмотров
schedule 01.09.2022

Нокогири: как найти выбранный вариант ‹выбрать›?
Мне нужно получить значение выбранного параметра HTML: <select name="DisplayCurrency" id="DisplayCurrency" > <option value="GBP" >Pounds Sterling</option> <option value="EUR" selected="selected" >Euros</option>...
4915 просмотров
schedule 04.06.2022

Как разобрать XML и поместить все значения узлов с одинаковыми именами в массив
У меня есть XML, который я пытаюсь проанализировать и получить статус каждого из моих тестов сердцебиения, используя Nokogiri. Вот мой код: xml = <a:HBeat> <a:ElapsedTime>3 ms</a:ElapsedTime> <a:Name>Service...
1216 просмотров
schedule 05.02.2023

XPath для поиска привязки с определенным доменом в этом HTML
У меня есть следующий HTML <div id="profile-bio-full"> <p>Bla bla bla bla </p> <p>Site: <a href="http://www.something.com" rel="nofollow">something.com</a></p> <p>Facebook: <a...
1184 просмотров
schedule 06.02.2023

Ось XPath, получить все следующие узлы, пока
У меня есть следующий пример HTML: <!-- lots of html --> <h2>Foo bar</h2> <p>lorem</p> <p>ipsum</p> <p>etc</p> <h2>Bar baz</h2> <p>dum dum dum</p>...
6323 просмотров
schedule 14.05.2022

Разобрать таблицу с помощью Nokogiri
Я хотел бы проанализировать таблицу с помощью Nokogiri. я делаю так def parse_table_nokogiri(html) doc = Nokogiri::HTML(html) doc.search('table > tr').each do |row| row.search('td/font/text()').each do |col| p...
6448 просмотров
schedule 08.02.2023

Использование Nokogiri для создания элемента XML с пространством имен
Я использую Nokogiri, который создает XML. Я хочу иметь следующую структуру: <content:encode>text</content> Я пробовал этот код: xml.content['encoded'] {xml.text "text"} но это дает мне ошибку. Как правильно это...
3166 просмотров
schedule 25.12.2022