пустое значение захватывается при соскабливании с использованием Rselenium

Я пытаюсь очистить значение текстового поля из URL-адреса в коде. Я выбрал css с помощью гаджета slector. Невозможно захватить содержимое текстового поля. Протестировано и несколько других CSS, но значение текстового поля не фиксируется. Текстовое поле: год постройки Помогите, пожалуйста. Ниже приведен код для справки.

url = "https://www.ncspo.com/FIS/dbBldgAsset_public.aspx?BldgAssetID=8848"
values = list()
remDr$navigate(url)
page_source<-remDr$getPageSource()
a = read_html(page_source[[1]])
=        html_nodes(a,"#ctl00_mainContentPlaceholder_txtConstructionYear_iu")

values = html_text(html_main_node)
values

заранее спасибо

r web-scraping rselenium

Apoorv 23.02.2016 источник

Ответы (2)

arrow_upward
0
arrow_downward

Приведенный выше ответ тоже работает. Но если вы пытаетесь использовать только RSelenium. Вот код

library(RSelenium)
checkForServer()
startServer()
Sys.sleep(5)
re<-remoteDriver()
re$open()
re$navigate("https://www.ncspo.com/FIS/dbBldgAsset_public.aspx?BldgAssetID=8848")
re$findElement(using = "css selector", "#ctl00_mainContentPlaceholder_txtConstructionYear_iu")$clickElement()
text<-unlist(re$findElement(using = "css selector", "#ctl00_mainContentPlaceholder_txtConstructionYear_iu")$getElementAttribute("value"))

Это работает

Bharath 23.02.2016

arrow_upward
1
arrow_downward

Почему RSelenium? Он отлично справляется с rvest (хотя это ужасный сайт SharePoint, который может вызвать проблемы в конце с поддержанием правильных файлов cookie состояния просмотра).

library(rvest)

pg <- html_session("https://www.ncspo.com/FIS/dbBldgAsset_public.aspx?BldgAssetID=8848")

html_attr(html_nodes(pg, "input#ctl00_mainContentPlaceholder_txtConstructionYear_iu"), "value")

## [1] 1987

Вы должны захватить value атрибут вместо текста узла. Это должно работать и в вашем коде селена.

hrbrmstr 23.02.2016

пустое значение захватывается при соскабливании с использованием Rselenium

Ответы (2)

Похожие вопросы