Я использую код из: https://www.r-bloggers.com/htmltotext-extracting-text-from-html-via-xpath/ код находится на github:
https://github.com/tonybreyal/Blog-Reference-Functions/blob/master/R/htmlToText/htmlToText.R
Он создает команду, извлекающую текст из html:
htmlToText
У меня есть цикл, как показано ниже:
for(i in 1:10000){
input <- URL[i]
txt <- htmlToText(input)
write.table(txt, file = paste0(URL[i], ".txt", sep=""))
}
Я хочу, чтобы ito переходил к следующему i, когда он получает следующую ошибку:
Error in function (type, msg, asError = TRUE) : "Could not resolve host: NA"
Есть ли способ сделать это? Это может помочь многим другим, использующим этот код. Спасибо.
if(is.na(input)) next
передread_html
? - person chinsoon12   schedule 13.07.2018read_html
? Google говорит мне, чтоrvest
иtextreadr
имеют функциюread_html
. - person Maurits Evers   schedule 13.07.2018read_html
. - person Maurits Evers   schedule 13.07.2018