в цикле: пропустить определенный тип ошибки (R)

Я использую код из: https://www.r-bloggers.com/htmltotext-extracting-text-from-html-via-xpath/ код находится на github:

https://github.com/tonybreyal/Blog-Reference-Functions/blob/master/R/htmlToText/htmlToText.R

Он создает команду, извлекающую текст из html:

htmlToText

У меня есть цикл, как показано ниже:

for(i in 1:10000){
input <- URL[i]
txt <- htmlToText(input)
write.table(txt, file = paste0(URL[i], ".txt", sep=""))
}

Я хочу, чтобы ito переходил к следующему i, когда он получает следующую ошибку:

Error in function (type, msg, asError = TRUE)  :    "Could not resolve host: NA"

Есть ли способ сделать это? Это может помочь многим другим, использующим этот код. Спасибо.


person useR    schedule 13.07.2018    source источник
comment
добавить if(is.na(input)) next перед read_html ?   -  person chinsoon12    schedule 13.07.2018
comment
Чем этот вопрос отличается от вашего предыдущего вопроса, который вы удалили? Опять же, вы не предоставляете достаточно подробностей. Откуда read_html? Google говорит мне, что rvest и textreadr имеют функцию read_html.   -  person Maurits Evers    schedule 13.07.2018
comment
Что делать, когда он получает другую ошибку? Должна ли она продолжаться или должна прекратиться?   -  person Onyambu    schedule 13.07.2018
comment
Я попробовал следующее, и это не сработало: статус ‹- tryCatch(getURL(input, ssl.verifypeer=FALSE, useragent=R), error = function(e) e) if(inherits(status, error)) next}   -  person useR    schedule 13.07.2018
comment
это единственный тип ошибки, который я получаю каждый раз.   -  person useR    schedule 13.07.2018
comment
@userR Трудно помочь без автономного минимального и воспроизводимого примера. Код, который вы даете в своем комментарии, полностью отличается от кода в исходном сообщении. Вы должны потратить некоторое время на редактирование своего вопроса, чтобы включить необходимые детали. Не помещайте код в комментарии, комментарии преходящи.   -  person Maurits Evers    schedule 13.07.2018
comment
@chinsoon12: сработало!!!   -  person useR    schedule 13.07.2018
comment
@Maurits Evers: я изменил вопрос, потому что функция, которую я использовал, не была из пакета.   -  person useR    schedule 13.07.2018
comment
@userR Это все еще не проясняет, откуда read_html.   -  person Maurits Evers    schedule 13.07.2018
comment
@MauritsEvers: я отредактировал сообщение. Подождите минуту, прежде чем ставить минус.   -  person useR    schedule 13.07.2018
comment
@userR Хорошо, спасибо, и я удалил свой голос против. Для протокола: я попросил вас предоставить подробности в моем первом комментарии почти час назад. В любом случае, я так понимаю, ответ chinsoon12 решил вашу проблему?   -  person Maurits Evers    schedule 13.07.2018
comment
@MauritsEvers Да, это сработало. У меня были NA в URL-адресах.   -  person useR    schedule 13.07.2018


Ответы (1)