Я столкнулся с очень странной проблемой при использовании rvest
. Это один из примеров: https://politics.raisethemoney.com/cchristiansen. Эти страницы нормально открываются в любом веб-браузере и могут быть открыты base::url
.
A connection with
description "https://politics.raisethemoney.com/cchristiansen"
class "url-libcurl"
mode "r"
text "text"
opened "closed"
can read "yes"
can write "no"
При использовании xml2::read_html
выдает ошибку 404.
Ошибка в open.connection(x, "rb"): ошибка HTTP 404.
Протестировано как на Rstudio Cloud, так и на локальном компьютере (Windows 10). Я сбит с толку. Любые идеи, почему это может происходить?
httr::content(httr::GET("https://politics.raisethemoney.com/cchristiansen"))
, кажется, работает нормально и даетhtml_document
в качестве вывода (что IIRC совпадает с тем, чтоxml2
должен делать) - person MichaelChirico   schedule 22.09.2019