Я хотел бы знать, как загружать файлы LEHD с их FTP-сайта.
https://lehd.ces.census.gov/data/lodes/LODES7/ < / а>
Мне нужно загрузить данные за несколько лет, как по месту работы, так и по месту жительства. Файлы имеют регулярные имена, а техническую документацию можно найти здесь:
https://lehd.ces.census.gov/data/lodes/LODES7/LODESTechDoc7.2.pdf S000 ссылается на все сегменты рабочей силы JT00 ссылается на все типы должностей
Итак, типичное имя файла: ca_wac_S000_JT00_2008.csv.gz В 'каталоге' / URL: https://lehd.ces.census.gov/data/lodes/LODES7/ca/wac/
Этот фрагмент кода git-hub кажется актуальным. Гарвардский учебник оказался полезным и дал мне возможность создать список всех файлов. Но я не могу заставить фактическую загрузку работать - R.curl у меня не сработало, так как я столкнулся с проблемой SSL.
Расширенный код тоже не работает:
install.packages("RCurl")
library(RCurl)
options(RCurlOptions = list(cainfo = system.file("CurlSSL", "cacert.pem", package = "RCurl")))
URL <- "https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Fss06hid.csv"
x <- getURL(URL)
x
#the above code works.
#my implementation...fails
URL <- "https://lehd.ces.census.gov/data/lodes/LODES7/ca/wac/ca_wac_S000_JT00_2002.csv.gz"
x <- getURL(URL)
#results in following error:
#Error in function (type, msg, asError = TRUE) :
# error:14077410:SSL routines:SSL23_GET_SERVER_HELLO:sslv3 alert handshake failure
devtools :: session_info () Информация о сеансе ------------------------------------------ --------------------------------------------- значение настройки версия R версия 3.4.3 (30.11.2017) система x86_64, mingw32 ui RStudio (1.1.383) язык (EN) сопоставление English_United States.1252 tz America / Denver
дата 17.12.2017Если вы можете использовать пакеты, устанавливаемые на GitHub (это будет немного, прежде чем я получу это на CRAN), вы можете дать https://github.com/hrbrmstr/lodes в ход: