Некоторые проблемы с read.fwf в R

Я пытаюсь открыть большой файл фиксированной ширины, но, к сожалению, функция read.fwf требует очень много времени. Поскольку мне приходится работать с большим набором данных, я хотел бы знать, есть ли другие решения для экономии времени или нет решений для этого.

В моем случае, чтобы открыть файл размером около шестисот тысяч, я использую следующий код:

df <- read.fwf(file = "df.txt", widths = c(1,3,3,4,3,3,1,1,2,2,2,2,1,1,3,3,2,2,3,1,2,2,3,2,1,3,1,1,3,3,1,3,1,1,1,1,2,3,1,2,1,3,2,1,1,1,3,3,1,1,1,2,4,16,3,7,1,1,2,1,2,2,1))

Это занимает около 12 минут.

Поскольку мне не нужны все столбцы в базе данных, я попытался удалить некоторые из них, выполнив следующие действия:

df <- read.fwf(file = "df.txt", widths = c(1,3,3,4,-3,3,-1,-1,2,-2,-2,2,1,-1,-3,-3,-2,-2,-3,-1,-2,-2,3,-2,-1,-3,-1,-1,-3,-3,-1,3,-1,-1,-1,1,-2,-3,-1,2,1,-3,-2,-1,-1,1,-3,-3,-1,-1,-1,-2,-4,-16,3,-7,-1,-1,2,-1,-2,2,-1))

Я экономлю время (6 минут), но процедура по-прежнему занимает слишком много времени, потому что мне приходится работать со многими наборами данных из более чем 2 миллионов строк.


person Antonio    schedule 13.07.2021    source источник
comment
Вы пробовали смотреть на это   -  person David    schedule 13.07.2021