У меня есть файл csv
, содержащий около 2 миллионов строк и около 150 столбцов данных. Общий размер файла составляет около 1,3 ГБ. Это около 300 миллионов членов массива.
Я начал с файла из 3,5 миллионов строк и методом проб и ошибок понял, что FORTRAN
даже не скомпилируется, если массив не определен в 3,9 миллиона или меньше. 4 миллиона, не ходи. Ошибка шины/дампы ядра.
Так или иначе, я думал, что мой файл с 2 миллионами строк будет работать. Я прочитал несколько сообщений о лимите в 2 ГБ. Однако, когда я распечатываю номер строки при чтении данных, я получаю только 250 000 или около того, прежде чем он просто закончится. Как ни странно, у меня есть почти идентичный файл (использовал команду разделения), и он достигает только 85 000, прежде чем вырубиться. Не уверен, почему так по-разному, одинаковое количество символов в строке.
Могу ли я что-нибудь сделать, чтобы прочитать эти данные? Было бы большой проблемой собирать все данные сотни раз.
gfortran -Wall -g
, запускали ли вы под отладчикомgdb
? - person Basile Starynkevitch   schedule 24.10.2012unformatted
на Фортране. - person High Performance Mark   schedule 24.10.2012stream
доступ не был добавлен в стандарт в одной из последних версий? Это еще один двоичный формат, который занимает меньше места на диске, чемunformatted
, и при этом достаточно прост для понимания... - person mgilson   schedule 24.10.2012stream
можно использовать для файловformatted
иunformatted
, так что это, строго говоря, не альтернатива ни тому, ни другому. - person High Performance Mark   schedule 24.10.2012