Улучшает ли увеличенная буферизация максимальную скорость ifstream.getline() в C++?

Непосредственно перед использованием MSVC++ input.getline() для чтения очень большого (3 ГБ) текстового файла с разделителями я хотел оптимизировать скорость, увеличив размер входного буфера:

    ifstream input("in1.txt");
    input.rdbuf()->pubsetbuf(NULL, 1024 * 1024);

Однако при выполнении кода скорость не улучшилась, поэтому хотелось бы знать:

Что не так в коде?
Работает ли буферизация с ifstream.getline?
Каков размер буферизации по умолчанию, назначенный для ifstream?

С Уважением.

vizcayno 23.02.2012 источник

comment

возможный дубликат Что такое Самый быстрый метод для высокопроизводительного последовательного файлового ввода-вывода в C++? и Самый быстрый способ прочитать текстовый файл строк за строкой - Ben Voigt 24.02.2012

Ответы (5)

arrow_upward
3
arrow_downward

Рассматривали ли вы системный вызов mmap()?

Функция mmap() должна установить отображение между адресным пространством процесса и файлом, объектом разделяемой памяти или объектом типизированной памяти. Формат вызова следующий:

pa=mmap(addr, len, prot, flags, fildes, off);

справочная страница

MapViewOfFile — эквивалент Windows.

LPVOID WINAPI MapViewOfFile( __in HANDLE hFileMappingObject,
__in DWORD dwDesiredAccess, __in DWORD dwFileOffsetHigh, __in DWORD dwFileOffsetLow, __in SIZE_T dwNumberOfBytesToMap );

yves Baumes 23.02.2012

comment

Айвз, спасибо за помощь! хотя код для windows выглядит ужасно и очень близко к C. Я не могу поверить, что невозможно улучшить скорость с помощью STL. - vizcayno; 24.02.2012

arrow_upward
0
arrow_downward

Суть буферизации в том, что она работает на многих уровнях, у вас есть буферизация на уровне библиотеки (ifstream), у вас есть буферизация на уровне ОС и буферизация на аппаратном уровне. Изменение размера любого из них может оказать существенное или несуществующее влияние на производительность.

Что правда, так это то, что «логика» программы будет намного быстрее, чем у IO.

Лично, если горлышко бутылки не серьезно, я бы оставил его в покое.

111111 23.02.2012

comment

«логика» программы будет намного быстрее, чем у IO. Это распространенное предположение, которое никто никогда не проверяет. Они просто используют это как предлог, чтобы не ускорять ввод-вывод. В результате того, что вы никогда не беспокоитесь о производительности ввода-вывода, он действительно очень медленный. - Ben Voigt; 24.02.2012

comment

@BenVoigt: +1 Я согласен!. С появлением на рынке сетевых адаптеров 10g и 40g ввод-вывод фактически загружает ЦП, логика быстро становится узким местом, а тупая/неэффективная обработка ввода в логике является причиной большинства замедлений. - Sami Kenjat; 12.11.2012

arrow_upward
0
arrow_downward

Вы получите самую высокую производительность, используя CreateFile и ReadFile. Откройте файл с помощью FILE_FLAGS_SEQUENTIAL_SCAN.

Чтение с размером буфера, равным степени двойки. Только бенчмаркинг может определить это число. Однажды я видел, что это 8K. В другой раз я обнаружил, что это 8M! Это сильно варьируется.

Это зависит от размера кэш-памяти ЦП, от эффективности упреждающего чтения ОС и от накладных расходов, связанных с выполнением множества небольших операций записи.

Отображение памяти — не самый быстрый способ. У него больше накладных расходов, потому что вы не можете контролировать размер блока, а ОС должна выдавать ошибки на всех страницах.

usr 23.02.2012

comment

Принятые ответы объясняют, почему это так. Он также не использовал FILE_FLAG_SEQUENTIAL_SCAN. - usr; 24.02.2012

comment

Да, я сказал ему об этом в комментариях. Но тот факт, что MapViewOfFile выполняется немного быстрее, чем FILE_FLAG_NO_BUFFERING, показывает, что отображение памяти либо намного эффективнее, чем ReadFile, возможно, из-за отсутствия необходимости копировать все из кеша на частную страницу, принадлежащую приложению, либо отображение памяти выполняет собственную предварительную выборку (которая была отключена для ReadFile в этом вопросе), или, возможно, некоторые из них. - Ben Voigt; 24.02.2012

comment

Да, отображение памяти выполняет предварительную выборку самостоятельно. По крайней мере, согласно книге Windows Internals. Cache Manager может даже обнаруживать определенные шаблоны доступа. Он автоматически переключается в режим SEQUENTIAL или RANDOM_ACCESS внутри. - usr; 24.02.2012

comment

FILE_FLAG_NO_BUFFERING означает, что вы получаете поиск по диску для каждого блока, потому что предварительная выборка не держит диск занятым. - usr; 24.02.2012

arrow_upward
0
arrow_downward

Вы можете попробовать использовать функцию файла с отображением памяти, предоставляемую ОС, или, если память не является проблемой, попробуйте прочитать весь файл в память перед обработкой.

Dmitri Bouianov 23.02.2012

arrow_upward
-1
arrow_downward

Я хотел оптимизировать скорость

Избавьтесь от fstream. iostreams вообще ужасное узкое место.

Ben Voigt 23.02.2012

comment

Бен, тесты Google убедили меня, что C++ — самый быстрый язык, и, конечно же, он включает в себя STL :-( - vizcayno; 24.02.2012

comment

@ user255053: Я серьезно сомневаюсь, что вы используете STL, и даже если вы используете, iostreams никогда не были его частью. ‹/pedant› Стандартная библиотека C++ может быть оптимизирована или нет, в зависимости от реализации и используемой части. - Ben Voigt; 24.02.2012

Улучшает ли увеличенная буферизация максимальную скорость ifstream.getline() в C++?

Ответы (5)

Похожие вопросы