Действительно ли list :: size () O (n)?

Недавно я заметил, что некоторые люди упоминают, что std::list::size() имеет линейную сложность.
Согласно некоторые источники, на самом деле это зависит от реализации, поскольку в стандарте не указано, что сложность должна быть.
Комментарий в этой записи блога говорится:

Собственно, это зависит от того, какой STL вы используете. Microsoft Visual Studio V6 реализует size () как {return (_Size); } тогда как gcc (по крайней мере, в версиях 3.3.2 и 4.1.0) делает это как {return std :: distance (begin (), end ()); } Первый имеет постоянную скорость, второй - скорость o (N).

Итак, я предполагаю, что для толпы VC ++ size() имеет постоянную сложность, поскольку Dinkumware, вероятно, не изменит этот факт со времен VC6. Я прав?
Как это выглядит сейчас в gcc? Если это действительно O (n), почему разработчики решили это сделать?

foraidt 23.10.2008 источник

Ответы (7)

arrow_upward
52
arrow_downward

Pre-C ++ 11 ответ

Вы правы, что в стандарте не указывается, какой должна быть сложность list::size(), однако он рекомендует, чтобы он «имел постоянную сложность» (примечание A в таблице 65).

Вот интересная статья Говарда Хиннанта, в которой объясняется, почему некоторые люди думают, что list::size() должен иметь O (N) сложность (в основном потому, что они считают, что O (1) list::size() делает list::splice() сложностью O (N)) и почему O (1) list::size() - хорошая идея (по мнению автора):

http://howardhinnant.github.io/On_list_size.html

Я думаю, что основные моменты статьи следующие:

есть несколько ситуаций, когда поддержание внутреннего счетчика, так что list::size() может быть O (1), приводит к тому, что операция соединения становится линейной
вероятно, существует гораздо больше ситуаций, когда кто-то может не знать о негативных эффектах, которые могут произойти из-за того, что они вызывают O (N) size() (например, его один пример, где list::size() вызывается при удерживании блокировки).
что вместо того, чтобы разрешать size() быть O (N), в интересах «наименьшего удивления», стандарт должен требовать, чтобы любой контейнер, реализующий size(), реализовал его в режиме O (1). Если контейнер не может этого сделать, он вообще не должен реализовывать size(). В этом случае пользователь контейнера будет уведомлен о том, что size() недоступен, и если он по-прежнему хочет или должен получить количество элементов в контейнере, они все равно могут использовать container::distance( begin(), end()) для получения этого значения, но они будут полностью осведомлены что это операция O (N).

Думаю, я склонен согласиться с большей частью его рассуждений. Однако мне не нравится его предлагаемое дополнение к splice() перегрузкам. Необходимость передать n, который должен быть равен distance( first, last), чтобы получить правильное поведение, кажется рецептом для трудно диагностируемых ошибок.

Я не уверен, что следует или можно было бы сделать в будущем, поскольку любое изменение окажет значительное влияние на существующий код. Но в нынешнем виде я думаю, что существующий код уже затронут - поведение может значительно отличаться от одной реализации к другой для чего-то, что должно было быть четко определено. Может быть, один комментарий о том, что размер 'кеширован' и помечен как известный / неизвестный, может работать хорошо - вы получаете амортизированное поведение O (1) - единственный раз, когда вы получаете поведение O (N), это когда список изменяется некоторыми операциями splice () . Приятно то, что разработчики могут сделать это сегодня без изменения стандарта (если я чего-то не упускаю).

~~Насколько мне известно, C ++ 0x ничего не меняет в этой области.~~

Michael Burr 23.10.2008

comment

Ответ правильный, но рассуждения о размере списка плавны. Ваше предложение склонно к несогласованным параметрам и нарушает принцип, согласно которому пользователь предоставляет всю информацию только один раз. - PierreBdR; 23.10.2008

comment

Также должна быть возможность оставить стык O (1), но пометить размер как неизвестный. Тогда size () по-прежнему остается O (N) в худшем случае, но в худшем случае происходит не более одного раза за «недружественное» соединение. Таким образом, производительность всех операций строго превосходит всегда-O (N) size (). Предупреждение: я не продумал это до конца. - Steve Jessop; 23.10.2008

comment

строго лучше - на самом деле это ложь, поскольку в splice есть несколько дополнительных проверок, чтобы выяснить, в каком случае вы находитесь, и арифметика с размерами во всех мутаторах. Сказал вам, что я не подумал об этом. Но сложность никогда не бывает хуже, а иногда и лучше. - Steve Jessop; 23.10.2008

comment

@PierreBdR - Если неясно, я не автор статьи, я указал на нее, потому что подумал, что в ней есть некоторые интересные моменты. Я отредактировал ответ, чтобы сделать его более ясным (а также добавил несколько моих собственных мыслей и включил идеи из этих комментариев). - Michael Burr; 23.10.2008

comment

Последний черновик C ++ 0x требует, чтобы size() имел постоянную временную сложность (это изменение требований к контейнеру было внесено в N3000). - James McNellis; 16.03.2010

arrow_upward
79
arrow_downward

В C ++ 11 требуется, чтобы для любого стандартного контейнера операция .size() выполнялась с «постоянной» сложностью (O (1)). (Таблица 96 - Требования к контейнерам). Ранее в C ++ 03 .size() должен иметь постоянную сложность, но это не обязательно (см. Является ли std :: string size () операцией O (1)?).

Изменение стандарта вводится n2923: указание сложность размера () (редакция 1).

Однако реализация .size() в libstdc ++ по-прежнему использует алгоритм O (N) в gcc до 4.8:

  /**  Returns the number of elements in the %list.  */
  size_type
  size() const _GLIBCXX_NOEXCEPT
  { return std::distance(begin(), end()); }

См. Также Почему std :: list больше на C ++ 11? для подробно, почему это так.

Обновление: std::list::size() is правильно O (1) при использовании gcc 5.0 в режиме C ++ 11 (или выше).

Кстати, .size() в libc ++ правильно O (1):

_LIBCPP_INLINE_VISIBILITY
size_type size() const _NOEXCEPT     {return base::__sz();}

...

__compressed_pair<size_type, __node_allocator> __size_alloc_;

_LIBCPP_INLINE_VISIBILITY
const size_type& __sz() const _NOEXCEPT
    {return __size_alloc_.first();}

kennytm 06.12.2012

comment

это следует принять, к сожалению, люди не смотрят на старый Q. :) - NoSenseEtAl; 12.12.2012

arrow_upward
15
arrow_downward

Раньше мне приходилось заглядывать в list::size gcc 3.4, поэтому я могу сказать следующее:

Он использует std::distance(head, tail).
std::distance имеет две реализации: для типов, удовлетворяющих RandomAccessIterator, он использует "хвостовую часть", а для типов, которые просто удовлетворяют InputIterator, он использует алгоритм O (n), полагающийся на "iterator ++", считая, пока он не достигнет заданного хвоста.
std::list не удовлетворяет требованиям RandomAccessIterator, поэтому размер равен O (n).

Что касается «почему», я могу только сказать, что std::list подходит для задач, требующих последовательного доступа. Сохранение размера в качестве переменной класса приведет к накладным расходам при каждой вставке, удалении и т. Д., И эти потери являются большим запретом для STL. Если вам действительно нужно size() с постоянным временем, используйте std::deque.

introp 23.10.2008

arrow_upward
13
arrow_downward

Я лично не вижу проблемы с соединением O (N) как единственной причины, по которой разрешено иметь размер O (N). Вы не платите за то, что не используете - важный девиз C ++. В этом случае для поддержания размера списка требуется дополнительное увеличение / уменьшение при каждой вставке / стирании, независимо от того, проверяете ли вы размер списка или нет. Это небольшие фиксированные накладные расходы, но их все же важно учитывать.

Проверка размера списка требуется редко. Итерация от начала до конца без учета общего размера гораздо более распространена.

Greg Rogers 23.10.2008

comment

Очевидно, комитет C ++ 11 с вами не согласился. Жалость. - Mark Ransom; 27.12.2011

arrow_upward
5
arrow_downward

Я бы пошел к источнику (архив). На странице SGI STL говорится, что разрешено иметь линейную сложность. Я считаю, что они следовали руководству по дизайну, чтобы сделать реализацию списков как можно более общей и, таким образом, обеспечить большую гибкость в использовании списков.

Yuval F 23.10.2008

comment

SGI - не совсем источник. Он основан на оригинальном (HP?) STL, но Стандарт отклонился от этого. SGI просто говорит о том, что делает их реализация, а не о том, что стандарт говорит, что она должна делать. - James Curran; 23.10.2008

comment

И ссылка все равно разорвана. - Lightness Races in Orbit; 20.03.2018

arrow_upward
1
arrow_downward

Этот отчет об ошибке: [C ++ 0x] std :: list :: size сложность, в мучительных деталях фиксируется тот факт, что реализация в GCC 4.x - это линейное время, и то, что переход к постоянному времени для C ++ 11 происходил медленно (доступен в 5.0) из-за проблем совместимости с ABI.

Справочная страница для серии GCC 4.9 по-прежнему включает следующий отказ от ответственности:

Поддержка C ++ 11 все еще является экспериментальной и может измениться несовместимым образом в будущих выпусках.

Здесь есть ссылка на тот же отчет об ошибке: Должен ли std :: list :: size иметь постоянную сложность в C ++ 11?

Brent Bradburn 04.12.2015

arrow_upward
0
arrow_downward

Если вы правильно используете списки, вы, вероятно, не заметите никакой разницы.

Списки хороши для больших структур данных, которые вы хотите переупорядочить без копирования, или для данных, которые вы хотите сохранить действительные указатели после вставки.

В первом случае это не имеет значения, во втором я бы предпочел старую (меньшую) реализацию size ().

В любом случае std - это больше о правильности, стандартном поведении и «удобстве для пользователя», чем о чистой скорости.

Luke Givens 18.05.2017

comment

Я не понимаю, как желание знать, в крайнем случае, сколько элементов в списке, означает неправильное использование списка. - Lightness Races in Orbit; 08.08.2018

Действительно ли list :: size () O (n)?

Ответы (7)

Pre-C ++ 11 ответ

Похожие вопросы