Теорема CAP - доступность и допуск на разбиение

Хотя я пытаюсь понять «Доступность» (A) и «Допуск разделения» (P) в CAP, мне было трудно понять объяснения из различных статей.

У меня такое чувство, что A и P могут идти вместе (я знаю, что это не так, и поэтому не понимаю!).

Объясняя простым языком, что такое A и P и чем они отличаются?

Manikandan Kannan 10.09.2012 источник

comment

вот статья, которая объясняет CAP на простом английском языке ksat.me/a -plain-english-Introduction-to-cap-теорема - Tushar Saha 25.06.2019

comment

не выбирайте готовые ответы. Прочтите, визуализируйте и поймите каждый C, A, P отдельно. Разработайте распределенную кластерную архитектуру (возможно, 3 БД) и примените свое понимание. Посмотрите, что происходит с C, A, P, когда случаются отказы распределенных (DB). Как только вы поймете, проверьте ответы и примените свою логику. Помните - даже если вы понимаете, это может быть непонятно. Итак, подумайте и примените свое понимание. Спасибо - Maiden 04.10.2019

comment

Каким-то образом указанная выше ссылка ksat.me ведет на URL-адрес 404, потому что она заканчивается на '/'. ksat.me/a-plain-english-introduction-to-cap- теорема Это прекрасно работает и дает очень подробное объяснение каждого из "C", "A", "P". - vivek.m 07.01.2020

Ответы (10)

arrow_upward
497
arrow_downward

Согласованность означает, что данные одинаковы во всем кластере, поэтому вы можете читать или записывать с / на любой узел и получать одни и те же данные.

Доступность означает возможность доступа к кластеру, даже если узел в кластере выходит из строя.

Допуск на разделение означает, что кластер продолжает функционировать, даже если существует «раздел» (разрыв связи) между двумя узлами (оба узла работают, но не могут общаться).

Чтобы получить как доступность, так и устойчивость к разделам, вы должны отказаться от согласованности. Подумайте, есть ли у вас два узла, X и Y, в настройке мастер-мастер. Теперь существует разрыв между сетевым взаимодействием между X и Y, поэтому они не могут синхронизировать обновления. На этом этапе вы можете:

A) Разрешите узлам выйти из синхронизации (отказ от согласованности) или

Б) Считайте кластер "неработающим" (отказ от доступности)

Все доступные комбинации:

CA - данные согласованы между всеми узлами - пока все узлы подключены к сети - и вы можете читать / писать с любого узла и быть уверенным, что данные совпадают, но если вы когда-нибудь разработаете раздел между узлами данные будут не синхронизированы (и не будут повторно синхронизироваться после разрешения раздела).
CP - данные согласованы между всеми узлами и поддерживают разбиение (предотвращение рассинхронизации данных), становясь недоступными при выходе из строя узла.
AP - узлы остаются в сети, даже если они не могут взаимодействовать друг с другом, и повторно синхронизируют данные после разрешения раздела, но вы не гарантируете, что все узлы будут иметь одинаковые данные (во время или после раздела)

Обратите внимание, что систем CA практически не существует (даже если некоторые системы утверждают, что так).

Chris Heald 10.09.2012

comment

Почему в AP мы не гарантируем, что все узлы будут иметь одинаковые данные? Хорошо, из-за того, что у нас нет C, но ... это для меня непонятно ... Я хочу знать, почему это происходит ... - grep; 08.10.2014

comment

@grep Извините за поздний ответ. Если у вас есть как доступность (кластер не выходит из строя), так и устойчивость к разделам (база данных может выжить, узлы не могут обмениваться данными), то вы не можете гарантировать, что все узлы всегда будут иметь все данные (согласованность), потому что узлы работают и принимают записи, но не могут передать эти записи друг другу. - Chris Heald; 10.01.2015

comment

Поздно к вечеринке, но стоит продемонстрировать несколько примеров в каждой категории, например. blog.nahurst.com/visual-guide-to-nosql-systems - bitinn; 22.04.2015

comment

Было бы действительно полезно включить простую иллюстрацию / пример о кластерах узлов, подразумеваемых здесь. это система или таблица / коллекции данных, распределенные по разным системам, или что-то еще? - shrotavre; 14.09.2018

comment

С практической точки зрения, узлы чаще всего представляют собой отдельные системы (или программное обеспечение, работающее в этих системах), соединенные каким-либо сетевым механизмом. - Chris Heald; 14.09.2018

comment

«Доступность означает возможность доступа к кластеру ...» - это должно быть «степень доступа к кластеру». Кластер все еще работает, но доступны только несколько узлов. - Gadam; 31.07.2019

comment

Для этого утверждения: B) Считайте, что кластер не работает (отказ от доступности), не означает ли это, что мы потеряли и A, и P? Кластер сейчас не работает ... - Zippon; 26.12.2019

comment

Это актуальное чтение. Google Cloud Spanner утверждает, что является системой CA на практике (не технически) для большинства случаев использования: cloud.google.com/blog/products/gcp/ - Vigneswaran Rk; 07.10.2020

comment

Б) Считайте, что кластер не работает (отказ от доступности). Как в этом случае система становится терпимой к разделам? - Prashanth Debbadwar; 11.02.2021

comment

Вы можете оставаться частично доступным в чем-то вроде настройки «ведущий-ведомый», делая ведомые устройства недоступными во время раздела, а ведущее устройство остается в сети. Вы просто не можете сохранить доступным весь кластер во время раздела - только его части, способные объявить, что такое авторитетное состояние. - Chris Heald; 11.02.2021

comment

Если есть смысл спросить, как работает доступность в системе AP? Рассмотрим 3 узла системы A, B, C с RF = 3, а B и C не работают. Любая запись в узел A с согласованностью ALL / QUORUM завершится ошибкой, поскольку B, C не работают. Как здесь достигается доступность? - Bishnu; 06.03.2021

comment

Требование ALL - это, по сути, CP, а не AP. QUORUM работает, гарантируя, что записи идут только в основной кластер в разделе, но если кластер из большинства узлов не может быть сформирован, он не может продолжаться. Ни одна система не может поддерживать доступность при отключенном критическом количестве узлов. - Chris Heald; 09.03.2021

arrow_upward
65
arrow_downward

Рассмотрение P в равных условиях с C и A - это небольшая ошибка, скорее, понятие «2 из 3» среди C, A, P вводит в заблуждение. Я бы кратко объяснил теорему CAP: «В распределенном хранилище данных во время разделения сети вы должны выбрать либо согласованность, либо доступность и не можете получить и то, и другое». Новые системы NoSQL пытаются сосредоточиться на доступности, в то время как традиционные базы данных ACID уделяют больше внимания согласованности.

Вы действительно не можете выбрать CA, сетевой раздел - это не то, что кто-то хотел бы иметь, это просто нежелательная реальность распределенной системы, сети могут выходить из строя. Вопрос в том, какой компромисс вы выберете для своего приложения, когда это произойдет. Эта статья от мужчины кто первым сформулировал этот термин, кажется, очень ясно это объясняет.

jayadev 23.01.2014

comment

Это то, что я понимаю из теоремы CAP. В сетевом разделе вы можете выбрать согласованность или доступность. - Ashish Ranjan; 03.12.2020

comment

Согласитесь, традиционные базы данных SQL - это CA, но у них нет никакого разделения, только аварийное переключение для HA. Можно ли считать систему без P распределенной? - Varun Garg; 28.04.2021

arrow_upward
19
arrow_downward

Вот как я обсуждаю CAP, особенно в отношении P.

CA возможен только в том случае, если у вас все в порядке с монолитной базой данных с одним сервером (возможно, с репликацией, но все данные в одном «блоке сбоя» - серверы не считаются частично отказавшими).

Если ваша проблема требует масштабирования, распределения и работы с несколькими серверами - могут возникнуть сетевые разделы. Вам уже требуется P. Некоторые проблемы, которые я подхожу, поддаются парадигме «всегда один сервер» (или, как сказал Стоунбрейкер, «распределение - это ставки стола»). Если вы можете найти проблему CA, такие решения, как традиционная немасштабируемая СУБД, предоставляют множество преимуществ.

Для меня это редкость: поэтому мы переходим к обсуждению AP vs CP.

Вы выбираете только между AP и CP, когда у вас есть раздел. Если сеть и оборудование работают правильно, вы получите свой пирог и тоже его съедите.

Давайте обсудим различие AP / CP.

AP - когда есть сетевой раздел, пусть независимые части работают свободно.

CP - при наличии сетевого раздела выключите узлы или запретите чтение и запись, чтобы возникли детерминированные сбои.

Мне нравятся архитектуры, которые могут делать и то, и другое, потому что некоторые проблемы связаны с AP, а некоторые с CP, а некоторые базы данных могут справиться и с тем, и с другим. Среди решений CP и AP тоже есть свои тонкости.

Например, в наборе данных AP у вас есть возможность как несогласованного чтения, так и возникновения конфликтов записи - это два разных возможных режима AP. Можно ли настроить вашу систему для точки доступа с высокой доступностью для чтения, но не допускать конфликтов записи? Или ваша AP-система может принимать конфликты записи с сильной и гибкой системой разрешения? В конечном итоге вам понадобятся и то, и другое, или вы можете выбрать систему, которая выполняет только одну?

В системе CP, насколько недоступны небольшие разделы (один сервер), если таковые имеются? Большая репликация может увеличить недоступность в CP-системе, как система справляется с этими компромиссами?

Это все вопросы, которые следует задать при выборе CP vs AP.

Отличное чтение в этой области сейчас - это пост Брюера «12 лет спустя». Я считаю, что это продвигает обсуждение CAP с ясностью, и настоятельно рекомендую это сделать.

http://www.infoq.com/articles/cap-twelve-years-later-how-the-rules-have-changed

Brian Bulkowski 09.07.2014

comment

Система CA действительно сбивает с толку, у меня есть вопрос относительно вашего примера CA с монолитной базой данных. Если это всего лишь один сервер, откуда берется A, поскольку мне кажется, что отказ указанного сервера приведет к тому, что служба будет недоступна? - chaooder; 08.12.2019

comment

Хороший вопрос. На серверах может произойти сбой диска, или даже сбой модулей DIMM, или сбой блоков питания, если они предназначены для обеспечения высокой доступности. Даже представьте, что вы находитесь в нескольких электросетях. Вы получаете все более и более высокую доступность, но внутри никогда не бывает сети, которая могла бы разбивать и работать с несовпадающими компонентами. Хотя существует более сложное оборудование (ищите SQL NON-STOP), примеры RAID-массивов с отказавшими и возобновляемыми компонентами все еще распространены в наши дни и обеспечивают очень высокую доступность на одном сервере. - Brian Bulkowski; 08.04.2020

comment

Хм, я прочитал ваш ответ @BrianBulkowski, что A говорит, что он все еще будет доступен, даже если есть сетевой раздел, а не он все равно будет доступен, если узел выйдет из строя. Это точно? - Adam Zerner; 10.04.2021

arrow_upward
18
arrow_downward

Последовательность:

При чтении гарантируется возврат самой последней записи (например, ACID) для данного клиента. Если в это время поступает какой-либо запрос, он должен дождаться завершения синхронизации данных между узлами и узлами.

Доступность:

каждый узел (если он не отказал) всегда выполняет запросы и всегда должен отвечать на запросы. Не имеет значения, вернет он последнюю копию или нет.

Допуск на разделение:

Система продолжит функционировать при возникновении сетевых разделов.

Что касается AP, доступность (всегда доступная) может существовать с (Cassendra) или без (RDBMS) допуска раздела.

источник изображения

mrsrinivas 18.04.2017

arrow_upward
5
arrow_downward

Я просмотрел много ссылок, но ни одна из них не смогла дать мне удовлетворительного ответа, кроме одной.

Поэтому я описываю CAP очень простыми формулировками.

Согласованность: должны возвращать одни и те же данные, независимо от того, с какого узла они поступают.
Доступность: узел должен ответить (должен быть доступен).
Допуск раздела: Кластер должен отвечать (должен быть доступен), даже если между узлами существует раздел (например, сбой сети).

(Также одна из основных причин, по которой это больше сбивает с толку, - это неправильное соглашение об именах. Если бы я был прав, я мог бы вместо этого дать теорему DNC: Согласованность данных, Доступность узла , Доступность кластера, где каждому соответствует Согласованность, Доступность и Допуск раздела соответственно)

База данных CP. База данных CP обеспечивает согласованность и устойчивость к разделам за счет доступности. Когда между любыми двумя узлами происходит разделение, система должна выключить несогласованный узел (т.е. сделать его недоступным) до тех пор, пока раздел не будет разрешен.

База данных AP: База данных AP обеспечивает доступность и устойчивость к разделам за счет согласованности. Когда возникает раздел, все узлы остаются доступными, но те, которые находятся не на том конце раздела, могут вернуть более старую версию данных, чем другие. (Когда раздел разрешен, базы данных AP обычно повторно синхронизируют узлы для устранения всех несоответствий в системе.)

База данных CA. База данных CA обеспечивает согласованность и доступность на всех узлах. Однако он не может этого сделать, если между любыми двумя узлами в системе есть раздел, и, следовательно, не может обеспечить отказоустойчивость. В распределенной системе нельзя избежать разделов. Итак, хотя мы можем обсуждать распределенную базу данных CA теоретически, для всех практических целей распределенная база данных CA может существовать, но не должна существовать.

Следовательно, это не означает, что у вас не может быть базы данных CA для вашего распределенного приложения, если она вам нужна. Многие реляционные базы данных, такие как PostgreSQL, обеспечивают согласованность и доступность и могут быть развернуты на нескольких узлах с помощью репликации.

Источник: https://www.ibm.com/cloud/learn/cap-theorem

Pratik K. Shah 29.06.2020

arrow_upward
3
arrow_downward

Я чувствую, что толерантность к разделению не объясняется хорошо ни в одном из ответов, поэтому более подробное объяснение теоремы CAP означает:

C: (линеаризуемость или сильная согласованность) примерно означает

Если операция B началась после успешного завершения операции A, то операция B должна видеть систему в том же состоянии, в котором она была при завершении операции A, или в более новом состоянии (но никогда в старом состоянии).

«Каждый запрос, полученный исправным узлом [база данных] в системе, должен приводить к ответу [без ошибок]». Недостаточно, чтобы какой-то узел мог обработать запрос: любой исправный узел должен уметь его обрабатывать. Многие так называемые «высокодоступные» (т.е. с низким временем простоя) системы фактически не соответствуют этому определению доступности.

Терпимость раздела (ужасно неверное название) в основном означает, что вы общаетесь по асинхронной сети, которая может задерживать или отбрасывать сообщения. Интернет и все наши центры обработки данных обладают этим свойством, поэтому у вас действительно нет выбора в этом вопросе.

Источник: удивительный Мартин Клеппманн.

Просто возьмем некоторый пример: Cassandra может быть максимальной системой AP. Но если вы сконфигурируете его для чтения или записи на основе кворума, тогда он не останется CAP-доступным (доступным согласно определению теоремы CAP) и будет только системой P.

Anurag Sharma 23.06.2019

arrow_upward
2
arrow_downward

Простой способ понять теорему CAP:

В случае разделения сети нужно выбирать между идеальной доступностью и идеальной согласованностью.

Выбор последовательности означает невозможность ответить на запрос клиента, поскольку система не может гарантировать возврат самой последней записи. Это приносит в жертву доступность.

Выбор доступности означает возможность ответить на запрос клиента, но система не может гарантировать согласованность, т. е. самое последнее записанное значение. Доступные системы дают наилучший ответ в данных обстоятельствах.

Это объяснение взято из этой замечательной статьи. Надеюсь, это поможет.

Mouna 15.10.2019

arrow_upward
1
arrow_downward

В простой теореме CAP говорится, что распределенная система не может одновременно предоставить все три гарантии:

Последовательность

Каждый узел содержит одни и те же данные одновременно

Доступность

По крайней мере, один узел должен быть доступен для обслуживания данных каждый раз.

Допуск на разделение

Выход из строя системы очень редок

В большинстве случаев каждая система может гарантировать минимум две функции: CA, AP или CP.

JERRY 17.05.2018

arrow_upward
0
arrow_downward

Согласованность - когда мы отправляем запрос на чтение, если он возвращает результат, он должен возвращать самую последнюю запись, полученную по запросу клиента. Доступность - ваш запрос на чтение / запись всегда должен выполняться. Устойчивость к разделению - когда есть сетевой раздел (проблема для некоторых машин, чтобы разговаривать друг с другом), система по-прежнему должна работать.

В распределенном есть вероятность того, что произойдет разделение сети, и мы не сможем избежать «P» CAP. Поэтому мы выбираем между «Последовательность» и «Доступность».

http://bigdatadose.com/understanding-cap-theorem/

rajnish 05.03.2015

arrow_upward
0
arrow_downward

В лейтмотиве Брюера, в статье Гилберта и во многих других трактовках C, A и P приравниваются к желаемым свойствам реализации и фактически говорится «выберите два!». Однако это часто считается вводящей в заблуждение презентацией, поскольку вы не можете строить - или выбирать! - «Допуск на разделы»: в вашей системе либо могут быть разделы, либо нет.

CAP лучше понимать как описание компромиссов, которые вы должны сделать при построении системы, которая может иметь разделы. На практике это любая распределенная система: не бывает 100% надежной сети. Итак (по крайней мере, в распределенном контексте) реалистичной системы CA не существует. Вы потенциально можете столкнуться с разделами, поэтому в какой-то момент вам придется скомпрометировать C или A.

https://github.com/henryr/cap-faq#10-why-do-some-people-get-annoyed-when-i-characterise-my-system-as-ca

digit plumber 07.05.2021

Теорема CAP - доступность и допуск на разбиение

Ответы (10)

Последовательность:

Доступность:

Допуск на разделение:

Похожие вопросы