Вероятность хотя бы одного события из нескольких возможных

Бывает, что нам нужно принять решение, для чего надо оценить вероятность наступления какого-то сложного события. Сложного в смысле состоящего из комбинации других событий.

Например мы собираемся в поход на выходные. Вероятность дождя в субботу 30%, а в воскресенье — 65%. Нужно ли брать резиновые сапоги? Если возьмем, а дождя не будет, будем зря таскать их с собой. Если оставим дома, а дождь пойдет, мы промочим ноги.

Или другой пример.

Мы планируем путешествие в Аргентину. Чтобы сэкономить, хотим купить билет с пятью пересадками, но беспокоимся, что если хотя бы один рейс опоздает, порушится вся цепочка. Готовы ли мы рисковать?

С точки зрения теории вероятностей все эти задачи очень похожи: есть цепочка каких-то независимых случайных событий, мы хотим оценить вероятность наступления хотя бы одного из них, чтобы принять правильное решение.

Хорошая новость в том, что раз задачи похожи, то и решаются они одинаково. Давайте, покажу, как.

Будет ли дождь?

Решим первую задачу. Начнем с того, что выпишем все возможные варианты погоды на выходных:

  1. Дождя нет ни в один из дней.
  2. Дождь идет только в субботу.
  3. Дождь идет только в воскресенье.
  4. Дожди идут оба дня.

Какая-то погода на выходных будет в любом случае, поэтому если мы сложим вероятности всех вариантов, то получим 100%.

P(1) + P(2) + P(3) + P(4) = 100%

Кстати, обратите внимание, что из всех вариантов, только (1) не подходит под условие «на выходных идет дождь». Если мы перенесем вероятность P(1) в левую часть уравнения, в правой части получим прям почти решение:

P(2) + P(3) + P(4) = 100% − P(1)

P(2) + P(3) + P(4) — это и есть то, что нам надо посчитать. Но, блин, там целых три случайных события.

Правая часть уравнения выглядит намного проще: 100% — P(1). Там только одно событие. И ведь эти части равны, значит если мы посчитаем правую, автоматически узнает и левую и решим задачу.

☝️ Хитрость в том, что решить задачу проще, если ее «перевернуть»: думать не о том, пойдет ли дождь в какой-нибудь из дней, а, наоборот, какова вероятность, что ни в один из дней дождя не будет.

Проговорим решение словами: вероятность того, что хотя бы в один из дней пойдет дождь = 100% − вероятность того, что ни в один из дней дождя не будет.

Это все круто, но чему равна вероятность того, что дождя не будет ни в один из дней?

Чтобы не углубляться в метеорологию, будем считать, что погода каждый день не зависит от погоды предыдущих дней. А если так, то, чтобы посчитать вероятность отсутствия дождя на выходных, достаточно перемножить вероятности того, что дождя не будет в каждый из дней:

Вероятности дождя в каждый из дней мы знаем. Значит можем посчитать вероятности того, что дождя не будет:

День Дождь Не дождь
Суббота 30% 100% − 30% = 70%
Воскресенье 65% 100% − 65% = 35%

Теперь перемножим:

P(дождя не будет) = 0.7 × 0.35 = 0.245 = 24.5%.

Сведем все воедино:

P(дождь будет хотя бы в один из выходных) = 100% − 24.5% = 75.5%

В общем виде решение задачи можно представить в виде формулы:

Вероятность P(А или B или C) = 100% − P(не, А) x P(не B) x P(не C)

Кайф этой формулы в том, что она подходит для любой комбинации независимых событий.

☝️ Случайные события называются независимыми, если вероятность наступления одного не меняется в случае наступления другого.

Независимые события

  • Самолет Аэрофлота из Москвы в Сочи задержался на 20 минут. Самолет Quatar Airlines, из Каира в Дубай задержался на час. Рейсы вылетали из разных мест, поэтому задержки вряд ли как-то связаны между собой.
  • Наше мобильное приложение скачал один, а потом и еще один пользователь. Может быть, конечно, оба пользователя увидели одну и ту же рекламу, но решения об установке, наверное, они принимали независимо друг от друга.
  • Гость казино несколько раз играет в рулетку. Каждый розыгрыш начинается с нуля и не зависит от предыдущих.

Зависимые события

  • Мы попали в пробку по пути в аэропорт, а потом мы опоздали на рейс. Если бы мы выехали заранее, или выбрали другой маршрут, могли бы успеть. То есть вероятность опоздать на рейс меняется в зависимости от наших предыдущих решений.
  • Пользователь скачал приложение и оформил платную подписку. Очевидно, что не было бы установки, не было бы и подписки.
  • Гость казино несколько раз играет в блекджек. В каждом розыгрыше из колоды достают несколько кард, поэтому шансы на победу каждый раз чуть-чуть меняются.

Для оценки вероятности нескольких зависимых событий используются чуть другие формулы, о них я расскажу отдельно.

Закрепим навык и решим задачу про путешествие в Аргентину.

Долетим ли мы до Аргентины?

Допустим, мы планируем отпуск. Заходим на Авиасейлз находим там вот такой маршрут.

  1. Москва → Сочи (Аэрофлот). Пересадка 1:35 ⚠️
  2. Сочи → Каир (Аэрофлот). Пересадка 12:45
  3. Каир → Доха (Quatar). Пересадка 8:20
  4. Доха → Сан Паулу (Quatar). Пересадка 1:45 ⚠️
  5. Сан Паулу → Буэнос Айрес (Air Canada)

Меня смущают две стыковки: в Сочи и в Сан Паулу. На пересадку будет мало времени, если хотя бы один рейс в цепочке задержится, может поломаться весь маршрут.

Перед покупкой я хочу посчитать вероятность того, что хотя бы один рейс в цепочке задержится.

Я нашел в сети статистику задержек авиакомпаний. Аэрофлот задерживает в 28.2% рейсов. Quatar Airlines — 8%. В моем маршруте два рейса Аэрофлотом, затем еще два — Quatar. Посчитаем вероятность того, что каждый рейс прилетит вовремя.

Рейс Вероятность
Москва → Сочи (Aэрофлот) 100% − 28.2% = 71.8%
Сочи → Каир (Aэрофлот) 100% − 28.2% = 71.8%
Каир → Доха (Quatar) 100% − 8% = 92%
Доха → Сан Паулу (Quatar) 100% − 8% = 92%

Сначала посчитаем вероятность того, что все рейсы прибудут вовремя:

P(все рейсы приедутут вовремя) = 0.718 × 0.718 × 0.92 × 0.92 ≈ 0.436

Теперь посчитаем, вероятность, что хотя бы один рейс задержится:

P(хотя бы один рейс задержится) = 1 − 0.436 = 0.564 = 56%

Вероятность хотя бы одной задержки равна 56%, то есть, скорее всего, что-то где-то пойдет не так. Может, конечно, какой-то рейс задержат всего на несколько минут, и это не порушит весь маршрут. Но кажется, все-таки стоит поискать маршрут попроще.

Резюме

  1. Если есть несколько случайных событий, то вероятность наступления хотя бы одного из них равна 100% минус перемноженные вероятности того, что эти события не наступят.
  2. Принцип работает для любых независимых событий.