Вероятность хотя бы одного события из нескольких возможных
Бывает, что нам нужно принять решение, для чего надо оценить вероятность наступления
Например мы собираемся в поход на выходные. Вероятность дождя в субботу 30%, а в воскресенье — 65%. Нужно ли брать резиновые сапоги? Если возьмем, а дождя не будет, будем зря таскать их с собой. Если оставим дома, а дождь пойдет, мы промочим ноги.
Или другой пример.
Мы планируем путешествие в Аргентину. Чтобы сэкономить, хотим купить билет с пятью пересадками, но беспокоимся, что если хотя бы один рейс опоздает, порушится вся цепочка. Готовы ли мы рисковать?
С точки зрения теории вероятностей все эти задачи очень похожи: есть цепочка
Хорошая новость в том, что раз задачи похожи, то и решаются они одинаково. Давайте, покажу, как.
Будет ли дождь?
Решим первую задачу. Начнем с того, что выпишем все возможные варианты погоды на выходных:
- Дождя нет ни в один из дней.
- Дождь идет только в субботу.
- Дождь идет только в воскресенье.
- Дожди идут оба дня.
P(1) + P(2) + P(3) + P(4) = 100%
Кстати, обратите внимание, что из всех вариантов, только (1) не подходит под условие «на выходных идет дождь». Если мы перенесем вероятность P(1) в левую часть уравнения, в правой части получим прям почти решение:
P(2) + P(3) + P(4) — это и есть то, что нам надо посчитать. Но, блин, там целых три случайных события.
Правая часть уравнения выглядит намного проще: 100% — P(1). Там только одно событие. И ведь эти части равны, значит если мы посчитаем правую, автоматически узнает и левую и решим задачу.
☝️ Хитрость в том, что решить задачу проще, если ее «перевернуть»: думать не о том, пойдет ли дождь в
Проговорим решение словами: вероятность того, что хотя бы в один из дней пойдет дождь = 100% − вероятность того, что ни в один из дней дождя не будет.
Это все круто, но чему равна вероятность того, что дождя не будет ни в один из дней?
Чтобы не углубляться в метеорологию, будем считать, что погода каждый день не зависит от погоды предыдущих дней. А если так, то, чтобы посчитать вероятность отсутствия дождя на выходных, достаточно перемножить вероятности того, что дождя не будет в каждый из дней:
Вероятности дождя в каждый из дней мы знаем. Значит можем посчитать вероятности того, что дождя не будет:
День | Дождь | Не дождь |
Суббота | 30% | |
Воскресенье | 65% |
Теперь перемножим:
P(дождя не будет) =
Сведем все воедино:
P(дождь будет хотя бы в один из выходных) =
В общем виде решение задачи можно представить в виде формулы:
Вероятность P(А или B или C) =
Кайф этой формулы в том, что она подходит для любой комбинации независимых событий.
☝️ Случайные события называются независимыми, если вероятность наступления одного не меняется в случае наступления другого.
Независимые события
- Самолет Аэрофлота из Москвы в Сочи задержался на 20 минут. Самолет Quatar Airlines, из Каира в Дубай задержался на час. Рейсы вылетали из разных мест, поэтому задержки вряд ли
как-то связаны между собой. - Наше мобильное приложение скачал один, а потом и еще один пользователь. Может быть, конечно, оба пользователя увидели одну и ту же рекламу, но решения об установке, наверное, они принимали независимо друг от друга.
- Гость казино несколько раз играет в рулетку. Каждый розыгрыш начинается с нуля и не зависит от предыдущих.
Зависимые события
- Мы попали в пробку по пути в аэропорт, а потом мы опоздали на рейс. Если бы мы выехали заранее, или выбрали другой маршрут, могли бы успеть. То есть вероятность опоздать на рейс меняется в зависимости от наших предыдущих решений.
- Пользователь скачал приложение и оформил платную подписку. Очевидно, что не было бы установки, не было бы и подписки.
- Гость казино несколько раз играет в блекджек. В каждом розыгрыше из колоды достают несколько кард, поэтому шансы на победу каждый раз
чуть-чуть меняются.
Для оценки вероятности нескольких зависимых событий используются чуть другие формулы, о них я расскажу отдельно.
Закрепим навык и решим задачу про путешествие в Аргентину.
Долетим ли мы до Аргентины?
Допустим, мы планируем отпуск. Заходим на Авиасейлз находим там вот такой маршрут.
- Москва → Сочи (Аэрофлот). Пересадка 1:35 ⚠️
- Сочи → Каир (Аэрофлот). Пересадка 12:45
- Каир → Доха (Quatar). Пересадка 8:20
- Доха → Сан Паулу (Quatar). Пересадка 1:45 ⚠️
- Сан Паулу → Буэнос Айрес (Air Canada)
Меня смущают две стыковки: в Сочи и в Сан Паулу. На пересадку будет мало времени, если хотя бы один рейс в цепочке задержится, может поломаться весь маршрут.
Перед покупкой я хочу посчитать вероятность того, что хотя бы один рейс в цепочке задержится.
Я нашел в сети статистику задержек авиакомпаний. Аэрофлот задерживает в 28.2% рейсов. Quatar Airlines — 8%. В моем маршруте два рейса Аэрофлотом, затем еще два — Quatar. Посчитаем вероятность того, что каждый рейс прилетит вовремя.
Рейс | Вероятность |
Москва → Сочи (Aэрофлот) | 100% − 28.2% = 71.8% |
Сочи → Каир (Aэрофлот) | 100% − 28.2% = 71.8% |
Каир → Доха (Quatar) | 100% − 8% = 92% |
Доха → Сан Паулу (Quatar) | 100% − 8% = 92% |
Сначала посчитаем вероятность того, что все рейсы прибудут вовремя:
P(все рейсы приедутут вовремя) = 0.718 × 0.718 × 0.92 × 0.92 ≈ 0.436
Теперь посчитаем, вероятность, что хотя бы один рейс задержится:
P(хотя бы один рейс задержится) =
Вероятность хотя бы одной задержки равна 56%, то есть, скорее всего,
Резюме
- Если есть несколько случайных событий, то вероятность наступления хотя бы одного из них равна 100% минус перемноженные вероятности того, что эти события не наступят.
- Принцип работает для любых независимых событий.