для чего нужна формула байеса
Простое объяснение теоремы Байеса
Подробно теорема Байеса излагается в отдельной статье. Это замечательная работа, но в ней 15 000 слов. В этом же переводе статьи от Kalid Azad кратко объясняется самая суть теоремы.
Разберемся в методе
В статье, на которую дана ссылка в начале этого эссе, разбирается метод диагностики (маммограмма), выявляющий рак груди. Рассмотрим этот метод подробно.
Как работать с этим данными?
Насколько метод точен?
Теперь разберем положительный результат теста. Какова вероятность того, что человек действительно болен: 80%, 90%, 1%?
вероятность события = исходы события / все возможные исходы
То есть положительный результат маммограммы значит только то, что вероятность наличия заболевания – 7,8%, а не 80% (последняя величина — это лишь предполагаемая точность метода). Такой результат кажется поначалу непонятным и странным, но нужно учесть: метод дает ложноположительный результат в 9,6% случаев (а это довольно много), поэтому в выборке будет много ложноположительных результатов. Для редкого заболевания большинство положительных результатов будут ложноположительными.
Давайте пробежимся глазами по таблице и попробуем интуитивно ухватить смысл теоремы. Если у нас есть 100 человек, только у одного из них есть заболевание (1%). У этого человека с 80% вероятностью метод даст положительный результат. Из оставшихся 99% у 10% будут положительные результаты, что дает нам, грубо говоря, 10 ложноположительных исходов из 100. Если мы рассмотрим все положительные результаты, то только 1 из 11 будет верным. Таким образом, если получен положительный результат, вероятность заболевания составляет 1/11.
Выше мы посчитали, что эта вероятность равна 7,8%, т.е. число на самом деле ближе к 1/13, однако здесь с помощью простого рассуждения нам удалось найти приблизительную оценку без калькулятора.
Теорема Байеса
Теперь опишем ход наших мыслей формулой, которая и называется теоремой Байеса. Эта теорема позволяет исправить результаты исследования в соответствии с искажением, которое вносят ложноположительные результаты:
Pr(X) – это константа нормализации. Она сослужила нам хорошую службу: без нее положительный исход испытаний дал бы нам 80% вероятность события.
Pr(X) – это вероятность любого положительного результата, будет ли это настоящий положительный результат при исследовании больных (1%) или ложноположительный при исследовании здоровых людей (99%).
В нашем примере Pr(X) – довольно большое число, потому что велика вероятность ложноположительных результатов.
Pr(X) создает результат 7,8%, который на первый взгляд кажется противоречащим здравому смыслу.
Смысл теоремы
Мы проводим испытания, чтоб выяснить истинное положение вещей. Если наши испытания совершенны и точны, тогда вероятности испытаний и вероятности событий совпадут. Все положительные результаты будут действительно положительными, а отрицательные — отрицательными. Но мы живем в реальном мире. И в нашем мире испытания дают неверные результаты. Теорема Байеса учитывает искаженные результаты, исправляет ошибки, воссоздает генеральную совокупность и находит вероятность истинного положительного результата.
Спам-фильтр
Теорема Байеса удачно применяется в спам-фильтрах.
Фильтр берет в расчет результаты испытаний (содержание в письме определенных слов) и предсказывает, содержит ли письмо спам. Всем понятно, что, например, слово «виагра» чаще встречается в спаме, чем в обычных письмах.
Фильтр спама на основе черного списка обладает недостатками — он часто выдает ложноположительные результаты.
Спам-фильтр на основе теоремы Байеса использует взвешенный и разумный подход: он работает с вероятностями. Когда мы анализируем слова в письме, мы можем рассчитать вероятность того, что письмо — это спам, а не принимать решения по типу «да/нет». Если вероятность того, что письмо содержит спам, равна 99%, то письмо и вправду является таковым.
Со временем фильтр тренируется на все большей выборке и обновляет вероятности. Так, продвинутые фильтры, созданные на основе теоремы Байеса, проверяют множество слов подряд и используют их в качестве данных.
Теорема Байеса: из-за чего весь сыр-бор?
Теорему Байеса называют мощным методом создания нового знания, но её можно использовать и для рекламы суеверий и псевдонауки
Теорема Байеса стала такой популярной, что её даже показали в телешоу «Теория Большого взрыва». Но, как и любой инструмент, её можно использовать во благо или во вред.
Не знаю точно, когда впервые я услышал про неё. Но по-настоящему я начал проявлять интерес к ней только в последние лет десять, после того, как несколько самых больших ботанов из моих студентов начали рекламировать её как волшебного проводника в жизни.
Разглагольствования студентов запутали меня, как и объяснения теоремы на Википедии и других сайтах – они были либо совсем тупые, либо слишком сложные. Я решил, что Байес – преходящая причуда, и в глубоких исследованиях смысла нет. Но теперь байесовская лихорадка стала слишком назойливой, чтобы её игнорировать.
Как пишет The New York Times, байесовская статистика «проникает везде, от физики до исследований рака, от экологии до психологии». Физики предложили байесовские трактовки квантовой механики и байесовские защиты теории струн и теории мультивселенных. Философы рассуждают о том, что всю науку в целом можно рассматривать, как байесовский процесс, и что Байес помогает отличить науку от псевдонауки лучше, чем метод фальсифицируемости, популяризованный Карлом Поппером.
Исследователи искусственного интеллекта, включая разработчиков робомобилей в Google, применяют ПО Байеса, чтобы помогать машинам распознавать закономерности и принимать решения. Байесовские программы, согласно Шэрон Бёрщ Макгрейн [Sharon Bertsch McGrayne], автору популярной истории теоремы Байеса, «сортируют емейл и спам, оценивают медицинские риски и государственную безопасность, расшифровывают ДНК, прочее». На сайте Edge.org физик Джон Мэтер беспокоится, что байесовые машины могут стать настолько умными, что вытеснят людей.
Когнитивисты предполагают, что в нашем мозге работают алгоритмы Байеса, когда он ощущает, размышляет и принимает решения. В ноябре учёные и философы изучали эту возможность на конференции в Нью-Йоркском университете под названием «Работает ли мозг по Байесу?»
Фанатики настаивают, что если бы больше людей приняло метод мышления Байеса (вместо бессознательной работы по Байесу, которая, якобы, идёт в мозге), мир был бы гораздо лучше. В статье «Интуитивное объяснение теоремы Байеса» теоретик ИИ Элизер Юдковский говорит об обожании Байеса:
«Почему математическая концепция вызывает такой странный энтузиазм среди её изучающих? Что есть т.н. „байесовская революция“, которая прокатывается по различным областям науки, заявляющая о поглощении даже экспериментальных методов как особых случаев? Что за секрет известен приверженцам Байеса? Какой свет они увидели? Скоро вы узнаете. Скоро вы будете одним из нас». Юдковский шутит. Или нет?
Из-за всей этой шумихи я попытался раз и навсегда разобраться с Байесом. Лучшие из объяснений теоремы среди бесчисленного их множества в интернете я нашёл у Юдковского, в Википедии и в работах философа Кёртиса Брауна и специалистов по информатике Оскара Бонилла и Калида Азада. Сейчас я попытаюсь, в основном и для себя тоже, объяснить, в чём суть теоремы.
Теорема Байеса, названная так в честь пресвитерианского священника XVIII века Томаса Байеса [правильная транскрипция – Бейз / прим. перев.] – это метод подсчёта обоснованности верований (гипотез, заявлений, предложений) на основе имеющихся доказательств (наблюдений, данных, информации). Наипростейшая версия звучит так:
изначальная вера + новые свидетельства = новая, улучшенная вера
Если подробнее: вероятность того, что убеждение истинно с учётом новых свидетельств равна вероятности того, что убеждение было истинно без этих свидетельств, помноженной на вероятность того, что свидетельства истинны в случае истинности убеждений, и делённой на вероятность того, что свидетельства истинны вне зависимости от истинности убеждений. Понятно?
Простая математическая формула выглядит так:
Где P – вероятность, B – убеждение, E – свидетельства. P(B) – вероятность того, что B – истинно, P(E) – вероятность того, что E истинно. P(B|E) – вероятность B в случае истинности E, а P(E|B) – вероятность E в случае истинности B.
Для демонстрации работы формулы часто используют пример с медицинскими анализами. Допустим, вас проверяют на наличие рака, который появляется у 1% людей вашего возраста. Если тест на 100% надёжен, то вам не нужна теорема Байеса, чтобы понять, что означает положительный результат – но давайте просто посмотрим на такую ситуацию для примера.
Чтобы подсчитать значение P(B|E), нужно разместить данные в правой части уравнения. P(B), вероятность того, что у вас рак до тестирования, равна 1%, или 0,01. Такова же и P(E), вероятность того, что результат теста будет положительным. Так как они стоят в числителе и знаменателе, они сокращаются, и остаётся P(B|E) = P(E|B) = 1. Если результат анализов будет положительный, у вас рак, и наоборот.
В реальном мире надёжность анализов редко достигает 100%. Допустим, ваш тест надёжен на 99%. То есть, 99 из 100 человек, больных раком, получат положительный результат, и 99 здоровых людей из 100 получат отрицательный результат. И это всё равно будет удивительно надёжный тест. Вопрос: если ваш тест положительный, какова вероятность того, что у вас рак?
Вот теперь теорема Байеса показывает всю мощь. Большинство людей посчитают, что ответ — 99%, или где-то так. Ведь тест настолько надёжен, верно? Но правильный ответ будет – всего лишь 50%.
Чтобы узнать, почему, вставьте данные в правую часть уравнения. P(B) всё ещё равна 0,01. P(E|B), вероятность получить положительный тест в случае рака, равна 0,99. P(B) * P(E|B) = 0,01 * 0,99 = 0,0099. Такова вероятность того, что вы получите положительный тест, показывающий, что вы больны.
Что насчёт знаменателя, P(E)? Тут есть небольшая хитрость. P(E) – вероятность получить положительный тест вне зависимости от того, больны ли вы. Иначе говоря, в неё входят ложные положительные срабатывания и истинные положительные срабатывания.
Чтобы подсчитать вероятность ложного положительного срабатывания, нужно умножить количество ложных срабатываний, 1% или 0,01, на процент людей, не больных раком – 0,99. Получается 0,0099. Да, ваш отличный тест с 99%-й точностью выдаёт столько же ложных срабатываний, сколько и истинных.
Закончим подсчёты. Чтобы получить P(E), сложим истинные и ложные срабатывания, получим 0,0198, поделим на это 0,0099, и получим 0,5. Итак, P(B|E), вероятность того, что у вас есть рак в случае положительного теста, равна 50%.
Если вы ещё раз пройдёте тест, то можете кардинально уменьшить неопределённость, поскольку вероятность наличия у вас рака P(B) будет уже 50% вместо 1. Если второй тест тоже будет положительным, по теореме Байеса вероятность наличия у вас рака будет равна 99%, или 0,99. Как показывает этот пример, повторение теоремы может дать очень точный ответ.
Но если надёжность теста 90%, что совсем неплохо, шансы на наличие у вас рака даже в случае дважды полученных положительных результатов всё ещё меньше 50%.
Большинство людей, включая врачей, с трудом понимают это распределение шансов, что объясняет излишнее количество диагнозов и лечений рака и других болезней. Этот пример говорит о том, что байесианцы правы: мир был бы лучше, если бы больше людей – хотя бы больше пациентов и врачей – приняли бы байесовскую логику.
С другой стороны, теорема Байеса – это лишь сведение в кодекс здравого смысла. Как пишет Юдковский к концу своего обучающего материала: «К этому моменту теорема Байеса может казаться совершенно очевидной и напоминать тавтологию, вместо того чтобы быть удивительной и новой. В таком случае это введение достигло своей цели».
Возвращаясь к примеру с раком: теорема Байеса говорит, что вероятность наличия у вас рака в случае положительных результатов теста равна вероятности получения истинного положительного результата, делённой на вероятность всех положительных результатов, истинных и ложных. В общем, остерегайтесь ложных положительных результатов.
Вот моё обобщение этого принципа: достоверность вашего убеждения зависит от того, насколько сильно ваше убеждение объясняет существующие факты. Чем больше вариантов объяснения фактов, тем менее достоверно ваше личное убеждение. С моей точки зрения, в этом состоит суть теоремы.
«Альтернативные объяснения» могут включать в себя много всего. Ваши факты могут быть ложными, полученными при помощи неправильно сработавшего инструмента, неверного анализа, склонности к получению нужного результата и даже подделанными. Ваши факты могут быть точными, но их могут объяснять множество других убеждений или гипотез.
Иначе говоря, в теореме Байеса нет никакого волшебства. Всё сводится к тому, что ваши убеждения достоверны настолько, насколько верны свидетельства в их пользу. Если у вас есть хорошие доказательства, теорема выдаёт годные результаты. Если доказательства так себе, теорема вам не поможет. Мусор на входе, мусор на выходе.
Проблемы с теоремой могут начинаться с величины P(B), изначального предположения по поводу вероятности ваших убеждений, часто называемой априорной вероятностью. В примере выше у нас была красивая и точная априорная вероятность 0,01. В реальном мире эксперты спорят по поводу того, как диагностировать и учитывать рак. Ваша априорная вероятность, скорее всего, будет состоять из диапазона, а не из одного числа.
Во многих случаях оценка априорной вероятности основывается лишь на догадках, и позволяет субъективным факторам вкрадываться в подсчёты. Можно догадываться, что вероятность существования чего-либо – в отличие от того же рака – просто нулевая, к примеру, струн, мультивселенной, инфляции или бога. Вы можете ссылаться на сомнительные подтверждения сомнительной веры. В таких случаях теорема Байеса может рекламировать псевдонауку и суеверия, наряду со здравым смыслом.
В теореме содержится назидание: если вы недостаточно скрупулёзно ищете альтернативные объяснения имеющихся свидетельств, то свидетельство лишь подтвердит то, во что вы уже верите. Учёные часто упускают это из вида, что объясняет, почему такое большое количество научных заявлений оказываются неверны. Байесианцы утверждают, что их методы могут помочь учёным преодолеть склонность к поискам подтверждающих их веру фактов и выдавать больше надёжных результатов – но я в этом сомневаюсь.
Как я уже упоминал, некоторые энтузиасты теории струн и мультивселенных используют байесовский анализ. Почему? Потому что энтузиасты устали слышать о том, что теория струн и теория мультивселенной нефальсифицируемы, а следовательно, ненаучны. Теорема Байеса позволяет им представить эти теории в лучшем свете. В этих случаях теорема не уничтожает предвзятость, а потакает ей.
Как писал журналист, работающий с научно-популярными темами, Фэй Флэм в The New York Times, байесовская статистика «не может спасти нас от плохой науки». Теорема Байеса универсальна и может служить любой цели. Выдающийся специалист по байесовской статистике Дональд Рубин работал консультантом табачных компаний на судебных процессах, связанных с полученными от курения заболеваниями.
И всё же я восхищаюсь теоремой Байеса. Она напоминает мне теорию эволюции, ещё одну идею, кажущуюся до тавтологии простой или удручающе глубокой, в зависимости от точки зрения, и точно так же вдохновившую людей как на всякий вздор, так и на удивительные открытия.
Возможно, оттого, что мой мозг работает по Байесу, мне повсюду начинают видеться аллюзии на эту теорему. Пролистывая собрание сочинений Эдгара Аллана По на своём Kindle, я наткнулся на следующее предложение из «Повести о приключениях Артура Гордона Пима»: «В силу наших пристрастий или предубеждений мы не способны извлекать урок даже из самых очевидных вещей» [пер. Георгий Павлович Злобин].
Учитывайте это перед тем, как записываться в приверженцы Байеса.
Формула полной вероятности и формулы Байеса
На данном уроке мы рассмотрим важное следствие теорем сложения и умножения вероятностей и научимся решать типовые задачи по теме. Читателям, которые ознакомились со статьёй о зависимых событиях, будет проще, поскольку в ней мы уже по факту начали использовать формулу полной вероятности. Если Вы зашли с поисковика и/или неважно разбираетесь в теории вероятностей (ссылка на 1-й урок курса), то сначала рекомендую посетить указанные страницы.
Собственно, продолжаем. Рассмотрим зависимое событие 




Эта формула получила название формулы полной вероятности. В учебниках она формулируется теоремой, доказательство которой элементарно: согласно алгебре событий, 










Наверное, многие предчувствуют содержание первого примера =)
Куда ни плюнь – везде урна:
Имеются три одинаковые урны. В первой урне находятся 4 белых и 7 черных шаров, во второй – только белые и в третьей – только черные шары. Наудачу выбирается одна урна и из неё наугад извлекается шар. Какова вероятность того, что этот шар чёрный?
Решение: рассмотрим событие 



Так как урна выбирается наугад, то выбор любой из трёх урн равновозможен, следовательно:
Обратите внимание, что перечисленные гипотезы образуют полную группу событий, то есть, по условию чёрный шар может появиться только из этих урн, а например, не прилететь с бильярдного стола. Проведём простую промежуточную проверку: 
В первой урне 4 белых + 7 черных = 11 шаров, по классическому определению:

Во второй урне только белые шары, поэтому в случае её выбора появление чёрного шара становится невозможным: 
И, наконец, в третьей урне одни чёрные шары, а значит, соответствующая условная вероятность извлечения чёрного шара составит 
По формуле полной вероятности: 

Ответ:
Разобранный пример снова наводит на мысль о том, как важно ВНИКАТЬ В УСЛОВИЕ. Возьмём те же задачи с урнами и шарами – при их внешней схожести способы решения могут быть совершенно разными: где-то требуется применить только классическое определение вероятности, где-то события независимы, где-то зависимы, а где-то речь о гипотезах. При этом не существует чёткого формального критерия для выбора пути решения – над ним почти всегда нужно думать. Как повысить свою квалификацию? Решаем, решаем и ещё раз решаем!
В тире имеются 5 различных по точности боя винтовок. Вероятности попадания в мишень для данного стрелка соответственно равны 0,5; 0,55; 0,7; 0,75 и 0,4. Чему равна вероятность попадания в мишень, если стрелок делает один выстрел из случайно выбранной винтовки?
Краткое решение и ответ в конце урока.
В большинстве тематических задач гипотезы, конечно же, не равновероятны:
В пирамиде 5 винтовок, три из которых снабжены оптическим прицелом. Вероятность того, что стрелок поразит мишень при выстреле из винтовки с оптическим прицелом, равна 0,95; для винтовки без оптического прицела эта вероятность равна 0,7. Найти вероятность того, что мишень будет поражена, если стрелок производит один выстрел из наудачу взятой винтовки.
Решение: в этой задаче количество винтовок точно такое же, как и в предыдущей, но вот гипотезы всего две:


По классическому определению вероятности: 
Контроль:
Рассмотрим событие: 
По условию: 
По формуле полной вероятности:
Ответ: 0,85
На практике вполне допустим укороченный способ оформления задачи, который вам тоже хорошо знаком:
Решение: по классическому определению: 
По условию, 
По формуле полной вероятности:

Ответ: 0,85
Следующая задача для самостоятельного решения:
Двигатель работает в трёх режимах: нормальном, форсированном и на холостом ходу. В режиме холостого хода вероятность его выхода из строя равна 0,05, при нормальном режиме работы – 0,1, а при форсированном – 0,7. 70% времени двигатель работает в нормальном режиме, а 20% – в форсированном. Какова вероятность выхода из строя двигателя во время работы?
На всякий случай напомню – чтобы получить значения вероятностей проценты нужно разделить на 100. Будьте очень внимательны! По моим наблюдениям, условия задач на формулу полной вероятности частенько пытаются подзапутать; и я специально подобрал такой пример. Скажу по секрету – сам чуть не запутался =)
Решение в конце урока (оформлено коротким способом)
Задачи на формулы Байеса
Материал тесно связан с содержанием предыдущего параграфа. Пусть событие 

При условии, что событие 






…


На первый взгляд кажется полной нелепицей – зачем пересчитывать вероятности гипотез, если они и так известны? Но на самом деле разница есть:



Рассмотрим это различие на конкретном примере:
На склад поступило 2 партии изделий: первая – 4000 штук, вторая – 6000 штук. Средний процент нестандартных изделий в первой партии составляет 20%, а во второй – 10%. Наудачу взятое со склада изделие оказалось стандартным. Найти вероятность того, что оно: а) из первой партии, б) из второй партии.
Первая часть решения состоит в использовании формулы полной вероятности. Иными словами, вычисления проводятся в предположении, что испытание ещё не произведено и событие «изделие оказалось стандартным» пока не наступило.
Рассмотрим две гипотезы:


Всего: 4000 + 6000 = 10000 изделий на складе. По классическому определению: 
Контроль:
Рассмотрим зависимое событие: 
В первой партии 100% – 20% = 80% стандартных изделий, поэтому: 
Аналогично, во второй партии 100% – 10% = 90% стандартных изделий и 
По формуле полной вероятности:

Часть вторая. Пусть наудачу взятое со склада изделие оказалось стандартным. Эта фраза прямо прописана в условии, и она констатирует тот факт, что событие 
По формулам Байеса:
а) 
б) 
После переоценки гипотезы 

Ответ:
Понять смысл переоценки гипотез нам поможет Иван Васильевич, которой снова сменил профессию и стал директором завода. Он знает, что сегодня 1-й цех отгрузил на склад 4000, а 2-й цех – 6000 изделий, и приходит удостовериться в этом. Предположим, вся продукция однотипна и находится в одном контейнере. Естественно, Иван Васильевич предварительно подсчитал, что изделие, которое он сейчас извлечёт для проверки, с вероятностью 



Вы скажете, чистый субъективизм? Отчасти – да, более того, сам Байес интерпретировал апостериорные вероятности как уровень доверия. Однако не всё так просто – в байесовском подходе есть и объективное зерно. Ведь вероятности того, что изделие будет стандартным (0,8 и 0,9 для 1-го и 2-го цехов соответственно) это предварительные (априорные) и средние оценки. Но, выражаясь философски – всё течёт, всё меняется, и вероятности в том числе. Вполне возможно, что на момент исследования более успешный 2-й цех повысил процент выпуска стандартных изделий (и/или 1-й цех снизил), и если проверить бОльшее количество либо все 10 тысяч изделий на складе, то переоцененные значения 
Кстати, если Иван Васильевич извлечёт нестандартную деталь, то наоборот – он будет больше «подозревать» 1-й цех и меньше – второй. Предлагаю убедиться в этом самостоятельно:
На склад поступило 2 партии изделий: первая – 4000 штук, вторая – 6000 штук. Средний процент нестандартных изделий в первой партии 20%, во второй – 10%. Наудачу взятое со склада изделие оказалось нестандартным. Найти вероятность того, что оно: а) из первой партии, б) из второй партии.
Условие отличатся двумя буквами, которые я выделил жирным шрифтом. Задачу можно решить с «чистого листа», или воспользоваться результатами предыдущих вычислений. В образце я провёл полное решение, но чтобы не возникло формальной накладки с Задачей №5, событие «наудачу взятое со склада изделие будет нестандартным» обозначено через 
Байесовская схема переоценки вероятностей встречается повсеместно, причём её активно эксплуатируют и различного рода мошенники. Рассмотрим ставшее нарицательным АО на три буквы, которое привлекает вклады населения, якобы куда-то их инвестирует, исправно выплачивает дивиденды и т.д. Что происходит? Проходит день за днём, месяц за месяцем и всё новые и новые факты, донесённые путём рекламы и «сарафанным радио», только повышают уровень доверия к финансовой пирамиде (апостериорная байесовская переоценка в связи с произошедшими событиями!). То есть, в глазах вкладчиков происходит постоянное увеличение вероятности того, что «это серьёзная контора»; при этом вероятность противоположной гипотезы («это очередные кидалы»), само собой, уменьшается и уменьшается. Дальнейшее, думаю, понятно. Примечательно, что заработанная репутация даёт организаторам время успешно скрыться от Ивана Васильевича, который остался не только без партии болтов, но и без штанов.
К не менее любопытным примерам мы вернёмся чуть позже, а пока на очереди, пожалуй, самый распространенный случай с тремя гипотезами:
Электролампы изготавливаются на трех заводах. 1-й завод производит 30% общего количества ламп, 2-й – 55%, а 3-й – остальную часть. Продукция 1-го завода содержит 1% бракованных ламп, 2-го – 1,5%, 3-го – 2%. В магазин поступает продукция всех трех заводов. Купленная лампа оказалась с браком. Какова вероятность того, что она произведена 2-м заводом?
Заметьте, что в задачах на формулы Байеса в условии обязательно фигурирует некое произошедшее событие, в данном случае – покупка лампы.
Событий прибавилось, и решение удобнее оформить в «быстром» стиле.
Алгоритм точно такой же: на первом шаге находим вероятность того, что купленная лампа вообще окажется бракованной.
Пользуясь исходными данными, переводим проценты в вероятности:

Контроль:
Аналогично: 
По формуле полной вероятности: 

Шаг второй. Пусть купленная лампа оказалась бракованной (событие произошло)
По формуле Байеса:

Ответ:
Почему изначальная вероятность 2-й гипотезы 

Интересно заметить, что вероятности 1-й и 3-й гипотез, переоценились в ожидаемых направлениях и сравнялись:
Контроль: 
К слову, о заниженных и завышенных оценках:
В студенческой группе 3 человека имеют высокий уровень подготовки, 19 человек – средний и 3 – низкий. Вероятности успешной сдачи экзамена для данных студентов соответственно равны: 0,95; 0,7 и 0,4. Известно, что некоторый студент сдал экзамен. Какова вероятность того, что:
а) он был подготовлен очень хорошо;
б) был подготовлен средне;
в) был подготовлен плохо.
Проведите вычисления и проанализируйте результаты переоценки гипотез.
Задача приближена к реальности и особенно правдоподобна для группы студентов-заочников, где преподаватель практически не знает способностей того или иного студента. При этом результат может послужить причиной довольно-таки неожиданных последствий (особенно это касается экзаменов в 1-м семестре). Если плохо подготовленному студенту посчастливилось с билетом, то преподаватель с большой вероятностью сочтёт его хорошо успевающим или даже сильным студентом, что принесёт неплохие дивиденды в будущем (естественно, нужно «поднимать планку» и поддерживать свой имидж). Если же студент 7 дней и 7 ночей учил, зубрил, повторял, но ему просто не повезло, то дальнейшие события могут развиваться в самом скверном ключе – с многочисленными пересдачами и балансировкой на грани вылета.
Что и говорить, репутация – это важнейший капитал, не случайно многие корпорации носят имена-фамилии своих отцов-основателей, которые руководили делом 100-200 лет назад и прославились своей безупречной репутацией.
Да, байесовский подход в известной степени субъективен, но… так устроена жизнь!
Закрепим материал заключительным индустриальным примером, в котором я расскажу о до сих пор не встречавшихся технических тонкостях решения:
Три цеха завода производят однотипные детали, которые поступают на сборку в общий контейнер. Известно, что первый цех производит в 2 раза больше деталей, чем второй цех, и в 4 раза больше третьего цеха. В первом цехе брак составляет 12%, во втором – 8%, в третьем – 4%. Для контроля из контейнера берется одна деталь. Какова вероятность того, что она окажется бракованной? Какова вероятность того, что извлечённую бракованную деталь выпустил 3-й цех?
Таки Иван Васильевич снова на коне =) Должен же быть у фильма счастливый конец =)
Решение: в отличие от Задач №№5-8 здесь в явном виде задан вопрос, который разрешается с помощью формулы полной вероятности. Но с другой стороны, условие немного «зашифровано», и разгадать этот ребус нам поможет школьный навык составлять простейшие уравнения. За «икс» удобно принять наименьшее значение:
Пусть 
По условию, первый цех производит в 4 раза больше третьего цеха, поэтому доля 1-го цеха составляет 
Кроме того, первый цех производит изделий в 2 раза больше, чем второй цех, а значит, доля последнего: 
Составим и решим уравнение: 
Таким образом: 
Контроль: 
За «икс» изначально можно было принять долю 1-го либо долю 2-го цеха – вероятности выйдут такими же. Но, так или иначе, самый трудный участок пройден, и решение входит в накатанную колею:
Из условия находим:

По формуле полной вероятности: 

Вопрос второй: какова вероятность 

В данном случае пришлось упрощать четырёхэтажную дробь, что в задачах на формулы Байеса приходится делать довольно часто. Но для данного урока я как-то так случайно подобрал примеры, в которых многие вычисления можно провести без обыкновенных дробей.
Коль скоро в условии нет пунктов «а» и «бэ», то ответ лучше снабдить текстовыми комментариями:
Ответ: 

Как видите, задачи на формулу полной вероятности и формулы Байеса достаточно простЫ, и, наверное, по этой причине в них так часто пытаются затруднить условие, о чём я уже упоминал в начале статьи.
Дополнительные примеры есть в файле с готовыми решениями на Ф.П.В. и формулы Байеса, кроме того, наверное, найдутся желающие более глубоко ознакомиться с данной темой в других источниках. А тема действительно очень интересная – чего только стОит один парадокс Байеса, который обосновывает тот житейский совет, что если у человека диагностирована редкая болезнь, то ему имеет смысл провести повторное и даже два повторных независимых обследования. Казалось бы, это делают исключительно от отчаяния… – а вот и нет! Но не будем о грустном.
Задача 2: Решение: рассмотрим гипотезы 

Рассмотрим событие 
По условию: 
По формуле полной вероятности: 
Ответ: 0,58
Задача 4: Решение: из условия находим 
По условию 
По формуле полной вероятности: 

Ответ: 0,215
Задача 6: Решение: рассмотрим две гипотезы:


Всего: 4000 + 6000 = 10000 изделий на складе. По классическому определению: 
Рассмотрим событие: 
Из условия находим: 
По формуле полной вероятности: 
Примечание: данную вероятность легко найти, пользуясь результатом Задачи 5: 
Пусть событие 
По формулам Байеса:
а) 
б) 
Ответ:
Задача 8: Решение: всего: 3 + 19 + 3 = 25 студентов в группе. По классическому определению:

Контроль: 
По условию: 
По формуле полной вероятности: 

Пусть студент сдал экзамен. По формулам Байеса:
а) 

б) 

в) 

Проверка: 
Ответ:
Автор: Емелин Александр
(Переход на главную страницу)

cкидкa 15% на первый зaкaз, прoмoкoд: 5530-hihi5














