Beiesa teorēma
Šo rakstu ir ierosināts pārvietot uz Beiza teorēma. Argumentus par tā nosaukuma veidošanu vari izteikt attiecīgajā diskusiju lapā. Papildu informācija var būt atrodama arī lapas hronoloģijā. |
Beiesa teorēma, arī Beiesa formula, ir viena no pamatteorēmām elementārās varbūtības teorijā, ar kuras palīdzību var noteikt kaut kāda notikuma varbūtību iespējamību, ar noteikumu, ja ir zināms, ka ir noticis cits notikums, kas ir statistiski savstarpēji atkarīgs no tā. Citiem vārdiem sakot, pēc Beijesa formulas var daudz precīzāk aprēķināt varbūtības, ņemot vērā gan iepriekš zināmu informāciju, gan arī jauniegūtos novērojuma datus. Formulu Beiesa var izteikt no galvenajām varbūtību teorijas pamata aksiomām, galvenokārt, no nosacītās varbūtības. Beiesa teorēmas specifiskā iezīme ir tāda, ka tā praktiskajā pielietojumā ir vajadzīgs liels skaits datu un aprēķinu, tāpēc Beiesa teorēmas aprēķinus aktīvi sāka izmantot tikai pēc revolūcijas datora un tīkla tehnoloģijās.
Parādoties Beijesa teorēmai, tās izmantotās varbūtības tika pakļautas vairākām iespējamām interpretācijām. Vienā no šīm interpretācijām tiek teikts, ka formulas atvasinājums ir tieši saistīts ar tās izmantošanu speciālās pieejas statistiskas analīzei. Ja izmantot Beiesa varbūtības teorijas interpretāciju, tad teorēma parāda, kā personīgais uzticības līmenis var ievērojami mainīties notikušo notikumu skaita dēļ. Tas arī ir Beiesa secinājumi, kas ir kļuvuši par fundamentu Beiesa statistikai. Tomēr teorēmu lieto ne tikai Beiesa analīzē, bet to arī aktīvi izmanto daudzos citos aprēķinos.
Psiholoģiskie eksperimenti parādīja, ka cilvēki bieži nepareizi novērtē notikuma varbūtību, viņi pamatojas uz gūto pieredzi, jo ignorē pašu iespējas varbūtību.[1] Tādēļ pareizais rezultāts, izmantojot Beijesa formulu, var ļoti atšķirties no intuitīvi gaidāmajā rezultāta.
Beiesa teorēma ir nosaukta par godu tā autoram Tomasam Beiesam (1702—1761), angļu matemātiķis un priesteris, kurš pirmo reizi ierosināja izmantot šo teorēmu, lai koriģētu uzskatus, pamatojoties pēc atjauninātajiem datiem. Viņa darbs «An Essay towards solving a Problem in the Doctrine of Chances» pirmo reizi tika publicēts 1763. gadā,[2] 2 gadus pēc autora nāves. Pirms tam, kā Bejesa darbu pieņēma un izlasīja Karaliskā sabiedrība, to ievērojami rediģēja un atjaunināja Ričards Praiss. Tomēr šīs idejas netika publiskotas līdz brīdim, kamēr tās atkal neatklāja un neizstrādāja Laplass, kas pirmo reizi publicēja mūsdienu teorēmas formulējumu savā 1812. gada grāmatā "Analītiskās varbūtības teorija".
Sers Harolds Džefrijs rakstīja, ka Beiesa teorēma "varbūtības teorijai ir tāda pati, kā Pitagora teorēma ģeometrijai".
Formulējums
labot šo sadaļuBeijesa formula
labot šo sadaļu,
kur
- apriorā hipotēzes A varbūtība
- hipotēzes A varbūtība, ja izpildās B
- varbūtība B notikuma notikšanai, ja ir patiesa hipotēze A
- pilnīgā varbūtība notikuma B izpildīšanai.
Pierādījums
labot šo sadaļuBeijesa formula izriet no nosacījuma varbūtības definīcijas. Vienota notikuma AB varbūtība ir izteikta divos veidos, izmantojot nosacījuma varbūtības.
Tādēļ
Aprēķini
labot šo sadaļuUzdevumos un statistikas lietojumos P(B) parasti aprēķina pēc pilnīgās notikumu varbūtības formulas, kas ir atkarīga no vairākām nesaderīgām hipotēzēm, kuru kopējā varbūtība ir 1.
,
kur ir zināmas varbūtības zem summas zīmes vai pieļauj to eksperimentāli novērtēt.
Tādā gadījumā, formulu Beijesa raksta:
"Fiziskā nozīme" un terminoloģija
labot šo sadaļuBeijesa formula ļauj "pārkārtot cēloņus un sekas": no zināmā notikuma fakta aprēķināt varbūtību, ka to izraisījis kāds cēlonis.
Šajā gadījumā notikumus, kas atspoguļo "cēloņu" darbību, sauc par hipotēzēm, jo tie ir iespējamie notikumi, kas to izraisīja. Par pilnīgāko varbūtības hipotēzes taisnīgumu sauc apriori (cik vispār ir iespējams šis notikums), bet nosacīto, ņemot vērā notikušo notikumu, sauc par a posteriori (cik liela varbūtība izrādījās, ņemot vērā notikuma datus).
Piemēri
labot šo sadaļu1.piemērs
labot šo sadaļuKā piemēram, notikums B būs — automašīnu nevar iedarbināt, un hipotēze A — tvertnē nav degvielas. Acīmredzams, varbūtība , ka mašīnu nevarēs iedarbināt, ja tvertnē nav degvielas, ir vienāda ar viens. Līdz ar to a posteriori varbūtība, ka tvertnē nav degvielas, ja automašīnu nevar iedarbināt, kas ir ir vienāda ar , kas nozīmē, ka apriori varbūtība, ka tvertnē nav degvielas, attiecība pret varbūtību, ka mašīnu nevar iedarbināt. Piemēram, ja iepriekšēja varbūtība, ka tvertnē nav degvielas, ir 1%, un varbūtība, ka automašīna nedarbosies, ir 2%, un nejauši izvēlēta automašīna neiedarbināsies, tad varbūtība, ka tvertnē nav degvielas, ir 50%.
2.piemērs
labot šo sadaļuBrāķa varbūtība pirmajam strādniekam ir , otrajam strādniekam — un trešajam strādniekam — . Pirmais izgatavoja detaļas , otrais — detaļas un trešais- detaļas. Rūpnīcas vadītājs paņem pēc nejaušības principa vienu detaļu un viņa izrādās ir brāķēta. Jautājums ir, cik ir liela varbūtība, ka šo detaļu ir izgatavojis trešais darbinieks?
Notikums — detaļas brāķis, notikums - detaļu izgatavoja strādnieks . Tad , kur , bet .
Pēc pilnīgās varbūtības formulas:
Pēc Beijesa formulas mēs iegūsim:
3.piemērs
labot šo sadaļuEntomologs domā, ka iespējams vabole var piederēt pie retām vaboļu sugām, jo tā ķermeņa korpusā ir īpaši raksti . Retās pasugās 98% vabolēm ir raksti vai P (Raksti | Rets) = 0,98 (P (Pattern | Rare) = 0,98). Starp parastajām vabolēm tikai 5%, kurām ir raksti. Retas kukaiņu sugas ir tikai 0,1% no visas populācijas. Kāda ir varbūtība, ka vabole ar rakstu pieder pie reta apakštipa vai P (Rets | Raksti) (P (Rare| Pattern))?
No paplašinātās Beijesa teorēmas iegūstam (jebkurš kukainis var piederēt vai nu pie reta vai parasta (Common) sugas) :
4.piemērs — Beijesa teorēmas paradokss
labot šo sadaļuPieņemsim, ka ir slimība ar izplatības biežumu starp iedzīvotājiem 0,001 un diagnostiskās pārbaudes metodi, kas ar 0,9 varbūtību identificē pacientu, bet tajā pašā laikā varbūtība ir 0,01 kļūdaini noteiktu slimību veselam cilvēkam. Atrodiet varbūtību, ka persona ir vesela, ja viņš tika atzīts par slimu pārbaudes laikā.
Apzīmēsim ar B — gadījums, kad persona slimo, „B” ir notikums, ka pārbaude parādīja, ka persona ir slima, un Z — notikums, kad persona ir vesela. Tad norādītie nosacījumi tiek pārrakstīti šādi:
- P(«B» | B) = 0,9;
- Р(«B» | Z)= 0,01;
- Р(B) = 0,001, значит P(Z) = 0,999.
Varbūtība, ka cilvēks ir vesels, ja tas bija atzīts slims vienāda ar nosacīto varbūtību:
- Р(Z | «B»).
Lai to atrastu, aprēķināsim vispirms pilnīgo varbūtību , kad cilvēks atzīts par slimu:
Р(«B») = 0,999 × 0,01 + 0,001 × 0,9 = 1,089 %.
Varbūtība, ka cilvēks tomēr ir vesels, ja ir rezultāts "slims".:
Р(Z | «B») = 0,999 × 0,01 / (0,999 × 0,01 + 0,001 × 0,9) ≈ 91,7 %.
Tādējādi 91,7% cilvēku, kuriem aptauja parādīja rezultātu „slims”, ir faktiski veseli cilvēki. Iemesls tam ir tāds, ka saskaņā ar uzdevuma viltus-pozitīvā rezultāta nosacījumiem kaut arī ir maza, bet beigās deva uz galvas tiesu vairāk slimu cilvēku pētāmajā cilvēku grupā.
Ja aptaujas kļūdainos rezultātus var uzskatīt par nejaušiem, tad vienas un tās pašas personas atkārtota pārbaude sniegs neatkarīgu rezultātu no pirmā. Šajā gadījumā, lai samazinātu viltus-pozitīvo rezultātu iespējamību, ir lietderīgi vēlreiz pārbaudīt cilvēkus, kuri ir saņēmuši rezultātu "slimi". Varbūtību, ka cilvēks ir vesels pēc rezultāta “slims” iegūšanas, var aprēķināt arī pēc Beijesa formulas: Р(Z| «B», «B») = 0,999 × 0,01 × 0,01 / (0,999 × 0,01 × 0,01 + 0,001 × 0,9 × 0,9) ≈ 10,98 %.
Varbūtību interpretācijas varianti Beijesa teorēmā
labot šo sadaļuMatemātiski Beijesa teorēma parāda attiecību starp notikuma A varbūtību un notikuma B, P (A) un P (B) varbūtību, notikuma A nosacīto varbūtību iestāšanās eksistējot notikumam B un notikuma B iestāšanās, ja notiek A, P (A | B) un P (B) | A).
Kopējā formā Beijesa formulā izskatās šādi:
Izteiksmes nozīme atkarīga no tā, kā interpretējas varbūtība dotajā formulā.
Beijesa interpretācijas
labot šo sadaļuBeijesa interpretācijā varbūtība mēra ticamības līmeni. Beijesa teorēma apvieno pieņēmumu ticamību līdz un pēc vērā ņemamiem pierādījumu. Piemēram, kāds pieņēma, ka, izmetot monētu, tā izkrīt divas reizes biežāk ar skaitli augšup. Sākotnēji ticamības pakāpe, ka šāds notikums notiks, monēta nokritīs ar ciparu uz augšu- 50%. Uzticības līmenis var palielinātie līdz 70%, ja pieņēmumu apstiprina pierādījumi.
Pieņēmumiem (hipotēzēm) A un pierādījumiem B
- P(A) — apriora hipotēzes varbūtība A, sākotnējais ticamības pieņēmums A;
- P(A | B) — a posterior hipotēzes varbūtība A, notiekot notikumam B;
- attiecība P(B | A)/P(B) parāda, kā notikums B palīdz mainīt pieņēmuma ticamības līmeni A.
Frekvenču interpretācija
labot šo sadaļuFrekvenču interpretācijā Beijesa teorēma fiksē notikušo notikumu skaitu (iespējas) un nosaka to varbūtību. Piemēram, pieņemsim, ka eksperiments tika veikts vairākas reizes. P (A) ir notikumu A reižu skaits, kas noticis (mērīts daļās). P (B) ir notikumu B reižu skaits, kas noticis (mērīts daļās). P (B | A) ir notikuma “B” rašanās biežums (daļās) nenotiekot notikumam A. P (A | B) ir notikuma A rašanās nenotiekot notikumam B.
Beijesa teorēmas nozīmi vislabāk var saprast no diagrammas labajā pusē. Abas diagrammas parāda notikumus A un B ar pozitīviem un negatīviem rezultātiem, lai parādītu visus varbūtību iznākumus. Beijesa teorēmu izmanto kā saikni starp šīm dažādajām daļām.
Forma
labot šo sadaļuNotikumi
labot šo sadaļuParasta forma
labot šo sadaļuNotikumiem A un B, ar nosacījumu, ka P(B) ≠ 0,
Daudzi Beijesa teorēmas papildinājumi norāda, ka notikums B ir zināms un nepieciešams saprast, kā zināšanas par notikumu B ietekmē pārliecību, ka notikums A notiks. Tādā gadījumā pēdējā gadījumā saucējs ir — notikuma B iespējamība — zināms; mēs vēlamies mainīt A. Beijesa teorēmu parāda, ka a posteriori varbūtības ir proporcionālas skaitītājam:
(proporcionalitāte "A dotajam B").
Ja notikumi A1, A2, … ir savstarpēji izslēdzoši un izsmeļoši, tas ir, tikai viens no notikumiem ir iespējams,vienā un tajā pašā laikā divi notikumi nevar notikt kopā, mēs varam noteikt proporcionalitātes koeficientu, orientējoties uz to, ka to kopējā varbūtības summa ir viens. Piemēram, konkrētam notikumam A — notikums A un tā pretējais notikums ¬A, ir savstarpēji izslēdzoši un izsmeļoši. Norādot proporcionalitātes koeficientu kā C, mums ir:
un
Apvienojot abas formulas, mēs iegūstam:
Paplašinātā forma
labot šo sadaļuBieži vien notikumu telpa (tādu kā {Aj}) noteikti terminos P(Aj) и P(B | Aj). Tieši šajā gadījumā ir labi noteikt P(B), pielietojot pilnīgo varbūtības teorēmu:
Jo īpaši:
Nepārtrauktie nejaušie mainīgie
labot šo sadaļuIzskatīsim elementāro notikumu telpu Ω, ko veido divi daudzumi X un Y. Principā Beijesa teorēma pielietojas notikumiem A = {X = x} un B = {Y = y}. Tomēr izteiksmes kļūst vienādas ar 0 vietās, kur mainīgajam ir ierobežots varbūtības blīvums. Lai turpinātu lietderīgi izmantot Beijesa teorēmu, to var formulēt piemērotu blīvuma izteiksmē.
Parastā forma
labot šo sadaļuJa X nepārtraukta un Y diskrēta, tad
Ja X diskrēts un Y nepārtraukta,
Ja gan X, gan Y nepārtraukti,
Paplašinātā forma
labot šo sadaļuNepārtraukta notikumu telpa bieži tiek definēta kā nosacījumu A skaitītājs. Nepārtraukta notikuma telpa bieži tiek attēlota kā skaitītājs. Tālāk ir lietderīgi atbrīvoties no saucēja, izmantojot vispārējo varbūtības formulu. Priekš“fY (y), tas kļūst par integrāli:
Beijesa likums
labot šo sadaļuBeijesa likums — pārveidota Beijesa teorēma:
,
kur
To sauc par Beijesa likumu vai pareizuma attiecību. Divu notikumu rašanās varbūtības atšķirība ir tikai šo divu notikumu varbūtību attiecība. Tādējādi,
,
Formulu atvasināšana
labot šo sadaļuNotikumiem
labot šo sadaļuBeijesa teorēma var būt iegūta no noteiktas varbūtības:
Nejaušiem mainīgajiem
labot šo sadaļuAttiecībā starp diviem nepārtrauktiem nejaušiem mainīgajiem lielumiem X un Y, Beijesa teorēmu var līdzīgi atvasināt no nosacītā sadalījuma definīcijas:
Literatūra
labot šo sadaļu- Гмурман В. Е. Теория вероятностей и математическая статистика, — М.: Высшее образование. 2005
- Judgment under Uncertainty: Heuristics and Biases / Daniel Kahneman, et al. — 21st. — Cambridge University Press, 2005. — 555 p. — ISBN 978-0-521-28414-1.
- Элиезер Юдковски. Наглядное объяснение теоремы Байеса Arhivēts 2019. gada 29. janvārī, Wayback Machine vietnē.
Papildu resursi
labot šo sadaļu- Sharon Bertsch McGrayne. The Theory That Would Not Die: How Bayes' Rule Cracked the Enigma Code, Hunted Down Russian Submarines & Emerged Triumphant from Two Centuries of Controversy. Yale University Press, 2011. ISBN 978-0-300-18822-6.
- Andrew Gelman, John B. Carlin, Hal S. Stern, and Donald B. Rubin (2003), «Bayesian Data Analysis», Second Edition, CRC Press.
- Charles M. Grinstead and J. Laurie Snell (1997), «Introduction to Probability (2nd edition)», American Mathematical Society (free pdf available [1] Arhivēts 2011. gada 27. jūlijā, Wayback Machine vietnē..
- Pierre-Simon Laplace. (1774/1986), «Memoir on the Probability of the Causes of Events», Statistical Science 1(3):364-378.
- Peter M. Lee (2012), «Bayesian Statistics: An Introduction», Wiley.
- Rosenthal, Jeffrey S. (2005): «Struck by Lightning: the Curious World of Probabilities». Harper Collings.
- Stephen M. Stigler (1986), «Laplace’s 1774 Memoir on Inverse Probability», Statistical Science 1(3):359-363.
- Stone, JV (2013). Chapter 1 of book «Bayes’ Rule: A Tutorial Introduction», University of Sheffield, England.
Saites
labot šo sadaļu- The Theory That Would Not Die by Sharon Bertsch McGrayne New York Times Book Review by John Allen Paulos on 5 August 2011
- Weisstein, Eric W. Bayes' Theorem (англ.) на сайте Wolfram MathWorld.
- Bayes' theorem (англ.) на сайте PlanetMath.
- A tutorial on probability and Bayes’ theorem devised for Oxford University psychology students
- An Intuitive Explanation of Bayes' Theorem by Eliezer S. Yudkowsky
Atsauces
labot šo sadaļu- ↑ Daniel Kahneman, et al. — 21st. — Cambridge University Press, 2005. — 555 p.
- ↑ «Arhivēta kopija». www.stat.ucla.edu. Arhivēts no oriģināla, laiks: 2011-04-10. Skatīts: 2019-01-03.
- ↑ ru:Теорема Байеса