Beiesa teorēma

varbūtības teorijas teorēma

Beiesa teorēma, arī Beiesa formula, ir viena no pamatteorēmām elementārās varbūtības teorijā, ar kuras palīdzību var noteikt kaut kāda notikuma varbūtību iespējamību, ar noteikumu, ja ir zināms, ka ir noticis cits notikums, kas ir statistiski savstarpēji atkarīgs no tā. Citiem vārdiem sakot, pēc Beijesa formulas var daudz precīzāk aprēķināt varbūtības, ņemot vērā gan iepriekš zināmu informāciju, gan arī jauniegūtos novērojuma datus. Formulu Beiesa var izteikt no galvenajām varbūtību teorijas pamata aksiomām, galvenokārt, no nosacītās varbūtības. Beiesa teorēmas specifiskā iezīme ir tāda, ka tā praktiskajā pielietojumā ir vajadzīgs liels skaits datu un aprēķinu, tāpēc Beiesa teorēmas aprēķinus aktīvi sāka izmantot tikai pēc revolūcijas datora un tīkla tehnoloģijās.

Parādoties Beijesa teorēmai, tās izmantotās varbūtības tika pakļautas vairākām iespējamām interpretācijām. Vienā no šīm interpretācijām tiek teikts, ka formulas atvasinājums ir tieši saistīts ar tās izmantošanu speciālās pieejas statistiskas analīzei. Ja izmantot Beiesa varbūtības teorijas interpretāciju, tad teorēma parāda, kā personīgais uzticības līmenis var ievērojami mainīties notikušo notikumu skaita dēļ. Tas arī ir Beiesa secinājumi, kas ir kļuvuši par fundamentu Beiesa statistikai. Tomēr teorēmu lieto ne tikai Beiesa analīzē, bet to arī aktīvi izmanto daudzos citos aprēķinos.

Psiholoģiskie eksperimenti parādīja, ka cilvēki bieži nepareizi novērtē notikuma varbūtību, viņi pamatojas uz gūto pieredzi, jo ignorē pašu iespējas varbūtību.[1] Tādēļ pareizais rezultāts, izmantojot Beijesa formulu, var ļoti atšķirties no intuitīvi gaidāmajā rezultāta.

Beiesa teorēma ir nosaukta par godu tā autoram Tomasam Beiesam (1702—1761), angļu matemātiķis un priesteris, kurš pirmo reizi ierosināja izmantot šo teorēmu, lai koriģētu uzskatus, pamatojoties pēc atjauninātajiem datiem. Viņa darbs «An Essay towards solving a Problem in the Doctrine of Chances» pirmo reizi tika publicēts 1763. gadā,[2] 2 gadus pēc autora nāves. Pirms tam, kā Bejesa darbu pieņēma un izlasīja Karaliskā sabiedrība, to ievērojami rediģēja un atjaunināja Ričards Praiss. Tomēr šīs idejas netika publiskotas līdz brīdim, kamēr tās atkal neatklāja un neizstrādāja Laplass, kas pirmo reizi publicēja mūsdienu teorēmas formulējumu savā 1812. gada grāmatā "Analītiskās varbūtības teorija".

Sers Harolds Džefrijs rakstīja, ka Beiesa teorēma "varbūtības teorijai ir tāda pati, kā Pitagora teorēma ģeometrijai".

Beijesa formula

labot šo sadaļu

 ,

kur

 - apriorā hipotēzes A varbūtība

 - hipotēzes A varbūtība, ja izpildās B

 - varbūtība B notikuma notikšanai, ja ir patiesa hipotēze A

 - pilnīgā varbūtība notikuma B izpildīšanai.

Pierādījums

labot šo sadaļu

Beijesa formula izriet no nosacījuma varbūtības definīcijas. Vienota notikuma AB varbūtība ir izteikta divos veidos, izmantojot nosacījuma varbūtības.

 

Tādēļ  

Aprēķini  

labot šo sadaļu

Uzdevumos un statistikas lietojumos P(B) parasti aprēķina pēc pilnīgās notikumu varbūtības formulas, kas ir atkarīga no vairākām nesaderīgām hipotēzēm, kuru kopējā varbūtība ir 1.

 ,

kur ir zināmas varbūtības zem summas zīmes vai pieļauj to eksperimentāli novērtēt.

Tādā gadījumā, formulu Beijesa raksta:

 

"Fiziskā nozīme" un terminoloģija

labot šo sadaļu

Beijesa formula ļauj "pārkārtot cēloņus un sekas": no zināmā notikuma fakta aprēķināt varbūtību, ka to izraisījis kāds cēlonis.

Šajā gadījumā notikumus, kas atspoguļo "cēloņu" darbību, sauc par hipotēzēm, jo tie ir iespējamie notikumi, kas to izraisīja. Par pilnīgāko varbūtības hipotēzes taisnīgumu sauc apriori (cik vispār ir iespējams šis notikums), bet nosacīto, ņemot vērā notikušo notikumu, sauc par a posteriori (cik liela varbūtība izrādījās, ņemot vērā notikuma datus).

Kā piemēram, notikums B būs — automašīnu nevar iedarbināt, un hipotēze A — tvertnē nav degvielas. Acīmredzams, varbūtība  , ka mašīnu nevarēs iedarbināt, ja tvertnē nav degvielas, ir vienāda ar viens. Līdz ar to a posteriori varbūtība, ka tvertnē nav degvielas, ja automašīnu nevar iedarbināt, kas ir   ir vienāda ar  , kas nozīmē, ka apriori varbūtība, ka tvertnē nav degvielas, attiecība pret varbūtību, ka mašīnu nevar iedarbināt. Piemēram, ja iepriekšēja varbūtība, ka tvertnē nav degvielas, ir 1%, un varbūtība, ka automašīna nedarbosies, ir 2%, un nejauši izvēlēta automašīna neiedarbināsies, tad varbūtība, ka tvertnē nav degvielas, ir 50%.

Brāķa varbūtība pirmajam strādniekam ir  , otrajam strādniekam —   un trešajam strādniekam —   . Pirmais izgatavoja  detaļas , otrais —  detaļas un trešais-   detaļas. Rūpnīcas vadītājs paņem pēc nejaušības principa vienu detaļu un viņa izrādās ir brāķēta. Jautājums ir, cik ir liela varbūtība, ka šo detaļu ir izgatavojis trešais darbinieks?

Notikums   — detaļas brāķis, notikums  - detaļu izgatavoja strādnieks  . Tad  , kur  , bet  .

Pēc pilnīgās varbūtības formulas:

 

Pēc Beijesa formulas mēs iegūsim:

  

 
Koka diagramma parāda biežuma piemēru. R, C, P un P ar domuzīmi ir notikumi, kas norāda, ka vabole ir reta, parasta, ar rakstu un bez raksta. Aprēķina procentus iekavās. Ņemiet vērā, ka tiek dotas trīs neatkarīgo notikumu vērtības, tāpēc ir iespējams aprēķināt apgriezto koku (skat. Iepriekšējo grafiku)

Entomologs domā, ka iespējams vabole var piederēt pie retām vaboļu sugām, jo tā ķermeņa korpusā ir īpaši raksti . Retās pasugās 98% vabolēm ir raksti vai P (Raksti | Rets) = 0,98 (P (Pattern | Rare) = 0,98). Starp parastajām vabolēm tikai 5%, kurām ir raksti. Retas kukaiņu sugas ir tikai 0,1% no visas populācijas. Kāda ir varbūtība, ka vabole ar rakstu pieder pie reta apakštipa vai P (Rets | Raksti) (P (Rare| Pattern))?

No paplašinātās Beijesa teorēmas iegūstam (jebkurš kukainis var piederēt vai nu pie reta vai parasta (Common) sugas) :  

4.piemērs — Beijesa teorēmas paradokss

labot šo sadaļu

Pieņemsim, ka ir slimība ar izplatības biežumu starp iedzīvotājiem 0,001 un diagnostiskās pārbaudes metodi, kas ar 0,9 varbūtību identificē pacientu, bet tajā pašā laikā varbūtība ir 0,01 kļūdaini noteiktu slimību veselam cilvēkam. Atrodiet varbūtību, ka persona ir vesela, ja viņš tika atzīts par slimu pārbaudes laikā.

Apzīmēsim ar B — gadījums, kad persona slimo, „B” ir notikums, ka pārbaude parādīja, ka persona ir slima, un Z — notikums, kad persona ir vesela. Tad norādītie nosacījumi tiek pārrakstīti šādi:

P(«B» | B) = 0,9;
Р(«B» | Z)= 0,01;
Р(B) = 0,001, значит P(Z) = 0,999.

Varbūtība, ka cilvēks ir vesels, ja tas bija atzīts slims vienāda ar nosacīto varbūtību:

Р(Z | «B»).

Lai to atrastu, aprēķināsim vispirms pilnīgo varbūtību , kad cilvēks atzīts par slimu:

Р(«B») = 0,999 × 0,01 + 0,001 × 0,9 = 1,089 %.

Varbūtība, ka cilvēks tomēr ir vesels, ja ir rezultāts "slims".:

Р(Z | «B») = 0,999 × 0,01 / (0,999 × 0,01 + 0,001 × 0,9) ≈ 91,7 %.

Tādējādi 91,7% cilvēku, kuriem aptauja parādīja rezultātu „slims”, ir faktiski veseli cilvēki. Iemesls tam ir tāds, ka saskaņā ar uzdevuma viltus-pozitīvā rezultāta nosacījumiem kaut arī ir maza, bet beigās deva uz galvas tiesu vairāk slimu cilvēku pētāmajā cilvēku grupā.

Ja aptaujas kļūdainos rezultātus var uzskatīt par nejaušiem, tad vienas un tās pašas personas atkārtota pārbaude sniegs neatkarīgu rezultātu no pirmā. Šajā gadījumā, lai samazinātu viltus-pozitīvo rezultātu iespējamību, ir lietderīgi vēlreiz pārbaudīt cilvēkus, kuri ir saņēmuši rezultātu "slimi". Varbūtību, ka cilvēks ir vesels pēc rezultāta “slims” iegūšanas, var aprēķināt arī pēc Beijesa formulas: Р(Z| «B», «B») = 0,999 × 0,01 × 0,01 / (0,999 × 0,01 × 0,01 + 0,001 × 0,9 × 0,9) ≈ 10,98 %.

Varbūtību interpretācijas varianti Beijesa teorēmā

labot šo sadaļu

Matemātiski Beijesa teorēma parāda attiecību starp notikuma A varbūtību un notikuma B, P (A) un P (B) varbūtību, notikuma A nosacīto varbūtību iestāšanās eksistējot notikumam B un notikuma B iestāšanās, ja notiek A, P (A | B) un P (B) | A).

Kopējā formā Beijesa formulā izskatās šādi:

 

Izteiksmes nozīme atkarīga no tā, kā interpretējas varbūtība dotajā formulā.

Beijesa interpretācijas

labot šo sadaļu

Beijesa interpretācijā varbūtība mēra ticamības līmeni. Beijesa teorēma apvieno pieņēmumu ticamību līdz un pēc vērā ņemamiem pierādījumu. Piemēram, kāds pieņēma, ka, izmetot monētu, tā izkrīt divas reizes biežāk ar skaitli augšup. Sākotnēji ticamības pakāpe, ka šāds notikums notiks, monēta nokritīs ar ciparu uz augšu- 50%. Uzticības līmenis var palielinātie līdz 70%, ja pieņēmumu apstiprina pierādījumi.

Pieņēmumiem (hipotēzēm) A un pierādījumiem B

  • P(A) — apriora hipotēzes varbūtība A, sākotnējais ticamības pieņēmums A;
  • P(A | B) — a posterior hipotēzes varbūtība A, notiekot notikumam B;
  • attiecība P(B | A)/P(B) parāda, kā notikums B palīdz mainīt pieņēmuma ticamības līmeni A.
 
Frekvenču interpretācijas ilustrācija

Frekvenču interpretācija

labot šo sadaļu

Frekvenču interpretācijā Beijesa teorēma fiksē notikušo notikumu skaitu (iespējas) un nosaka to varbūtību. Piemēram, pieņemsim, ka eksperiments tika veikts vairākas reizes. P (A) ir notikumu A reižu skaits, kas noticis (mērīts daļās). P (B) ir notikumu B reižu skaits, kas noticis (mērīts daļās). P (B | A) ir notikuma “B” rašanās biežums (daļās) nenotiekot notikumam A. P (A | B) ir notikuma A rašanās nenotiekot notikumam B.

Beijesa teorēmas nozīmi vislabāk var saprast no diagrammas labajā pusē. Abas diagrammas parāda notikumus A un B ar pozitīviem un negatīviem rezultātiem, lai parādītu visus varbūtību iznākumus. Beijesa teorēmu izmanto kā saikni starp šīm dažādajām daļām.

Parasta forma

labot šo sadaļu

Notikumiem A un B, ar nosacījumu, ka P(B) ≠ 0,

 

Daudzi Beijesa teorēmas papildinājumi norāda, ka notikums B ir zināms un nepieciešams saprast, kā zināšanas par notikumu B ietekmē pārliecību, ka notikums A notiks. Tādā gadījumā pēdējā gadījumā saucējs ir — notikuma B iespējamība — zināms; mēs vēlamies mainīt A. Beijesa teorēmu parāda, ka a posteriori varbūtības ir proporcionālas skaitītājam:

 (proporcionalitāte "A dotajam B").

Ja notikumi A1, A2, … ir savstarpēji izslēdzoši un izsmeļoši, tas ir, tikai viens no notikumiem ir iespējams,vienā un tajā pašā laikā divi notikumi nevar notikt kopā, mēs varam noteikt proporcionalitātes koeficientu, orientējoties uz to, ka to kopējā varbūtības summa ir viens. Piemēram, konkrētam notikumam A — notikums A un tā pretējais notikums ¬A, ir savstarpēji izslēdzoši un izsmeļoši. Norādot proporcionalitātes koeficientu kā C, mums ir:

  un  

Apvienojot abas formulas, mēs iegūstam:

 

Paplašinātā forma

labot šo sadaļu

Bieži vien notikumu telpa (tādu kā {Aj}) noteikti terminos P(Aj) и P(B | Aj). Tieši šajā gadījumā ir labi noteikt P(B), pielietojot pilnīgo varbūtības teorēmu:

 

 

Jo īpaši:

 

 
Diagramma atspoguļo Beijesa teorēmas nozīmi un ir piemērojama notikumu telpai, ko veido nepārtraukti nejaušie mainīgie X un Y. Ņemiet vērā, ka pēc Beijesa teorēmas ir prasības katram telpas punktam. Praksē šīs prasības var attēlot parametru formā, izmantojot sadalījuma blīvuma apzīmējumu kā x un y funkciju

Nepārtrauktie nejaušie mainīgie

labot šo sadaļu

Izskatīsim elementāro notikumu telpu Ω, ko veido divi daudzumi X un Y. Principā Beijesa teorēma pielietojas notikumiem A = {X = x} un B = {Y = y}. Tomēr izteiksmes kļūst vienādas ar 0 vietās, kur mainīgajam ir ierobežots varbūtības blīvums. Lai turpinātu lietderīgi izmantot Beijesa teorēmu, to var formulēt piemērotu blīvuma izteiksmē.

Parastā forma

labot šo sadaļu

Ja X nepārtraukta un Y diskrēta, tad

 

Ja X diskrēts un Y nepārtraukta,

 

Ja gan X, gan Y nepārtraukti,

 

 
Diagramma, kas parāda, ka telpas varbūtības, ko veido nepārtraukti nejauši mainīgie lielumi X un Y, bieži vien nosakās

Paplašinātā forma

labot šo sadaļu

Nepārtraukta notikumu telpa bieži tiek definēta kā nosacījumu A skaitītājs. Nepārtraukta notikuma telpa bieži tiek attēlota kā skaitītājs. Tālāk ir lietderīgi atbrīvoties no saucēja, izmantojot vispārējo varbūtības formulu. Priekš“fY (y), tas kļūst par integrāli:

 

Beijesa likums

labot šo sadaļu

Beijesa likums — pārveidota Beijesa teorēma:

 ,

kur

 

To sauc par Beijesa likumu vai pareizuma attiecību. Divu notikumu rašanās varbūtības atšķirība ir tikai šo divu notikumu varbūtību attiecība. Tādējādi,

 ,

 

Formulu atvasināšana

labot šo sadaļu

Beijesa teorēma var būt iegūta no noteiktas varbūtības:

 

 

 

 

Nejaušiem mainīgajiem

labot šo sadaļu

Attiecībā starp diviem nepārtrauktiem nejaušiem mainīgajiem lielumiem X un Y, Beijesa teorēmu var līdzīgi atvasināt no nosacītā sadalījuma definīcijas:

 

 

 [3]

Papildu resursi

labot šo sadaļu
  1. Daniel Kahneman, et al. — 21st. — Cambridge University Press, 2005. — 555 p.
  2. «Arhivēta kopija». www.stat.ucla.edu. Arhivēts no oriģināla, laiks: 2011-04-10. Skatīts: 2019-01-03.
  3. ru:Теорема Байеса