Razmišlja(j)mo bajesovski!

Podeli :
  •  
  •  
  •  
  •  

bayesBajesovu teoremu nesvesno primenjujemo svakodnevno: kad prepoznamo saobraćajni znak samo na osnovu oblika, kada samo na osnovu ritma reči razumemo šta osoba traži od nas, kada na osnovu zadataka sa časa pretpostavimo šta treba da se primeni u rešavanju zadatka… Takođe, krije se iza raznih paradoksa, kao što su npr Monty Hall ili Lindlijev (Lindley) paradoks.
Tog jutra mi je zazvonio telefon: nepoznat broj. Odmah kažem: “Ćao Vesna.” “Ćao Ivane.” Vidovit sam? Ne. Posrećilo mi se? Ne. Prosto, Vesnin broj nisam zabeležio, ali sam ja nju zvao nešto pre toga. Bilo je sasvim realno očekivati da je ovaj poziv od nje. Ovo “sasvim realno” je kolokvijalni način da kažemo “a posteriori verovatnoća da me zove osoba X sa nepoznatog broja je najveća ukoliko je osoba X Vesna.” Kakva sad a posteriori verova–tnoća? Strpimo se malo…

U ovom slučaju, teorija verovatnoće predivno opisuje ono šta se dešava u našem mozgu: Poziv od nepoznatog broja sam po sebi ne nosi nikakvu informaciju. Nevezano od toga, od svih ljudi koji bi mogli da me pozovu u tom trenutku, verova–tnoća da je to Vesna je najveća, pošto ona ima propušten poziv od mene. Da je na ekranu pisalo “Francisko”, to bi bio nedvosmislen znak ko zove (mada je i dalje moguće da je Vesna nekako došla u posed Franciskovog telefona…). Moj mozak automatski preračunava sve ovo i signalizirara mi koga da očekujem sa druge strane.

Šta je uopšte verovatnoća?

Definicija “stepen verovanja da je neki iskaz tačan” vam je možda i isprazna (kako tačno ovo izračunati, čoveče?) i sumnjiva (“verovanja”, o čemu ti to?). Ipak, ovo je najpraktičnija formulacija. Takozvane “frekvencionističke” definicije verovatnoće (odnos pozitivnih ishoda prema ukupnim, kada broj merenja teži beskonačnosti) nisu od praktične koristi pošto nam je broj uzoraka retko toliko veliki da ga zaista možemo smatrati beskonačnim. “Verovanje” u ovom slučaju naglašava da je verovatnoća subjektivna, tj. zavisi od predznanja. Na primer, na pitanje: “Kolika je verovatnoća da je temperatura u sobi u kojoj sedim sada između 23 i 25 stepeni?”, Vi i ja bismo dali bitno drugačije odgovore. No, zapišimo konačno tu famoznu Bajesovu teoremu, onako kako se danas koristi u interpretaciji naučnih rezultata:

Ovaj zapis znači: a posteriori verovatnoća neke teorije (modela, tvrđenja) T, ako su dati podaci (merenja, posmatranja) D, je jednaka proizvodu verovatnoće dobijanja podataka D za dato T i a priori verovatnoće za T (dakle, verovatnoće pre nego što smo izvršili merenje), podeljenim sa ukupnom verovatnoćom D (prosumiranom po svim mogućim T). A sada, brzo, ovaj mali pasus formalne matematike ispratimo jednim popularnim primerom:

Test na HIV daje pozitivan rezultat ako je ispitanik zaražen. Međutim, ukoliko virusa nema, postoji verovatnoća od 1% da test da pozitivan rezultat (“false positive”). Rezultat testa je pozitivan. Kolika je verovatnoća da je ispitanik zaista zaražen virusom HIV?

Odgovor: “99%”, pogađate, nije tačan. Problem je u tome što ne znamo a priori verovatnoću da je ispitanik zaražen. Ako je u pitanju neko ko apsolutno nikada nije bio izložen HIV virusu,  svakako je u pitanju “false positive”. A priori verovatnoću možemo da procenimo (ukoliko o osobi ne znamo ništa) kao udeo zaraženih u ukupnoj svetskoj populaciji, što je oko 0.5%. Nakon igranja Bajesovom teoremom dolazimo do zaključka da je verovatnoća da je ispitanik zaista zaražen manja, svega 33%! (Za sličan primer i detaljno objašnjenje videti: http://www.statlect.com/bayes_rule.htm).

Naravno, primena u nauci nije toliko jednostavna, ali definitivno vodi ka logički tačnijem zaključivanju.  Naime, nisu sve teorije (ili modeli) podjednako a priori verovatni. Jednostavan primer: pri određivanju mase neke čestice moramo, a priori, odstraniti mogućnost negativne mase, a to može uticati na naš a posteriori zaključak.

Za zainteresovane, mnogo više primera, ali i formalne matematike, se može naći u knjigama:
Bayes’ Rule, James V. Stone
The Theory that would not Die, Sharon Bertsch McGrayne
Bayesian Reasoning in Data Analysis: Gulio D’Agostini
A mnogo zanimljivih ali suptilnih primera u knjigama i serijama o Šerloku Holmsu, te u, do skora megapopularnoj seriji, House M.D..

Ako bismo popularnu nauku definisali kao “šta je u poslednje vreme popularno u naučnom metodu”, bajesovski pristup verovatnoći i naučnom zaključivanju bismo sigurno mogli okarakterisati kao “popularan.”
Iako je u pitanju način razmišljanja zasnovan na jednostavnoj teoremi, staroj više od 200 godina, primena istog se tek danas probija u naučne radove i obradu rezultata merenja, a usput generiše i razrešava razne glavolomke i paradokse. Skuvajte sebi šolju crne kafe, skinite cipele i razgibajte vijuge. Verovatnoća je zabavna, ljudi.

Podeli :
Share on Facebook0Tweet about this on TwitterShare on Google+0Share on LinkedIn0Email this to someone

Podeli :
  •  
  •  
  •  
  •