Kysymys:
Mitä eroa on "todennäköisyyden" ja "todennäköisyyden" välillä?
Douglas S. Stones
2010-09-14 08:24:01 UTC
view on stackexchange narkive permalink

wikipedia-sivu väittää, että todennäköisyys ja todennäköisyys ovat erillisiä käsitteitä.

Ei-teknisessä kielessä "todennäköisyys" on yleensä synonyymi sanalle "todennäköisyys". mutta tilastollisessa käytössä on selkeä ero perspektiivissä: lukua, joka on joidenkin havaittujen tulosten todennäköisyys, kun annetaan joukko parametriarvoja, pidetään parametriarvojen joukon todennäköisyytenä havaittujen tulosten perusteella.

Voiko joku antaa maanläheisemmän kuvauksen siitä, mitä tämä tarkoittaa? Lisäksi muutama esimerkki siitä, kuinka "todennäköisyys" ja "todennäköisyys" ovat eri mieltä, olisi mukavaa.

Suuri kysymys. Lisään sinne myös "kertoimet" ja "mahdollisuus" :)
Mielestäni sinun tulisi tarkastella tätä kysymystä http://stats.stackexchange.com/questions/665/whats-the-difference-between-probability-and-statistics/675#675, koska todennäköisyys on tilastolliseen tarkoitukseen ja todennäköisyys todennäköisyys.
Vau, nämä ovat joitain _todella_ hyviä vastauksia. Joten iso kiitos siitä! Joskus kohta, valitsen erityisen pidetyn vastauksen "hyväksytyksi" vastaukseksi (vaikka on useita, jotka mielestäni ovat yhtä ansaittuja).
Huomaa myös, että "todennäköisyyssuhde" on itse asiassa "todennäköisyyssuhde", koska se on havaintojen funktio.
Yksitoista vastused:
user28
2010-09-14 11:08:03 UTC
view on stackexchange narkive permalink

Vastaus riippuu siitä, onko kyseessä erillisiä vai jatkuvia satunnaismuuttujia. Joten jaan vastaukseni vastaavasti. Oletan, että haluat joitain teknisiä yksityiskohtia eikä välttämättä selitystä selkokielellä.

Diskreetit satunnaismuuttujat

Oletetaan, että sinulla on stokastinen prosessi, joka ottaa erilliset arvot (esim. kolikon heittämisen tulokset 10 kertaa, kauppaan saapuvien asiakkaiden määrä 10 minuutissa jne.). Tällaisissa tapauksissa voimme laskea tietyn tulosjoukon havaitsemisen todennäköisyyden tekemällä sopivia oletuksia taustalla olevasta stokastisesta prosessista (esim. Kolikoiden laskeutumispäiden todennäköisyys on $ p $ span > ja että kolikonheitot ovat riippumattomia).

Merkitse havaitut tulokset $ O $ : lla ja parametrien joukolla, jotka kuvaavat stokastista prosessia muodossa $ \ theta $ . Kun puhumme todennäköisyydestä, haluamme laskea $ P (O | \ theta) $ . Toisin sanoen annettujen arvojen arvo $ \ theta $ , $ P (O | \ theta) $ on todennäköisyys, että havaitsemme tuloksia, joita edustaa $ O $ .

Kun mallinnamme tosielämän stokastista prosessia, emme kuitenkaan usein tiedä $ \ theta $ . Havaitsemme yksinkertaisesti $ O $ ja tavoitteena on sitten saavuttaa arvio $ \ theta $ olisi uskottava valinta, kun otetaan huomioon havaitut tulokset $ O $ . Tiedämme, että kun arvo on $ \ theta $ , todennäköisyys havaita $ O $ on $ P (O | \ theta) $ . Luonnollinen arviointiprosessi on siis valita $ \ theta $ -arvo, joka maksimoi todennäköisyyden, että todellisuudessa havaitsemme $ O $ . Toisin sanoen löydämme parametriarvot $ \ theta $ , jotka maksimoivat seuraavan funktion:

$ L (\ theta | O) = P (O | \ theta) $

$ L (\ theta | O) $ span > kutsutaan todennäköisyysfunktioksi. Huomaa, että todennäköisyystoiminto riippuu määritelmän mukaan havaitusta $ O $ : sta ja että se on tuntemattomien parametrien $ funktio. \ theta $ .

Jatkuvat satunnaismuuttujat

Jatkuvassa tapauksessa tilanne on samanlainen yhdellä tärkeällä erolla. Emme voi enää puhua todennäköisyydestä, jonka havaitsimme $ O $ annettuna $ \ theta $ , koska jatkuva tapaus $ P (O | \ theta) = 0 $ . Ilman teknisiä yksityiskohtia perusajatus on seuraava:

Merkitään tuloksiin $ O $ liittyvä todennäköisyystiheysfunktio (pdf): $ f (O | \ teeta) $ . Näin ollen jatkuvassa tapauksessa arvioimme $ \ theta $ havaitut tulokset $ O $ maksimoimalla seuraavat funktio:

$ L (\ theta | O) = f (O | \ theta) $

Tässä tilanteessa , emme voi teknisesti väittää, että löydämme parametriarvon, joka maksimoi todennäköisyyden, että havaitsemme $ O $ kun maksimoimme havaittuihin tuloksiin liittyvän PDF-tiedoston "math-container"> $ O $ .

Diskreettien ja jatkuvien muuttujien välinen ero katoaa mittateorian näkökulmasta.
@whuber kyllä, mutta vastaus mittateorian avulla ei ole kaikkien saatavilla.
@Srikant: suostui. Kommentti oli hyödyllinen OP: lle, joka on matemaatikko (mutta ehkä ei tilastotieteilijä), jotta vältettäisiin harhaan ajattelemasta, että erossa on jotain perustavaa laatua.
Voit tulkita jatkuvan tiheyden, joka on sama kuin erillinen tapaus, jos $ O $ korvataan $ dO $: lla, siinä mielessä, että jos pyydämme ) $ (eli todennäköisyys, että tiedot $ O $ sisältyvät äärettömän pienelle alueelle noin $ O '$) ja vastaus on $ f (O' | \ theta) dO '$ ($ dO' $ tekee tämän selväksi, että laskevat histogrammin äärettömän pienen "bin" -alueen pinta-alan).
Olen myöhässä puolueeseen myöhässä, mutta luulen, että tämän ratkaisevan tärkeä seuranta olisi http://stats.stackexchange.com/questions/31238/what-is-the-reason-that-a-likelihood-function-is-not-a-pdf, joka korostaa sitä tosiasiaa, että todennäköisyysfunktio $ L (\ theta) $ ei ole pdf suhteessa $ \ theta $.$ L (\ theta $) on todellakin pdf-tiedosto, joka antaa parametrin arvon, mutta koska koska $ L $ on pelkästään $ \ theta $: n funktio (tietojen ollessa vakiona), ei ole merkitystä, että $ L (\ theta) $ on pdf-tiedosto tiedoista $ \ theta $.
@whuber Erittäin mielenkiintoinen kommentti mittausteorian suhteen.Olen varma, etten ole yksin, 1) minulla ei ole taustaa tällä alalla ja 2) olen utelias siitä, miten lausuntosi on ymmärrettävä.Onko hyödyllisiä tekstejä, joita voit suositella?
@DJohnson Hellävaraisin ja intuitiivisin, mutta kuitenkin tiukka johdanto, jonka olen nähnyt, on se, että Steven Shreven teoksessa * Stochastic Calculus for Finance, * Volume II.Tarvitset ensimmäiset tusinaa sivua.Jos se näyttää matemaattisesti liian raskaalta, tutki sitten nide I. Jos sinulla on kiinnostusta rahoituksen todennäköisyyden sovelluksiin, niin nide I on aikaasi arvoinen - ja se on ihanan lyhyt.
Kirjoitit $ L (\ theta | O) = P (O | \ theta) $ tarkoittako tämä sitä, että $ P (O | \ theta) $ ei integroitu yhteen, koska se ei ole todennäköisyyttä?Miksi sitten käytämme $ P $: ta täällä, meidän pitäisi pitää se arvona $ L $, muuten se on hämmentävää.
OP: * Voiko joku antaa maanläheisemmän kuvauksen *.Tämä vastaus: * täällä pilvessä 11 näet .. *
whuber
2010-09-14 20:45:09 UTC
view on stackexchange narkive permalink

Tämä on sellainen kysymys, johon melkein kaikki vastaavat, ja odotan kaikkien vastausten olevan hyviä. Mutta olet matemaatikko, Douglas, joten anna minun tarjota matemaattinen vastaus.

Tilastollisen mallin on yhdistettävä kaksi erillistä käsitteellistä kokonaisuutta: data , jotka ovat elementtejä $ x $ joidenkin joukkojen (kuten vektoritilan) ja mahdollinen kvantitatiivinen malli datakäyttäytymisestä. Mallit ovat yleensä edustettuina pisteillä $ \ theta $ rajallisessa mittasuhteessa, jakotukilla, joilla on raja, tai funktiotilassa (jälkimmäistä kutsutaan "ei-parametriseksi" ongelma).

Tiedot $ x $ on yhdistetty mahdollisiin malleihin $ \ theta $ funktion $ \ Lambda (x, \ theta) $ avulla. $ \ theta $ , $ \ Lambda (x, \ theta) $ on tarkoitettu $ x $ : n todennäköisyys (tai todennäköisyystiheys). Minkä tahansa tietyn $ x $ , toisaalta, $ \ Lambda (x, \ theta) $ voidaan tarkastella $ \ theta $ -funktiona, ja sen oletetaan yleensä olevan tiettyjä mukavia ominaisuuksia, kuten jatkuvasti toissijaisesti erotettavissa. Aikomuksesta tarkastella $ \ Lambda $ tällä tavalla ja vedota näihin oletuksiin ilmoitetaan kutsumalla $ \ Lambda $ span> "todennäköisyys".

Se on aivan kuin ero muuttujien ja parametrien välillä differentiaaliyhtälössä: joskus haluamme tutkia ratkaisua (ts. keskitymme muuttujiin argumenttina) ja joskus haluamme tutkia, miten ratkaisu vaihtelee parametrien mukaan. Tärkein ero on se, että tilastoissa meidän on harvoin tutkittava molempien argumenttijoukkojen samanaikaista vaihtelua; ei ole tilastollista objektia, joka luonnollisesti vastaa sekä tietojen $ x $ että malliparametrien $ \ theta $ väli>. Siksi kuulet enemmän tästä kahtiajaosta kuin vastaavissa matemaattisissa olosuhteissa.

+1, mikä siisti vastaus. Analogia differentiaaliyhtälöiden kanssa näyttää erittäin sopivalta.
Vaikka tämä taloustieteilijä ei liity niin läheisesti kuin edellinen oppimiini käsitteisiin, se oli informatiivisinta intuitiivisessa mielessä.Paljon kiitoksia.
Itse asiassa tämä väite ei ole totta "ei ole tilastollista objektia, joka luonnollisesti vastaisi sekä datan x että malliparametrien changing muuttamista."On, sitä kutsutaan "tasoitukseksi, suodatukseksi ja ennustamiseksi", lineaarisissa malleissa sen Kalman-suodatin, epälineaarisissa malleissa niillä on täydet epälineaariset suodattimet, https://fi.wikipedia.org/wiki/Kushner_equation jne.
Kyllä, hieno vastaus!Niin lame kuin tämä kuulostaa, se helpotti minua valitsemalla $ \ Lambda \ left (x, \ theta \ right) $ tavallisen $ P \ left (x, \ theta \ right) $ -merkinnän sijaan.että aloitamme yhteisellä todennäköisyydellä, joka voidaan määritellä joko todennäköisyydeksi tai ehdolliseksi todennäköisyydeksi.Lisäksi "tiettyjen mukavien ominaisuuksien" kommentti auttoi.Kiitos!
@Mike Olet tervetullut.Huomaa kuitenkin, että $ \ Lambda $ ei yleensä ole "yhteinen todennäköisyys" paitsi Bayesin malleissa.Toivon, että tilini ei ollut sekava siitä.
@whuber Kyllä, tiedän, että $ \ Lambda $ ei ole tavallinen merkintätapa.Siksi se auttoi!Lopetin ajattelemasta, että sillä on oltava erityinen merkitys, ja seurasin vain logiikkaa.;-p
Pidetäänkö $ \ Lambda $ tässä ehdollisena todennäköisyysjakautumana (ehdollisena parametreilla $ \ theta $)?
@Iamanon Ei välttämättä: se parametroi todennäköisyysjakaumaperheen.Voit ajatella sitä funktiona (ainakin jatkuvana) parametriavaruudesta $ \ Theta $ todennäköisyysjakaumien avaruuteen viemällä $ \ theta \ sisään \ Theta $ jakoon, jonka tiheys on $ x \ to \ Lambda (x, \ theta). $ Tämä vaatii yhteisen mittarin, jonka suhteen kaikilla jakaumilla on tosiasiallisesti tiheys.
Thylacoleo
2010-09-14 13:45:33 UTC
view on stackexchange narkive permalink

Yritän minimoida matematiikan selityksessäni, koska hyviä matemaattisia selityksiä on jo olemassa.

Kuten Robin Girard kommentoi, todennäköisyyden ja todennäköisyyden välinen ero liittyy läheisesti eroon todennäköisyyden ja tilastojen välillä. Tavallaan todennäköisyys ja tilastot koskevat itseään ongelmista, jotka ovat toisiinsa nähden päinvastaisia ​​tai käänteisiä.

Harkitse kolikonheittoa. (Vastaukseni on samanlainen kuin esimerkki 1 Wikipediassa.) Jos tiedämme kolikon olevan oikeudenmukainen ( $ p = 0,5 $ ), tyypillinen todennäköisyyskysymys on: Mikä on todennäköisyys saada kaksi päätä peräkkäin. Vastaus on $ P (HH) = P (H) \ kertaa P (H) = 0,5 \ kertaa0,5 = 0,25 $ .

Tyypillinen tilastollinen kysymys on: Onko kolikko oikeudenmukainen? Tähän vastaamiseksi meidän on kysyttävä: Missä määrin otoksemme tukee oletustamme, että $ P (H) = P (T) = 0.5 $ ? P Ensimmäinen huomautettava asia on, että kysymyksen suunta on kääntynyt päinvastaiseksi. Todennäköisyydessä aloitamme oletetulla parametrilla ( $ P (pää) $ ) ja arvioimme tietyn otoksen todennäköisyyden (kaksi päätä peräkkäin). Tilastoissa aloitamme havainnosta (kaksi päätä peräkkäin) ja teemme INFERENCEa parametristamme ( $ p = P (H) = 1- P (T) = 1 - q $ ).

Esimerkki 1 Wikipediassa näyttää meille, että $ P (H) $ : n suurin todennäköisyysarvo kahden pään perässä on $ p_ {MLE} = 1 $ . Tiedot eivät kuitenkaan missään tapauksessa sulje pois parametrin todellista arvoa $ p (H) = 0,5 $ (älä välitä tällä hetkellä yksityiskohdista). Todellakin vain hyvin pienet $ p (H) $ -arvot ja erityisesti $ p (H) = 0 $ voidaan kohtuudella eliminoida $ n = 2 $ (kaksi kolikon heittoa) jälkeen. Kun kolmas heitto tulee esiin hännät, voimme nyt poistaa mahdollisuuden, että $ P (H) = 1.0 $ (eli se ei ole kaksi kolikkopää), mutta suurimman osan välissä olevista arvoista tiedot voivat kohtuudella tukea . (Tarkka binominen 95%: n luottamusväli $ p (H) $ on 0,094 - 0,992.

100 kolikonheiton ja (esimerkiksi) 70 jälkeen päätä, meillä on nyt kohtuullinen perusta epäilylle, että kolikko ei todellakaan ole reilu. Tarkka 95%: n luottamusväli $ p (H) $ -arvossa on nyt 0,787 ja todennäköisyys havaita niin äärimmäinen tulos kuin 70 tai enemmän päätä (tai häntää) 100 heitosta, jotka on annettu $ p (H) = 0,5 $ , on 0,0000785.

Vaikka en ole nimenomaisesti käyttänyt todennäköisyyslaskelmia, tämä esimerkki kuvaa todennäköisyyden käsitettä: Todennäköisyys on mittari siitä, missä määrin näyte tukee parametrimallin tiettyjä parametriarvoja .

Hyvä vastaus!Varsinkin kolme viimeistä kappaletta ovat erittäin hyödyllisiä.Kuinka laajennat tätä kuvaamaan jatkuvaa tapausta?
Minulle paras vastaus.En välitä lainkaan matematiikasta, mutta * minulle * matematiikka on * työkalu *, jota hallitsen mitä haluan (en pidä matematiikasta sen itsensä vuoksi, mutta siitä, mitä se auttaa minua tekemään).Vain tällä vastauksella tiedän jälkimmäisen.
ars
2010-09-14 10:16:18 UTC
view on stackexchange narkive permalink

Annan teille näkökulman todennäköisyysteorian näkökulmasta, joka on peräisin Fisherilta - ja on perusta viitatun Wikipedia-artikkelin tilastolliselle määritelmälle.

Oletetaan, että sinulla on satunnaisia ​​muunnelmia $ X $, jotka syntyvät parametrisoidusta jakaumasta $ F (X; \ theta) $, jossa $ \ theta $ on parametria, joka kuvaa $ F $. Tällöin $ X = x $: n todennäköisyys olisi: $ P (X = x) = F (x; \ theta) $, tunnetulla $ \ theta $: lla.

Sinulla on useammin tietoja $ X $ ja $ \ theta $ ei ole tiedossa. Ottaen huomioon oletetun mallin $ F $, todennäköisyys määritellään havaittujen tietojen todennäköisyydeksi $ \ theta $: n funktiona: $ L (\ theta) = P (\ theta; X = x) $. Huomaa, että $ X $ tunnetaan, mutta $ \ theta $ ei tunneta; Itse asiassa todennäköisyyden määrittelemisen motivaatio on määrittää jakauman parametri.

Vaikka näyttää siltä, ​​että olemme yksinkertaisesti kirjoittaneet todennäköisyysfunktion uudelleen, tämän keskeinen seuraus on, että todennäköisyysfunktio tekee eivät noudata todennäköisyyden lakeja (esimerkiksi se ei ole sidottu [0, 1] -väliin). Todennäköisyysfunktio on kuitenkin verrannollinen havaittujen tietojen todennäköisyyteen.

Tämä todennäköisyyden käsite johtaa itse asiassa eri ajattelutapaan, "likelihoodisteihin" (jotka eroavat yleisistä ja bayesiläisistä), ja voit googlella etsiä kaikkia erilaisia ​​historiallisia keskusteluja. Kulmakivi on todennäköisyyden periaate, joka sanoo olennaisesti, että voimme tehdä johtopäätöksiä suoraan todennäköisyystoiminnosta (Bayesilaiset eivätkä usein esiintyvät eivät hyväksy tätä, koska se ei ole todennäköisyysperusteista päätelmää). Nykyään suuri osa siitä, mitä kouluissa opetetaan "usein esiintyväksi", on itse asiassa yhdistelmä yleistä ja todennäköistä ajattelua.

Syvemmän oivalluksen saamiseksi Edwardsin todennäköisyys on hieno alku ja historiallinen viite. Nykyaikaiseen otteeseen suosittelen Richard Royallin upeaa monografiaa Tilastolliset todisteet: todennäköisyysparadigma.

Mielenkiintoinen vastaus, ajattelin itse asiassa, että "todennäköisyyskoulu" oli pohjimmiltaan "usein vierailevia, jotka eivät suunnittele näytekoulua", kun taas "suunnittelukoulu" oli loput yleisistä. Minulla on itse asiassa vaikea sanoa mikä "koulu" olen, koska minulla on vähän tietoa jokaisesta koulusta. "Todennäköisyys laajennettuna logiikkana" -koulu on suosikkini (duh), mutta minulla ei ole tarpeeksi käytännön kokemusta sen soveltamisesta todellisiin ongelmiin ollakseni dogmaattinen.
+1 merkinnälle "todennäköisyysfunktio ei noudata todennäköisyyden lakeja (esimerkiksi se ei ole sidottu [0, 1] -väliin). Todennäköisyysfunktio on kuitenkin verrannollinen havaittujen tietojen todennäköisyyteen."
"Todennäköisyysfunktio ei noudata todennäköisyyden lakeja" voisi käyttää joitain lisäselvityksiä, varsinkin kun se on kirjoitettu muodossa θ: L (θ) = P (θ; X = x), ts. yhtäläinen todennäköisyyden kanssa!
Kiitos vastauksestasi.Voisitko vastata @locster: n kommenttiin?
Minulle ei matemaatikoksi tämä lukee kuin uskonnollinen matematiikka, ja erilaiset uskomukset johtavat erilaisiin arvoihin tapahtumien todennäköisyydelle.Voitteko muotoilla sen niin, että on helpompaa ymmärtää, mitkä eri uskomukset ovat ja miksi niillä kaikilla on järkeä, sen sijaan että toinen olisi yksinkertaisesti väärä ja toinen koulu / uskomus oikein?(oletus, että on olemassa * yksi oikea tapa * laskea tapahtumien mahdollisuus)
Gypsy
2013-04-14 01:49:40 UTC
view on stackexchange narkive permalink

Kun otetaan huomioon kaikki yllä olevat hienot tekniset vastaukset, haluan ottaa sen takaisin kieleen: Todennäköisyys kvantifioi ennakoinnin (lopputuloksen), todennäköisyys kvantifioi luottamuksen (mallissa).

Oletetaan, että joku haastaa meidät 'kannattavaksi'. uhkapeli '. Sitten todennäköisyydet auttavat meitä laskemaan asioita, kuten voittojesi ja menettämiesi odotettu profiili (keskiarvo, tila, mediaani, varianssi, informaatiosuhde, riskin arvo, pelaajien pilaaminen ja niin edelleen). Sitä vastoin todennäköisyys palvelee meitä määrittelemään, luotammeko ensinnäkin noihin todennäköisyyksiin; vai haistammeko rotan.


Muuten - koska joku edellä mainitsi tilastojen uskonnot - uskon todennäköisyyssuhteen olevan olennainen osa Bayesin maailmaa ja usein esiintyvä: Bayesin maailmassa Bayes-kaava yhdistää vain etukäteen todennäköisyyden tuottaa jälkipuoliskoa.

Tämä vastaus tiivistää sen minulle.Minun piti miettiä, mitä se tarkoitti, kun luin, että todennäköisyys ei ole todennäköisyys, mutta minulle tapahtui seuraava tapaus.Kuinka todennäköinen on, että kolikko on oikeudenmukainen, kun otetaan huomioon neljä päätä peräkkäin?Emme voi oikeastaan sanoa mitään todennäköisyydestä tässä, mutta sana "luottamus" näyttää sopivalta.Tuntuuko meiltä, että voimme luottaa kolikkoon?
Alun perin tämä on voinut olla todennäköisyyksien historiallisesti tarkoitettu tarkoitus, mutta nykyään todennäköisyydet ovat jokainen Bayesin laskelma, ja tiedetään, että todennäköisyydet voivat yhdistää uskomukset ja uskottavuuden, minkä vuoksi Dempster-Shafer-teoria luotiin erottamaan molemmat tulkinnat.
Yaroslav Bulatov
2010-09-14 11:04:27 UTC
view on stackexchange narkive permalink

Oletetaan, että sinulla on kolikko, jonka todennäköisyys $ p $ laskee päähän ja $ (1-p) $ span> laskeutua hännät. Anna $ x = 1 $ osoittaa päät ja $ x = 0 $ osoittaa hännät. Määritä $ f $ seuraavasti

$$ f (x, p) = p ^ x ( 1-p) ^ {1-x} $$

$ f (x, 2/3) $ on todennäköisyys x annettu $ p = 2/3 $ , $ f (1, p) $ on todennäköisyys $ p $ annettu $ x = 1 $ . Periaatteessa todennäköisyys vs. todennäköisyys kertoo, mitä tiheysparametriä pidetään muuttujana

Hieno lisäys edellä käytettyihin teoreettisiin määritelmiin!
Huomaan, että $ C ^ n_kp ^ n (1-p) ^ {k-n} $ antaa todennäköisyyden saada $ n $ päätä $ k $ -kokeissa.$ P ^ x (1-p) ^ {1-x} $ näyttää olevan $ k $ -th: n juuri: $ x = n / k $.Mitä se tarkoittaa?
@LittleAlien mikä on $ C_k ^ n $ yhtälössäsi?
@GENIVI-LEARNER $ C ^ n_k $ on binomikerroin (katso https://en.wikipedia.org/wiki/Binomial_coefficient).Sen avulla voit laskea todennäköisyyden nähdä eri pään ja hännän yhdistelmät (esimerkiksi: $ HTT $, $ THT $, $ TTH $ hintaan $ n = 3 $, $ k = 1 $) kaikkien päiden tai kaikkien sijastakäyttämällä yksinkertaisempaa $ f (x, p) = p ^ x (1-p) ^ {nk} $ -kaavaa.
John
2010-09-14 08:44:11 UTC
view on stackexchange narkive permalink

Jos minulla on reilu kolikko (parametriarvo), todennäköisyys, että se tulee päähän, on 0,5. Jos käännän kolikkoa 100 kertaa ja se nousee päihin 52 kertaa, sillä on suuri todennäköisyys olla oikeudenmukainen (todennäköisyyden numeerinen arvo voi muodostaa useita muotoja).

Tämän ja Gypsyn vastauksen pitäisi olla ylhäällä!Intuitio ja selkeys kuivan matemaattisen kurinalaisuuden yläpuolella, sanomatta jotain halveksivampaa.
onko todennäköisyyden laskentakaavalle intuitiivinen selitys, kuten meillä on todennäköisyyttä laskevalle binomijakaumakaavalle?
Kuulostaa siltä, että se olisi lähetettävä omaksi kysymykseksi
Lenar Hoyt
2015-11-27 19:41:29 UTC
view on stackexchange narkive permalink

$ P (x | \ theta) $ voidaan nähdä kahdesta näkökulmasta:

  • $ x $: n funktiona käsitellään $ \ theta $ tunnettuna / havaittu. Jos $ \ theta $ ei ole satunnainen muuttuja, niin $ P (x | \ theta) $ kutsutaan $ parametrisoitu ) todennäköisyydeksi malliparametrien $ \ theta $, joka kirjoitetaan joskus myös nimellä $ P (x; \ theta) $ tai $ P _ {\ theta} (x) $. Jos $ \ theta $ on satunnainen muuttuja, kuten Bayesin tilastoissa, niin $ P ( x | \ theta) $ on ehdollinen todennäköisyys, joka määritellään nimellä $ {P (x \ cap \ theta)} / {P (\ theta)} $.
  • Kohteen $ x theta $ funktiona kohtelemalla kohtaa $ x $ havaitulla tavalla. Esimerkiksi, kun yrität löytää $ $ theta $: lle tietyn tehtävän $ \ hat \ theta $, joka maksimoi $ P (x | \ theta) $, sitten $ P (x | \ hat \ theta) $ kutsutaan $ \ theta $ suurimmaksi todennäköisyydeksi , kun otetaan huomioon tiedot $ x $, joskus kirjoitetaan nimellä $ \ mathcal L (\ hattu \ theta | x) $. Joten termi todennäköisyys on vain lyhyt viittaamaan todennäköisyyteen $ P (x | \ theta) $ joillekin tiedoille $ x $, jotka johtuvat eri arvojen osoittamisesta $ \ theta $: lle (esim. Kun yksi kulkee $ \ hakutilan läpi) theta $ hyvästä ratkaisusta). Joten sitä käytetään usein objektiivisena funktiona, mutta myös suorituskyvyn mittana vertaamaan kahta mallia kuten Bayesin mallivertailussa.

Usein tämä lauseke on edelleen sen molempien argumenttien funktio, joten se on pikemminkin painopiste.

Toisessa tapauksessa ajattelin, että ihmiset yleensä kirjoittavat P (teeta | x).
Alun perin intuitiivisesti ajattelin jo, että he molemmat sanat ovat samanlaisia näkökulman tai luonnollisen kielen muotoilun eroilla, joten minusta tuntuu "Mitä? Olin oikeassa koko ajan ?!"Mutta jos näin on, miksi niiden erottaminen on niin tärkeää? Englanti, joka ei ole äidinkieleni, kasvoin vain yhdellä sanalla näennäisesti molemmille termeille (vai olenko vain koskaan saanut ongelmaa, jossa minun on erotettava termit?) Enkä koskaan tiennyt, että eroa on.Vasta nyt, kun tiedän kaksi englanninkielistä termiä, aloin epäillä ymmärrystäni näistä asioista.
Vastauksesi näyttää olevan erittäin haluttava ja helppo ymmärtää.Ihmettelen, miksi se sai niin vähän ääniä.
Huomaa, että P (x | $ \ theta $) on ** ehdollinen ** todennäköisyys vain, jos $ \ theta $ on satunnaismuuttuja, jos $ \ theta $ on parametri, se on yksinkertaisesti x: n todennäköisyys, jonka parametrisoi $ \ theta$.
mielestäni tämä on paras vastaus kaikkien joukossa
schotti
2019-06-28 03:37:29 UTC
view on stackexchange narkive permalink

tunnetko pilotin tv-sarjassa "num3ers", jossa FBI yrittää löytää sarjarikollisen kotipaikan, joka näyttää valitsevan uhrinsa sattumanvaraisesti?

FBI: n matemaattinen neuvonantaja ja vastuuhenkilön veli ratkaisee ongelman suurimman todennäköisyyden lähestymistavalla. Ensinnäkin hän olettaa joidenkin "gugelhupfin muotoisten" probability $ p (x | \ theta) $ , että rikokset tapahtuvat paikoissa $ x $ , jos rikollinen asuu paikassa $ \ theta $ . (gugelhupf-oletus on, että rikollinen ei tee rikos lähialueellaan eikä matkustaa äärimmäisen kauas valitsemaan seuraavan satunnaisen uhrinsa.) Tämä malli kuvaa probability: tä eri $ x $ annettu kiinteä $ \ theta $ . toisin sanoen, $ p _ {\ theta} (x) = p (x | \ theta) $ on funktion $ x $ kiinteällä parametrilla $ \ theta $ .

FBI ei tietenkään tiedä rikollisen kotipaikkaa eikä halua ennustaa seuraavaa rikospaikkaa. (He toivovat löytävänsä rikollisen ensin!) Se on päinvastoin, FBI tietää jo rikospaikat $ x $ ja haluaa löytää rikollisen kotipaikan $ \ theta $ .

joten FBI-agentin loistavan veljen on yritettävä löytää kaikista arvoista eniten likely $ \ theta $ , eli $ \ theta $ , joka maksimoi $ p (x | \ theta) $ todella havaitulle $ x $ . siksi hän pitää nyt $ l_x (\ theta) = p (x | \ theta) $ funktiona $ \ theta $ kiinteällä parametrilla $ x $ . kuvaannollisesti, hän työntää gugelhupfiaan ympäri karttaa, kunnes se optimaalisesti "sopii" tunnetuille rikospaikoille $ x $ . sitten FBI koputtaa ovea gugelhupfin keskellä $ \ hat {\ theta} $ .

Tämän näkökulman muutoksen korostamiseksi $ l_x (\ theta) $ kutsutaan nimellä $ likelihood (funktio). \ theta $ , kun taas $ p _ {\ theta} (x) $ oli : n probability (funktio) $ x $ . molemmat ovat itse asiassa sama funktio $ p (x | \ theta) $ , mutta katsottuna eri näkökulmista ja $ x $ ja $ \ theta $ vaihtavat roolinsa muuttujana ja vastaavasti parametrina.

Response777
2017-11-06 15:45:56 UTC
view on stackexchange narkive permalink

Minusta tärkein ero on se, että todennäköisyys ei ole todennäköisyys ($ \ theta $).

Arviointiongelmassa annetaan X ja todennäköisyys $ P (X | \ theta) $ kuvaa X: n jakaumaa pikemminkin kuin $ \ theta $.Toisin sanoen $ \ int P (X | \ theta) d \ theta $ on merkityksetön, koska todennäköisyys ei ole $ \ theta $: n pdf-tiedosto, vaikka se luonnehtii $ \ theta $: ta jossakin määrin.

Kuten @Lenar Hoytin vastaus huomauttaa, jos teeta on satunnaismuuttuja (mikä se voi olla), todennäköisyys on todennäköisyys.Todellinen vastaus näyttää siis olevan, että todennäköisyys voi olla todennäköisyys, mutta toisinaan ei.
@MikeWise, Mielestäni teetaa voidaan aina pitää "satunnaisena" muuttujana, vaikka on todennäköistä, että se ei vain ole niin "satunnainen" ...
Ahmad
2019-11-06 18:00:39 UTC
view on stackexchange narkive permalink

Jos jätämme ehdollisen todennäköisyyden tulkinnan sivuun, voit ajatella sitä tällä tavalla:

  • todennäköisyydessä haluat yleensä löytää mahdollisen tapahtuman todennäköisyyden mallin / parametrin / todennäköisyysjakauman jne. perusteella.

  • todennäköisyydessä olet havainnut jonkinlaisen tuloksen, joten haluat löytää / luoda / arvioida todennäköisimmän lähde / malli / parametri / todennäköisyysjakauma jostatämä tapahtuma on herättänyt.

Minusta näyttää siltä, että asia puuttuu kokonaan.Todennäköisyyttä ja todennäköisyyttä ei pidä erottaa tällä tavalla.(Muokkaukseni ovat vain kielellisiä.)
@NickCox Mikä on ongelma?se on vain intuitio, ei muodollinen vastaus, muut antoivat muodolliset vastaukset.
@NickCox Muutin sitä hieman, tarkista se uudelleen.
Anteeksi, mutta muodollinen tai epävirallinen tyyli ei ole asia.Eroa ei ole menneisyyden ja tulevaisuuden suhteen.Tämä lisää vain hämmennystä säikeeseen, ja olen äänestänyt alas jos väärin.
@NickCox En ole tilastotieteilijä, mutta eikö tapahtumien todennäköisyys ole tiedossa ** etukäteen **?ja havaintojen todennäköisyys?Ja havainto on tapahtuma!En todellakaan halua olla kovin pedanttinen, vain intuitio, joka toimii useimmissa tilanteissa.
Lankalla on jo useita erinomaisia, paljon arvostettuja vastauksia.Tämä ei ole tilanne, jossa joku, joka ei ole varma asiantuntemuksestaan, tarvitsee tai hänen pitäisi lisätä uusi.Kiinnostus tulevaisuuteen ei ole kysymys, koska käytännössä sekä todennäköisyys että todennäköisyys lasketaan jo käsillä olevista tiedoista.
@NickCox Luin ne, mutta se oli tapa, jolla pidin sitä intuitiivisemmaksi itselleni ja lähetän vastauksen niille, jotka saattavat nähdä tilanteen minun näkökulmastani.Kyllä, meillä on molemmat tiedot, nämä ovat vain todennäköisyyden laskemista varten, eivät pdf: n käyttöä.Tapa, jolla ajattelet todennäköisyyttä, eroaa tavasta, jolla ajattelet todennäköisyyttä.Se on minun mielipiteeni.Aivan kuten kirjoitin, todennäköisyys on tapahtuman todennäköisyys.Kuinka todennäköinen tapahtuma tapahtuu;tuloksen epävarmuuden aste (jotain, jota emme voi ennustaa deterministisesti).
@NickCox, mutta todennäköisyyden vuoksi emme ole huolissamme tapahtuman tapahtumisesta ja kuinka todennäköisestä se on, tapahtuma on jo tapahtunut ja jätti meille jonkinlaisen havainnon spekuloida todennäköisyysprosessin alla.
-1 Intuitiiviset vastaukset ovat hyviä - kun ne ovat oikein.Tämä on vain harhaanjohtava ja väärä.
@whuber toisella henkilöllä oli myös ideasi, mutta yritin vakuuttaa hänet, eikä hän lisännyt mitään.Lue keskustelumme ja jos sinulla olisi jotain lisättävää, olisit iloinen kuullessasi.Sano vain, että jokin on vialla, ei tee siitä väärää.Tarkoitukseni ei kuitenkaan ole antaa virallista tai täydellistä vastausta.Vain nopea vihje ja jättää perustelut käyttäjälle.Joten sinulla on myös vapaa saada asia tai yrittää olla täsmällinen.
@whuber muuten, muutin joitain sanoja teknisempien mukaan niille, jotka saattavat olla harhaanjohtavia eivätkä saa suhdetta
@whuber Yritin parantaa vastaustani, mutta se menetti kaikki intuitiiviset kohdat toiseksi mauttomaksi määritelmäksi, joten aion poistaa sen.Voin vain sanoa, että verkkosivustosi on erittäin masentava ja ensisijainen.
En ole iloinen siitä, että sinulla on negatiivinen käsitys sivustostamme, mutta väärien tai epäolennallisten vastausten lannistaminen on osa sivuston toimintaa, valitettavasti sinulle tässä tapauksessa.Kommenttini muistiinpano voi olla kaikkien muiden lukijoiden mielestä yrittää selittää ytimekkäästi, kuinka vastauksesi ei auttanut.
@NickCox kiitos ymmärryksestäsi!Ei ongelmaa.Tiedän, että teet myös työsi hyvällä tarkoituksella.Olen oppinut joitain seikkoja, ja jouduin käyttämään enemmän aikaa vastaukselleni, mutta keskityin vain antamaan uuden edes epätarkan näkökulman pikemminkin kuin toistamaan ilmeisiä tai yleisiä tulkintoja, mutta se osoittautui hankalaksi.Joka tapauksessa, kiitos
Sinulla on väärä suunta, Ahmad: väärä vastaus oikeuttaa toteamaan sen vääräksi.Ymmärtääksesi miksi viesti on väärä - koska @Nick's-vastaukset eivät ole riittäneet - sinun tarvitsee vain pyytää viranomaiselta todennäköisyyden ja todennäköisyyden määritelmiä tai kuvauksia.(Sinulla on kuitenkin vaikea löytää sellaista, joka tekee ajallisen eron, koska todennäköisyys tai todennäköisyys eivät tee eroa menneisyyden, nykyisyyden tai tulevaisuuden välillä.) Muiden vastausten lukeminen tässä säikeessä olisi hyvä alku.
@whuber "vastaus" on epämääräinen kohde termille väärä.Joka tapauksessa voin logiikkasi perusteella sanoa, että olet väärässä!et ymmärtänyt asiaa, eikä kyse ole menneisyydestä, tulevaisuudesta jne. Jos haluat tietää miksi voit lukea keskustelun minun ja Nick Coxin välillä.Selitin tarpeeksi!Poistan kuitenkin vastaukseni.
Ymmärrän, miksi sinusta tuntuu edelleen hyvin tuskalliselta tästä vaihdosta, mutta se ei ole tekosyy olla epäkohtelias @whuber: lle.Hän on selvästi lukenut kommenttini, kun hän viittaa niihin, ja on järjetöntä antaa ymmärtää, että hän on liian tyhmä tai tietämätön ymmärtämään asiaasi.Jopa tarkasti tarkistettuna vastauksesi herättää enemmän ongelmia kuin ratkaisee.Aluksi karakterisointi, että "Todennäköisesti olet yleensä spekuloi mahdollisen tapahtuman todennäköisyyttä", viittaa korkeintaan aikaisempaan todennäköisyyteen eikä ole yleisesti hyödyllinen.Pysyn siellä.
@whuber, NickCox, anteeksi, luulen, että olin impulsiivinen edellisessä kommentissani, enkä huomannut antamiasi vihjeitä.Ensinnäkin impulssini johtui ensimmäisestä virkkeestä, kyllä, "väärä vastaus oikeuttaa toteamisen vääräksi, mutta väärän toteaminen ei tarkoita, että se on väärä tai oikea".Joka tapauksessa, en halua väitellä, mieluummin oppia ja luulin, ettet tarjonnut perusteluja.Kuitenkin nyt näen, että sana "ajallinen ero" oli vihje.Se on jotain, josta voidaan keskustella.
Ja erotteluni oli pikemminkin nyrkkisääntö / vihje / (en tiedä ilmausta), jotta niiden erottaminen helpottaisi ei-asiantuntijaa, mutta olen kuitenkin sitä mieltä, että se tarvitsee tarkempaa terminologiaa.Voin tarkistaa tai poistaa vastaukseni myöhemmin, mutta tässä vaiheessa minun pitäisi jättää se.Kiitos.
@Nick tarkista uudet kommenttini.
se on sinun valintasi, ellei muut poistoa koskevat äänet päätä asiaa. Tällä hetkellä sinulla on kaksi alasääntä (@whuber ja ilmoitin itsemme) ja yksi yläneuvos joku aivan erilainen
@NickCox, tekeekö tämän vastauksen nykyinen muutos "hieman oikean"?Mielestäni se tapahtuu, koska todennäköisyys on määrittää, mitkä ovat havaitun lopputuloksen hypoteesiryhmät, ja suurin todennäköisyys asetetaan määrittämään yksi hypoteesi, joka parhaiten selittää lopputuloksen.Tässä yhteydessä hän kirjoitti "todennäköisimmin" määrittääkseen todennäköisyyden eikä suurimman todennäköisyyden, joka mielestäni on "ainoa" harhaanjohtava käsite tässä.Eikö?
@GENIVI-LEARNER En usko, että se on vielä hyödyllinen vastaus.Kumpikaan määrä ei ole hyvin määritelty asenteella, jonka olet todennäköisesti käyttävän sitä.Esimerkiksi todennäköisyydet voidaan arvioida kuvailevasti ilman mitään muodollista mallia.
@NickCox, No näyttää siltä, että todennäköisyys on vähän monimutkaisempi silloin.Sinulla on hyvä käsitys siitä, katso, voisitko osallistua myös [tähän] (https://stats.stackexchange.com/questions/445928/probability-and-likelihood-from-another-angle).Kehitin sen uudelleen konkreettisella skenaarialla.
@NickCox, Myös silloin, kun sanoit ** todennäköisyydet voidaan arvioida kuvailevasti ilman mitään muodollista mallia mielessä ** sanotko, että todennäköisyyden varalta on aina oltava hypoteesi tai jokin analyyttinen tai numeerinen malli?Jos näin on, luulen, että tämä todennäköisyysmallipohjainen näkökohta voi yksilöidä, kuinka todennäköisyys eroaa todennäköisyydestä.Eikö?
Olen edelleen sitä mieltä, että täällä on useita poikkeuksellisen hyviä vastauksia, ja minulla ei ole mitään sanottavaa, joka olisi erilainen tai parempi muotoilla.Myös empiirinen todennäköisyys ei ole, että tiedän siitä tarpeeksi lähetettäväksi.


Tämä Q & A käännettiin automaattisesti englanniksi.Alkuperäinen sisältö on saatavilla stackexchange-palvelussa, jota kiitämme cc by-sa 2.0-lisenssistä, jolla sitä jaetaan.
Loading...