AIC: n ja BIC: n välillä ei ole paljon eroa siitä, mitä voin kertoa. Ne ovat molemmat matemaattisesti käteviä likiarvoja , jotka voidaan tehdä mallien tehokkaan vertailun kannalta. Jos ne antavat sinulle erilaisia "parhaita" malleja, se tarkoittaa todennäköisesti sitä, että sinulla on suuri epävarmuus mallista, mikä on tärkeämpää huolehtia siitä, pitäisikö sinun käyttää AIC: tä vai BIC: tä. Pidän henkilökohtaisesti BIC: stä paremmin, koska se kysyy enemmän (vähemmän) mallista, jos sillä on enemmän (vähemmän) tietoja parametriensa mukaiseksi - ikään kuin opettaja pyytää korkeampaa (matalampaa) suorituskykyä, jos heidän oppilaansa on enemmän (vähemmän ) aika oppia aiheesta. Minusta tämä tuntuu vain intuitiiviselta tekemältä. Mutta sitten olen varma, että myös AIC: lle on olemassa yhtä intuitiivisia ja pakottavia argumentteja, koska sen yksinkertainen muoto on.
Nyt, kun teet likiarvon, on varmasti joitain ehtoja, kun nämä likiarvot ovat roskaa. Tämä näkyy varmasti AIC: ssä, jossa on monia "säätöjä" (AICc) tiettyjen olosuhteiden huomioon ottamiseksi, jotka tekevät alkuperäisestä likiarvosta huonon. Tämä pätee myös BIC: ään, koska on olemassa monia muita tarkempia (mutta silti tehokkaita) menetelmiä, kuten Fully Laplace Approximations Zellnerin g-priorien seoksiin (BIC on likiarvo integraalien Laplace-approksimaatiomenetelmään).
Yksi paikka, jossa he molemmat ovat paskaa, on, kun sinulla on huomattavaa ennakkotietoa tietyn mallin parametreista. AIC ja BIC rankaisevat tarpeettomasti malleja, joissa parametrit ovat osittain tiedossa verrattuna malleihin, jotka edellyttävät parametrien arviointia tiedoista.
Yksi mielestäni tärkeä huomata on, että BIC ei oleta "aitoa" mallia, joka a) on olemassa tai b) sisältyy mallijoukkoon. BIC on yksinkertaisesti likiarvo integroidulle todennäköisyydelle $ P (D | M, A) $ (D = Data, M = malli, A = oletukset). Vain kertomalla aikaisemmalla todennäköisyydellä ja normalisoimalla, saat $ P (M | D, A) $. BIC kuvaa yksinkertaisesti datan todennäköisyyttä, jos symbolin $ M $ mukainen ehdotus on totta. Joten loogisesta näkökulmasta data tukee yhtä lailla mitä tahansa ehdotusta, joka johtaisi BIC: ään likiarvona. Joten jos ilmoitan ehdotuksiksi $ M $ ja $ A $.
$$ \ begin {array} {l | l} M_ {i}: \ text {i-malli on paras kuvaus data} \\ A: \ text {pois otettavasta K-mallien joukosta, yksi niistä on paras} \ end {array} $$
Ja jatka sitten samojen todennäköisyysmallien määrittämistä (samat parametrit, samat tiedot, samat likiarvot jne.), saan saman BIC-arvojoukon. Ainoastaan liittämällä jonkinlainen ainutlaatuinen merkitys loogiseen kirjaimeen "M" ihminen vetää epäolennaisiin kysymyksiin "todellisesta mallista" ("todellisen uskonnon" kaiut). Ainoa asia, joka "määrittelee" M: n, ovat matemaattiset yhtälöt, jotka käyttävät sitä laskelmissaan - ja tuskin koskaan erotetaan yhtä ja yhtä määritelmää. Voisin yhtä lailla esittää ennusteen M: stä ("i: n malli antaa parhaat ennusteet"). En henkilökohtaisesti näe, miten tämä muuttaisi todennäköisyyksiä ja siten kuinka hyvä tai huono BIC tulee olemaan (AIC myös tässä asiassa - vaikka AIC perustuu eri johdokseen)
Ja lisäksi , mikä on vialla lauseessa Jos todellinen malli on harkitsemassani joukossa, on 57% todennäköisyys, että se on malli B . Näyttää tarpeeksi järkevältä minulle, tai voit käyttää "pehmeämpää" versiota on 57% todennäköistä, että malli B on paras harkittavasta joukosta
Viimeinen kommentti: Luulen, että löydät niin paljon mielipiteitä AIC / BIC: stä kuin on ihmisiä, jotka tietävät niistä.