Het antwoord hangt ervan af of u te maken heeft met discrete of continue willekeurige variabelen. Dus ik zal mijn antwoord dienovereenkomstig splitsen. Ik ga ervan uit dat je technische details wilt en niet per se een uitleg in gewoon Engels.
Discrete willekeurige variabelen
Stel dat je een stochastisch proces hebt dat neemt discrete waarden (bijv. resultaten van 10 keer opgooien van een munt, aantal klanten dat binnen 10 minuten in een winkel arriveert, enz.). In dergelijke gevallen kunnen we de waarschijnlijkheid berekenen van het observeren van een bepaalde reeks uitkomsten door geschikte aannames te doen over het onderliggende stochastische proces (de kans op landingskoppen van munten is bijvoorbeeld $ p $ span > en dat het opgooien van munten onafhankelijk is).
Geef de waargenomen resultaten aan door $ O $ en de set parameters die het stochastische proces beschrijven als $ \ theta $ . Als we het dus over waarschijnlijkheid hebben, willen we $ P (O | \ theta) $ berekenen. Met andere woorden, gegeven specifieke waarden voor $ \ theta $ , $ P (O | \ theta) $ is de kans dat we de resultaten zouden observeren die worden weergegeven door $ O $ .
Wanneer we echter een echt stochastisch proces modelleren, weten we vaak $ \ theta $ niet. We observeren eenvoudig $ O $ en het doel is dan om tot een schatting te komen voor $ \ theta $ dat zou een plausibele keuze zijn gezien de waargenomen resultaten $ O $ . We weten dat gegeven een waarde van $ \ theta $ de kans om $ O $ te observeren $ P (O | \ theta) $ . Een 'natuurlijk' schattingsproces is dus om die waarde van $ \ theta $ te kiezen die de kans maximaliseert dat we $ O $ . Met andere woorden, we vinden de parameterwaarden $ \ theta $ die de volgende functie maximaliseren:
$ L (\ theta | O) = P (O | \ theta) $
$ L (\ theta | O) $ span > heet de waarschijnlijkheidsfunctie. Merk op dat de waarschijnlijkheidsfunctie per definitie afhankelijk is van de waargenomen $ O $ en dat het een functie is van de onbekende parameters $ \ theta $ .
Continue willekeurige variabelen
In het continue geval is de situatie vergelijkbaar met één belangrijk verschil. We kunnen niet langer praten over de waarschijnlijkheid die we hebben waargenomen $ O $ gegeven $ \ theta $ omdat in de doorlopend hoofdlettergebruik $ P (O | \ theta) = 0 $ . Zonder in technische details in te gaan, is het basisidee als volgt:
Geef de kansdichtheidsfunctie (pdf) aan die is gekoppeld aan de resultaten $ O $ als: $ f (O | \ theta) $ . Dus in het continue geval schatten we $ \ theta $ gegeven waargenomen resultaten $ O $ door het volgende te maximaliseren functie:
$ L (\ theta | O) = f (O | \ theta) $
In deze situatie , kunnen we technisch niet beweren dat we de parameterwaarde vinden die de kans maximaliseert dat we $ O $ waarnemen terwijl we de PDF maximaliseren die is gekoppeld aan de waargenomen resultaten $ O $ .