KORT ANTWOORD: de gemiddelde leeftijd is niet gewoon beter dan de gemiddelde leeftijd; het is je misschien opgevallen dat meer mensen het gebruiken. Een betere vraag zou dus kunnen zijn: "Waarom zouden meer demografen de gemiddelde leeftijd gebruiken dan de gemiddelde leeftijd?"
Een statistiek, als een vocabulaire, vindt zijn oorsprong in de staat (nominaal een juridische entiteit) die probeert de menselijke populatie te begrijpen. Denk dus aan de mensen in die regeringen en hoeveel informatie ze willen of nodig hebben, en hoeveel tijd ze moeten besteden aan het begrijpen van de precieze wiskundige betekenis van wetenschappelijke woorden.
De gemakkelijkste manier om veel gegevens op te sommen, zonder een afbeelding te gebruiken, is door een enkel getal te rapporteren; dit staat bekend als een schatter voor de parameter in kwestie (in deze kooi de tijd die verstreken is sinds de geboorte van een mens, precies op het niveau van jaren). Een verzameling. Jaynes toonde in zijn boek Probability Theory: The Logic of Science dat men ervoor zou kunnen kiezen om een schatter te construeren op basis van een utilitaire verliesfunctie, die de consequenties samenvat van het maken van een fout op basis van het gebruik van een enkel getal in plaats van een geheel dataset bij het nemen van beslissingen op basis van die informatie.
In Jaynes 'boek laat hij met wiskundig bewijs zien dat de modus, of de maximale waarschijnlijkheidsschatter, de schatter is die het verlies minimaliseert in de vorm van een Dirac-deltafunctie. Het gemiddelde minimaliseert kwadratische verliesfuncties, zodat hoe verder men van de schatting komt, de hoeveelheid verlies (ongewenst gevolg) zeer snel stijgt zodra u de eenheidsschaal passeert.
De mediaan daarentegen minimaliseert een verliesfunctie in de vorm van een omgekeerde driehoek, zodat het slechts vijf keer minder wenselijk is om één eenheid van precisie af te wijken in plaats van 25 keer (zoals in het geval de betekenis). In feite maakt de eenheid van precisie helemaal geen verschil, omdat er geen kromming is in zo'n driehoekige puntige verliesfunctie.
Met deze theoretische basis zou men letterlijk verliesfuncties kunnen tekenen die helemaal niet symmetrisch zijn en een oneindig aantal nieuwe schatters kunnen vormen die op maat zijn gemaakt voor de behoeften van hun consumenten / gebruikers. Een ander alternatief voor het omgaan met de culturele verwachting van een enkel nummer is om diezelfde gebruikers / consumenten van informatie te leren dat een maatstaf voor centrale tendens meer informatie kan opleveren in combinatie met andere parameters van een distributie, zoals variantie, scheefheid en kurtosis ( wil misschien beginnen met alleen variantie en scheefheid om ze erin te vergemakkelijken.
De variantie is slechts één voorbeeld van een spreidingsmaatstaf; een andere die Jaynes suggereert (in andere geschriften) is om een Bayesiaanse posterieure verdeling te vormen en de breedte te berekenen van het kortste geloofwaardige interval met waarde 0,5 (of betrouwbaarheidsinterval / standaarddeviatie enz. als je de Bayesiaanse theorie niet aanvaardt - laten we alsjeblieft niet krijgen op een zijspoor). Een meer intuïtieve methode die mogelijk voor meer mensen gemakkelijker te begrijpen is, zou het interkwartielbereik zijn, vooral wanneer gerapporteerd met de mediaan als de overeenkomstige maat voor centrale tendens.
Ik weet niet zeker of er een niet-parametrische vorm van skew of kurtosis is, maar als ze bestaan, zullen ze vrijwel zeker gemakkelijker te begrijpen zijn dan deze parametrische analogen. Ik heb het vermoeden dat een belangrijke, zo niet dominante, deel van de reden waarom mediane leeftijd vaker opduikt dan gemiddelde leeftijd, is omdat het gewoon meer aantrekkelijk is voor mensen met minder tijd of met minder behoefte om in te gaan op theoretische details over zaken als sigma-algebra's, Lebesgue maattheorie, enz. Die allemaal technisch noodzakelijk zijn om de meer algemene grondslagen van probabilistisch redeneren te begrijpen.