Suurel määral saate teha kõike, mis teile meeldib tingimusel, et teil on juhuslikult piisavalt andmeid, et testida säilitatud andmete põhjal mis tahes mudelit, mille välja mõtlete. 50% jagamine võib olla hea mõte. Jah, sa kaotad teatud võime suhteid avastada, kuid see, mida saad, on tohutu; nimelt võime oma teost paljundada enne selle avaldamist. Pole tähtis, kui keerulised on statistilised võtted, mida te kasutate, olete šokeeritud, kui paljud "olulised" ennustajad kinnitusandmetele rakendatuna on täiesti kasutud.
Pidage ka seda meeles " asjakohane "ennustamiseks tähendab rohkem kui madalat p-väärtust. Lõppude lõpuks tähendab see ainult seda, et tõenäoliselt pole selles konkreetses andmekogumis leitud seos juhus. Ennustamiseks on tegelikult olulisem leida muutujad, millel on prognoosimõõdule oluline mõju (ilma mudeli üle sobitamata); see tähendab, et leida muutujad, mis on tõenäoliselt "tõelised" ja kui need varieeruvad kogu mõistliku väärtuste vahemikus (mitte ainult need väärtused, mis võivad teie proovis esineda!), põhjustab ennustaja erinevad märkimisväärselt. Kui teil on mudeli kinnitamiseks andmed olemas, võite olla mugavam ajutiselt säilitada marginaalselt "olulisi" muutujaid, millel ei pruugi olla madalat p-väärtust.
Nendel põhjustel (ja tuginedes chl-i heale vastusele) ), kuigi olen leidnud samm-sammulisi mudeleid, AIC-i võrdlusi ja Bonferroni parandusi üsna kasulikuks (eriti kui mängus on sadu või tuhandeid võimalikke ennustajaid), ei tohiks need olla ainsad määravad tegurid, millised muutujad teie mudelisse sisenevad. Ärge unustage ka teooria pakutavaid juhiseid: muutujates, millel on tugev teoreetiline põhjendus olla mudelis, tuleks tavaliselt hoida ka siis, kui need pole olulised, tingimusel, et need ei loo ebasobivaid võrrandeid ( nt , kollineaarsus).
NB : kui olete mudeli kallale asunud ja kinnitanud selle kasulikkust pidurdusandmetega, on hea kombineerida säilitatud andmed lõpliku hinnangu saamiseks väljapikendusandmetega. Seega pole midagi kadunud täpsuse osas, mille abil saate mudeli koefitsiente hinnata.