אם מבחן t ו- ANOVA לשתי קבוצות שוות ערך, מדוע ההנחות שלהם אינן שוות ערך?

Rob Hyndman

2010-08-13 14:52:45 UTC

view on stackexchange narkive permalink

מבחן t עם שתי קבוצות מניח שכל קבוצה מופצת באופן נורמלי עם אותה שונות (אם כי האמצעים עשויים להיות שונים בהשערה החלופית). זה שווה ערך לרגרסיה עם משתנה דמה שכן הרגרסיה מאפשרת לממוצע של כל קבוצה להיות שונה אך לא לשונות. מכאן שהשאריות (שוות לנתונים עם אמצעי הפחתה של הקבוצה) הן בעלות אותה התפלגות --- כלומר, הם מופצים בדרך כלל עם ממוצע אפס.

מבחן t עם שונות לא שווה אינו שווה ערך ANOVA חד כיווני.

אני יכול לחפש ציטוט, אבל זה מספיק קל לבדיקה אמפירית. F מ- ANOVA עם שתי קבוצות שווה בדיוק ל- t ^ 2 וערכי ה- p יהיו זהים לחלוטין. הסיבה היחידה שזה לא יהיה שווה ערך במקרה של שונות לא שוויונית היא אם אתה מיישם תיקון. אחרת, הם זהים.

מבחן F הוא הכללה של מבחן t. בדיקת t מיועדת להשוואה של 2 טיפולים ובדיקת F מיועדת למספר טיפולים. הגזירה היא בתכנון הסטטיסטי של קאסלה, פרקים 3 ו- 4. עם זאת, כפי שמציין פרופ 'הינדמן, עם שונות לא שווה, זה כבר לא מבחן t. זו הבעיה של פישר בהרן. בדרך כלל איננו משתמשים בפתרון של פישר, אלא משתמשים במבחן וולש או בגישה בייסיאנית.

מבחן t של שני דגימות עם שונות לא שווה אכן שווה ל- ANOVA חד כיווני עם שתי קבוצות.אולי למה שהתכוונת היה שבדיקת t באמצעות תיקון להבדלים לא שוויוניים (כלומר Welch) אינה זהה ל- ANOVA חד כיווני שאינו מתוקן (אם כי מדוע שיהיה)?

Brett

2010-08-13 20:24:20 UTC

view on stackexchange narkive permalink

מבחן t פשוט מקרה מיוחד של מבחן F בו משווים בין שתי קבוצות. התוצאה של כל אחת מהן תהיה זהה מבחינת ערך ה- p ויש קשר פשוט גם בין הסטטיסטיקה F ל- t. F = t ^ 2. שני המבחנים הם שקולים מבחינה אלגברית והנחותיהם זהות.

למעשה, שקילות אלו משתרעות על כל סוג ANOVAs, מבחני t ומודלים של רגרסיה ליניארית. מבחן t הוא מקרה מיוחד של ANOVA. ANOVA הוא מקרה מיוחד של רגרסיה. כל ההליכים הללו מתבצעים תחת המודל הליניארי הכללי וחולקים אותן הנחות יסוד.

עצמאות תצפיות.
נורמליות של שאריות = נורמליות בכל קבוצה במקרה המיוחד. .
שווה לשונות של שאריות = שונות שווה בין קבוצות במקרה המיוחד.

אתה עשוי לחשוב על זה כנורמליות בנתונים, אך אתה בודק נורמליות בכל קבוצה - שהיא למעשה זהה לבדיקת תקינות בשאריות כאשר המנבא היחיד במודל הוא אינדיקטור לקבוצה. כמו כן בשונות שווה.

בדיוק כמו בצד, ל- R אין שגרות נפרדות ל- ANOVA. פונקציות האנובה ב- R הן רק עטיפות לפונקציה lm () - אותו הדבר המשמש להתאמה למודלים של רגרסיה לינארית - ארוזות קצת אחרת כדי לספק את מה שנמצא בדרך כלל בסיכום ANOVA ולא בסיכום רגרסיה. / p>

היה מעוניין לדעת כיצד להתאים מודלים חוזרים ונשנים של מודלים ANOVA באמצעות lm.

הסוגיות של קידוד משתנים קטגוריים, שוויון בין רגרסיה למודלים של ANOVA, וקידוד רגרסיה למדידות חוזרות ונשנות מתוארות במאמר זה. http://dionysus.psych.wisc.edu/Lit/Topics/Statistics/Contrasts/Wendorf2004a.pdf הנה הציטוט ... Wendorf, C. A. (2004). פריימר על קידוד רגרסיה מרובה: צורות נפוצות והמקרה הנוסף של ניגודים חוזרים. הבנת הסטטיסטיקה 3, 47-57.

@AndyF לא `lm ()`, אלא אם כן אתה עובר למודלים מעורבים עם החבילה `nlme` או` lme4`, אך יש דרך שימושית להתמודד עם מדידות חוזרות באמצעות מפרט מתאים של המונח `שגיאה 'ב- aov () `, ראה פרטים נוספים על הדרכת Baron & Li, §6.9, http://j.mp/c5ME4u

@AndyF `aov ()` בנוי על גבי הפונקציה `lm ()` אך כולל טיעון נוסף, הנקרא מונחים * מיוחדים *, כמו 'שגיאה'.

aov () הוא פשוט עטיפה ל- lm (). זה עושה קידוד ניגודיות מאחורי הקלעים ומארז את התוצאה בסגנון ANOVA. כל זה מעוצב על ידי lm (). במאמר שהזכרתי לעיל הוא אומר לך כיצד להגדיר קידוד כדי לעשות ניגודים חוזרים במודלים של רגרסיה, כולל lm ().

"למעשה, המקבילות הללו משתרעות על כל סוגי ANOVAs, מבחני ה- t והמודלים של רגרסיה ליניארית. ה- t-test הוא מקרה מיוחד של ANOVA. ANOVA הוא מקרה מיוחד של רגרסיה.מודל לינארי כללי ושיתוף אותן הנחות יסוד. "סיכום נהדר.אז ANOVA הוא מקרה כללי יותר כשרק יש לנו יותר משתי קבוצות.

Henrik

2010-08-13 17:24:12 UTC

view on stackexchange narkive permalink

אני מסכים לחלוטין עם התשובה של רוב, אבל תן לי לומר זאת אחרת (באמצעות ויקיפדיה):

הנחות ANOVA:

עצמאות מקרים - זו הנחה של המודל שמפשט את הניתוח הסטטיסטי.
נורמליות - התפלגויות השאריות הן נורמליות.
שוויון (או "הומוגניות") של שונות נקרא homoscedasticity

מבחן הנחות מבחן:

כל אחת משתי האוכלוסיות בהשוואה צריכה לבצע התפלגות נורמלית ...
... שתי האוכלוסיות בהשוואה צריכות להיות באותה שונות ...
יש לדגום את הנתונים המשמשים לביצוע הבדיקה באופן עצמאי משתי האוכלוסיות בהשוואה. / li>

לפיכך, הייתי מפריך את השאלה, מכיוון שברור שיש להן אותן הנחות (אם כי בסדר אחר :-)).

ראה תגובה לרוב.

@Alexis אני לא בטוח שאני מבין את ההצבעה שלך למטה. דאג לפרט.

הנחת הבדיקה * t * השנייה אינה נכונה. עבודתו המקורית של התלמיד הניחה זאת, אך "שונות לא שוויונית" היא הנחה נפוצה מספיק בטיפול מאוחר יותר במבחן.

dsimcha

2011-02-04 07:30:00 UTC

view on stackexchange narkive permalink

נקודה ברורה אחת שמתעלמים מכולם: עם ANOVA אתה בודק את האפס שהממוצע זהה ללא קשר לערכי המשתנים ההסבריים שלך. בעזרת T-Test תוכלו גם לבדוק את המקרה החד-צדדי, שהממוצע גדול במיוחד בהתחשב בערך אחד של המשתנה ההסבר שלכם בהשוואה לאחר.

אלא אם כן אני טועה, זה לא הבדל.אם אתה מבצע ANOVA בשתי קבוצות, אתה יכול לעשות "מבחן חד צדדי" בדיוק כמו שאתה יכול לעשות במבחן t.שמתי "מבחן חד-צדדי" במרכאות כי למעשה אין הבדל ב"מבחן "בין" מבחן חד-צדדי "לבין" מבחן דו-צדדי ".ההבדל היחיד הוא כיצד אתה מפרש את המשמעות הסטטיסטית של ערכי ה- p.אז ה"מבחנים "החד-צדדיים לעומת הדו-צדדיים הם בדיוק אותו" המבחן ".רק הדרך לפרש נכון את התוצאות היא שונה.

syed

2013-01-08 21:26:46 UTC

view on stackexchange narkive permalink

אני מעדיף להשתמש במבחן t להשוואה בין שתי קבוצות ואשתמש ב- ANOVA ליותר משתי קבוצות, בגלל סיבות. סיבה חשובה היא הנחת השונות השווה.

ברוך הבא לאתר, @syed. אכפת לך להרחיב על תשובתך? לדוגמא, לאילו "סיבות" אתה מתייחס? שים לב כי * שניהם * מבחן t ו- ANOVA מניחים שונות שווה.

אכפת לך להבהיר את ההיגיון שלך?לא יכולתי לעקוב אחרי זה.