מהו הבדל-בהבדלים?

שְׁאֵלָה:

מהו הבדל-בהבדלים?

Graham Cookson

2010-07-23 21:57:50 UTC

view on stackexchange narkive permalink

ההבדל בהבדלים פופולרי זה מכבר ככלי שאינו ניסיוני, במיוחד בכלכלה. האם מישהו יכול בבקשה לספק תשובה ברורה ולא טכנית לשאלות הבאות בנוגע להבדל בהבדלים.

מהו אומדן ההבדל בהפרש?
מדוע ההבדל בין אומדן ההבדל כל שימוש?
האם אנו יכולים באמת לסמוך על אומדני ההבדל בהבדל?

האם מישהו יודע לאמוד את ההבדל ברגרסיה של ההבדל ב- gretl? האם עלי לעבוד עם OLS או נתוני פאנל?

@Pyca זה נשמע כמו שימוש לא הולם בתגובות שם. עליך לפרסם שאלה חדשה, בהתייחס לשאלה זו.

ארבע תשובות:

Andy

2014-11-24 19:27:26 UTC

view on stackexchange narkive permalink

מה ההבדל באומדן ההבדלים
ההבדל בהבדלים (DiD) הוא כלי לאמידת השפעות הטיפול בהשוואת ההבדלים לפני ואחרי הטיפול בתוצאות הטיפול ו קבוצת ביקורת. באופן כללי, אנו מעוניינים להעריך את השפעת הטיפול $ D_i $ (למשל מעמד האיחוד, תרופות וכו ') על התוצאה $ Y_i $ (למשל שכר, בריאות וכו') כמו ב- $$ Y_ {it} = \ alpha_i + \ lambda_t + \ rho D_ {it} + X '_ {it} \ beta + \ epsilon_ {it} $$ כאשר $ \ alpha_i $ הם השפעות קבועות בודדות (מאפיינים של אנשים שאינם משתנים לאורך זמן), $ \ lambda_t $ הם אפקטים קבועים בזמן, $ X_ {it} $ הם משתנים משתנים בזמן כמו גיל הפרט, ו $ \ epsilon_ {it} $ הוא מונח שגיאה. אנשים וזמן באינדקס של $ i $ ו- $ t $, בהתאמה. אם יש מתאם בין ההשפעות הקבועות ל- $ D_ {it} $, אזי אומדן רגרסיה זו באמצעות OLS יהיה מוטה בהתחשב בכך שלא נשלטים על ההשפעות הקבועות. זוהי הטיה משתנה שהושמטה.

כדי לראות את ההשפעה של טיפול נרצה לדעת מה ההבדל בין אדם בעולם בו היא קיבלה את הטיפול לבין אחד בו היא לא. כמובן שרק אחד מאלה נצפה אי פעם בפועל. לכן אנו מחפשים אנשים עם אותן מגמות טרום הטיפול בתוצאה. נניח שיש לנו שתי תקופות $ t = 1, 2 $ ושתי קבוצות $ s = A, B $. ואז, בהנחה שהמגמות בקבוצות הטיפול והבקרה היו נמשכות באותה צורה כמו בעבר בהיעדר טיפול, אנו יכולים לאמוד את השפעת הטיפול כ $$ \ rho = (E [Y_ {ist} | s = A, t = 2] - E [Y_ {ist} | s = A, t = 1]) - (E [Y_ {ist} | s = B, t = 2] - E [Y_ {ist} | s = B, t = 1]) $$

מבחינה גרפית זה ייראה בערך כך: enter image description here

אתה יכול פשוט לחשב אמצעים אלה ביד, כלומר להשיג את התוצאה הממוצעת של הקבוצה $ A $ בשתי התקופות ולקחת את ההפרש שלהם. לאחר מכן השג את התוצאה הממוצעת של הקבוצה $ B $ בשתי התקופות וקח את ההבדל. ואז קח את ההבדל בהבדלים וזה אפקט הטיפול. עם זאת, יותר נוח לעשות זאת במסגרת רגרסיה מכיוון שהדבר מאפשר לך

לשלוט עבור משתנים
להשיג שגיאות סטנדרטיות לאפקט הטיפול כדי לראות אם זה הוא משמעותי

לשם כך, תוכל לעקוב אחר אחת משתי אסטרטגיות שוות ערך. צור דמה של קבוצת בקרה $ \ text {treat} _i $ ששווה ל- 1 אם אדם נמצא בקבוצה $ A $ ו- 0 אחרת, צור דמה של זמן $ \ text {time} _t $ ששווה ל- 1 אם $ t = 2 $ ו- 0 אחרת, ואז נסיג $$ Y_ {it} = \ beta_1 + \ beta_2 (\ text {treat} _i) + \ beta_3 (\ text {time} _t) + \ rho (\ text {treat } _i \ cdot \ text {time} _t) + \ epsilon_ {it} $$

או שאתה פשוט מייצר דמה $ T_ {it} $ ששווה לאחד אם אדם נמצא בקבוצת הטיפול AND פרק הזמן הוא התקופה שלאחר הטיפול והיא אחרת אפסית. אז היית רגרסיבי $$ Y_ {it} = \ beta_1 \ gamma_s + \ beta_2 \ lambda_t + \ rho T_ {it} + \ epsilon_ {it} $$

איפה $ \ gamma_s $ הוא שוב דמה עבור קבוצת הבקרה ו- $ \ lambda_t $ הם בובות זמן. שתי הרגרסיות נותנות לך את אותן התוצאות במשך שתי תקופות ושתי קבוצות. המשוואה השנייה היא כללית יותר, כיוון שהיא משתרעת בקלות למספר קבוצות ותקופות זמן. בשני המקרים, כך תוכלו להעריך את ההבדל בפרמטר ההבדלים באופן כזה שתוכלו לכלול משתני בקרה (השארתי אותם מחוץ למשוואות לעיל כדי לא להעמיס עליהם אך תוכלו פשוט לכלול אותם) ולקבל שגיאות סטנדרטיות. להסקה.

מדוע ההבדל באומדן ההבדלים שימושי?
כאמור, DiD היא שיטה לאמידת השפעות הטיפול בעזרת נתונים שאינם ניסיוניים. זו התכונה הכי שימושית. DiD היא גם גרסה של אומדן השפעות קבועות. בעוד שמודל האפקטים הקבועים מניח $ E (Y_ {0it} | i, t) = \ alpha_i + \ lambda_t $, DiD מניח הנחה דומה אך ברמה הקבוצתית, $ E (Y_ {0it} | s, t) = \ gamma_s + \ lambda_t $. אז הערך הצפוי של התוצאה כאן הוא סכום של קבוצה ואפקט זמן. אז מה ההבדל? עבור DiD אתה לא בהכרח זקוק לנתוני פאנל כל עוד חתכים חוזרים ונמשכים מאותה יחידה מצטברת $ s $. זה הופך את DiD ליישומי על מערך נתונים רחב יותר ממודלים רגילים של אפקטים קבועים הדורשים נתוני פאנל.

האם אנו יכולים לסמוך על הבדל בהבדלים?
ההנחה החשובה ביותר ב- DiD היא הנחת המגמות המקבילות (ראה איור לעיל). לעולם אל תסמכו על מחקר שאינו מראה גרפית את המגמות הללו! מאמרים בשנות התשעים אולי הסתלקו עם זה, אך כיום ההבנה שלנו לגבי DiD טובה בהרבה. אם אין גרף משכנע המראה את המגמות המקבילות בתוצאות לפני הטיפול בקבוצות הטיפול ובקרת הביקורת, היזהר. אם הנחת המגמות המקבילות מתקיימת ואנחנו יכולים לשלול באופן מהימן כל שינוי אחר במשתנה זמן שעשוי לבלבל את הטיפול, אז די היא שיטה אמינה.

יש לנקוט מילת זהירות נוספת בכל הנוגע ל טיפול בשגיאות סטנדרטיות. עם הרבה שנים של נתונים אתה צריך להתאים את השגיאות הסטנדרטיות להתאמה אוטומטית. בעבר זה הוזנח אך מאז ש Bertrand et al. (2004) "עד כמה עלינו לסמוך על אומדני הבדלים-בהבדלים?" אנו יודעים שמדובר בנושא. בעיתון הם מספקים כמה תרופות להתמודדות עם התאמה אוטומטית. הקלה ביותר היא להתקבץ על מזהה הלוח האישי המאפשר מתאם שרירותי של השאריות בין סדרות זמן בודדות. זה מתקן הן להתאמה אוטומטית והן להטרוסדקטיות.

לעיון נוסף ראו הערות הרצאות אלה מאת Waldinger ו- Pischke.

Stephen Turner

2010-07-24 01:42:43 UTC

view on stackexchange narkive permalink

לויקיפדיה יש ערך הגון בנושא זה, אבל מדוע לא להשתמש רק ברגרסיה לינארית המאפשרת אינטראקציה בין המשתנים העצמאיים שלך שמעניינים אותך? זה נראה לי פרשני יותר. אז תוכלו לקרוא על ניתוח מדרונות פשוטים (בספר כהן ואח 'בחינם ב- Google ספרים) אם משתני העניין שלכם הם כמותיים.

Carlos Dutra

2016-02-14 09:07:54 UTC

view on stackexchange narkive permalink

זוהי טכניקה שנמצאת בשימוש נרחב באקונומטריקה כדי לבחון את ההשפעה של כל אירוע אקסוגני בסדרת זמן. אתה בוחר שתי קבוצות נתונים נפרדות הנוגעות לאירוע שנלמד ואחריו. התייחסות טובה למידע נוסף היא הספר מבוא לאקונומטריקה מאת וולדריג '.

כתשובה לא תמציתית תמציתית זו משלימה לתשובתו של אנדי, אבל אני לא חושב שהיא מכסה "האם אנחנו יכולים באמת לסמוך על אומדני הבדל בהבדל?"

New in Here

2018-11-17 03:59:44 UTC

view on stackexchange narkive permalink

זהיר:

ראוי לשים לב לשתי נקודות נוספות. ראשית, ל- 80 מתוך 92 המאמרים המקוריים DD יש בעיה פוטנציאלית במונחי שגיאה מקובצים מכיוון שיחידת התצפית מפורטת יותר מרמת השונות (נקודה שנדונה על ידי דונלד ולנג [2001]). רק 36 מהמאמרים הללו מטפלים בבעיה זו, על ידי אשכול שגיאות סטנדרטיות או על ידי צבירת הנתונים. שנית, נעשה שימוש במספר טכניקות (באופן פחות או יותר בלתי פורמלי) להתמודדות עם האנדוגניות האפשרית של משתנה ההתערבות. לדוגמא, שלושה מאמרים כוללים משתנה תלוי בפיגור במשוואה (1), שבעה כוללים מגמת זמן ספציפית למצבים המטופלים, חמישה עשר מתווים כמה גרפים לבחינת הדינמיקה של אפקט הטיפול, שלושה בוחנים אם יש "אפקט" לפני החוק, שניים בודקים אם ההשפעה מתמשכת, ואחד עשר מנסים באופן רשמי לעשות הבדלים משולשים (DDD) על ידי מציאת קבוצת ביקורת אחרת. ב- Bertrand, Duflo, and Mullainathan [2002] אנו מראים שרוב הטכניקות הללו אינן מקלות על בעיות המתאם הסדרתי.

(Bertrand, Duflo, and Mullainathan 2004, 253)

ⓘ

שאלה ותשובה זו תורגמה אוטומטית מהשפה האנגלית.התוכן המקורי זמין ב- stackexchange, ואנו מודים לו על רישיון cc by-sa 2.0 עליו הוא מופץ.

about - legalese