איך לעצבן שופט סטטיסטי?

onestop

2010-10-21 00:28:41 UTC

view on stackexchange narkive permalink

מה שמרגיז במיוחד את אותי באופן אישי הוא אנשים שהשתמשו בבירור בחבילות שנכתבו על ידי משתמשים לתוכנות סטטיסטיות אך אינם מצטטים אותן כראוי, או בכלל, ובכך לא נותנים שום אשראי למחברים. פעולה זו חשובה במיוחד כאשר הכותבים נמצאים באקדמיה ועבודתם תלויה בפרסום מאמרים שמצטטים . (אולי עלי להוסיף שבתחומי, רבים מהאשמים אינם סטטיסטיקאים.)

+1 בשבילי. זה מתסכל אותי, במיוחד כאשר הם מצטטים את הדבר הלא נכון וסיפקתי את הפרטים הרלוונטיים לגבי ציטוט החבילות

שאלה: האם כשאתה מצטט חבילה האם אתה מצטט את הווינייט (אם קיימת) או את החבילה עצמה?

@Brandon: אם מחבר החבילה דואג מספיק להדריך אותך, אז הם נתנו את התשובה בצורה שתאסוף על ידי ציטוט ("קצת_חבילה")

מלבד שיש נייר ציון דרך, וזה לא כל כך קל לעשות, הדרך הקלה ביותר לקבל ציטוטים היא להשאיר לפחות שגיאה אחת בעיתון שלך.אז אתה יכול לפרסם תיקון, שמצטט את העיתון המקורי.השאירו שגיאה בתיקון ותוכלו לפרסם תיקון המתייחס לתיקון המקורי ולעיתון המקורי (ראיתי דבר כזה תלמיד כיתה א ').מספר הציטוטים גדל כתהליך O (N ^ 2), כאשר N הוא מספר התיקונים.

Stephan Kolassa

2010-10-21 00:29:30 UTC

view on stackexchange narkive permalink

אלוהים לי, כל כך הרבה דברים עולים בראש ...

רגרסיה בשלבים
פיצול נתונים רציפים קבוצות intog
מתן ערכי p אך אין מידה של גודל ההשפעה
תיאור נתונים תוך שימוש בממוצע ובסטיית התקן מבלי לציין אם הנתונים הם סימטריים פחות או פחות לא מודלים
דמויות ללא כיתובים ברורים (האם זה שגיאות המוטעות שגיאות תקן של הממוצע, או סטיות תקן בתוך קבוצות, או מה?)

אני קצת סקרן לגבי כדור הרגרסיה המדרגות. מה הופך את הרגרסיה בשלבים לרעה כל כך? האם נושא חפירת הנתונים והשוואות מרובות?

הבעיה היא שפרוצדורות בשלבים מבטלות לחלוטין את כל ההנחות והתנאים המוקדמים לסטטיסטיקה מסקנת "רגילה" המבוססת על ערכי p, שאז מוטים בצורה גרועה (כלפי מטה להיות "משמעותיים יותר"). אז בעצם, התשובה היא "כן", עם האזהרה שבאופן עקרוני אפשר לתקן עבור כל ההשוואות המרובות הללו (אך שמעולם לא ראיתי שהן עושות). אני מאמין בתוקף שזו הסיבה החשובה היחידה שבגללה אני רואה כל כך הרבה מחקרים בפסיכולוגיה שלא ניתן לשכפל אותם - מה שמוביל בתורו לבזבוז אדיר של משאבים.

@Stephan: אני מסכים, צעד אחר צעד זה רעיון רע. אמנם, אמנם אמנם עדיין לא הגיעו לשיטות פסיכולוגיות, אך ישנם מגוון הליכי בחירה המתאימים להטיות הקשורות להתאמת יתר על ידי התאמת אומדנים ושגיאות סטנדרטיות. זה בדרך כלל לא נחשב לנושא של השוואות מרובות. הם ידועים כשיטות הצטמקות. ראו את תגובתי בשרשור זה אסטרטגיות "או טיבשיראני על הלאסו.

@Brett Magill: +1 על זה, וכן, אני יודע על הצטמקות והלאסו. עכשיו כל מה שאני צריך הוא דרך כלשהי לשכנע פסיכולוגים שאלו הגיוניים ... אבל אנשים נלחמים בהצלחה מוגבלת מאוד רק כדי לגרום לפסיכולוגים לדווח על מרווחי אמון, אז אני לא אופטימי מדי לגבי התכווצות הפסיכולוגים בתקופה הבאה עשרים שנה.

אני גם טוען שבפסיכולוגיה חיזוי מקסימלי אינו בדרך כלל המטרה התיאורטית, אולם רגרסיה מדרגתית נוגעת למקסום חיזוי, אם כי בצורה מעין-חדה. לפיכך, בדרך כלל יש נתק בין הליך לשאלה.

אנשים נוטים לפרש בצורה שגויה את תוצאות הרגרסיה בשלבים כמתן את מערך המנבאים הטוב ביותר לתוצאה, כאשר במציאות מה שהוא נותן הוא, במקרה הטוב, כמה מנבאים טובים.

+1 לערכי p אך ללא גודל אפקט. @rolando2 זה לא רק ברגרסיה מדרגתית, אבל זו אכן בעיה, ומעוררת בעיה.

אני חושב שהנקודה שלך לגבי דיכוטומיזציה של משתנים רציפים (תלויים או בלתי תלויים) היא התסכול הגדול ביותר שיש לי כמבקר סטטיסטי למאמרים רפואיים. דבר נוסף הוא ההתעקשות על המחברים לבזבז מקום במאמר המציג אומדנים לא מותאמים כאשר האומדנים המשמעותיים יותר הם מותאמים (למשל, מותאמים למשתנים משתנים).

onestop

2010-10-21 00:13:42 UTC

view on stackexchange narkive permalink

אירן סטרטון והקולגה פרסמו מאמר קצר על שאלה הדוקה:

Stratton IM, Neil A. כיצד להבטיח שמאמרך נדחה על ידי הסוקר הסטטיסטי. רפואה לסוכרת 2005; 22 (4): 371-373.

הקישור נשבר.

https://onlinelibrary.wiley.com/doi/full/10.1111/j.1464-5491.2004.01443.x

user603

2010-10-21 00:41:33 UTC

view on stackexchange narkive permalink

הקוד שאינו משמש להפקת התוצאות המדומות אינו מסופק. לאחר שביקש את הקוד, הוא דורש עבודה נוספת בכדי להריץ אותו על מערך נתונים שנוצר על ידי שופט.

והוא מעוצב בצורה גרועה, אינו מוגדר ומשתמש בשמות משתנים ופונקציות שאינם ניתנים לפענוח. אוווו כן.

chl

2010-10-21 01:23:39 UTC

view on stackexchange narkive permalink

פלגיאט (תיאורטי או מתודולוגי). הסקירה הראשונה שלי אכן נכתבה עבור מאמר המגלה העתק / הדבקה רבים ללא הפניה ממאמר מתודולוגי מבוסס היטב שפורסם לפני 10 שנים.

רק מצאתי כמה מאמרים מעניינים בנושא זה: מחבר ופלגיאט במדע.

באותו אופן, אני מוצא ש זיוף (של נתונים או תוצאות) הגרוע מכולם.

מזכיר לי שבימים הראשונים שלי כשופט הקדשתי * הרבה יותר מדי זמן לבדיקת מאמר סטטיסטי שנדחה בסופו של דבר על ידי אותו כתב עת, אך שאר השופטים והצענו יישום שימושי יותר לשיטה, ושרטטתי גם הוכחה אלגברית להחלפת מחקר סימולציה לא מספק בכתב היד. המחברים קיבלו מאז שני מאמרים שפורסמו. אני לא * מתעצבן * מכך, אבל הכרה דוגמת "אנו מודים לשופטים של גרסה קודמת של העיתון על הערות מועילות" הייתה נימוסים טובים.

@onestop כן, אני יכול לדמיין כמה מצב כזה יכול להיות מאכזב ...

לפני מספר שבועות קיבלתי מאמר לסקירה וגיליתי ש 85% ממנו פורסמו בכתב עת אחר ... על ידי אותם מחברים. גם זה עדיין נחשב כפלגיאט. במשך השנים האחרונות הגשתי באופן שגרתי נתחי מאמרים - במיוחד תקצירים, הקדמות ומסקנות - למנועי חיפוש באינטרנט * לפני * שביצעתי ביקורת כלשהי. אני רוצה להיות בטוח שהיצירה מקורית לפני שאשקיע זמן כלשהו בקריאה בה.

+1, @whuber. כעורך כתב עת מתודולוגי, לעתים קרובות יש לי את העבודה הקשה הזו להבין האם התרומה (ככלל, ממחברים מבוססים; המחברים הצעירים עוד לא כולם הגיעו למסלול זה) מצדיקה את הפרסום בהתחשב בכך שכל מה שהם ' סיימנו שהם הרכיבו מחדש באופן אחר את שמונה בלוקי הלגו שכללו את חמשת המאמרים הקודמים שלהם. זה גורם לי להטיל ספק בתרומה בחמישים המאמרים הקודמים שאותם פרסמו מחברים :(.

chl

2010-10-21 01:29:24 UTC

view on stackexchange narkive permalink

כשאנחנו מבקשים מהמחברים

הערה מינורית על רעיון שיש לנו (במובן זה, זה לא נחשב כסיבה לדחיית העיתון אלא רק כדי להיות בטוח שהמחברים מסוגלים לדון ב- POV אחר), או
תוצאות לא ברורות או סותרות,

ושמחברים לא ממש עונים במקרה (1) או שהתוצאות המפלילות מביאות ל 2) נעלמים מהטרשת הנפוצה.

תוצאות נעלמות באופן מסתורי צריכות להיות דחייה אוטומטית, imo. אני בטוח שזה קורה הרבה "מאחורי הקלעים" (כלומר לפני הגשת העיתון), אך זו עדות ברורה ל"קטיף דובדבן "שקוראים רגילים של העיתון לעולם לא ידעו.

סיבה נוספת למערכת ביקורות עמיתים פתוחה.

Andy W

2010-11-03 09:01:11 UTC

view on stackexchange narkive permalink

ערכי p ו- גודל האפקט מבלבלים (כלומר שההשפעה שלי גדולה כי יש לי ערך p ממש זעיר).

שונה במקצת מ התשובה של סטפן של אי הכללת האפקט גדלים אך נותנים ערכי p. אני מסכים שאתה צריך לתת את שניהם (ואני מקווה להבין את ההבדל!)

Peter Flom

2012-04-12 01:46:00 UTC

view on stackexchange narkive permalink

לא כולל גדלי אפקטים.

P- בכל רחבי המחקר (אני חייב לזכות את הפרופסור האהוב עלי בבית הספר לכיתה עבור אותה שורה).

מתן מספר מופרז של ספרות (גברים עלו 3.102019 קילו יותר מנקבות)

לא כולל מספרי עמודים (מה שמקשה על הסקירה)

מספרים וטבלאות שגויים

(כאמור - צעד אחר צעד וסיווג משתנים רציפים)

(+1) צחק בקול רם על "מתן מספר ספרות מופרך (גברים עלו 3.102019 קילו יותר מנקבות)".

anony

2010-10-21 03:55:13 UTC

view on stackexchange narkive permalink

כאשר הם לא מסבירים מספיק את הניתוח שלהם ו / או כוללים שגיאות פשוטות שמקשות על העבודה מה באמת נעשה. לרוב זה כולל השלכת ז'רגון רב, בדרך של הסבר, שהוא דו משמעי יותר מכפי שנראה שהמחבר מבין וייתכן שהוא מנוצל לרעה.

מסכים - המאבק להבין למה התכוונו המחברים לפני שאפילו הערכת התוכן המדעי הוא ממש מעצבן.

אני מסכים אבל אני מוצא את זה אפילו יותר מעצבן כאשר סוקר אומר לך להשמיט (או לעבור להחליף חומרים) מה הם, באופן מציאותי, פרטים מכריעים מאוד לגבי הניתוח. בעיה זו גורמת לכך שהרבה מאמרים מדעיים / מדעיים חברתיים שעושים אפילו את הניתוח המעט מסובך הם די סתומים בהקשר זה.

Michael Bishop

2011-05-21 21:04:11 UTC

view on stackexchange narkive permalink

שימוש בשפה סיבתית לתיאור אסוציאציות בנתוני תצפית כאשר משתנים שהושמטו הוא כמעט ודאי דאגה רצינית.

אני מסכים שחוקרים צריכים להבין את ההתחייבויות של עיצובי מחקר תצפיתיים, במיוחד אלה הקשורים למשתנים שהושמטו, אך אני לא חושב שהימנעות משפה סיבתית עושה זאת. ראה את עבודתו של הוברט בלוק, ובמיוחד את ספרו Cferal Inferences in Non-Experimental Research לקבלת טיעון מפורט יותר להגנה על השימוש בשפה סיבתית.

(+1) זו עשויה להיות הבעיה הגדולה ביותר שלי במחקר אפידמיולוגי.

StasK

2012-04-10 21:50:19 UTC

view on stackexchange narkive permalink

לבוא עם מילים חדשות עבור המושגים הקיימים, או להיפך, באמצעות המונחים הקיימים כדי לציין משהו אחר.

חלק מהפרשי המינוח הקיימים התיישבו זה מכבר בספרות: נתונים אורכיים בביוסטטיסטיקה לעומת נתוני פאנל באקונומטריה; מדדי סיבה ותוצאה בסוציולוגיה לעומת אינדיקטורים מעצבים ומשקפים בפסיכולוגיה; וכו 'אני עדיין שונא אותם, אבל לפחות אתה יכול למצוא כמה אלפי אזכורים לכל אחד מהם בספרות שלהם. האחרון הוא כל חוט העבודה הזה על גרפים אסיקליים מכוונים בספרות סיבתית: רוב, אם לא כל, תיאוריית הזיהוי וההערכה הללו פותחה על ידי האקונומטריסטים בשנות החמישים בשם משוואות בו זמנית. p>

המונח בעל משמעות כפולה, אם לא משולשת, הוא "חזק", והמשמעויות השונות לרוב סותרות. שגיאות תקן "חזקות" אינן חזקות עבור חריגים רחוקים; יתר על כן, הם אינם חסינים כנגד שום דבר פרט לסטייה המשוערת מהמודל, ולעתים קרובות הם בעלי ביצועי מדגם קטנים עגומים. השגיאות הסטנדרטיות של ווייט אינן חסינות כנגד מתאמים סדרתיים או אשכוליים; שגיאות תקן "חזקות" ב- SEM אינן חזקות כנגד מפרט שגוי של מבנה המודל (נתיבים או משתנים שהושמטו). בדיוק כמו עם הרעיון של בדיקת משמעות ההשערה האפסית, אי אפשר להפנות אצבע לאף אחד ולומר: "אתה אחראי לבלבל כמה דורות של חוקרים שטבעו את המושג הזה שלא באמת עומד בשמו". p>

אני חייב להודות בביצוע שני החטאים: אני מתאר את הנתונים שלי כ"בעלי מבנה היררכי: כשיש לי רמות עם יחסי 1: n (מדידות רבות של כל דגימה, דגימות מרובות לחולה). בשלב מסוים למדי בטעות למדתי שזה נקרא מבנה נתונים "מקובץ" - עכשיו אני משתמש בשני המונחים. אבל אני עדיין לא יודע איך יכולתי למצוא את המונח הזה, כן חיפשתי במפורש את המילה כדי לתאר את מבנה הנתונים שלי ... להפך: אני משתמש בטכניקות הנקראות סיווג רך בחישה מרחוק. התחום שלי (כימומטריה) משתמש בו עם משמעות שונה לגמרי.

זה בסדר גמור - אתה יכול להוסיף "רב-שכבתי" לרשימת הדרכים להתייחס גם למבנה זה. פירושו של "אשכולות" בדרך כלל הוא כי התצפיות ידועות בקורלציה, אך איש אינו דואג לדגם את המתאם מכיוון שהוא אינו מעניין בעיקר, ומרחיק שיטות חזקות למתאם כזה, כגון GEE. מה שיש לך הוא משהו כמו MANOVA. יש חבילת סטטה `gllamm` שחושבת על הנתונים שלך כנתונים רב-מישוריים / היררכיים, אך רוב החבילות האחרות יחשבו על מדידות מרובות כמשתנים / עמודות, ודגימות כתצפיות / שורות.

תודה על הקלט. ובכן, בימינו כמובן הייתי שואל כאן איך זה נקרא ... זה לא בדיוק מדידות חוזרות: בדרך כלל אני מודד מספר (סדר גודל: בין 10 ^ 2 ל 10 ^ 4) נקודות שונות על המדגם כדי לייצר מפות צבעוניות כוזבות של מרכיבים שונים, ולכל מדידה יש כבר 10 ^ 2 - 10 ^ 3 תצפיות (אורכי גל בספקטרום). בתוך כל דגימה, ספקטרומים רבים נמצאים בקורלציה גבוהה, אך לא כולם: הדגימות אינן הומוגניות. ...

... התיאור שלך של "אשכולות" נשמע מאוד כמו מה שאנחנו עושים. אבל אני כן דואג לפצל את הדגימות לצורך אימות, אומר שאין לי מושג לגבי גודל המדגם היעיל (מלבד זה לפחות מספר הדגימות האמיתיות המעורבות), ולפעמים מראה שיש את כל המדידות האלה של כל אחת מהן. מדגם למעשה עוזר לאימוני המודל.

נתונים מעניינים ומאתגרים, בוודאות.

Freya Harrison

2012-04-11 23:11:44 UTC

view on stackexchange narkive permalink

כאשר מחברים משתמשים במבחן הסטטיסטי היחיד שהם מכירים (בתחום שלי, בדרך כלל מבחן t או ANOVA), ad infinitum, ללא קשר לשאלה האם זה מתאים. לאחרונה סקרתי מאמר שבו הכותבים רצו להשוות בין תריסר קבוצות טיפול שונות, ולכן הם ערכו בדיקת דו-מדגמית לכל זוג טיפולים אפשרי ...

D L Dahly

2013-04-03 20:39:46 UTC

view on stackexchange narkive permalink

אפס שיקול של נתונים חסרים.

יישומים מעשיים רבים משתמשים בנתונים שיש להם לפחות כמה ערכים חסרים. זה בהחלט נכון מאוד באפידמיולוגיה. נתונים חסרים מציגים בעיות עבור שיטות סטטיסטיות רבות - כולל מודלים לינאריים. נתונים חסרים עם מודלים לינאריים מטופלים לעתים קרובות באמצעות מחיקת מקרים עם נתונים חסרים על משתנים כלשהם. זוהי בעיה, אלא אם כן חסרים נתונים מתוך הנחה כי נתונים חסרים לחלוטין באופן אקראי (MCAR).

אולי לפני 10 שנים, היה זה סביר לפרסם תוצאות ממודלים לינאריים ללא התחשבות נוספת בחסר. אני בהחלט אשם בזה. עם זאת, עצות טובות מאוד כיצד להתמודד עם נתונים חסרים עם זקיפה מרובה זמינה כעת באופן נרחב, כמו גם חבילות סטטיסטיות / מודלים / ספריות / וכו '. כדי להקל על ניתוחים מתאימים יותר בהנחות סבירות יותר כאשר קיים חסר.

ברוח הניסיון לחנך, האם תוכל להתרברב יותר? מה אתה מחשיב לשיקול - להודות בכך שהוא קיים או להתאים את הניתוח הסטטיסטי מולו (למשל זקיפה). במידת האפשר, אני מנסה לכלול ספקים טבלאות של ערכים חסרים של משתנים מעניינים, אך לא ברור אם זה מספיק ל"התחשבות "בהערה זו.

StatisticsDoc Consulting

2012-11-21 06:03:28 UTC

view on stackexchange narkive permalink

דיווח על השפעות ש"התקרבו למשמעות (עמ '< .10 למשל) ואז כתבו עליהן כאילו קיבלו משמעות ברמה מחמירה ומקובלת יותר. הפעלת מודלים של משוואות מבניות מרובות שלא היו מקוננות ואז כתבו עליהן כאילו הם מקוננים. לנקוט באסטרטגיה אנליטית מבוססת ולהציג אותה כאילו איש מעולם לא העלה על דעתה להשתמש בה לפני כן. אולי זה יכול להיחשב כפלגיאט עד תואר.

אולי זה ממציא מחדש את הגלגל ולא פלגיאט?

Karl Ove Hufthammer

2015-04-01 14:01:33 UTC

view on stackexchange narkive permalink

אני ממליץ על שני המאמרים הבאים:

מרטין בלנד:
כיצד להרגיז את השופט הסטטיסטי
זה מבוסס על סדרת שיחות שניתנו מאת מרטין בלנד, יחד עם נתונים משופטים סטטיסטיים אחרים ('מדגם נוחות עם אחוז תגובה נמוך'). זה מסתיים ברשימת 11 נקודות של '[h] ow כדי להימנע מהפרת השופט הסטטיסטי'.

סטיאן ליודרסן:
סקירה סטטיסטית: הערות שניתנות לעתים קרובות לעשות כראוי את הניתוח / דיווח. רשימת הפניות המצוטטת היא אוצר של ניירות מעניינים.

הרשימה מאת ליודרסן מעניינת.אני חושב שאני לא מסכים עם קומץ מהם...

cbeleites unhappy with SX

2012-04-10 22:38:03 UTC

view on stackexchange narkive permalink

אני מוטרד ביותר (ולעתים קרובות) מ"אימות "שמטרתו שגיאת הכללה של מודלים מנבאים כאשר נתוני הבדיקה אינם עצמאיים (למשל, בדרך כלל מדידות מרובות למטופל בנתונים, מחוץ לאתחול או אימות צולב פיצול מדידות לא חולים ).

עוד יותר מעצבן, מאמרים הנותנים תוצאות אימות צולבות כל כך פגומות וכן ערכת בדיקות עצמאית המדגימה את ההטיה האופטימית של אימות הצלב אך לא אחת מילה שתכנון אימות ההצלבה שגוי ...

(אני אשמח לחלוטין אם אותם נתונים יוצגו "אנו יודעים כי אימות הצלב צריך לפצל חולים, אבל אנחנו תקועים עם תוכנה שאינה מאפשרת זאת. לכן בדקנו מערכת עצמאית באמת של חולי בדיקה בנוסף ")

(אני גם מודע לכך ש- bootstrapping = דגימה מחדש עם החלפה בדרך כלל מתפקדת טוב יותר מאשר אימות צולב = דגימה מחדש ללא החלפה. עם זאת, מצאנו נתונים ספקטרוסקופיים (מדומה s פקטרה והתקנת מודל מעט מלאכותית אך ספקטרום אמיתי) שחזר / אישר את אימות הצלב ו מחוץ למתחול היה בעל אי ודאות כוללת דומה; ל- oob הייתה הטיה רבה יותר אך פחות שונות - להתאמה מחדש, אני מסתכל על זה מנקודת מבט פרגמטית מאוד: אימות חוזר חוזר לעומת רצועה מחוץ לאתחול לא משנה כל עוד הרבה מאמרים לא מפוצלים מבחינה מטופלת ולא מדווחים / דנים / להזכיר אי וודאות אקראית עקב גודל מדגם מוגבל של הבדיקה.)

מלבד הטעות, יש לכך גם תופעת לוואי שאנשים שעושים אימות נכון צריכים לעתים קרובות להגן על הסיבה שהתוצאות שלהם גרועות כל כך מכל אותם אחרים תוצאות בספרות.

לא בטוח אם התכוונת לומר זאת, אבל ה- bootstrap "האופטימי" הוא אחת הדרכים הטובות ביותר לאמת מודל, ודוגמאות ההדרכה והבדיקה שלו חופפות.

@Frank Harrell - אני לא בטוח שהבנתי את הנקודה שלך. אולי הקושי הוא שבכימומטריה "אימות של מודל ניבוי" תמיד קשור לביצועים במקרים חדשים, לא ידועים, עתידיים (בדוגמה: אבחון חולים חדשים). אני משתמש מחוץ לאתחול או באימות צולב חוזר / איטרציה כל הזמן. האם אתה יכול להסביר מה היתרון בכך שיש חפיפה בין מערכות הבדיקה והרכבת לעומת פיצול ברמת המטופל (אני מניח ש"חפיפה "פירושה פיצול מדידות כך שמדידות הבדיקה וההדרכה יכולות להיות שייכות לאותו מטופל, תמיד מדבר על מודל בין-מטופל )?

... וכן, ניתן לענות על כמה נקודות של אימות המודל מבלי לפצל את הנתונים במקרים שונים של מבחנים ואימונים (למשל יציבות מודל מבחינת המקדמים). אבל כבר יציבות מודל. לתחזיות יש למדוד באמצעות מטופלים לא ידועים (לא ידוע: מעולם לא הופיע בתהליך בניית המודל כולל עיבוד מקדים מונע נתונים המתחשב בכל המקרים). למעשה, עבור כימות מסורתית בכימומטריה, לאימות יש צעדים שזקוקים לנתוני בדיקה נמדדים באופן עצמאי: ...

שיטות עבודה טובות קוראות למפעיל לא ידוע של המכשיר ומאפיין חשוב אחד של השיטה האנליטית שייקבע במהלך האימות הוא באיזו תדירות יש לבצע את הכיול מחדש (או להראות שזרימה אינסטרומנטלית היא זניחה לאורך זמן מסוים) - [ יש מחברים שאף מדברים על "שימוש לרעה בדגימה מחדש" שמוביל להזנחה של ערכות בדיקה עצמאיות כאלה] (http://onlinelibrary.wiley.com/doi/10.1002/cem.1310/abstract).

אם הציוד או טכניקות המדידה זקוקים לאימות, נדרש דגימה עצמאית. אבל טעות נפוצה היא להשתמש פיצול נתונים כדי לנסות לדמות אימות עצמאית. זה עדיין אימות פנימי. כדי לענות על שאלת @cbeleites לעיל, הדוגמאות החופפות הקשורות לאתחול ההפעלה יביאו להערכות מדויקות יותר של ביצועי המודל העתידי מאשר פיצול נתונים ברוב מערכי הנתונים שאפשר לראות. יש לי פיצול נתונים אינו מתפקד כראוי עם n = 17,000 ו 0.30 שיעור אירוע.

@Frank: האם אתה משתמש בפיצול = אימות צולב; חופפים = bootstrap? ואז אנו מסכימים לחלוטין (מבחינתי, גם מחוץ לאתחול וגם אימות צולב מחלקים מערך נתונים אחד למערכות אימונים ומבחנים [שוב ושוב] - אבל מערך האימונים מורכב עם ובלי החלפה, בהתאמה. אני מפרש חפיפה כמקרים שנראים הן באימון והן במערכות המבחן (תת) של אחד מהמודלים הרבים (מודלים משנה, מודלים פונדקאיים) שנבנו במהלך אימות הדגימה מחדש).

על ידי פיצול התכוונתי לרמוז על פיצול יחיד, ולא אימות צולב. אך ההערכה המדויקת ביותר לגבי ביצועים עתידיים ככל הנראה נובעת לרוב מהאופטימיות הרגילה (Efron-Gong), בה דוגמת "אימון" ו"מדגם "חפיפה רבה.

Peter

2012-04-12 01:19:33 UTC

view on stackexchange narkive permalink

שימוש ב"נתונים "במובן יחיד. נתונים הם, הם אף פעם לא.

כנראה סטטיסטיקאי צרפתי;)

אני חייב להודות, נטשתי לאחרונה את השימוש ברבים בנתונים לאחר שנאחזתי בו במשך 10 שנים לערך. בדרך כלל אני כותב לקהלים שאינם טכניים ודאגתי שאעבור פומפוזית. נראה כי ל- APA עדיין יש קריאה קפדנית על היותו ברבים, אך מעניין שלחברה הסטטיסטית המלכותית אין דעה מסוימת. יש כאן דיון מעניין: http://www.guardian.co.uk/news/datablog/2010/jul/16/data-plural-singular

אני לא דובר אנגלית, אבל הבעיה ביצירות כמו "נתונים" או "מדיה" ביחיד היא שאנגלית השאילה מילים רבות אחרות בלטינית ואתה צריך להשתמש בכל המילים הלטיניות בצורה עקבית. מה הלאה? "תוכניות לימודים זה" או "תכניות לימודים הן"? "בינוני הם"? אם "נתונים" הם לטיניים, הרי שהם רבים. סוף הדיון. לא משנה כמה אנשים רוצים להתעלם מזה.

אולי אני חסר את זה, אבל אני עובר בין יחיד לרבים בהתאם להקשר.

השימוש במילה 'נתון' בהיותו נמוך ורק במין נסיבות מיוחדות, אני חושב על המילה 'נתונים' כמשהו שקול למילה 'חבילה' לגבי 'זאבים'.בהחלט מקובל להשתמש במילה 'חבילה' ביחיד לתיאור זאבים מרובים.המילה 'נתונים' הופכת בהדרגה לשם עצם קיבוצי משלה ...

StatsStudent

2015-10-07 02:55:13 UTC

view on stackexchange narkive permalink

מבחינתי הוא, ייחוס סיבה ללא ניתוח סיבתי ראוי או כשיש הסקה סיבתית לא תקינה.

אני גם שונא את זה כאשר נותנים אפס תשומת לב לאופן הטיפול בנתונים חסרים. אני רואה גם כל כך הרבה מאמרים שבהם המחברים פשוט מבצעים ניתוח מקרים מלא ואינם מזכירים האם התוצאות ניתנות להכללה לאוכלוסייה עם ערכים חסרים או כיצד האוכלוסייה עם ערכים חסרים עשויה להיות שונה באופן שיטתי מהאוכלוסייה עם נתונים מלאים.

Simone

2015-10-07 03:13:38 UTC

view on stackexchange narkive permalink

שימוש ב- Microsoft Word במקום ב- LaTeX.