אני אוהב את ספרו של ג'ון ואן בל על כללים סטטיסטיים של אגודל, ובמידה פחותה שגיאות נפוצות בסטטיסטיקה (וכיצד להימנע מהן) מפיליפ I טוב ו ג'יימס וו. הרדין. הם מתייחסים למלכודות נפוצות כאשר מפרשים תוצאות ממחקרים ניסיוניים ותצפיתיים ומעניקים המלצות מעשיות להסקה סטטיסטית, או ניתוח נתונים חקרני. אבל אני מרגיש שההנחיות "המודרניות" חסרות במקצת, במיוחד עם השימוש ההולך וגובר בסטטיסטיקה חישובית וחזקה בתחומים שונים, או הכנסת טכניקות מקהילת למידת המכונה, למשל. ביו סטטיסטיקה קלינית או אפידמיולוגיה גנטית.
מלבד טריקים חישוביים או מלכודות נפוצות בהדמיית נתונים שניתן לטפל בהם במקומות אחרים, הייתי רוצה לשאול: מה הם כללי האצבע העליונים שאתה ממליץ עליהם ליעילות ניתוח נתונים? ( כלל אחד לתשובה, בבקשה ).
אני חושב על הנחיות שאתה עשוי לספק לעמית, חוקר ללא רקע חזק בסטטיסטיקה. דוגמנות, או סטודנט בקורס ביניים עד מתקדם. זה עשוי להתייחס לשלבים שונים של ניתוח נתונים, למשל. אסטרטגיות דגימה, בחירת תכונות או בניית מודלים, השוואת מודלים, הערכה לאחר, וכו '