Get Mystery Box with random crypto!

چه‌گونه با آمار دروغ بگوییم. علم آمار، بر خلاف دستور زبان، ش | دِرَنـــگ

چه‌گونه با آمار دروغ بگوییم.

علم آمار، بر خلاف دستور زبان، شهودی نیست و اصول آن را نمی‌توان به‌سادگی از تجربه‌های روزمره آموخت [1]. مسائل احتمال نیز ارتباط نزدیکی با مسائل آمار دارند. ریاضی‌دان بزرگی مثل پرسی دیاکنیس معتقد است که مغز ما اصولاً برای حل مسائل احتمال طراحی نشده است [2].

از طرفی دانش مقدماتی از آمار و احتمال از ضروریات زندگی روزمره در دنیای پیچیده‌ٔ امروز است؛ طوری‌که سواد آماری [3] در کنار انواع دیگر سواد همچون سواد عاطفی، سواد مالی و ... می‌نشیند.

«چه‌گونه با آمار دروغ بگوییم» [4] عنوان کتاب کوچکی است از دارل هاف که علیرغم حجم کم‌اش (حدود ۱۴۰ صفحه) برای افزایش سواد آماری بسیار مفید است. کتاب اولین بار در سال ۱۹۵۴ چاپ شده است؛ بله، ۶۸ سال پیش! با‌این‌همه مطالب‌اش هنوز تازه و زنده است. کتاب پر از مثال‌هایی است که نشان‌ می‌دهند چطور می‌‌توان با سوء استفاده از مفاهیم آماری و با ارائهٔ داده‌های آماری به شکلی خاص و هدف‌مند، خواننده را گمراه کرد. همه‌ٔ مثال‌ها از نشریات و برنامه‌های رادیو و تلویزیون هفتاد سال پیش (عمدتاً در آمریکا) گرفته شده ولی اکثر آن‌ها هنوز تازه‌اند و برای خوانندهٔ امروزی کاملاً قابل درک و شاید تجربه‌شده.

کتاب ده فصل دارد. فصل اول در مورد نمونه‌گیری آماری است و نقش مخرب سوگیری (bias) در نمونه‌گیری. باید دقت کرد که همیشه نمی‌توان نتایج حاصل از نمونه‌های آماری را به‌ کل جامعه تعمیم داد. مثلاً خوانندگان یک وبسایت خبری یا دانشجویان یک دانشگاه نمونهٔ خوبی از کل جامعه نیستند.

فصل‌های دوم و سوم در مورد مفهوم مقدار متوسط و سوء استفاده‌هایی است که می‌توان از آن کرد. مفاهیمی مثلاً میانگین (mean)، میانه (median) و نما (mode) اگرچه ممکن است در موارد زیادی رفتاری مشابه داشته باشند ولی در مواردی هم تفاوت زیادی با هم دارند و کاربرد آن‌ها به‌جای هم گمراه‌کننده است. برای توضیحات بیشتر در مورد میانگین اینجا را ببینید.

فصل چهارم به مفهوم تفاوت یا اختلاف و سوء استفاده‌های ناشی از آن می‌پردازد. گاهی می‌توان تفاوت‌های بی‌اهمیت را به‌شکلی اغراق‌آمیز بزرگ جلوه داد و گاهی تفاوت‌های مهم را ناچیز نشان داد. شاید جمله‌ٔ زیر از این فصل خلاصه‌ٔ خوبی برایش باشد:

A difference is a difference only if it makes a difference.

فصل‌های پنجم، ششم و هفتم به سوء استفاده از گراف‌ها، تصاویر و نمودارها می‌پردازد: استفاده از مقیاس‌های نامناسب یا رسم نمودارها و شکل‌هایی که به‌لحاظ دیداری گمراه‌کننده اند. به‌عنوان یک مثال اینجا را ببینید. گاهی نیز نمودار تغییرات یک کمیت نشان داده می‌شود ولی با ظرافت گزاره‌ای دربارهٔ یک کمیت دیگر بیان می‌شود.

فصل هشتم به این موضوع مهم می‌پردازد که همبستگی‌های آماری همیشه نشان‌دهنده‌ٔ رابطهٔ علت‌ و معلولی نیستند.

فصل نهم به انواع دستکاری‌های آماری می‌پردازد: «واقعیت این است که آمار، علیرغم مبنای ریاضی‌اش، بیشتر هنر است تا علم».

در نهایت فصل دهم راهکارهایی برای مقابله با فریب‌ها و سوء استفاده‌های آماری پیشنهاد می‌کند.

اگر به موضوع کتاب علاقه‌مندید، فرسته‌های زیر از همین کانال را هم ببینید:

https://t.me/k1samani_channel/34
https://t.me/k1samani_channel/55
https://t.me/k1samani_channel/86
https://t.me/k1samani_channel/89


[1] Daniel Kahneman, ''Thinking, Fast and Slow'' (2011).
[2] Persi Diaconis, "The search for randomness", Talk (1989).
[3] https://wikipedia.org/wiki/Statistical_literacy
[4] Darrell Huff, "How to Lie with Statistics" (1954).

@k1samani_channel