2022-07-29 23:03:21
چهگونه با آمار دروغ بگوییم.
علم آمار، بر خلاف دستور زبان، شهودی نیست و اصول آن را نمیتوان بهسادگی از تجربههای روزمره آموخت [1]. مسائل احتمال نیز ارتباط نزدیکی با مسائل آمار دارند. ریاضیدان بزرگی مثل پرسی دیاکنیس معتقد است که مغز ما اصولاً برای حل مسائل احتمال طراحی نشده است [2].
از طرفی دانش مقدماتی از آمار و احتمال از ضروریات زندگی روزمره در دنیای پیچیدهٔ امروز است؛ طوریکه سواد آماری [3] در کنار انواع دیگر سواد همچون سواد عاطفی، سواد مالی و ... مینشیند.
«چهگونه با آمار دروغ بگوییم» [4] عنوان کتاب کوچکی است از دارل هاف که علیرغم حجم کماش (حدود ۱۴۰ صفحه) برای افزایش سواد آماری بسیار مفید است. کتاب اولین بار در سال ۱۹۵۴ چاپ شده است؛ بله، ۶۸ سال پیش! بااینهمه مطالباش هنوز تازه و زنده است. کتاب پر از مثالهایی است که نشان میدهند چطور میتوان با سوء استفاده از مفاهیم آماری و با ارائهٔ دادههای آماری به شکلی خاص و هدفمند، خواننده را گمراه کرد. همهٔ مثالها از نشریات و برنامههای رادیو و تلویزیون هفتاد سال پیش (عمدتاً در آمریکا) گرفته شده ولی اکثر آنها هنوز تازهاند و برای خوانندهٔ امروزی کاملاً قابل درک و شاید تجربهشده.
کتاب ده فصل دارد. فصل اول در مورد نمونهگیری آماری است و نقش مخرب سوگیری (bias) در نمونهگیری. باید دقت کرد که همیشه نمیتوان نتایج حاصل از نمونههای آماری را به کل جامعه تعمیم داد. مثلاً خوانندگان یک وبسایت خبری یا دانشجویان یک دانشگاه نمونهٔ خوبی از کل جامعه نیستند.
فصلهای دوم و سوم در مورد مفهوم مقدار متوسط و سوء استفادههایی است که میتوان از آن کرد. مفاهیمی مثلاً میانگین (mean)، میانه (median) و نما (mode) اگرچه ممکن است در موارد زیادی رفتاری مشابه داشته باشند ولی در مواردی هم تفاوت زیادی با هم دارند و کاربرد آنها بهجای هم گمراهکننده است. برای توضیحات بیشتر در مورد میانگین اینجا را ببینید.
فصل چهارم به مفهوم تفاوت یا اختلاف و سوء استفادههای ناشی از آن میپردازد. گاهی میتوان تفاوتهای بیاهمیت را بهشکلی اغراقآمیز بزرگ جلوه داد و گاهی تفاوتهای مهم را ناچیز نشان داد. شاید جملهٔ زیر از این فصل خلاصهٔ خوبی برایش باشد:
A difference is a difference only if it makes a difference.
فصلهای پنجم، ششم و هفتم به سوء استفاده از گرافها، تصاویر و نمودارها میپردازد: استفاده از مقیاسهای نامناسب یا رسم نمودارها و شکلهایی که بهلحاظ دیداری گمراهکننده اند. بهعنوان یک مثال اینجا را ببینید. گاهی نیز نمودار تغییرات یک کمیت نشان داده میشود ولی با ظرافت گزارهای دربارهٔ یک کمیت دیگر بیان میشود.
فصل هشتم به این موضوع مهم میپردازد که همبستگیهای آماری همیشه نشاندهندهٔ رابطهٔ علت و معلولی نیستند.
فصل نهم به انواع دستکاریهای آماری میپردازد: «واقعیت این است که آمار، علیرغم مبنای ریاضیاش، بیشتر هنر است تا علم».
در نهایت فصل دهم راهکارهایی برای مقابله با فریبها و سوء استفادههای آماری پیشنهاد میکند.
اگر به موضوع کتاب علاقهمندید، فرستههای زیر از همین کانال را هم ببینید:
https://t.me/k1samani_channel/34
https://t.me/k1samani_channel/55
https://t.me/k1samani_channel/86
https://t.me/k1samani_channel/89
[1] Daniel Kahneman, ''Thinking, Fast and Slow'' (2011).
[2] Persi Diaconis, "The search for randomness", Talk (1989).
[3] https://wikipedia.org/wiki/Statistical_literacy
[4] Darrell Huff, "How to Lie with Statistics" (1954).
@k1samani_channel
749 viewsKeivan Aghababaei Samani, 20:03