منبع: | دنیای اقتصاد | تاریخ انتشار: | 1390-03-09 |
نویسنده: | موری روتبارد | مترجم: | یاسر میرزایی |
چکیده: | |||
با این که ممکن است این مساله عجیب به نظر برسد، اما من زمانی دانشجوی آمار بودهام. |
|||
علم آمار: ویرانی از درون؟ پس از گذراندن همه درسهای دوره کارشناسی آمار، من در یک درس دوره ارشد آمار ریاضیاتی در دانشگاه کلمبیا ثبتنام کردم که استاد برجسته آن هارولد هتلینگ، یکی از بنیادگذاران اقتصاد ریاضیاتی جدید بود. پس از شرکت در چند جلسه از کلاس هتلینگ، من دچار تجربه معرفتی خاصی شدم: فهم ناگهانی این نکته که استنتاج آماری بر فرضی قاطع استوار است و آن فرض اساسا پا در هوا است. من از کلاس هتلینگ بیرون آمدم و حتی از جهان آمار نیز برای همیشه خداحافظی کردم. علم آمار، البته چیزی بس بیشتر از صرف مجموعهای از دادهها است. «استنتاج» آماری، نتیجهگیریهایی است که میتوان از آن دادهها بیرون کشید. به طور خاص، از آن جا که ما هرگز همه دادهها را نمیدانیم_از سرشماریهای دهساله ایالاتمتحده که بگذریم_، نتیجهگیریهای ما باید بر مثالهای بسیار کوچکی که از جمعیت بیرون کشیده میشود، استوار شود. پس از آن که مثال یا مثالهایمان را انتخاب کردیم، مجبوریم راهی بیابیم تا توضیحی راجع به کل جمعیت ارائه دهیم. مثلا فرض کنید ما بخواهیم نتیجهای راجع به متوسط قد جمعیت مذکر آمریکا ارائه دهیم. از آنجا که ما نمیتوانیم قد تمام مردان آمریکایی را اندازه بگیریم، نمونهای با شمارگان کم انتخاب میکنیم، فرض کنید 500 نفر که به روشهای مختلف انتخاب شدهاند و از طریق آنها تخمین میزنیم که متوسط قد مردان آمریکایی چقدر است. در علم آمار، آنچه ما از طریق آن از نمونههای شناخته شده به جمعیت ناشناخته گذر میکنیم، یک فرض قاطع است: در همه جا چه ما با قد افراد طرف باشیم، چه مساله بیکاری باشد چه نتایج انتخابات، نمونهها بر اساس «منحنی نرمال» پخش میشوند. منحنی نرمال یک منحنی متقارن و زنگولهای شکل است که در همه کتابهای درسی آمار آمده است. از آن جا که فرض شده است، همه نمونهها طبق این منحنی دور نمودار جمعیت میریزند، علم آمار خود را موجه میداند که با چند نمونه محدود مشخص کند مثلا میانگین قد آمریکاییها، یا نرخ بیکاری یا هر چیز دیگری، دقیقا با «سطح دقت» 90 تا 95 درصد چیست. کوتاه سخن آنکه اگر برای مثال میانگین قد افراد 1 متر و 90سانت باشد، 90 تا 95 نفر از هر صد نفر، دقیقا قدی نزدیک به این اندازه خواهند داشت. این نمودارهای دقیق به سادگی از این فرض برآمدهاند که همه نمونهها بر اساس منحنی نرمال در اطراف جمعیت پخش شدهاند. این به دلیل خصوصیات منحنی نرمال است که مثلا ناظر انتخابات میتواند با اطمینان کافی مدعی شود بوش از سوی درصد خاصی از رایدهندگان حمایت شده بود و دوکاکیس با درصدی دیگر و همه این آمارها تنها «خطایی» سه تا پنج درصدی دارند. این منحنی نرمال است که به متخصصان آمار اجازه میدهد ادعای معرفت دقیق نسبت به کل نمودار جمعیتی نداشته باشند، اما به جایش ادعای چنان معرفتی در مورد درصدهای پایین خطا کنند. خب؛ چه شاهدی برای درستی فرض حیاتی پخش شدن پیرامون منحنی نرمال وجود دارد؟ هیچ شاهدی! این فرض، حاصل کنشی خالص و افسانهای از سر امید است. در متون درسی آمار من، تنها «شاهد» صادق بودن منحنی نرمال این گزاره بود که اگر یک تیرانداز خوب، تیری را به قصد خوردن به هدف شلیک کند، گلولهها در اطراف خال هدف به صورت شکلی شبیه به منحنی نرمال پخش میشوند. فرض حیاتی اعتبار همه استنتاجهای آماری مبتنی بر چنین بنیاد سستی است. متاسفانه، علوم اجتماعی نیز تمایل دارند قانونی را پیروی کنند مشابه چیزی که دکتر روبرت مندلسون نشان داد در پزشکی پذیرفته شده است: هیچ وقت هیچ رویهای را فارغ از اینکه چقدر اشتباه است، فرو نگذارید تا اینکه رویهای بهتر پیشنهاد شود و اکنون به نظر میرسد که ساختار کاملا غلط استنتاج مبتنی بر منحنی نرمال، تسلیم تکنولوژی پیشرفته شده است. ده سال پیش، بردلی افرون، متخصص آمار دانشگاه استنفورد از کامپیوترهای پرسرعت برای تولید «مجموعه دادههای مصنوعی» که مبتنی بر یک نمونه واقعی بودند، استفاده کرد و میلیونها محاسبه عددی ضروری انجام داد تا به تخمینی در مورد جمعیت برسد بی آنکه از منحنی نرمال یا هر فرض ریاضیاتی دلخواه دیگری استفاده کند که مدعی هستند نمونهها چطور پیرامون یک نمودار جمعیت پخش میشوند. پس از یک دهه بحث و جدل، متخصصان آمار روشهای استفاده عملی از این «بوتستراپ» (Boot-strap)[تکنیک استفاده از منابع موجود برای تولید چیزهایی پیچیدهتر و موثرتر. م.] را پذیرفتهاند و در حال حاضر این روش کل این حرفه را به تصرف خود در آورده است. جروم اچ فریدمن، متخصص آمار دانشگاه استنفورد، یکی از پیشگامان روش جدید، آن را «مهمترین اندیشه جدید در علم آمار طی بیست سال گذشته و شاید 50 سال گذشته» میخواند. در این مرحله، متخصصین آمار در نهایت میخواهند اجازه دهند خروسی که دمش مشخص بود، رخ بنماید. فریدمن اکنون تصدیق میکند که «دادهها همیشه منحنیهای زنگولهای شکل را پیروی نمیکنند و وقتی چنین میشود، شما» با روشهایی که استاندارد است «دچار اشتباه میشوید.» در حقیقت او میافزاید «دادهها به طور متناوب به نحوی کاملا متفاوت از منحنیهای زنگولهای شکل پخش میشوند.» خب، مساله دقیقا همین است؛ حال ما دریافتهایم که پادشاه منحنی نرمال اصلا لباسی بر تن ندارد. امید افسانهای پیشین اکنون میتواند کنار گذاشته شود. منبع: Making Economic Sense |