تحلیل رگرسیون

منبع: دنیای اقتصاد تاریخ انتشار: 1390-05-06
نویسنده: مترجم: جعفر خیرخواهان
چکیده:

در جایگاه قضاوت نشستن، باعث می‌شود تا شخص بیش از آن که به سطح معنی‌دار بودن آماری توجه کند نگران روابط آماری باشد. معنی‌دار بودن نتایج فقط در صورتی قابل تایید است که درک عمیقی از همه جنبه‌های مساله داشته باشیم.


دعوت به اقتصادخواني
تحليل رگرسيون: موتور حركت اقتصاد تجربي
 
بايد شناخت کافی از همه تئوري‌هاي مرتبط با موضوع داشت و ادبيات گسترده درباره آن موضوع و نهادهايي را كه نقش مهمي در مساله مورد بررسي دارند، شناخت.
(ديويد كلاندر، «چگونگی شکل‌گیری اقتصاددان»، ص 243)

ابزار اصلي آماری كه در علم اقتصاد استفاده مي‌شود تحليل رگرسيوني است. در اين شيوه به دو يا چند سري آماري نگاه می‌کنیم كه آيا به نحوي سازگار با هم در يك جهت يا در جهت مقابل حركت مي‌كنند و اگر اين‌طور است وقتي يكي از سري‌ها تغيير مي‌كند سري ديگر چقدر تغيير خواهد كرد: به عبارت ديگر هم‌ارتباطي آنها چگونه بوده و چقدر دقيق است. فرض كنيد قصد داريم فروش یخچال را تبيين يا پيش‌بيني كنيم. فروش یخچال را «متغير وابسته» مي‌ناميم چون كه مي‌خواهيم بدانيم به چه متغيرهايي وابسته است. سپس به تئوري اقتصادي يا به فهم مشترك عمومي متوسل مي‌شويم تا به ما بگويد عوامل تعيين‌كننده- كه آنها را «متغير مستقل» يا گاهي اوقات «رگرسورها» مي‌نامند- چه هستند. آنها را «متغير مستقل» مي‌نامند چون در حالي كه روی فروش یخچال تاثير مي‌گذارند فرض مي‌كنيم فروش یخچال در مقابل تاثيري بر آنها نمي‌گذارد. (اين امكان نيز هست كه مجموعه معادلات رگرسيون را به طور همزمان حل كنيم كه متغير وابسته در يك معادله، متغير مستقل در معادله ديگر مي‌شود.)
در علوم طبيعي اغلب اوقات، دو متغير رابطه دقيق دارند كه مي‌توان به صورت يك قانون علمي بيان كرد. براي مثال. متغير y هميشه دقيقا b برابر متغير ديگر x است. در اين حالت، نيازي به تحليل رگرسيوني نیست. تمام كاري كه بايد انجام داد دقت در مقادير هر جفت x و y است و با استفاده از اينها می‌توان مقدار b را حساب کرد، اما اگر x تنها متغيري نباشد كه بر y تاثير مي‌گذارد چنین روشی نتيجه نمي‌دهد. همان طور كه در شكل 1 ديده مي‌شود رابطه بين x و y دقيق نيست.

شكل 1- رابطه بين دو متغير
جایگاه متغير x را روي محور افقي در نظر بگيريد. برخي نقاط در جايگاه بسيار بالايي روي محور عمودي قرار دارند و برعكس. يك شيوه فهمیدن تحليل رگرسيوني اين است كه تصور كنيم رابطه زيربنايي دقيقي بين x و y وجود دارد، چنان كه y برابر 3x است، اما پیش از اينكه داده‌ها به دست شما برسد يك نفر شيطنت كرده است و مقداري اعداد تصادفي مثبت و منفي روي yها انداخته است. وظيفه شما پي‌بردن به روابط واقعي x و y از ميان مشاهدات آلوده‌شده‌اي است كه به شما داده شده است. مشخصا اين كارها را بايد بكنيد: (1) میزان تاثیری را كه يك واحد تغيير x روي y مي‌گذارد تعيين كنيد؛ (2) ارزيابي كنيد كه آيا اين اثر از نظر آماري معنی‌دار است و (3) برآورد كنيد چه نسبتي از تغيير در y كه مشاهده كرده‌ايم به خاطر تغييرات در x بوده است.

1- ضريب رگرسيون
براي سادگي فرض كنيد رابطه بين x و y را مي‌توان با يك خط راست نشان داد. معادله خط راست با وجود تنها يك متغير مستقل به این صورت درمی‌آید:
y = a + bx كه a و b اعداد ثابت هستند؛ يعني اعدادي مثل 34 يا 8 كه تغيير نمي‌كنند. پس b به شما مي‌گويد كه اگر x به ميزان 1 واحد تغيير كند، y به اندازه 8 واحد تغيير مي‌كند. b شبيه چرخ دنده است كه تغييرات از x را به y انتقال مي‌دهد.
پس آنچه رگرسيون x روي y انجام مي‌دهد انتخاب مقادير خاصي براي a و b است كه بهترين پيش‌بيني از y را كه با دانستن مقدار x مي‌توانيد به دست آوريد به شما مي‌دهد. دقيق‌تر اينكه بگوييم كامپيوتر آن مقاديري را براي a و b انتخاب مي‌كند كه مجذور تفاوت‌هاي بين مقادير واقعي y و مقادير y كه رگرسيون پيش‌بيني مي‌كند به حداقل مي‌رساند. براي ساده‌سازي بحث، لحظه‌اي مجذور كردن و نيز عدد ثابت a را فراموش کرده و فكر کنید چگونه وضعيتي را توصيف مي‌كنيد كه به صورت يك قاعده كلي هر وقت x به ميزان 1 واحد افزايش يافت، y به اندازه 3 واحد افزايش مي‌يابد، اما برخي اوقات يك كمي بيشتر و برخي اوقات يك كمي كمتر افزايش مي‌يابد. آيا منطقي نخواهد بود كه بگوييم: y برابر با 3x به علاوه يا منهاي يك عامل سرهم كردني است؟ اين عامل سرهم كردني را «جمله خطا» مي‌ناميم. مادامي كه اين حالت از خطاهاي نمونه‌گيري تصادفي ناشي مي‌شود، در نمونه به حدي كافي بزرگ جمله خطا توزيع نرمال خواهد داشت. همان طور كه نمونه بزرگ‌تر و بزرگ‌تر مي‌شود با داشتن اعداد مثبت و منفي كه ميل به حذف كردن هم دارند، عامل سرهم كردني به صفر نزديك مي‌گردد، اما مادامي كه وجود عامل سرهم كردني به علت تاثیر برخي متغيرهاي مستقل اضافي نباشد كه به اشتباه حذف كرده‌ايم، ما همچنين فرض مي‌كنيم، يا درست‌تر اينكه بگوييم اميدوار هستيم اين خطاها نيز به صورت نرمال توزيع شده باشند؛ بنابراين تقريبا همديگر را خنثي نمايند.
فرض كنيد كامپيوتر حساب مي‌كند كه a مثلا 10 و b مثلا 3 شده است. وجود خطاهاي نمونه‌گيري و ساير خطاها (يعني عامل سرهم كردني) به ما اجازه نمي‌دهد كه بگوييم هر وقت x مساوي 1 است y بايد 13 باشد، اما مادامي كه اين خطاها تصادفي باشند، از بخش‌هاي بعدي مي‌دانيم در اين‌باره چه كار بايد كرد. ما به خطاهاي معيار نگاه مي‌كنيم (يعني انحراف معيار) تا دامنه‌اي كه به نحو معقولي مي‌توان انتظار داشت a و b در آن محدوده جاي گيرند به دست آيد، (معمولا تا منها و به علاوه دو خطاي معيار پيش مي‌رود تا سطح احتمال 5 درصد به دست آيد). يا اگر ما صرفا مي‌خواهيم بدانيم آيا احتمال كمتر از 5 درصدي وجود دارد كه در جامعه، a يا b واقعا صفر هستند، مقادير آنها را كه «برآوردهاي نقطه‌اي» ناميده مي‌شوند بازبيني مي‌كنيم كه آيا از صفر به اندازه بيشتر از دو خطاي معيار تفاوت دارند يعني مقدار t آنها 2 يا بزرگ‌تر از 2 باشد.
اين a و b واقعا چه چيزي را اندازه‌گيري مي‌كنند؟ از آنجا كه a يك عدد ثابت است؛ يعني بدون توجه به مقداري كه x مي‌گيرد مقدار آن فرقي نمي‌كند، آن را مي‌توان اينگونه تفسير كرد: مقدار y، وقتي x صفر باشد. به طوري كه مي‌تواند منفي، مثبت يا صفر باشد. از آنجا كه ما عمدتا مي‌خواهيم بدانيم چگونه x بر y تاثير مي‌گذارد و نه اينكه وقتي x صفر است y چه مقدار مي‌شود، به اين جمله ثابت معمولا علاقه‌اي نشان داده نمي‌شود. به جاي آن، علاقه زيادي به ضريب b داريم كه «ضريب رگرسيون» ناميده مي‌شود. به شكل نموداري، b شيب خط رگرسيون است؛ يعني خطي كه از ميان خوشه نقاط (مشاهدات) كشيده شده است به طوري كه مربعات انحرافات اين نقاط از خط را به حداقل مي‌رساند و با اين معنی، بهترين تصوير از مشاهدات است.
تا اينجا فرض كردم رابطه بين x و y را مي‌توان با يك خط راست توصيف كرد. اگر بخواهيم علمي سخن بگوييم دليلي ندارد كه چرا بايد اينگونه باشد، اما معمولا آن خط، تقريب كافي و نزديكي است كه ما بتوانيم استفاده كنيم. همچنين امكان استفاده از معادلات رگرسيوني كه رگرسورهاي غيرخطي از قبيلX2 دارند هست، اما برخي اوقات باعث مي‌شود تا برنامه كامپيوتري به هم بريزد و وقتي داده‌ها با رسم خط راستی از اعداد طبيعي به خوبي قابل توصيف نباشند ما رگرسيون را روي لگاريتم آنها برازش مي‌كنيم. استفاده از لگاريتم اين مزيت را دارد كه تغييرات در هر دو متغيرهاي وابسته و مستقل را مي‌توان به صورت درصد تغييرات خواند.
تا اينجا ما فقط با يك رگرسور كار كرديم، اما معمولا اوضاع و احوال پيچيده‌تر است چون كه رفتار y وابسته به عوامل بسياري است؛ براي مثال، تقاضا براي خودرو نه فقط به قيمت خودرو، بلكه به قيمت بنزين و حمل و نقل عمومي، قيمت كالاهاي رقيب و جانشين، به درآمد و به عشق و علاقه مردم به داشتن خودرو نيز بستگي دارد. بنابراين اغلب اوقات نياز است تا رگرسورهاي بيشتري را بگنجانيم: مثلا اگر پنج متغير مستقل، اثر چشمگيری بر متغير وابسته داشته باشند بايد معادله رگرسيون را به اين صورت بنويسيم:
y=a +bx1 +cx2 +dx3 +ex4 +fx5 +e
كه پايين‌نويس‌هاي هر x بيانگر رگرسورهاي متفاوت است و e جمله خطا مي‌باشد. مي‌توان متغيرهاي مستقل بسياري را در رگرسيون جاي داد به شرط اينكه مشاهدات كافي داشته باشيم. بيشتر رگرسيون‌ها اينك از بيش از يك رگرسور استفاده مي‌كنند، اما براي اينكه بحث را ساده نگه داريم در اينجا فقط درباره يك رگرسور صحبت مي‌كنيم.

2- تعيين خوبي برازش رگرسيون با داده‌ها
فرض كنيد با محاسبات كامپيوتری معلوم می‌شود وقتي نرخ بهره وام خودرو يك درصد افزايش يابد فروش خودرو 5 درصد كاهش مي‌يابد. اين اطلاعات مفيدي است اگر كه شما در واحد بازاريابي يك شركت خودروسازي كار مي‌كنيد، اما اين اطلاعات به شما نمي‌گويد تغييرات در فروش خودرو كه مشاهده مي‌كنيد تا چه حد با تغييرات نرخ بهره قابل تبيين است به جاي اينكه با ساير عوامل از قبيل تغيير درآمد مصرف‌كننده قابل تبيين باشد. امكان اين هست که پيش‌بيني هر يك درصد تغيير در نرخ بهره، فروش خودرو را 5 درصد كاهش مي‌دهد كاملا درست باشد و درعين حال مي‌توان بيشتر تغييرات واقعا مشاهده شده در فروش خودرو را با عواملی به غير از تغيير نرخ بهره تبيين كرد.
اقتصاددانان و آماردانان، خوبي برازش معادله رگرسيون با داده‌ها را اندازه‌گيري مي‌كنند يعني با چه دقتي مي‌توان y (فروش خودرو) را به صرف دانستن x (نرخ بهره) پيش‌بيني كرد. آنها اين كار را با استفاده از ضريب همبستگي، R يا در بيشتر اوقات با پسر عموي آن، R2 ضريب تعيين، انجام می‌دهند. R و R2 در دامنه صفر تا يك هستند و با توجه به شرط مهمي كه در زير بحث می‌شود، نسبت نوسانات در y– يا دقيق‌تر نسبت مربع نوسانات y– را كه با نوسانات در x تبيين شده باشد اندازه‌گيري مي‌كند؛ اگر چه R2 نمي‌تواند منفي باشد چون كه مجذور يك عدد طبيعي نمي‌تواند عدد منفي به دست آيد، برخي اوقات با بي‌قيدي به صورت منفي گزارش مي‌شود تا به خواننده گوشزد كند رابطه بين x و y منفي است.
بنابراين، با فرض ثبات ساير چيزها، اگر مي‌خواهيد عواملي را پيدا كنيد كه به بهترين نحو تغييرات مشاهده شده در متغير وابسته شما را تبيين مي‌كنند بايد يك معادله رگرسيون انتخاب كنيد كه R2 مثلا 8/0 دارد نسبت به يك معادله رگرسيون كه R2 فقط 5/0 دارد، اما در اين كار زياده‌روي نكنيد: تفاوت كوچك در R2 از قبيل تفاوت بين مثلا 834/0 و 830/0 بي‌معني است و شايد حتي معكوس شود اگر برنامه كامپيوتري متفاوتي استفاده مي‌كرديد و علاوه بر اين، ساير چيزها اغلب اوقات برابر نيستند.

3- در رگرسيون بايد به دنبال چه چيزي باشيم؟
كداميك از اين سنجه‌ها مهم‌تر است، R2 ،ضريب رگرسيون يا مقدار t؟ پاسخ اين است: «هر سه تا». هر سه مهم هستند چون كه آنها به پرسش‌هاي متفاوتي پاسخ مي‌دهند. فرض كنيد از شما پرسيده مي‌شود رگرسورهاي مدل چقدر رفتار y را تبيين يا پيش‌بيني مي‌كند. پس همان طور كه در بالا بحث شد R2 سنجه مناسب خواهد بود، اما اگر پرسش شما اين است كه آيا يك واحد نوسان رگرسور، اثر چشمگيري بر متغير وابسته دارد، پس بايد ابتدا به مقدار t ضريب مربوطه نگاه كنيد تا از خطر نسبت دادن اهميت به نتيجه خطاي صرف نمونه‌گيري جلوگيري كنيد و نيز بايد به معنی‌دار بودن محتوايي ضريب نگاه كنيد تا معلوم شود آيا اين اثر به حد كافي بزرگ و مهم هست. در اينجا بايد به واحدهايي كه x و y اندازه‌گيري مي‌شوند توجه کرد. براي مثال اگر در تخمين عوامل تعيين‌كننده نرخ تورم، ضريب رگرسيون كسري فدرال، مثلا 001/0 است، فرق است بين اينكه آيا منظور اين است نرخ بهره 001/0 درصد افزايش مي‌يابد وقتي كسري به ميزان يك ميليون دلار افزايش مي‌يابد يا اين افزايش نتيجه يك افزايش يك‌ميليارد دلاري در كسري فدرال است.
توجه به واحدهاي اندازه‌گيري لازم اما نه كافي است تا ثابت شود كه آيا ضريب «بزرگ» بوده يا چنان كوچك است كه اهميتي ندارد. در اينجا هيچ قاعده مكانيكي مثل قرار 5 درصد معنی‌دار بودن آماري نداريم. آنچه نياز است قضاوت شما و نه قضاوت كامپيوتر است.
هنگام نگاه به ضريب رگرسور بايد اين دقت را نيز داشت كه اندازه آن يا مقدار t آن را با اهميتش در تبيين تغييرات مشاهده شده در y قاطي نكنيد. براي تبيين اين تغييرات، آنچه اهميت دارد نه فقط اندازه ضريب رگرسيون، بلكه اينكه چقدر خود رگرسور تغيير مي‌كند نيز هست. حتي اگر ضريب رگرسيون X1 بسيار بزرگ‌تر از ضريب رگرسيون X2 باشد اگر X2 بسيار بيشتر از X1 تغيير مي‌كند پس نوسانات احتمالا مي‌تواند نسبت بزرگ‌تري از تغييرات مشاهده شده در y را توضيح دهد. فرض كنيد در رگرسيوني كه درصد درآمد پس‌انداز شده خانواده‌ها را تبيين مي‌كند يك رگرسور X8 را شامل مي‌كنيد براي اينكه آيا خانواده در آن سال يك بچه‌ دارد يا خير. ضريب رگرسيون براي اين رگرسور احتمالا بزرگ است، اما بيشتر نوسانات در درصد درآمد پس‌انداز شده خانواده‌ها در نمونه شما را تبيين نخواهد كرد چون كه در هر سال خاص، X8 بيشتر خانواده‌ها صفر خواهد بود.
حتي اگر فقط علاقه‌مند به اين هستيد كه رگرسيون شما چقدر خوب مي‌تواند متغير وابسته را تبيين و پيش‌بيني كند بايد نه فقط به R2 بلكه همچنين به يكايك ضرايب رگرسيون و مقادير t آنها نگاه كنيد. فرض مي‌كنيم فروش كارت‌هاي كريسمس را روي نرخ بيكاري رگرس مي‌كنيد و عامل فصلي بودن را در نظر مي‌گيريد و نيز يك رگرسور اضافي كه به اصطلاح «متغير بدلي يا ساختگی» است كه در اين مورد خاص مقدار 1 را براي ماه دسامبر و مقدار صفر را براي ساير ماه‌ها مي‌گيرد. R2 بالايي به دست مي‌آوريد، اما اين به شما نمي‌گويد كه تغيير بيكاري اثر زيادي بر فروش كارت كريسمس دارد- شما همچنين يك R2 بالا به دست مي‌آوريد حتي اگر به جاي نرخ بيكاري، تعداد گربه‌هاي به دنيا آمده در آن ماه را استفاده مي‌كرديد چون كه در اين مورد، متغير بدلي فصلي بودن و نه نرخ بيكاري است كه تاثير مي‌گذارد. داستاني درباره يك فروشنده دوره‌گرد گفته مي‌شود كه به يك روستا رفت و اعلام كرد سنگ مخصوصی براي فروش دارد كه با آن مي‌توان سوپ خوشمزه‌اي درست كرد و حاضر به اثبات آن شد. در حيني كه سنگ را با آبجوش مي‌پخت به روستاييان گفت سوپ سنگي خيلي خوشمزه است، اما مزه حتي بهتري پيدا م



ارسال محتوا به دوستان نظرات خود را در رازنامه ثبت کنید                به اشتراک گذاری محتوا در فیسبوک به اشتراک گذاری محتوا در گوگل پلاس به اشتراک گذاری محتوا در لینکدین به اشتراک گذاری محتوا در توی تر

مشخصات ثبت اطلاعات

مدیریت رازنامه

مدیریت رازنامه

تاریخ ثبت:
1390/05/06
بروزرسانی:
1390/05/06
آخرین مشاهده:
1399/11/02

نظرات و پیشنهادات


دریافت آخرین اطلاعات رازنامه
با ثبت پست الکترونیکی خود و یا دوستان خود همیشه از آخرین اطلاعات سایت آگاه شوید.

دریافت آخرین اطلاعات رازنامه

پرسش ها و پاسخ ها

    با عرض سلام و خسته نباشید در صورتی شرکتی به عنوان اسپانسر با ما مشغول فعالیت باشد از نظر اداره مالیاتی پول های واریزی از طرف اسپانسر به چه صورت شناسایی میشود ؟ آیا معاف از مالیات است؟

    علیرضا سربی
    علیرضا سربی ( حسابداری ، حسابرسی ، قوانین کار ، تامین اجتماعی ، مالیات ها ، تجارت و حسابداری بهای تمام شده )

    باسلام من کاردان دامپزشکم باشراکت مرغداری خریدیم مرغدار نمونه کشور شدم سرم کلاه گذاشتن مرغداری رو فروختن .میخوام کار شروع کنم نمیدونم چیکار باید بکنم.از مردم فراری شدم میترسم با هر کس کار کنم سرم کلاه

    علیرضا سربی
    علیرضا سربی ( حسابداری ، حسابرسی ، قوانین کار ، تامین اجتماعی ، مالیات ها ، تجارت و حسابداری بهای تمام شده )

    سلام،وقت بخیر زمانی که لیست تعدیل حقوق تهیه می گردد و حقوق و عیدی از مالیات معاف می گردند در سیستم حسابداری چطور باید مالیات حقوق را کسر کرد متشکرم

    احمد نورمحمدی
    احمد نورمحمدی  ( راهبری سیستم های حسابداری - مالیاتی مشاور مالی مالیاتی شرکت های دانش بنیان )

    سلام وقت بخیر من دوتا حساب دارم به نام پیش دریافت عوارض و ارزش فزوده و پیش پرداخت عوارض و ارزش افزود موقع پرداخت ارزش افزوده و عوارض چطوری سند بزنم و این که چرا تفاوت ارزش افزوده خرید من و ارزش ا

    مانوئیل یوحنائی
    مانوئیل یوحنائی ( حسابداری مالی - حسابداری مالیاتی -حسابداری صنعتی - حسابرسی - حسابرسی داخلی  )

    سلام ، وقت بخیر نحوه سند زدن پرداختی بیمه تامین اجتماعی به چه صورته ؟ بدون این که تو لیست حقوق و دستمزد بیام ه صورت جداگانه چطوری ثبت بزنم؟

    احمد نورمحمدی
    احمد نورمحمدی  ( راهبری سیستم های حسابداری - مالیاتی مشاور مالی مالیاتی شرکت های دانش بنیان )

    سلام به مشاور محترم من تازه دیپلم در رشته حسابداری گرفته ام نمی دانم به تحصیل در دانشگاه ادامه دهم یا خیر ؟ با توجه به اینکه بیکاری در مقطع دانش آموختگان عال زیاد است چه کنم ؟ لطفا" رهنمایی بفرمائید

    عیسی ذوقی
    عیسی ذوقی ( مشاور بازرگانی، مالی ومالیاتی  )

    سلام و وقت بخیر برای استارت آپ ها و کسب و کارهای الکترونیک آیا معافیت مالیاتی وجود دارد؟ در صورت تایید، نحوه استفاده از معافیت چگونه است؟

    علیرضا سربی
    علیرضا سربی ( حسابداری ، حسابرسی ، قوانین کار ، تامین اجتماعی ، مالیات ها ، تجارت و حسابداری بهای تمام شده )

    با سلام خدمت جنابعالی چنانچه پروانه بهره برداری کارگاه یا کارخانه ای که در شهرک صنعتی به نام فرد باشد ولی همین شخص مدیرعامل شرکتی باشد که در همان کارگاه مشغول تولید است و برای آن شرکت دفاتر قانونی تهی

    علیرضا سربی
    علیرضا سربی ( حسابداری ، حسابرسی ، قوانین کار ، تامین اجتماعی ، مالیات ها ، تجارت و حسابداری بهای تمام شده )

    سلام و وقت بخیر برای استارت آپ ها و کسب و کارهای الکترونیک آیا معافیت مالیاتی وجود دارد؟ در صورت تایید، نحوه استفاده از معافیت چگونه است؟

    علیرضا سربی
    علیرضا سربی ( حسابداری ، حسابرسی ، قوانین کار ، تامین اجتماعی ، مالیات ها ، تجارت و حسابداری بهای تمام شده )

    با سلام خدمت استاد محترم برای آموزش کارکنان در دوره آموزشی اکسل در حسابداری میخواستم ببینم چطوری باید با شما هماهنگی کنیم. با تشکر

    مهدی مقدسی
    مهدی مقدسی ( مشاوره مالی ،حسابداری و حسابرسی مالی و مالیاتی ،قانون مالیات های مستقیم. اکسل .قوانین بازار سرمایه، )