روش حداقل مربعات معمولی

دانلود پایان نامه

در آمار و اقتصاد سنجی، مجموعه داده‌های پانلی شامل مشاهداتی برای چندین بخش(خانوار، بنگاه و…) می‌باشند که در طی زمان‌های مختلف جمع آوری شده‌اند. یعنی یک مدل داده‌های پانل حاوی اطلاعاتی در زمان و مکان است که شامل N مؤلفه در T دوره زمانی می‌باشد.
اگر تعداد مشاهدات زمانی برای تمام مؤلفه‌های موجود در پانل یکسان باشد، به آن پانل متوازن گفته می‌شود. اما در صورتی که مشاهدات مفقوده‌ای برای تعدادی از مؤلفه‌ها وجود داشته باشد، پانل را نامتوازن می‌نامیم.
3-5-3-1- مزایای داده‌های پانل
طبق اصل جامعیت آماری ما باید از همه اطلاعات در دسترس برای انجام رگرسیون استفاده نمایید. استفاده از داده‌های پانل باعث می‌شود حجم نمونه بسیار بیشتر شود. این داده‌ها مخصوصاً در کشورهای در حال توسعه که روش جمع‌آوری داده‌های آن‌ها منظم نیست کاربرد بیشتری دارد. استفاده از داده‌های پانل مزایای دارد که چند مورد آن به شرح زیر است :
کاهش هم خطی موجود بین متغیرها: زیرا یکی از روش‌های کاهش هم خطی افزایش حجم نمونه است که با توجه به این‌که در داده‌های پانل حجم نمونه زیاد می‌شود ممکن است هم خطی کاهش یابد.
افزایش واریانس متغیرها که منجر به کاهش واریانس پارامترهای برآوردی می‌شود.
خلاصی از بسیاری از متغیرهای غیرقابل مشاهده بدون اینکه مشکل زیادی به وجود آید. این ویژگی یکی از ویژگی‌های جالب مدل‌های پانل دیتا است. با وجود مزایای زیادی که داده‌های پانل دارد اگر فردی که تجربه و آشنایی کافی با پانل دیتا ندارد به استفاده از این داده ها همت گمارد احتمالاً نتایج غلط و عجیبی خواهد گرفت. غالباً بسیاری از دانشجویان و اساتیدی که از داده‌های پانل استفاده می‌کنند و از ادبیات داده‌های پانل اطلاع ندارند بسیار سطحی به برآورد مدل می‌پردازند .
مخصوصاً عدم لحاظ تمام ناهمگنی‌ها باعث برآوردهای تورش دار و ناسازگار خواهد شد. در بسیاری از تحقیقات داخلی که از داده‌های پانل استفاده نموده‌اند تنها به آزمون چاو و آزمون هاسمن بسنده نموده‌اند که این آزمون‌ها قطعاً جهت دستیابی به نتایج صحیح کافی نیست . محققی که از داده‌های پانل استفاده می‌نماید ابتدا باید با توجه نوع پانل (میکرو یا ماکرو) مسائلی که در هرکدام ممکن است اتفاق افتد را مورد بررسی قرار دهد. مسائل عمده‌ای که در داده‌های ماکرو پانل اتفاق می‌افتد عبارت‌اند از: غیر ایستایی، هم جمعی، شکست ساختاری و همبستگی بین مقاطع در میکرو پانل معمولاً خطای اندازه‌گیری ،اثر ثابت و اثر تصادفی مطرح می‌شود. در میکرو پانل اگر یک قسمت خاص را مورد توجه قرار دهیم مدل اثر ثابت مناسب‌تر خواهد بود . اما اگر در موقعی که تعداد مقاطع زیاد و تعداد سال‌ها کم باشد از مدل اثر ثابت استفاده نماییم درجه آزادی زیادی از دست می‌رود. آزمون چاو که به وسیله بسیاری از محققان استفاده می‌شود وجود اثر ثابت را در مقابل پولینگ تست می‌نماید. حال سؤال این است که اگر اثر تصادفی در متغیرهای وجود داشته باشد آیا آزمون چاو معتبر است. به آسانی می‌توان اثبات نمود که در این حالت آزمون چاو اعتبار لازم را نخواهد داشت، هم‌چنین در خصوص وجود مشکل ناهمسانی واریانس و خودهمبستگی در داده‌های پانل باید گفت چنانچه تعداد سال‌ها بیشتر از مقاطع باشد مشکل خودهمبستگی و چنانچه تعداد مقاطع بیشتر از سال‌ها باشد مسئله ناهمسانی مورد انتظار است.
3-5-3-2- مدل اثرات ثابت
در این مدل هر یک از مولفه‌ها یک مقدار ثابت مخصوص به خود دارد و به دلیل آنکه برای کار کردن با هر یک از این مقادیر ثابت، یک متغیر مجازی در نظر گرفته می شود، تخمین زن اثرات ثابت، تخمین زن متغیرهای مجازی حداقل مربعات(LSDV) نیز نامیده می شود. این مدل را می توان به شکل زیر نوشت:
(3-36)
که در آن D ماتریس متغیرهای مجازی با ابعاد NT*N و X ماتریس متغیرهای توضیحی با ابعاد NT*k و β نیز ماتریس ضرایب با ابعاد k*1 می باشند.
مدل اخیر یک مدل رگرسیونی کلاسیک بوده و هیچ شرط جدیدی برای تجزیه و تحلیل آن لازم نیست و می توان مدل را با استفاده از OLS برآورد کرد.
مزیت مدل با اثرات ثابت این است که می تواند اثراتی را که در هر یک از مؤلفه‌ها متفاوت است ولی در طول زمان تغییر نمی‌کند، نشان دهد. البته پس از تشکیل مدل دیگر نمی توان به آن متغیری افزود که در طول زمان تغییر نکند، چرا که با اثرات ثابت موجود همخطی کامل پیدا خواهد کرد. از سوی دیگر عیب چنین مدلی این است که در آن باید برای هریک از متغیرهای مجازی یک ضریب و در مجموع N ضریب تخمین زد. این امر هنگامی که تعداد مؤلفه‌ها یعنی N خیلی زیاد باشد، که معمولاً نیز چنین است، مسئله ساز خواهد شد.
برای برطرف کردن این مشکل یک راه آن است که میانگین زمانی هر یک از متغیرها را از مقدار اصلی آنها کم کنیم. با این کار به مدلی می رسیم که فاقد عرض از مبدأ خواهد بود و می توانیم روش حداقل مربعات معمولی رابرای آن اجرا کنیم. روش دیگر آن است که تفاضل مرتبه اول متغیرها را به جای آنها در مدل به کار ببریم. در این صورت نیز عرض از مبدأ از مدل حذف می‌شود و مشکل تعداد زیاد پارامترها برای تخمین نیز برطرف می گردد.
3-5-3-3- روش پانل پویای گشتاورهای تعمیم یافته
بسیاری از مدل‌‌های داده‌های پانل در اصل، پویا می‌باشند و لحاظ این پویایی در مدل‌های پانل به صحت و استحکام نتایج به دست آمده کمک خواهد نمود. روش گشتاور تعمیم یافته یکی از روش‌های برآورد پارامترهای مدل در رهیافت دادههای تابلویی پویا بوده که قابل استفاده برای دادههای سری زمانی، مقطعی و دادههای تابلویی است. در مدل‌های پانل با ورود وقفه‌های متغیر وابسته به عنوان متغیر مستقل در سمت راست مدل، فرم پویای مدل حاصل می‌گردد. روش پانل پویای گشتاورهای تعمیم یافته زمانی کاربرد دارد که در داده‌های پانل تعداد مقاطع بیشتر از تعداد سری‌های زمانی باشد (بالتاگی، 2008). در این مقاله نیز تعداد مقاطع 153 و تعداد سال‌های سری زمانی 13 می‌باشد. برآورد گشتاورهای تعمیم یافته (GMM) برآوردگر پرتوانی است که برخلاف روش حداکثر درست‌نمایی (ML) نیاز به اطلاعات دقیق توزیع جملات اختلال ندارد (مشکی، 1390).
وجود وقفه متغیر وابسته در سمت راست مدل پانل منجر می‌شود که فرض عدم خودهمبستگی میان متغیرهای مستقل (توضیحی) و جملات اختلال به عنوان یکی از فروض کلاسیک نقض شود. درنتیجه استفاده از روش‌های حداقل مربعات معمولی (در مدل پانل اثرات ثابت و اثرات تصادفی) نتایج تورش‌دار و ناسازگاری ارائه خواهد کرد (آرلانو و باند، 1991). استفاده از روش تعمیم‌یافته گشتاورها (GMM) با بکارگیری متغیرهای ابزاری این ایراد یعنی درون‌زایی متغیرهای توضیحی یا ساختار پویای مدل را برطرف می‌نماید و جهت حذف تورش ناشی از درون‌زایی متغیرهای توضیحی، اجازه می‌دهد تمام متغیرهای رگرسیونی حتی با وقفه، اگر همبستگی با اجزاء اخلال ندارد به عنوان متغیر ابزاری وارد مدل شوند (گرین، 2012).
ماتیاس و سوستر (1991) که روش حداقل مربعات دومرحله‌ای اندرسون و هسیائو (1981) که به منظور رفع مشکل همبستگی جملات اختلال و متغیرهای توضیحی ارایه شده است به دلیل مشکل در انتخاب ابزارها، منجر به محاسبه واریانس بزرگ برای برآوردگرها و عدم معنی‌داری آنها خواهد شد (یاوری، اشراف‌زاده، 1384). برای حل این مشکل روش گشتاورهای تعمیم یافته آرلانو و باند (1991) پیشنهاد شد. این روش به واسطه انتخاب ابزارهای صحیح و با اعمال یک ماتریس وزنی می‌تواند برای شرایط ناهمسانی واریانس و نیز خودهمبستگی‌های ناشناخته برآوردگر پرتوانی محسوب شود (مشکی، 1390). همچنین کاربرد روش گشتاورهای تعمیم یافته (GMM) با داده‌های پانل پویا (DPD) مزیت‌هایی مانند لحاظ نمودن ناهمسانی انفرادی، حذف تورش‌ها در رگرسیون‌های مقطعی و درنتیجه برآوردگرهایی با کارایی بالاتر و هم‌خطی کمتر خواهد بود (ندیری، محمدی، 1390).
روش تفاضلی مرتبه اول گشتاورهای تعمیم‌یافته (GMM) ابتدا توسط آرلانو و باند (1998) مطرح شد. در روش تفاضلی مرتبه اول آرلانو و باند ابتدا وقفه متغیر وابسته به سمت راست اضافه می‌شود، سپس از متغیرها تفاضل مرتبه اول گرفته می‌شود و مدل به روش برابر قرار دادن گشتاورهای اولیه و مرکزی در نمونه و جامه مورد برآورد قرار می‌گیرد (پارسیان، 1389). در این روش عرض از مبداء حذف می‌گردد (یاوری، اشراف‌زاده، 1384). آرلانو و باور (1995) و بوندل و بوند (1998) با لحاظ تغییراتی در روش تفاضلی مرتبه اول گشتاورهای تعمیم‌یافته (GMM) روش گشتاورهای تعمیم‌یافته (GMM) متعامد را پیشنهاد دادند. تفاوت این دو روش یعنی آرلانو- بوند و آرلانو- باور/ بوندل-باند بر اساس شیوه‌ای است که تاثیرات فردی در مدل لحاظ می‌شود (ندیری، محمدی، 1391). از مزایای روش دوم بر روش اول افزایش دقت و کاهش تورش محدودیت حجم نمونه، تخمین‌های کارآمدتر و دقیق‌تر می‌باشد (بالتاگی، 2008).
برای تخمین مدل پانل با ویژگی‌های ذکر شده از تخمین‌زن پانل پویای تعمیم‌یافته (DPD) به روش آرلانو- باور/ بوندل- باند دو مرحله‌ای بهره خواهیم برد. به منظور تصریح مدل فوق و استخراج برآوردگرهایروش آرلانو- باور/ بوندل- باند دو مرحله‌ای یک مدل پانل پویا (DPD) به صورت زیر درنظر بگیرید (آلرانو، 2003):
(3-37)
: تعداد p پرامتر که باید برآورد گردند.
: یک بردار از متغیرهای کاملا برون‌زا می‌باشد.
: یک بردار از پارامترهایی که برآورد خواهند شد.

این مطلب مشابه را هم بخوانید :   پیامبران الهی