مقاله رایگان درمورد رگرسیون، اثرات ثابت، داده های پانل، مدل رگرسیون

ه پایین تر از میانه کیو توبین باشند ، در گروه نمونه با فرصت رشد پایین قرار میگیرند .
برای آزمون فرضیه سوم ، از رگرسیون (مدل ۳-۶ ) برای هر دو گروه نمونه دارای فرصت رشد بالا و فرصت رشد پایین استفاده می شود و مورد مقایسه قرار میگیرد :
〖 Capital Investment〗_jt =β_۰+ β_۱ 〖Divident〗_jt+ β_۲ 〖Divident〗_jt×〖RQ〗_(jt-1)+β_۳ 〖RQ〗_(jt-1)
+∑▒β_i 〖controls〗_(jt-1)+ε_jt
بنابر پیش بینی فرضیه سوم ضریب β_۲ برای گروه نمونه دارای فرصت رشد بالا بزرگتر از ضریب β_۲ برای گروه نمونه دارای فرصت رشد پایین خواهد بود.
H_0: β_۲ for hi growth option≤β_۲ for low growth option
H_1:β_۲ for hi growth optionβ_۲ for low growth option
۳-۸)مراحل عمومی تجزیه و تحلیل داده ها:
در این تحقیق برای آزمون فرضیه ها از مدل رگرسیون خطی چند متغیره استفاده شده است. روش آماری مورد استفاده در این تحقیق روش داده های پانل می باشد. در ادامه ابتدا روش داده های پانل و آزمونهای مربوط به آن تشریح می گردد. سپس آزمون های مربوط به معنی دار بودن کل مدل و معنی دار بودن متغیرهای مستقل توضیح داده می شود. در آخر نیز پس از تشریح آزمون های مربوط به مفروضات رگرسیون کلاسیک، نحوه تصمیم گیری در مورد رد یا پذیرش فرضیه های تحقیق بیان می گردد. لازم به ذکر است در این مطالعه برای تجزیه و تحلیل داده ها از نرم افزار Eviewsبهره گرفته شده است.
۳-۸-۱) روش داده های پانل
مدل‌ها از لحاظ استفاده از اطلاعات آماری به سه گروه تقسیم می شوند. برخی از مدل‌ها با استفاده از «اطلاعات سری زمانی۱۲۵» یا به عبارتی طی دوره نسبتاً طولانی چند ساله برآورد می شوند. بعضی دیگر از مدل‌ها بر اساس «داده های مقطعی۱۲۶» برآورد می شوند یعنی متغیرها در یک دوره زمانی معین مثلاً یک هفته، یک ماه یا یک سال در واحدهای مختلف بررسی می شوند.
روش سوم برآورد مدل، که در این تحقیق نیز مورد استفاده قرار گرفته است ، برآورد بر اساس «داده های پانل۱۲۷» است. در این روش یک سری واحدهای مقطعی (مثلاً شرکت ها) در طی چند سال مورد توجه قرار می گیرند. با کمک این روش که در مطالعات سال های اخیر نیز زیاد استفاده شده است تعداد مشاهدات تا حد مطلوب افزایش می یابد.
با توجه به اینکه مشاهده های ادغام شده باعث تغییرپذیری بالاتر، هم خطی چندگانه کمتر میان متغیرهای توضیحی، درجه آزادی بیشتر و کارآیی بالاتر تخمین کننده ها می شود، مطالعات پانل نسبت به مطالعات مقطعی و سری زمانی دارای مزیت است (بالتاجی۱۲۸، ۱۹۹۵). در حالت کلی مدل زیر نشان دهنده یک مدل با داده های پانل می باشد :
Y_it=α_it+∑_(k-1)^K▒X_kit +ε_it
که در آن نشانگر واحدهای مقطعی (مثلا شرکت ها) و نشانگر زمان است. متغیر وابسته را برایامین واحد مقطعی در سال نشان می دهد و X_kit نیز امین متغیر مستقل غیرتصادفی برای برایامین واحد مقطعی در سالام است. جمله اخلال بوده و فرض می شود که دارای میانگین صفر (E[ε_it]=0)و واریانس ثابت (E[ε_it]=σ_t^2) است.
پارامترهای مدل می باشد که واکنش متغیر مستقل نسبت به تغییراتامین متغیر مستقل درامین مقطع وامین زمان را اندازه گیری می کند. برای برآورد مدل بر اساس داده های پانل روش های مختلفی همچون روش اثرات ثابت۱۲۹ و روش اثرات تصادفی۱۳۰ وجود دارد که بر حسب مورد، کاربرد خواهند داشت.
۳-۸-۱-۱) روش اثراث ثابت:
در روش اثرات ثابت فرض بر این است که ضرایب مربوط به متغیرها (شیب ها) ثابت هستند و اختلافات بین واحدها را می توان به صورت تفاوت عرض از مبداء نشان داد. در این حالت اگر عرض از مبداء تنها برای واحدهای مختلف مقطعی متفاوت باشد اصطلاحاً روش اثرات ثابت یکطرفه۱۳۱ نامیده شده و مدل آن بصورت زیر می‌باشد:
Y_it=α+μ_i+r^2+∑_(k-1)^K▒X_kit +ε_it
و اگر عرض از مبداء هم مابین مقاطع و هم مابین دوره ها متفاوت باشد روش اثرات ثابت دوطرفه۱۳۲ نامیده می‌شود و مدل آن بصورت زیر خواهد بود:
Y_it=α+μ_i+λ_t+r^2+∑_(k-1)^K▒X_kit +ε_it
در مدل‌های فوق متغیری است که برای واحدهای مقطعی متفاوت اما در طول زمان ثابت می باشد ومتغیری است که برای تمام واحدهای مقطعی در زمان مشابه یکسان بوده اما در طول زمان تغییر می کند. برای برآورد روش اثرات ثابت از مدل حداقل مربعات متغیر مجازی (LSDV) استفاده می شود.
مدل اخیر یک مدل رگرسیونی کلاسیک بوده و هیچ شرط جدیدی برای تجزیه و تحلیل آن لازم نیست و از طریق روش حداقل مربعات معمولی۱۳۳ قابل برآورد می باشد.
۳-۸-۱-۲) روش اثرات تصادفی:
مدل‌های اثرات ثابت تنها درصورتی منطقی خواهد بود که ما اطمینان داشته باشیم که اختلاف بین مقاطع را می توان به صورت انتقال تابع رگرسیون نشان داد، در حالیکه ما همیشه از وجود این موضوع مطمئن نیستیم. برای رفع این مشکل روشی پیشنهاد شده است که به مدل اجزاء خطا۱۳۴ یا اثرات تصادفی معروف است. این روش فرض می کند که جزء ثابت مشخص کننده مقاطع مختلف به صورت تصادفی بین واحدها و مقاطع توزیع شده است. بنابراین مدل اثرات تصادفی را می توان بصورت زیر تعریف کرد:
Y_it=α+∑_(k-1)^K▒〖β_k X〗_(kit ) +〖η_i +ε〗_it
که در آن یک جمله خطای تصادفی با میانگین صفر و واریانس می باشد. بنابراین در مدل اثرات تصادفی جزء اخلال از دو بخش تشکیل شده است؛ یکی که جزء اخلال مقطع می باشد، و دیگری که جزء اخلال ترکیب مقطع و سری زمانی است. با توجه به اینکه در این حالت واریانس های مربوط به مقاطع مختلف با هم یکسان نیستند لذا مدل دچار ناهمسانی واریانس بوده و از روش حداقل مربعات تعمیم یافته۱۳۵ (GLS) جهت برآورد مدل استفاده می شود.
۳-۸-۲) آزمون چاو۱۳۶ یا F لیمر:
در بررسی داده های مقطعی و سری های زمانی، اگر ضرایب اثرات مقطعی و اثرات زمانی معنی دار نشود، می توان داده ها را با یکدیگر ترکیب کرده و به وسیله یک رگرسیون حداقل مربعات معمولی تخمین بزنیم. از آنجایی که در اکثر داده های ترکیبی اغلب ضرایب مقاطع یا سری های زمانی معنی دار هستند این مدل که به مدل رگرسیون ترکیب شده۱۳۷ معروف است کمتر مورد استفاده قرار می گیرد (یافی۱۳۸، ۲۰۰۳). لذا برای اینکه بتوان مشخص نمود که آیا داده های پانل جهت برآورد تابع مورد نظر کارآمدتر خواهد بود یا نه، فرضیه ای را آزمون می کنیم که در آن کلیه عبارات ثابت برآورد با یکدیگر برابر هستند. فرضیه صفر این آزمون که به آزمون چاو یا F لیمر معروف است بصورت زیر می باشد:
برای آزمون فرضیه مذکور از آماره F بصورت زیر استفاده می شود:
که در آن N برابر با تعداد واحدهای مقطعی، T طول دوره مورد نظر، K تعداد متغیرهای توضیحی، RRSS مجذور پسماندهای حاصل از برآورد مقید رگرسیون بصورت حداقل مربعات متغیر مجازی و URSS مجذور پسماندهای حاصل از برآورد نامقید رگرسیون بصورت حداقل مربعات معمولی می باشد. در این آزمون فرضیه یعنی یکسان بودن عرض از مبداء ها در مقابل فرضیه یعنی ناهمسانی عرض از مبداء ها قرار می گیرد. در صورتی که فرضیه پذیرفته شود به معنی یکسان بودن شیب ها برای مقاطع مختلف بوده و قابلیت ترکیب شدن داده ها و استفاده از مدل رگرسیون ترکیب شده مورد تأیید آماری قرار می گیرد. اما در صورت رد فرضیه روش داده های پانل پذیرفته می شود و می توان از روش داده های پانل استفاده کرد.
۳-۸-۳) آزمون هاسمن۱۳۹:
به منظور اینکه مشخص گردد کدام روش (اثرات ثابت و یا اثرات تصادفی) جهت برآورد مناسب تر است (تشخیص ثابت یا تصادفی بودن تفاوت های واحدهای مقطعی) از آزمون هاسمن استفاده می شود. در روش اثرات تصادفی بار متغیرهای حذف شده روی جمله اخلال قرار می گیرند، اما این مشروط بر آن است که بین متغیرهای مستقل و مؤلفه خطای مقطعی همبستگی وجود نداشته باشد.
آزمون هاسمن وجود این همبستگی را بررسی می کند. این آزمون مبتنی بر این فرض اولیه است که در صورت وجود همبستگی، روش اثرات ثابت سازگار و روش اثرات تصادفی ناسازگار است. اگر تخمین کننده روش اثرات ثابت و تخمین کننده روش اثرات تصادفی باشد آماره این آزمون که دارای توزیع کای-دو با درجه آزادی برابر با تعداد متغیرهای مستقل است بصورت زیر قابل تعریف می باشد:
فرضیه صفر در آزمون هاسمن به صورت زیر خواهد بود:
فرضیه صفر به این معنی است که ارتباطی بین جزء اخلال مربوط به عرض از مبدأ و متغیرهای توضیحی وجود ندارد و آن ها از یکدیگر مستقل هستند. در حالی که فرضیه مقابل به این معنی است که بین جزء اخلال مورد نظر و متغیرهای توضیحی همبستگی وجود دارد. از آنجایی که به هنگام وجود همبستگی بین اجزاء اخلال و متغیر توضیحی با مشکل تورش و ناسازگاری مواجه می شویم، بنابراین بهتر است در صورت پذیرفته شدن (رد) از روش اثرات ثابت استفاده کنیم. هنگامی که بین اجزاء اخلال و متغیر توضیحی همبستگی وجود نداشته باشد ( قبول)، هر دو روش اثرات ثابت و اثرات تصادفی سازگار هستند ولی روش اثرات ثابت ناکارآ بوده و بایستی از روش اثرات تصادفی استفاده شود (بالتاجی، ۱۹۹۵).
۳-۸-۴) آزمون معنی دار بودن مدل
برای بررسی معنی دار بودن مدل رگرسیون از آماره F استفاده شده است. فرضیه صفر در آزمون F به صورت زیر خواهد بود:
که بوسیله آماره زیر صحت آن مورد بررسی قرار می گیرد:
برای تصمیم گیری در مورد پذیرش یا رد فرضیه صفر،آماره F به دست آمده با F جدول که با درجات آزادی K-1 و N-K در سطح خطای () ۵% محاسبه شده، مقایسه می شود، اگر F محاسبه شده بیشتر از F جدول باشد () مقدار عددی تابع آزمون در ناحیه بحرانی قرار گرفته و فرض صفر () رد می شود. در این حالت با ضریب اطمینان ۹۵% کل مدل معنی دار خواهد بود.
در صورتی که مقدار F محاسبه شده کمتر از F جدول باشد فرض پذیرفته شده و معنی داری مدل در سطح اطمینان ۹۵% مورد تأیید قرار نمی گیرد.
۳-۸-۵) آزمون معنی دار بودن متغیرهای تحقیق
برای بررسی معنی دار بودن ضرایب متغیرهای مستقل در هر مدل از آماره t استفاده شده است. فرضیه صفر در آزمون t به صورت زیر خواهد بود:
که بوسیله آماره زیر صحت آن مورد بررسی قرار می گیرد:
برای تصمیم گیری در مورد پذیرش یا رد فرضیه صفر، آماره T به دست آمده با t جدول که با درجه آزادی N-K در سطح اطمینان ۹۵% محاسبه شده مقایسه می شود، چنانچه قدرمطلق T محاسبه شده از t جدول بزرگتر باشد ،مقدار عددی تابع آزمون در ناحیه بحرانی قرار گرفته و فرض صفر () رد می شود. در این حالت با ضریب اطمینان ۹۵% ضریب مورد نظر () معنی دار خواهد بود که دلالت بر وجود ارتباط بین متغیر مستقل و وابسته دارد.
۳-۸-۶) آزمون های مربوط به مفروضات مدل رگرسیون خطی
مدل کلاسیک رگرسیون خطی دارای مجموعه ای از فروض تحت عنوان فروض کلاسیک می‌باشد که بیشتر آنها در مورد جمله اخلال مدل مطرح می گردند؛

مطلب مرتبط :   منبع مقاله دربارهاندازه گیری، نرم افزار، رگرسیون

دیدگاهتان را بنویسید