مقاله رایگان درمورد رگرسیون، رگرسیون خطی، ضریب تعیین، مدل رگرسیون

برای اینکه در مدل رگرسیون خطی، تخمین زن های حداقل مربعات معمولی ضرایب رگرسیون، بهترین تخمین زن های بدون تورش خطی (BLUE) باشند لازم است تا مفروضات این مدل بررسی و آزمون شوند. در ادامه نحوه آزمون این فرضیات بیان می گردد.
۳-۸-۶-۱) فرض نرمال بودن متغیرها و باقیمانده ها:
یکی از فروض مهم راجع به جمله خطا این است که توزیع نرمال دارد. در این پژوهش برای بررسی نرمال بودن توزیع خطاها از آزمون جارکیو- برا۱۴۰ استفاده می شود. فرضیه صفر و آماره این آزمون بصورت زیر بوده و به توزیعبا درجه آزادی ۲ گرایش دارد:
در این آماره،(ضریب چولگی) و (ضریب کشیدگی) از طریق باقیمانده های رگرسیون قابل محاسبه می باشند. فرضیه آزمون جارکیو- برا بیانگر نرمال بودن می باشد. بنابراین زمانی که مقدار آماره محاسبه شده از مقدار بحرانی آن با درجه آزادی ۲ کوچکتر باشد، فرضیهپذیرفته شده وحاکی از نرمال بودن توزیع خطاها می‌باشد (سوری، ۱۳۸۹).
۳-۸-۶-۲) فرض عدم وجود همخطی۱۴۱ بین متغیرهای مستقل:
همخطی به معنای وجود رابطه بین متغیرهای مستقل موجود در مدل می باشد به نحوی که: مخالف صفر باشد. برای تشخیص وجود همخطی روشهای مختلفی وجود دارد، از جمله اینکه اگر در مدل همخطی وجود داشته باشد ضریب تعیین مدل بالا برآورد شده و در عین حال تعداد متغیرهای معنی دار موجود در مدل کم می شود. البته این نکته حائز اهمیت است که همخطی هیچیک از فروض کلاسیک را نقض نمی نماید و برآورد کننده های بدست آمده با وجود مشکل همخطی سازگار خواهند بود اما در این حالت ضرائب دارای خطای معیار بالایی خواهد بود و در نتیجه این مساله باعث می شود که تعداد متغیرهای معنی دار در معادله کاهش بیابد. در این مطالعه برای بررسی عدم وجود همخطی از ضریب همبستگی پیرسون استفاده خواهد شد. در صورتی که همبستگی میان متغیرها قوی نباشد (کمتر از ۷/۰) می توان گفت همخطی شدیدی میان متغیرها وجود ندارد.
۳-۸-۶-۳) فرض مستقل بودن باقیمانده ها:
این فرصیه مدل کلاسیک رگرسیون خطی بیان می دارد که بین جملات اخلال رگرسیون همبستگی وجود ندارد. اگر این فرض نقض گردد کواریانس بین دو جمله اخلال i و j برابر صفر نخواهد بود. برای بررسی استقلال باقیمانده ها از آماره دوربین-واتسن۱۴۲ استفاده شده است. با توجه به استفاده از روش داده های پانل آماره این آزمون بصورت زیر تعریف می شود:
اگر مقدار آماره دوربین واتسن نزدیک به عدد ۲ باشد، می توان استقلال باقیمانده ها را بپذیریم. برای رفع مسئله خود همبستگی می توان از روش هایی از جمله ، رفع خود همبستگی مرتبه اولAR(1) یا روش تصحیح خود استفاده کرد.
۳-۸-۶-۴) فرض همسانی واریانس۱۴۳باقیمانده ها:
یکی از فروض رگرسیون خطی به روش حداقل مربعات معمولی(OLS) این است که تمامی جملات پسماند دارای واریانس برابر باشند. در عمل ممکن است این فرض چندان صادق نبوده و به دلایل مختلفی از قبیل شکل نادرست تابع مدل، وجود نقاط پرت، شکست ساختاری در جامعه آماری، یادگیری در طی زمان و… شاهد پدیده واریانس ناهمسانی باشیم. برای بررسی این مشکل آزمون های مختلفی توسط اقتصاددانان معرفی شده است. در این مطالعه فرض همسانی واریانس باقیمانده ها از طریق آزمون بروش-پاگان۱۴۴ مورد بررسی قرار خواهد گرفت. آزمون بروش-پاگان به منظور آزمودن واریانس ناهمسانی در مدل‌های رگرسیون خطی استفاده می شود و وابستگی واریانس جملات پسماند بدست آمده از رگرسیون خطی را به مقادیر متغیرهای توضیح دهنده مدل، بررسی می کند. این آزمون توسط بروش و پاگان در سال ۱۹۷۹ معرفی شده است. آزمون واریانس ناهمسانی به روش بروش-پاگان شامل چهار مرحله زیراست:
۱- مدل رگرسیونی با فرض واریانس همسانی تخمین زده شده و جملات پسماند بدست آورده می شود:
y=β_°+β_۱ X_1i+β_۲ X_2i+…+βX+u_i
۲- مجذور جملات پسماند روی متغیرهای توضیح دهنده X رگرسیون زده و ضریب تعیین این رگرسیون بدست می آید:
〖 u〗_i^2=γ_(° )+γ_۱ X_1i+γ_۲ x_2i+…+γ_k X_ki+η_i
۳- با استفاده از ضریب تعیین بدست آمده، آماره F مربوط می شود. آمارهF دارای توزیع F با درجه آزادی k, n-k-1 است.
با توجه به سطح اطمینان مورد نظر (در این مطالعه ۹۵%)، مقادیر بحرانی متناظر با این آماره از جدول توزیع‌ F بدست می آید، اگر مقادیر این آماره‌از مقادیر بحرانی بیشتر باشد، فرض صفرکه دلالت بر همسانی واریانس دارد، رد می شود و می توان گفت جملات پسماند ارتباط معناداری با متغیرهای توضیح دهنده X داشته و ناهمسانی واریانس وجود دارد.
۳-۸-۷) تصمیم گیری برای رد یا پذیرش فرضیه ها
با توجه به موارد عنوان شده فوق در این تحقیق برای آزمون فرضیات ابتدا با استفاده از آزمونF مقید، درستی ادغام داده ها مورد آزمون قرار گرفته و سپس بر اساس آزمون هاسمن نوع روش آزمون (اثرات ثابت یا اثرات تصادفی) تعیین گردیده و با توجه به نوع روش نسبت به برآورد مدل اقدام شده است. جهت بررسی معنی دار بودن کل مدل از آماره F استفاده شده است. بطوریکه با مقایسه آماره F و F جدول که با درجات آزادی K-1 و N-K در سطح خطای ۵% محاسبه شده، کل مدل مورد بررسی قرار گرفته است. همچنین برای بررسی معنی دار بودن ضریب متغیرهای مستقل از آماره t استفاده شده است. آماره t به دست آمده با t جدول که با درجه آزادی N-K در سطح اطمینان ۹۵% محاسبه شده مقایسه می شود، چنانچه قدرمطلق t محاسبه شده از t جدول بزرگتر باشد، ضریب مورد نظر معنی دار خواهد بود که دلالت بر وجود ارتباط بین متغیر مستقل و وابسته دارد. همچنین به عنوان روشی جایگزین جهت تصمیم گیری در مورد پذیرش یا رد یک فرضیه بر اساس مقدار احتمال یا سطح معنی داری نیز عمل شده است. بدین صورت که اگر مقدار احتمال محاسبه شده بزرگتر یا مساوی مقدار خطای نوع اول () باشد فرض صفر پذیرفته می شود و اگر مقدار احتمال کوچکتر از مقدار خطای نوع اول () باشد فرض صفر رد می شود.
۳-۹)خلاصه فصل:
فصل حاضر با بیان مقدمه ای بر روش تحقیق آغاز گردیده است . سپس روش تحقیق و آزمون های به کار رفته در تحقیق معرفی گردیده است . پس از آن جامعه مطالعاتی و نمونه آماری تحقیق که در فرآیند تحقیق به عنوان داده مورد استفاده قرار گرفته است و روش انتخاب نمونه ها به شیوه حذف سیستماتیک معرفی شده است. سپس نمودار مربوط به مدل مفهومی تحقیق در یک دید و شمای کلی ترسیم گردیده است . مدل تحلیلی و شیوه اندازه گیری متغیرهای تحقیق ، تشکیل دهنده بخش بعدی این فصل هستند . در این بخش الگوی رگرسیونی برای آزمون فرضیه های تحقیق معرفی گردیده است و بر اساس آن متغیرهای مستقل ، متغیرهای وابسته و متغیرهای کنترل به تفکیک و با تشریح شیوه اندازه گیری آن ها ارائه شده است. برای آگاهی خوانندگان ، روش های جمع آوری اطلاعات نیز در قسمت بعدی آمده است و در پی آن روش تجزیه و تحلیل اطلاعات و آزمون های تحقیق در فرآیند اجرای آن تشریح شده است . سپس به منظور روشن نمودن الگوهای رگرسیونی و کاربرد آن ها در فرضیات سه گانه پژوهش ، روش آزمون هر فرضیه به طور مستقل به همراه مدل رگرسیونی مربوطه ارائه شده است و در پایان مراحل عمومی تجزیه و تحلیل داده ها و آزمونها تحت نرم افزار ای ویوز و روش داده های پانل به منظور آگاهی دهندگی بیشتر ، تشریح گردیده است .
فصل چهارم
برآورد الگو و یافته های تحقیق
۴-۱) مقدمه
هدف اساسی تحقیق حاضر بررسی نقش کیفیت گزارشگری مالی در کاهش آثار محدود کننده سیاست تقسیم سود بر تصمیمات سرمایه گذاری در شرکتهای پذیرفته شده در بازار اوراق بهادار تهران می باشد. در راستای هدف مذکور، فرضیاتی مطرح شد که در فصل سوم روش تحقیق و نحوه آزمون این فرضیات ارائه گردید. دراین فصل، یافته های حاصل از تجزیه و تحلیل آماری ارائه می شود. ابتدا متغیرهای تحقیق به لحاظ آماری توصیف و بررسی می شوند. در ادامه، فرضیات تحقیق باتوجه به الگوی آزمون علمی مطرح شده در فصل قبل و از طریق نرم افزار Eviews و در سطح اطمینان ۹۵ درصد اجرا و نتایج حاصل ارائه می شود. در هر یک از آزمون های رگرسیونی، نحوه انتخاب روش مناسب برای تخمین و برقراری فرض های اساسی رگرسیون، به جهت دستیابی به نتایج معتبر، مورد توجه قرار گرفته است.
۴-۲) آمار توصیفی متغیرهای تحقیق
نقطه شروع تجزیه و تحلیل داده هایی که بر اساس مبانی کمی اندازه گیری می شوند؛ به منظور تجزیه و تحلیل اطلاعات، ابتدا لازم است آمارهای توصیفی داده های تحت بررسی محاسبه شود.تحلیل توصیفی، تکنیکی است که به بررسی شاخصهای مرکزی و پراکندگی داده های تحقیق می پردازد. تعداد مشاهدات تحقیق حاضر ۷۳۲ سال-شرکت است. این مشاهدات ناشی از ترکیب داده های ۱۲۲ شرکت پذیرفته شده در بورس، بعنوان نمونه آماری در طول ۶ سال (۱۳۸۶ تا ۱۳۹۱)، بعنوان دوره آزمون می باشد. آمار توصیفی مربوط به متغیرهای بکار رفته در مدل آزمون فرضیات در جدول ۴-۱ ارائه شده است.
جدول (۴-۱): تحلیل توصیفی متغیرهای به کار رفته در مدل آزمون فرضیات
میانگین
میانه
حداکثر
حداقل
انحراف معیار
چولگی
کشیدگی
تعداد مشاهدات
INV
۰۳۶۳/۰
۰۲۱۰/۰
۴۳/۰
۰۶/۰-
۰۴۷/۰
۵۲۷/۳
۴۷۱/۱۸
۷۳۲
RD
۰۲۰۳/۰
۰۰۰۰/۰
۳۲/۰
۰۰/۰
۴۴۳/۰
۲۲۱/۱
۰۷۰/۰-
۷۳۲
CINV
۰۱۶۷/۰
۰۰۵۵/۰
۳۷/۰
۰۳/۰-
۰۳۵/۰
۸۳۷/۴
۳۲۶/۳۲
۷۳۲
DIV
۱۳۹۶/۰
۰۷۳۰/۰
۰۰/۱
۰۰/۰
۱۷۳/۰
۸۸۹/۱
۸۴۴/۳
۷۳۲
RQ
۱۲۱/۲-
۷۶۶۲/۱-
۰۵/۰-
۴۲/۸-
۶۵۶/۱
۳۵/۱-
۱۶۶/۲
۷۳۲
CASH
۰۳۷۶/۰
۰۲۷۳/۰
۳۴/۰
۰۰/۰
۰۳۶/۰
۶۶۵/۲
۸۷۰/۱۱
۷۳۲
CYCLE
۳۶۹۸/۲
۴۰۷۳/۲
۲۹/۴
۵۱/۰
۴۵۶/۰
۵۶/۰-
۲۴۱/۴
۷۳۲
LEV
۱۱۷۳/۰
۰۶۵۸/۰
۸۲/۰
۰۰/۰
۱۳۵/۰
۹۰۵/۱
۹۹۰/۳
۷۳۲
LOSS
۰۴۷۸/۰
۰۰۰۰/۰
۰۰/۱
۰۰/۰
۲۱۳/۰
۲۴۷/۴
۰۸۲/۱۶
۷۳۲
SDCFO
۱۶۸۷/۰
۱۱۲۵/۰
۸۶/۰
۰۱/۰
۱۵۷/۰
۴۵۶/۲
۷۲۱/۶
۷۳۲
SDINV
۱۰۳۱/۰
۰۷۲۳/۰
۶۹/۰
۰۰/۰
۱۱۳/۰
۵۲۶/۲
۳۹۸/۸
۷۳۲
SDSALE
۲۱۵۵/۰
۱۵۰۶/۰
۹۶/۰
۰۰/۰
۱۹۹/۰
۸۶۶/۱
۱۴۳/۳
۷۳۲
SIZE
۷۹۳۰/۵
۷۰۳۱/۵
۰۱/۸
۵۶/۴
۶۰۵/۰
۸۷۲/۰
۸۵۵/۰
۷۳۲
TAN
۲۵۰۰/۰
۲۲۰۴/۰
۸۹/۰
۰۲/۰
۱۶۷/۰
۰۴۹/۱
۱۸۱/۱
۷۳۲
TOB
۵۵۶۸/۱
۲۴۶۳/۱
۹۴/۵
۳۶/۰
۹۲۲/۰
۰۵۹/۲
۷۰۴/۴
۷۳۲
CFOP
۲۵۴۵/۰
۱۲۶۰/۰
۴۹/۴
۹۳/۲-
۵۹۴/۰
۰۴۶/۳
۸۷۴/۱۸
۷۳۲
AGE
۵۰۰۷/۱
۵۸۰۰/۱
۰۰/۲
۰۰/۱
۲۷۸/۰
۴۲/۰-
۴۳۶/۰-
۷۳۲
BR
۹۹۲۳/۱
۹۸۳۸/۱
۸۸/۴
۸۱/۱-
۰۵۹/۱
۰۲/۰-
۵۲۰/۰
۷۳۲
تحلیل توصیفی، اطلاعات مفیدی را در خصوص توزیع داده های جمع آوری شده و متغیرهای محاسبه شده در اختیار محقق قرار می دهد. برای مثال، نتایج ارائه شده در جدول ۴-۱ نشان می‌دهد که انحراف معیار بدست آمده برای متغیرهایINV ، RD، DIV و CINV از میانگین آن‌ها بالاتر است. این یافته حاکی از وجو

مطلب مرتبط :   منابع و ماخذ مقالهthe، and، میکنم.

دیدگاهتان را بنویسید