تحلیل های آماری و آنالیز رگرسیون

دانلود پایان نامه

شکل 3-2- فرم شمارهی دو جهت یادداشت برداری از وضعیت بیماری لکه موجی سیب زمینی در منطقه ی بسطام.
جهت تعیین شدت بیماری در بوته های آلوده، از مقیاس های معتبر موجود (Bradley et al., 2003; Henson et al., 2006) استفاده گردید. شرح این مقیاس 5 طبقه ای عبارت است از:
صفر: بدون علائم روی برگ
یک: آلودگی کمتر از 5 درصد سطح برگ بدون لکه روی دمبرگ و شاخه
دو: آلودگی 20-6 درصد سطح برگ تعدادی لکه روی دمبرگ
سه: آلودگی 40-21 درصد سطح برگ لکه هایی روی دمبرگ و شاخه
چهار: آلودگی 70-41 درصد سطح برگ لکه هایی روی دمبرگ،شاخه و ساقه
پنج: آلودگی بیش از 71 درصد سطح برگ لکه هایی روی دمبرگ، شاخه و ساقه
I و X، به تنهایی یا به همراه هم، جهت اندازه گیری بیماریهای مختلف گیاهی مورد استفاده قرار
می گیرند اما در کنار این دو متغیر، متغیر سومی نیز وجود دارد که شاخص بیماری)1DI ) نامیده می شود. این پارامتر گاهی به عنوان شدت متوسط بیماری با نماد MS نیز شناخته می شود (McRobertset al., 2003). شاخص بیماری، نتیجه تلفیق I و X است و به عنوان صفتی از بیماری که منعکس کننده ی تأثیر همه ی عوامل محیطی مؤثر بر بیماری است، توسط بسیاری از دانشمندان، به عنوان تعریف رسمی و واقعی شدت بیماری مورد استفاده قرار گرفته است (Campbell and Madden, 1990 و McRobertset al., 2003). برای محاسبه ی این شاخص نیز از معادله ی زیر استفاده گردید (Cardoso et al., 2004).

جستجو در سایت ما :


S = ∑(xini) / N (معادلهی 3-3)
3-4- منحنیهای پیشرفت زمانی و نکویی برازش مدل ها
جهت ساختن منحنی های پیشرفت بیماری، نمودار مقادیر شدت متوسط بیماری مزارع برای هر منطقه در مقابل تاریخ های نمونه برداری ترسیم گردید. منحنی های پیشرفت بیماری با استفاده از آنالیز رگرسیون خطی با چهار مدل رشد برازش داده شد. معادله هایی با پارامترهای خطی از چهار مدل رشد خانواده ی ریچاردز (تک مولکولی، لجستیک، لاگ لجستیک و گومپرتز) به عنوان معادلههای پیش بینی شده برای مقایسه آماری دادههای واقعی تبدیل شده مورد استفاده قرار گرفت (Soto-Estrada and Adaskaveg, 2004). معادلهی این مدل ها (Bowen, 1997؛ Campbell and Madden, 1990؛ Nutter and Parker, 1997؛ Soto-Estrada and Adaskaveg, 2004) در جدول 1-1 ارایه شده است. متغیرهای این معادلهها عبارتند از: y= مقدار بیماری (شاخص بیماری که به صورت نسبت از صفر تا یک و یا به صورت درصد از صفر تا 100 متغیر است، امابه منظور تجزیه و تحلیل آماری داده ها، مقادیر وقوع و شدت بیماری به نسبت (صفر تا یک) تبدیل شدند.) در زمان t، yo= مقدار اولیه بیماری و r*= نرخ افزایش بیماری برای هر مدل.
نخستین گام در فرایند مقایسه، تبدیل داده های تجربی (مشاهده شده) به مدل های تک مولکولی [ln{1/(1-y)}]، لجستیک و لاگ لجستیک [ln{y/(1-y)}] و گومپرتز [-ln{-ln(y)}] می باشد. در مرحله بعدی نمودار این اعداد تبدیل شده (y*) در مقابل زمان ترسیم گردید و در قدم سوم، تعیین گردید که آیا داده های تبدیل شده توانسته یک خط مستقیم را ایجاد کند یا نه. لازم به ذکر است که تبدیل های لجستیک، لاگ لجستیک و گومپرتز در دو نقطه y=0 و y=1 تعریف نشده می باشند. ترسیم نمودار یادشده به روش دستی، عملی دشوار و زمان بر می باشد که از طریق آنالیز رگرسیون خطی به وسیله نرم افزارهای آماری انجام گردید. مرتب کردن داده ها و ترسیم برخی از نمودارها با استفاده از نرم افزار Microsoft Excel 2007 (شرکت Microsoft) و تجزیه و تحلیل های آماری و ترسیم بعضی از نمودارها با استفاده از نرم افزار StatGraphics Centurion XV, Version 15.2.05 (شرکت StatPoint) صورت پذیرفت.
بعد از انجام رگرسیون خطی، نکویی برازش مدل از طریق امتحان مقدار ضریب تبیین (R2) که نسبت تنوع در داده های محاسبه شده به وسیله مدل رگرسیون است، انحراف معیار محاسبات (SEE) و نمودار باقیماندههای استاندارد شده در برابر مقادیر پیش بینی شده تعیین گردید و از این سه معیار، جهت انتخاب بهترین مدل استفاده شد (Campbell and Madden, 1990؛ Neheret al., 1997).
در مورد مطالعات مزرعهای، مدلی با ضریب تبیین بالاتر از 80 درصد مورد قبول می باشد و مدل با R2 بین 50 تا 80 درصد دارای برازش ضعیف در نظر گرفته می شود. در مورد نمودار باقیمانده ها در برابر مقادیر پیشبینی شده نیز یک توزیع تصادفی از نقاط، یک برازش مناسب را برای مدل انتخابی پیشنهاد میکند. یک توزیع با اشکال «U» یا «~» مدلی را پیشنهاد میکند که به صورت روند سیستمیک از داده ها را برازش میکنند. چنین الگوی سیستمیکی از مقادیر باقیمانده های استانداردشده نامطلوب می باشد (Campbell and Madden, 1990 و Neheret al., 1997).
برای مقایسهی مدل هایی که از متغیرهای مستقل با تبدیل های متفاوت استفاده کرده بودند، از لحاظ نکویی برازش، y پیش بینی شده توسط مدل تبدیل برگشتی گردید و بر اساس داده های به دست آمده، ضریب تبیین (R*2) محاسبه گردید. سپس ضریب تبیین مدل های مختلف با یکدیگر مورد مقایسه قرار گرفت (Campbell and Madden, 1990) و بر این اساس، بهترین مدل انتخاب گردید.
3-5- مدل سازی روابط بین میزان وقوع و شدت بیماری
جهت تعیین روند کلی داده های وقوع و شدت بیماری، نمودار مقادیر این دو کمیت در مقابل یکدیگر ترسیم گردید. برای تعیین تابع ریاضی رابطه بین دو متغیر یادشده، از رگرسیون خطی استفاده شد. تبدیلهای معمول در منابع (Cardoso et al., 2004؛ Paul et al., 2005)، شامل لگاریتم طبیعی1 (ln(S) = βln(I) + ln(α))، ریشه مربع2 (Sqrt(S) = βSqrt(I) + α) و تبدیل مکمل لگاریتم لگاریتم3 (ln[-ln(1-S)] = βln[-ln(1-I)] + α)، در کنار رابطهی خطی ساده (S = β.I + α) جهت دستیابی به بهترین رابطهی خطی بین وقوع و شدت در هر مزرعه و منطقه انجام گردید.
به منظور مقایسهی مدل های با تبدیلهای مختلف متغیرهای مستقل از نظر نکویی برازش، متغیر وابستهی پیشبینیشده، تبدیل برگشتی شد و آمارههای مختلف نظیر ضریب تبیین (R*2) محاسبه گردید. بعد از انتخاب بهترین مدلها، رگرسیون خطی بین دادههای مشاهده شده و پیش بینی شده، با استفاده از نرم افزارهای یادشده صورت پذیرفت.
فصل چهارم:
نتایج
در این تحقیق، جنبه های مختلف اپیدمی بیماری لکه موجی سیب زمینی در استان سمنان شهرستان شاهرود بخش بسطام مورد بررسی قرار گرفت. در ذیل نتایج کسب شده، در بخش های مختلف ارایه می گردد.
یادداشت برداری از وضعیت بیماری لکه موجی سیب زمینی در40 مزرعهی سیب زمینی طی سال زراعی 91-90 و در چهار منطقه مختلف شهر بسطام صورت پذیرفت (جدول 4-1). نتایج این بررسی یک ساله نشان داد که مقدار بیماری در مزارع سیب زمینی مناطق مختلف، از تنوع قابل ملاحظهای برخوردار است و این تنوع یک ساله، با توجه به شرایط مختلف محیطی و زراعی حاکم بر مزارع، با شدت و ضعف های مختلف بروز می نماید (شکل 1-3). نتایج تجزیهی واریانس دادههای شدت متوسط بیماری در مزارع سیب زمینی(جدول 4-3) نشان داد که تفاوت معنیداری در بین چهار منطقهی (P<0.01) اجرای تحقیق وجود دارد، اما تفاوت موجود در بین مزارع، معنیدار نمی باشد. از بین مناطق اجرای طرح نیز، مزارع بسطام، با شدت متوسط 5/18و روستای مجن 6/5 درصد در طول سال، به ترتیب بیشترین و کمترین شدت بیماری را به خود اختصاص داده بودند. تجزیه واریانس نشان می دهد که اختلاف بین چهار منطقه تقریباً معنی دار می باشد(شکل 2-3).