پایان نامه با کلید واژه های کمترین مربعات جزئی، روش حداقل مربعات، نمونه برداری

ک تابعی از زمان در نوارهای طیفی می باشند.اسکن در سرعت ثابت برابر است با :
dA/dt=s
و همچنین برای اولین مشتق به این صورت می باشد :
dA/dt=1/s dA/dt (1-10)

مشتقات با مرتبه های خیلی بالاتر با استفاده از یکسری روش های پی در پی مشتقی به دست می آیند. از جمله معایب روش های الکترونی این است که دامنه و طول موج مشتقات متفاوت می باشد. سرعت اسکن، عرض شکاف و مقاومت از عواملی هستند که این معایب را تشدید می بخشند.

1-10-3- تکنیک های ریاضی در مشتق
اولین تکنیک ریاضی که استفاده شد نمونه برداری با استفاده از دیجیتال بود که اندازه آنها به پهنای طبیعی طیف های در حال پردازش برای تولید داده بستگی دارد. به طور معمول برای طیف UV-Vis پهنای طبیهی طیف در محدوده 50-10 نانومتر می باشد. اولین مشتق طیفی ممکن است به سادگی به وسیله جذب بین دو طول موج نزدیک به هم محاسبه شود.
D_(λ+∆λ)=((A_(λ+∆λ)-A_λ))/∆λ (1-11)
که در این رابطه Dλ از طول موج بین دو محدوده ی موجی به دست می آید. برای تعیین دومین مشتق سه فاصله نزدیک به هم از طول موج انتخاب می شود.

D_λ=((A_(λ-∆λ)-2A_λ+A_(λ+∆λ)))/(∆λ^2 )(1- 12)
برای محاسبه مشتق های بالاتر می توان همانند موارد بالا محاسبه کرد. در این روش از خطوط ساده بین طول موج ها استفاده می شود که توسط ساویسکی51و گولی52 برای محاسبه مشتق در یک طول موج خاص توسط روش حداقل مربعات پیشنهاد شده است.
A_λ=a_0+a_1 λ+K+a_1 λ́(1-13)

1-10-4- حذف پس زمینه
اگر به صورت ناخواسته در طیف سنجی یک تغییر در جذب زمینه داریم علت آن ممکن است مربوط به دستگاه( ناپایداری لامپ ، دتکتور ) و یا تغییرات نمونه53 باشد. البته با گرفتن مشتق اول از طیف تا حدی می توان آن را بهبود داد.

شکل1-3- نمایی از یک طیف دارای جذب زمینه و مشتق آن
سایر تاثیرات جذب زمینه به طور مستقیم متناسب است با طول موج به شکل کلی زیر:
A=a_0+a_1 λ^1+…+a_n λ^n(1-14)
جذب زمینه به وجود آمده می تواند با استفاده از مرتبه های بالاتر مشتق گیری حذف شود. اما هر مشتق گیری جزئیات بیشتری را نشان می دهد پس این اثر زیاد هم مورد استفاده نیست.

1-10-5- اثرات پهنای طیف
شاید مهمترین اثر فرایند مشتق گیری این است که باندهای پهن، باندهای تیز را محو کرده و این محو شدن با افزایش درجه مشتق گیری افزایش می یابد. این ناشی از این است که دامنه Dnاز یک گره گوسی در مشتق nام متناسب است با معکوس پهنای باند اصلی به توان n.
D^n=1/W^n (1-15)
پس برای دو باند هم اندازه و هم شدت اما با پهنای متفاوت دامنه مشتق nام طیف Xباید بیشتر از طیف Yباشد.
(D_X^n)/(D_Y^n )=(W_Y^n)/(W_X^n ) (1-16)
شکل (1-4) دو پیک را که یکی پهنای پیک 160 نانومترو دیگری 40 نانومترنشان می دهد. در حالت جذب هر دو دامنه برابر دارند اما در مشتق اول باند باریکتر دامنه اش 4 برابر بیشتر از دیگری می باشد و در مشتق مرتبه دوم 16 برابر بیشتر می شود. از این ویژگی برای بهبود دقت و صحت در پیک باریکتر در حضور یک گره که دارای پهنای باند بیشتری برای کاهش پراکندگی استفاده شده است.

شکل 1-4- نمایشی از تفاوت در پهنای گسترده پیک ها
پراکندگی یک مشکل بزرگ در تجزیه و تحلیل ناشی از اندازه گیری های کوچک موجود در نمونه های خاص است. پراکندگی معکوس متناسب به قدرت چهارم (ریلی ذرات کوچک ) و یا دوم (تیندال ذرات بزرگتر) از λ است. چون رابطه معکوس است استفاده از مشتقات نمی تواند باعث حذف پراکندگی از اسپکتروم شود.شکل(1-5) یک جذب با باند40 نانومترو یک باند مشابه در حضور پراکندگی را نشان می دهد.

شکل 1-5- اثرات حذف پراکندگی
استفاده از مشتق اول سهم پراکندگی را کاهش می دهد مثلا استفاده از maxλ قابل استفاده است برای اندازه گیری دارویی که دارای گونه های مزاحم هستند.

1-11- مشکلات ماتریسی در مشتق
مشکلات تجزیه ای اغلب به راحتی و سادگی ، پراکندگی خط زمینه نیستند. یک ترکیب از دو یا حتی بیشتر از این ها که منجر به ایجاد خط زمینه می شود ناشی می گردد. در تجزیه های تحلیلی مشتق گیری اجازه تشخیص از یک سطح که داری جذب زمینه می باشد مشاهده گردیده است. در آنالیزهای کمی مشتق گیری دقت را بهبود می بخشد.

مطلب مرتبط :   پایان نامه با موضوعتعهد مستمر، عملکرد کارکنان، استان خراسان، سابقه خدمت

شکل 1-6- نمایی از مشکلات ماتریسی بر روی طیف ها
1-12- مرحله کالیبراسیون (آموزش)54 و پیشگویی (تست)55
آنالیزهای شیمیایی به طور معمول از دو مرحله تشکیل شده است. ابتدا ویژگی‌های یک روش یا دستگاه مورد مطالعه قرار می‌گیرد و با توجه به اطلاعات به دست آمده توسط آزمایش‌های استاندارد یک کالیبراسیون صورت می‌گیرد که به این مرحله، کالیبراسیون یا آموزش می‌گویند. داده‌هایی که در این مرحله استفاده می‌شود را مجموعه داده‌های کالیبراسیون و پارامترهای مدل کالیبراسیون را ضرایب رگرسیون56 می‌نامند.
در مرحله دوم از مدل یا ضرایب رگرسیون مرحله قبل برای به دست آوردن غلظت گونه‌های مجهول استفاده می‌شود که به این مرحله، پیش گویی یا تست می‌گویند و مجموعه داده‌
های استفاده شده در این مرحله نیز داده‌های پیش گویی نام دارد. توانایی یک مدل کالیبراسیون تحت تاثیر برخی عوامل قرار می‌گیرد که این عوامل به دو دسته اصلی تقسیم می‌شوند:
طراحی آزمایش
اثر نویز57

1-12-1- طراحی آزمایش
منظور از طراحی آزمایش شناخت اثر فاکتورها بر یکدیگر و مدل‌سازی رابطه بین X و Y و به دست آوردن بیشترین اطلاعات مفید با کمترین آزمایش‌هاست [27-26]. در حقیقت طراحی آزمایش در کالیبراسیون چند متغیره برای آن که توصیف رضایت بخشی از رابطه آنالیت- دستگاه، مزاحمت‌های دستگاهی، نویزهای غیر قابل اجتناب و خطاهای مدل به دست آوریم، لازم است.
برنامه‌ریزی صحیح در مرحله کالیبراسیون باعث صرفه‌جویی در زمان و هزینه‌ها می‌شود و می‌تواند کارایی کالیبراسیون را افزایش دهد زیرا داده‌های مورد استفاده همگی اطلاعات مفید بوده و اطلاعات غیر مفید حذف می‌شود. در طراحی آزمایش در مرحله کالیبراسیون دو اصل عمده باید رعایت شود:
1. حذف انواع عمده خطاهای سیستماتیک مثل مزاحمت‌ها و در نتیجه اندازه‌گیری صحیح و مدل‌سازی مناسب.
2. کاهش اثر خطاهای تصادفی. چندین روش مختلف طراحی آزمایش و کاربردهای آن در منابع گزارش شده است.
برای یک مدل خطی، جایی که متغیرهای X توابع خطی از ترکیبات شیمیایی به علاوه نویز هستند، هر X، می‌تواند به این صورت نوشته شود:
(1-16) X1=Ko+ky1+e1
ترکیب مقادیر Y می‌تواند برطبق یک شماتیک طراحی قدیمی برای تخمین دقیق ko وk یا پیش گویی دقیق متغیر Y طراحی شود [30-28]. طرح کارآمد و ساده‌ای که می‌تواند در معادله بالا به کار رود، طراحی فاکتور58 با دو سطح برای هر فاکتور است شکل (a-1-7). این طراحی، که طرح اورتوگونال نیز نامیده می‌شود پارامترهای مختلف (برای اجزاء مختلف) را که از نظر آماری غیر وابسته‌اند تخمین می‌زند. اگر یک مدل دو خطی59 بکار رود و متغیر در X توسط ‘ تقریب می‌شود که تمام انواع فاکتورهای سیستماتیک، غلظت‌های شیمیایی، مزاحمت‌ها و توابع غیر خطی را پوشش می‌دهد. طراحی آزمایش برای چنین مدل‌های پیچیده است. تاکنون کاربردهای بسیار کمی در مورد آن گزارش شده است [31]. در اینجا یک ایراد این است که فاکتورهای فرضی هستند، تشخیص یک فاکتور تنها، غیر ممکن است. اشکال این است که متغیرهای Y وابسته، بخشی از طراحی هستد و برای کاربرد تئوری طراحی رگرسیون قدیمی ایجاد اشکال می‌کند.

شکل1-7- طراحی فاکتوری بر اساس سه فاکتور
(a طراحی فاکتوری با دو سطح برای هر فاکتور(b طراحی فاکتوری با سه سطح برای هر فاکتور

1-12-2- اثر نویز
اثر نویزها با آنالیز واریانس خطاهای آزمایشگاهی مشخص می‌شود. مهمترین منابع خطا عبارتند از: روش نمونه‌برداری، ابزارها، دستگاه‌ها، محیط و اپراتور. پارامترهای متعددی وجود دارند که بر کیفیت معادله کالیبراسیون تاثیر می گذارند:
1. خطاهای مدل که بر نحوه فیت کردن مدل کالیبراسیون موثر است و اهمیت زیادی نیز دارد چون اگر مدل استفاده شده به خوبی با داده‌ها فیت نشود معادله کالیبراسیون هرگز نتایج دقیقی نخواهد داد.
2. عدم در برگیری داده‌ها60، دومین منبع خطا وقتی ظاهر می‌شود که داده‌ها کالیبراسیون کل محدوده متغیرها را در بر نگیرد. در این موارد خطر پیش بینی نادرست داده‌های خارج از محدوده کالیبراسیون وجود دارد.
3. خطاهای تصادفی در داده‌های کالیبراسیون و پیش‌گویی، این گونه خطاها باعث تخمین نادرست پارامترهای کالیبراسیون و در نتیجه عدم پیش بینی صحیح می‌شود.

مطلب مرتبط :   پایان نامه با واژه های کلیدینقطه مرکز

1-13- پیش پردازش داده‌ها
پیش پردازش داده‌ها یا آماده سازی اطلاعات در همه روش‌های کمومتریکس ضروری است. به عبارتی قبل از ورود اطلاعات از روش‌های پیش پردازش برای بهبود اطلاعات استفاده می‌شود. از متداول‌ترین روش‌های پیش پردازش در کالیبراسیون چند متغیره و سه بعدی می‌توان به روش‌های تمرکز بر میانگین61 و هم مقیاس کردن62 اشاره کرد.

1-13-1- تمرکز بر میانگین
برای انجام این پیش‌پردازش میانگین متغیرها از مقدار هر متغیر در ماتریس کالیبراسیون کسر می شود و این کار معمولاً به صورت ستونی صورت می‌گیرد که می‌توان آن را طبق رابطه زیر نشان داد.
(1-17)

1-13-2- هم مقیاس کردن
به طور کلی متغیرها می‌توانند به سه حالت وجود داشته باشند. حالت اول که در آن نیازی به هم مقیاس کردن نیست یعنی متغیرهای موجود واحدهای یکسانی دارند. مثل روش‌های اسپکترومتری. در دو حالت دیگر هم مقیاس کردن واریانس‌ها صورت می‌گیرد یعنی زمانی که متغیرها واحدهای متفاوتی داشته باشند مثلاً (ppm,%) یامتغیرهای اصلی کم اهمیت بوده و زیاد مدل را تحت تاثیر قرار ندهد که در این حالت به آن متغیرها وزن کمتری تعلق می‌گیرد. هم مقیاس کردن طبق رابطه زیر انجام می‌شود:

(1-18)

(1-19)

شکل1-8- پیش پردازش داده ها. (A) وضعیت اغلب داده های خام. (B) وضعیت داده ها پس از انجام تمرکز بر میانگین.(C) وضعیت دادها پس از هم مقیاس کردن. (D) وضعیت داده ها پس از انجام هر دو روش پیش پردازش.

1-14- تصحیح سیگنال عمودی
این روش نخستین بار توسط والد و همکارانش معرفی شده است. این ابزار جهت انجام پیش پردازش برای
کالیبراسیون توسط محققان زیادی مورد استفاده قرار میگیرد. سابقه استفاده از این روش به کالیبراسیون در حیطه IR نزدیک بر می گردد. هدف اصلی OSC حذف یک یا چندین مسیر در راستای X است و عمود کردن آنها بر رویY که باعث ایجاد بزرگترین واریانس در X می گردد.
این روش به عنوان یک روش پیش پردازش جهت ارتقاء کارایی کالیبراسیون به کار می رود از این رو گروه های مختلف دانشمندان الگوریتم های متفاوتی را برای کاهش پیچیدگی مدل ها و حذف سیگنال های اورتوگونال ارائه کرده اند. روش ارائه شده را می توان به صورت زیر توضیح داد:

X Wold= X – tp T (1-20)
به هر حال
t= PC1(X ) (21-1)
t* =A t (1-22)
t= TT t* (1-23)
در اینجا
(1-24)
در صورتی که ترکیب های بیشتری ازOSC مورد نیاز باشد این مراحل را می توان تا حصول بهتری نتیجه تکرارنمود. برای یک طیف جدید از یک نمونه مراحل زیر جهت هرکدام ازترکیب های OSC می توان تکرار شود.
(1-25)

(1-26)
:bi بردار همگرایی رگرسیونی است که برای ترکیب های مختلف کمترین مربعات جزئی به کار می رود.

1-15- انتخاب فاکتورهای بهینه در کالیبراسیون
1-15-1- الگوریتم اعتبار سازی دو طرفه63
برای انتخاب تعداد فاکتورها در PLS از روش اعتبار سازی دو طرفه استفاده می‌شود. برای مثال اگر 40 طیف در مرحله کالیبراسیون داشته باشیم، یکی از نمونه‌های کنار گذاشته شده و با 39 طیف، و با تعداد مختلف فاکتورها کالیبراسیون انجام می‌شود و از ضریب رگرسیون حاصل برای تخمین غلظت نمونه کنار گذاشته شده استفاده می‌شود.
این پروسه 40 بار تکرار می‌شود تا برای هر نمونه یک غلظت تخمین زده شود و سپس غلظت‌های به دست آمده با مقادیر واقعی مقایسه شده و مجموع مربعات خطای پیشگویی64(PRESS) محاسبه می‌شود:
PRESS=∑(yi-ŷi)2 (1-27)
که yi غلظت حقیقی آنالیت در نمونه i و ŷi غلظت پیش‌گویی شده آنالت در نمونه i است. می‌توان گفت هنگامی که PRESS حداقل می‌شود تعداد فاکتورهای انتخاب شده بهینه شده است. متاسفانه این تعداد فاکتورهای بهینه (h*) معمولاً باعث اورفیتینگ65 می‌شود و به خصوص برای غلظت‌هایی که در ساخت مدل کالیبراسیون از آنها استفاده نشده باشد. معیار بهتر برای انتخاب فاکتورهای بهینه، مقایسه PRESS مدل‌هایی با فاکتورهای کمتر از (h*) است.
برای تعیین

دیدگاهتان را بنویسید