2-13-2) سیر تاریخی شبکههای عصبی……………………………………. ……………………………………………………………………………………………………………………………..34
2-13-3) کاربرد شبکههای عصبی……………………………………. ……………………………………………………………………………………………………………………………………..36
2-13-4) اجزا و ساختار شبکههای عصبی……………………………………. ………………………………………………………………………………………………………………………….38
2-13-5) مدل ریاضی نرونها…………………………………………………………………………………………………………………………………………………………………………………………40
2-13-6) الگوریتم پسانتشار خطا………………………………………………………………………………………………………………………………………………………………………………44
2-13-7) معماری شبکههای پسانتشار……………………………………………………………………………………………………………………………………………………………………….45
2-13-8) طراحی شبکهی عصبی………………………………………………………………………………………………………………………………………………………………………………….45
2-13-9) الگوریتم یادگیری Levenberg- Marquardt………………………………………………………………………………………………………………………………………48
2-13-10) مزایا و معایب شبکهی عصبی…………………………………………………………………………………………………………………………………………………………………….49
2-14) ماشین بردار پشتیبان……………………………………………………………………………………………………………………………………………………………………………………50
2-15) ماشین بردار پشتیبان دو کلاسه………………………………………………………………………………………………………………………………………………………………………..52
2-16) ماشین بردار پشتیبان با حاشیه ثابت…………………………………………………………………………………………………………………………………………………………………54
2-17) ماشین بردار پشتیبان با حاشیه منعطف……………………………………………………………………………………………………………………………………………………………58
2-18) ماشین بردار پشتیبان چند کلاسه…………………………………………………………………………………………………………………………………………………………………….59
2-19)رویکرد طبفه بندی غیر خطی در ماشین بردار پشتیبان……………………………………………………………………………………………………………………………………60
2-20) رگرسیون بردار پشتیبان…………………………………………………………………………………………………………………………………………………………………………………….63
2-20-1) رگرسیون خطی بردارپشتیبان……………………………………………………………………………………………………………………………………………………………………….63
2-20-2) رگرسیون غیرخطی بردار پشتیبان………………………………………………………………………………………………………………………………………………………………..66
2-21) مزایا و معایب ماشین بردار پشتیبان………………………………………………………………………………………………………………………………………………………………….67
2-22) شبکههای عصبی و عملکردهای متفاوت………………………………………………………………………………………………………………………………………………………….68
2-23) مروری بر مطالعات ترکیبی………………………………………………………………………………………………………………………………………………………………………………73
فصل سوم:
3-1) مقدمه79
3-2) فرضیههای تحقیق79
3-3) متغیرهای تحقیق و نحوه گردآوری دادهها80
3-4) دورهی زمانی انجام تحقیق و روش نمونه گیری80
3-5) برازش مدل خودرگرسیو میانگین متحرک انباشته(ARIMA)80
3-6) برازش شبکهی عصبی مصنوعی83
3-7) مدل ترکیبی84
3-7-1) شرح مدل ترکیبی85
3-7-2) برازش مدل ترکیبی86
3-8) مقایسهی عملکرد و آزمون فرضیه87
3-9) آزمون دایبولد- ماریانو………………………………………………………………………………………………………………………………………………………………………………………….87
3-10) جمع بندی………………………………………………………………………………………………………………………………………………………………………………………………………..89
فصل چهارم:
4-1) مقدمه……………………………………………………………………………………………………………………………………………………………………………………………………………………91
4-2) بررسی مانایی بازدههای لگاریتمی………………………………………………………………………………………………………………………………………………………………………..92
4-3)محاسبهی معیار میانگین مجذور خطا…………………………………………………………………………………………………………………………………………………………………..93
4-4) محاسبهی تابع زیان قدر مطلق درصد خطا………………………………………………………………………………………………………………………………………………………….96
4-5) آزمون فرضیههای تحقیق………………………………………………………………………………………………………………………………………………………………………………100
فصل پنجم:
5-1) نتیجهگیری……………………………………………………………………………………………………………………………………………………………………………………116
5-2) پیشنهادات برای تحقیقات آتی……………………………………………………………………………………………………………………………………………………….118
منابع و مآخذ
منابع داخلی……………………………………………………………………………………………………………………………………………………………………………………………119
منابع خارجی……………………………………………………………………………………………………………………………………………………………………………………………121
فهرست اشکال
شکل 2-1) ساختار پایهای شبکهی عصبی………………………………………………………………………………………………………………………………………………………………….38
شکل 2-2) نرون با یک ورودی عددی……………………………………………………………………………………………………………………………………………………………………….40
شکل 2-3) شبکه تک لایه با چندین نرون و بردار ورودی…………………………………………………………………………………………………….. ………………………………..43
شکل 2-4) شبکههای عصبی با چندین لایه و چندین نرون…………………………………………………………………………………………………………………………………….43
شکل 2-5) شبکهی عصبی پیشخور با تابع فعال سازی تانژانت هیپربولیک…………………………………………………………………………………………………………..45
شکل2-6) طبقه بندی کلاس داده ها توسط ماشین بردار پشتیبان……………………………………………………………………………………………………………………………53
شکل 2-7) طبقه بندی بهینه کلاس داده ها توسط ماشین بردار پشتیبان……………………………………………. …………………………………………………………………54
شکل2-8) ماشین بردار پشتیبان با حاشیه ثابت…………………………………………………………………… …………………………………………………………………………………..55
شکل2-9) فرآیند ماشین بردار پشتیبان……………………………………………………………………………………………… …………………………………………………………………….57
شکل 2-10) ماشین بردار پشتیبان با حاشیه نرم…………………………………………………………… ………………………………………………………………………………………..59
شکل 2-11) طبقه بندی غیر خطی ماشین بردارپشتیبان………………………………………….. ……………………………………………………………………………………………60
شکل 2-12) تابع ضرر وپنیک و متغیرهای slack………………………………………….. ……………………………………………………………………………………………………….64
فهرست جداول

در این سایت فقط تکه هایی از این مطلب با شماره بندی انتهای صفحه درج می شود که ممکن است هنگام انتقال از فایل ورد به داخل سایت کلمات به هم بریزد یا شکل ها درج نشود

شما می توانید تکه های دیگری از این مطلب را با جستجو در همین سایت بخوانید

ولی برای دانلود فایل اصلی با فرمت ورد حاوی تمامی قسمت ها با منابع کامل

اینجا کلیک کنید

جدول 4-1) آزمون دیکی و فولر برای بازده لگاریتمی سری زمانی شاخص کل…………………………………………………………………………………………………………94
جدول 4-2) قدرمطلق خطا برای مقایسه مدل ترکیبی آریما و شبکه عصبی با هر یک از اجزای تشکیل دهنده……………………………………………………95
جدول 4-3) قدر مطلق خطا برای مقایسه مدل ترکیبی آریما و رگرسیون بردار پشتیبان با هریک از اجزای تشکیل دهنده…………………………………97
جدول 4-4)قدرمطلق درصد خطا برای مقایسه مدل ترکیبی آریما و شبکه عصبی با هر یک از اجزای تشکیل دهنده…………………………………………..99
جدول 4-5) قدرمطلق درصدخطا برای مقایسه مدل ترکیبی آریماورگرسیون بردار پشتیبان با هریک ازاجزای تشکیل دهنده……………………………..100
جدول 4-6) آزمون مقایسه زوجی مدل ترکیبی آریما و شبکه عصبی با آریما(قدرمطلق خطا) …………………………………………………………………………..102
جدول 4-7) آزمون مقایسه زوجی مدل ترکیبی آریما و شبکه عصبی با شبکه عصبی(قدرمطلق خطا) …………………………………………………………….105
جدول 4-8) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه مدل ترکیبی آریما و شبکه عصبی با هر یک بطور مجزا(قدر مطلق خطا)104
جدول 4-9) آزمون مقایسه زوجی مدل ترکیبی آریما و شبکه عصبی با آریما (قدرمطلق درصد خطا) ……………………………………………………………….105
جدول 4-10) آزمون مقایسه زوجی مدل ترکیبی آریما و شبکه عصبی با شبکه عصبی(قدرمطلق درصدخطا)…………………………………..106
جدول 4-11) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه مدل ترکیبی آریما و شبکه عصبی با هر یک بطور مجزا(قدر مطلق درصد خطا)………………………… ………………………………………. ………………………….. ……………………………………………………………………………………………………………..107
جدول 4-12) آزمون مقایسه زوجی مدل ترکیبی آریما و رگرسیون بردار پشتیبان با آریما( قدر مطلق خطا)……………………………………………………………………………………………………………………………………………………………………………………………………108
جدول4-13) آزمون مقایسه زوجی مدل ترکیبی آریما و رگرسیون بردار پشتیبان با SVR( قدر مطلق خطا)………………………………….108
جدول4-14) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه مدل ترکیبی آریما و SVR با هر یک بطور مجزا(قدر مطلق خطا)………………………………………………………………………………………………………………………………………………………………………………………………….109
جدول 4-15) آزمون مقایسه زوجی مدل ترکیبی آریما و رگرسیون بردار پشتیبان با آریما( قدر مطلق درصد خطا)……………………..112
جدول 4-16) آزمون مقایسه زوجی مدل ترکیبی آریما و شبکه عصبی با شبکه عصبی( قدر مطلق خطا)……………………………………..112
جدول4-17) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه مدل ترکیبی آریما و SVR با هر یک بطور مجزا(قدر مطلق
درصد خطا)………………………………………………………………………………………………………………………………………………………………………………………..112
جدول 4-18) آزمون مقایسه زوجی دو مدل ترکیبی(قدر مطلق خطا)…………………………………………………………………………………………….113
جدول4-19) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه دو مدل ترکیبی(قدر مطلق خطا)……………………………………….114
جدول 4-20) آزمون مقایسه زوجی دو مدل ترکیبی( قدر مطلق درصد خطا)………………………………………………………………………………..114
جدول4-21) آزمون دایبولد-ماریانو و آماره تعدیل شده برای مقایسه دو مدل ترکیبی(قدر مطلق درصد خطا)……………………………115
فصل اول:
طرح تحقیق
1-1) مقدمه
سرمایه و نیروی انسانی از ارکان اصلی تولید هستند و تامین این عوامل و تخصیص بهینه آنها لازمه رشد اقتصادی است. این تخصیص مستلزم وجود بازار و عملکرد مطلوب نیروهای بازار است. دررابطه با سرمایه بازار بورس میتواند این وظیفه را بر عهده داشته باشد. مهمترین وظیفه بازار بورس، جذب سرمایههای پراکنده و هدایت آنها بسوی فعالیتهای سرمایهگذاری از طریق یک فرآیند تخصیص بهینه است.
نوسان قیمت سهام نیز در تمام بازارهای بورس امر طبیعی و عادی است، اما در هر صورت میتوان با یک پیشبینی از قیمت سهام ترکیبی مطلوب از آنها را انتخاب و نوسانها را کاهش داد. پیشبینی شاخصهای مهم بازار بورس میتواند گامی در جهت افزایش و شفاف نمودن اطلاعات در بازار سرمایه باشد.
پیشبینی شاخصهای بورس یا بازار سرمایه همواره مورد توجه مطالعات بوده است. این توجه در سالهای اخیر منجر به پیشرفت الگوهای مورد استفاده در پیشپیش‌بینی شده است. لیکن باید پیشبینی را مورد توجه قرار داد که با دقت بیشتری صورت گیرد و نسبت به نتایج واقعی مشاهده شده خطای کمتری داشته باشد.
پیشبینی سریهای زمانی یکی از مهمترین روشهای پیشبینی است که در آن از مشاهدات گذشتهی یک متغیر به منظور توسعهی مدل و پیشبینی در آینده استفاده میگردد. روشهای سری زمانی، درطول چند دهه گذشته توسعه بسیاری یافته اند، اما یکی از مهمترین و پرکاربردترین آنها مدل خودرگرسیو میانگین متحرک انباشته (ARIMA1) میباشد که تحت عنوان روش باکس و جنکینز شناخته میشود.
خودرگرسیو میانگین متحرک انباشته (ARIMA) که خلاصه شده‌ی (Autoregressive Integrated Moving Average) می‌باشد، یکی از پرکاربردترین مدل‌ها در پیش‌بینی سری‌های زمانی در طول سه دهه‌ی گذشته بوده است، اما پیش‌فرض اصلی آن این است که رابطه‌ی خطی میان ارزش‌های سری برقرار باشد. بنابراین رابطه‌های غیرخطی بوسیله‌ی مدل خودرگرسیو میانگین متحرک انباشته نمی‌توانند خوب توضیح داده شوند.
یکی دیگر از روش‌های مورد استفاده در پیش‌بینی سری‌های زمانی شبکه‌ی عصبی است که توان تخمین روابط غیر‌خطی مختلفی را دارا می‌باشد (اصطلاحاً به شبکه‌ی عصبی تخمین زننده‌ی همگانی2 می‌گویند). اما استفاده از شبکه، طبق ادبیات تحقیق در روابط خطی نتایج پیچیده‌ای در بر داشته است.
نوع دیگر از روشهای پیشبینی سری زمانی رگرسیون بردار پشتیبان(SVR 3 ) است. ماشین بردار پشتیبان، تابع رگرسیون را با به کارگیری یک دسته تابع خطی تخمین می زند و عملیات رگرسیون را با تابعی که انحراف از مقدار واقعی در آن به میزان کمتر از ɛ مجاز است انجام می دهد سپس با کمینه کردن ریسک ساختاری ، بهترین جواب را ارائه می دهد.[57]
بطور کلی باید به این نکته اشاره کرد که دانستن الگوی داده‌ها، مبنی بر خطی و غیرخطی بودن در دنیای واقعی کمی دشوار است و به ندرت سری‌های زمانی به طور خالص خطی و غیرخطی می‌باشند و اغلب از هر دو الگو تبعیت می‌کنند. بنابراین مسأله اینجاست که چگونه می‌توانیم قیمت پایانی و دامنه‌ی نوسان قیمت را با خطای کمتری پیش‌بینی کنیم؟
1-2) تشریح و بیان موضوع
در زمینه مدل‌سازی سریهای زمانی، روشهای متفاوتی مورد استفاده قرار می‌گیرد. مدل‌های سنتی مانند میانگین متحرک، هموارسازی نمایی و خودرگرسیو میانگین متحرک انباشته پیش‌بینی آینده را به روابط خطی از گذشته محدود می‌نمایند و الگوهای خطی را مدل سازی میکنند. از این مدل‌ها به دلیل سادگی در فهم و کاربرد در دهه‌های اخیر بسیار استفاده شده است. با وجود انعطاف پذیری بالای مدل خودرگرسیو میانگین متحرک انباشته در مدل سازی الگوهای خطی این مدل نمیتواند الگوهای غیر خطی را خوب مدل سازی کند.
به دلیل مشاهده الگوهای غیرخطی در دنیای واقعی یک سری از مدل‌های غیرخطی مانند4ARCH GARCH, 5 ،6TGARCH مطرح گردیدند. همگی این مدل‌ها، الگوهای غیرخطی بخصوصی را توضیح می‌دهند.
اما شبکه عصبی مجازی(7ANN) توان و قدرت پیش‌بینی روابط غیرخطی را داراست و کاملاً انعطاف پذیر عمل می‌نماید. شبکههای عصبی مصنوعی از عناصر عملیاتی سادهای ساخته میشوند که به صورت موازی در کنار یکدیگر عمل میکنند. این عناصر که از سیستمهای عصبی زیستی الهام گرفته شدهاند، در تلاشاند که به صورت ناپارامتریک، مغز انسان را شبیه سازی نمایند. نکته حائز اهمیت در استفاده از مدل شبکه عصبی وجود نتایج متفاوت برای روابط خطی است. برای مثال مارکهام8 و راکس9 اذعان داشتند عملکرد شبکه عصبی برای مساله‌های رگرسیون خطی وابسته به اندازه نمونه و سطح شوک (Noise) می‌باشد. [53]
از طرفی ماشین بردار پشتیبان (SVM)10 به عنوان تکنیک نوین یکی از روشهای یادگیری ماشینی است که بر مبنای تئوری یادگیری آماری واپنیک11 در دهه 90 میلادی توسط واپنیک و همکارانش ارائه گردید. این روش از جمله روش‌های نسبتاً جدیدی است که در سال‌های اخیر کارایی خوبی نسبت به روش‌های قدیمی‌تر از جمله شبکه‌های عصبی پرسپترون نشان داده است. رگرسیون بردار پشتیبان این عمل را با تابعی که انحراف از مقدار واقعی در آن به میزان کمتر از ɛ مجاز است، انجام میدهد.
همانطور که ذکر شد با وجود مزایای متعدد، شبکه های عصبی با محدودیت هایی از جمله مدلسازی روابط خطی و همچنین نیازمند بودن به شمار بالای نمونه برای آموزش(به منظور انجام فرآیند یادگیری) مواجه میباشد. اما چون دانستن خصوصیات دادهها مبنی بر خطی و یا غیر خطی بودن در واقعیت کمی دشوار است و از طرفی به ندرت روابط کاملا خطی و یا کاملا غیر خطی مشاهده میشود، بنابراین این ایده به ذهن میرسد که ترکیب مدل خطی آریما با مدلهای غیر خطی شبکه عصبی پیشخور و ماشین بردار پشتیبان میتواند باعث بهبود دقت پیشبینی گردد.
در مدل ترکیبی سعی بر این داریم ابتدا روابط غیرخطی در پسماندها را با استفاده از شبکهی عصبی و رگرسیون بردار پشتیبان شناسایی کرده سپس پسماندهای بدست آمده را به مدل خودرگرسیو میانگین متحرک انباشته اضافه کنیم. با این ترکیب، بخش خطی بوسیله‌ی مدل خودرگرسیو میانگین متحرک انباشته و بخش غیرخطی بوسیله‌ی شبکه عصبی و رگرسیون بردار پشتیبان پیش‌بینی خواهد شد.
با عنایت به مطالبی که ذکر شد این سوال پیش میآید که کدامیک از مدلهای رگرسیون بردار پشتیبان، شبکه عصبی، خودرگرسیو میانگین متحرک انباشته و مدلهای ترکیبی، با دقت بالاتر و خطای کمتری توانایی پیشبینی شاخص بورس اوراق بهادار تهران را دارد؟
1-3) ضرورت انجام تحقیق
پیشبینی بازده شاخص یکی از مسایل بسیار مهم در بازارهای مالی است که توجه بسیاری از فعالان بازار سرمایه و کارشناسان این حوزه را در چند دههی گذشته به خود جلب کرده است. اهمیت این موضوع از آن جا ناشی میشود که پیش بینی در بازار مالی یکی از متغیرهای مهم در زمینهی تصمیمات سرمایهگذاری، قیمتگذاری اوراق بهادار و مشتقهها، مدیریت ریسک، تدوین مقررات و سیاستگذاری پولی است.
همواره پیشبینی روند شاخص بورس یکی از چالشهای پیشروی معاملهگران در بازارهای سرمایه بوده که این مساله به عنوان یک امر ضروری وکاربردی مطرح میشود .البته باید پیشبینی را مورد توجه قرار داد که با دقت بیشتری صورت گیرد و نسبت به نتایج واقعی مشاهده شده خطای کمتری داشته باشد. بنابراین با وجود تمام این شرایط ما نیازمند مدلی هستیم که بتواند با خطای کمتری بازده شاخص کل بورس را که موضوع مورد بررسی در این تحقیق می باشد را پیشبینی کند.
1-4) سابقه تحقیقات و مطالعات انجام گرفته
1) فنگپای و شنگ لین در سال2005 در مقاله ای تحت عنوان”ترکیب خودرگرسیو میانگین متحرک انباشته و رگرسیون بردار پشتیبان برای پیش بینی قیمت سهام”بیان کردند که ترکیب سریهای زمانی آریما و ماشین بردار پشتیبان،در مقایسه با مدلهای خودرگرسیومیانگین متحرک انباشته و ماشین بردار پشتیبان، معیارهای ارزیابیمیانگین قدرمطلق درصد خطا MAPE)) 12و ریشه میانگین مربع خطا ( RMSE13) کمتری را نشان میدهند.[55]
2) ژانگ و همکاران در سال 2012در مقاله ای تحت عنوان”ترکیب خودرگرسیو میانگین متحرک انباشته و رگرسیون بردار پشتیبان برای پیش بینی بارگذاری کوتاه مدت الکتریسیته” که به پیشبینی مدیریت کارای سیستم نیرو میپردازد، بیان نمودند که پیشبینی سریهای زمانی از طریق مدل ترکیبی خودرگرسیو میانگین متحرک انباشته و ماشین بردار پشتیبان در مقایسه با هر یک از مدلهای خودرگرسیو میانگین متحرک انباشته و رگرسیون بردار پشتیبان از دقت بیشتری برخودار است و معیارهای ارزیابی MAPE و RMSEکمتری را نشان میدهد.[68]
3)ژانگ14 (2003) در مقالهای تحت عنوان « پیشبینی سریهای زمانی با استفاده از مدلهای ترکیبی خودرگرسیو میانگین متحرک انباشته و شبکهی عصبی»، اذعان داشت، با توجه به ماهیت خطی مدل خودرگرسیو میانگین متحرک انباشته و غیرخطی شبکهی عصبی، پیشبینی بخش خطی بوسیلهی میانگین متحرک انباشته و پسماند غیرخطی بوسیله ی شبکه میتواند منجر به افزایش دقت در پیش‌بینی شود.
وی از سه سری زمانی Sunspots، Lynx کانادا و نرخ مبادلهی دلار آمریکا و پوند انگلیس و معیارهای میانگین مجذور خطا (MSE) و میانگین قدر مطلق خطا (MAD) برای آزمون این ادعا و ارزیابی دقت پیشبینی بهره جست.[67]
نتایج این پژوهش دال بر موفقیت مدل ترکیبی نسبت به مدلهای خودرگرسیو میانگین متحرک انباشته و شبکهی عصبی میباشد.
4) فرجام نیا،ایمان (1384) در پایان نامه خود تحت عنوان “مقایسه پیشبینی قیمت نفت توسط مدلهای شبکه عصبی و خودرگرسیو میانگین متحرک انباشته “با توجه به نتایج به دست آمده از این تحقیق نشان دادند که شبکه های عصبی مصنوعی در پیش بینی قیمت روزانه نفت خام میزان MSE15 وSSE16 کمتری را نسبت به مدل خودرگرسیو میانگین متحرک انباشته دارند. و با توجه به معیارهای ارزیابی فوق مشخص شد که شبکه های عصبی مصنوعیعملکردی بهتر از مدلهای خودرگرسیو میانگین متحرک انباشته در خصوص پیش بینی قیمت های روزانه نفت خام دارند.در نتیجه می توان از مدل شبکه های عصبی مصنوعی به عنوان ابزاری دقیق برای پیش بینی متغیرهای اقتصادی در کنار سایر روشها بهره جست. [17]
5)رمضانی،رضا (1383) در پایان نامه خود تحت عنوان” مقایسه عملکرد پیش بینی در مدلهای شبکه عصبی مصنوعی و خودرگرسیو میانگین متحرک انباشته (مورد مطالعه : تقاضای ماهیانه برق در ایران) “با استفاده از داده های مربوط به سال های 1370 تا سال 1381 ، برای هر کدام از مدل های شبکه عصبی مصنوعی وخود رگرسیو میانگین متحرک انباشته داده های سالهای 1380 و1381 به عنوان معیار ارزیابی انتخاب گردیده و در نهایت با توجه به پیش بینی های انجام گرفته توسط بهترین مدل از مدل های شبکه عصبی میزان MSE وMAPE کمتری را در پیش بینی انجام گرفته نسبت به مدل خود رگرسیو میانگین متحرک انباشته داشته است و با توجه به معیارهای ارزیابی فوق مشخص است که شبکه های عصبی مصنوعی عملکردی بهتر از مدل های خود رگرسیو میانگین انباشته درخصوص پیش بینی مقادیر سری زمانی دارند.[7]
6) هانسن17 و نلسون18 در مقاله ای تحت عنوان” شبکه ی عصبی و سری های زمانی سنتی و ترکیب هم افزا در پیش بینی‍‍‍ های اقتصادی” بعد از بیان کردن اهمیت پیش بینی درآمد مشمول مالیات اذعان داشتند عواملی مثل بحران مالی باالقوه می توانند موجب انحراف تحلیلهای مبتنی بر سریهای زمانی سنتی گردند .آنها اذعان داشتند در این موارد شبکه می تواند با معرفی الگوهای جدید این مدلها را اصلاح نماید و نتایج تحقیقشان حاکی بر موفقیت آن‌ها در ترکیب شبکه‌های عصبی مانند شبکه‌های Time –delay و شبکه‌های پس انتشار با مدل‌های سری زمانی سنتی بود. [39]
7) لئو،تانگ،سو19 در مقاله‍ای تحت “عنوان ترکیب سری‍های زمانی و شبکه‍ی عصبی برای مدل‍های پیش‍بینی قابل اطمینان ” پیش‌بینی بهتر مدل ترکیبی نسبت به مدل سری‌های زمانی و شبکه‌ی عصبی در داده‍های دارای روند رشد را اذعان داشتند. [59]
1-5) فرضیه‌های تحقیق
1- عملکرد مدل ترکیبی شبکه عصبی پیشخور – خودرگرسیو میانگین متحرک انباشته از مدل خودرگرسیو میانگین متحرک انباشته بهتر است.
2- عملکرد مدل ترکیبی شبکه عصبی پیشخور – خودرگرسیو میانگین متحرک انباشته از مدل شبکه عصبی پیشخور بهتر است.
3- عملکرد مدل ترکیبی رگرسیون بردار پشتیبان – خودرگرسیو میانگین متحرک انباشته از مدل خودرگرسیو میانگین متحرک انباشته بهتر است.
4- عملکرد مدل ترکیبی رگرسیون بردار پشتیبان – خودرگرسیو میانگین متحرک انباشته از مدل رگرسیون بردار پشتیبان بهتر است
5- بین عملکرد مدل ترکیبی خودرگرسیو میانگین متحرک انباشته –شبکه عصبی پیشخور( FFNN)20 با مدل ترکیبی خودرگرسیو میانگین متحرک انباشته – رگرسیون بردار پشتیبان اختلاف معناداری وجود دارد.
1-6) اهداف اساسی از انجام تحقیق
1. پیش‌بینی شاخص بورس تهران برای یک گام جلوتر (one step ahead)
2. مقایسه توان پیش‌بینی مدل ترکیبی خودرگرسیو میانگین متحرک انباشته – رگرسیون بردار پشتیبان نسبت به مدل ترکیبی خودرگرسیو میانگین متحرک انباشته – شبکه عصبی
3. افزایش دقت پیشبینی شاخص بورس تهران در صورت امکان
1-7) نتایج مورد انتظار پس از انجام این تحقیق
با توجه به اینکه مدل ترکیبی، ترکیبی از مدل‌های خطی خودرگرسیو میانگین متحرک انباشته و مدل غیرخطی حاصل از ماشین بردار پشتیبان و شبکه عصبی می‌باشد، انتظار می‌رودکه خطای پیش‌بینی مدلهای ترکیبی نسبت به مدل خود رگرسیو میانگین متحرک انباشته، شبکه عصبی و ماشین بردار پشتیبان کمتر باشد.
1-8) روش انجام پژوهش
1-8-1 ) روش تحقیق
در روش خودرگرسیو میانگین متحرک انباشته برای پیش بینی مقادیر آینده متغیر از مقادیرگذشته متغیر و مقادیر حال و گذشته اجزاء اخلال استفاده می شود .
شرط بهرهگیری از مدلهای خودرگرسیو میانگین متحرک انباشته، مانا بودن سری زمانی میباشد. برای مانا کردن سریهای زمانی مالی واقتصادی اغلب از روش تفاضل استفاده می شود. جزء انباشتگی در مدل خود رگرسیو میانگین متحرک انباشته بیانگر میزان تفاضل مورد نیازبرای مانا کردن سری زمانی است .
مدل های خود رگرسیو میانگین متحرک انباشته را معمولاً به صورت ARIMA(p.d.q) نمایش می دهند. که در آنp مرتبه مورد نیاز برای خود رگرسیو، d میزان تفاضل مورد نیاز برای مانا کردن سری زمانی و q میزان مرتبهی مورد نیاز برای میانگین متحرک است.
(1-1(
Y_t=θ_0+ϕ_1 Y_(t-1)+ϕ_2 Y_(t-2)+…+ϕ_p Y_(t-p)+ɛ_t-θ_1 ε_(t-1)-θ_2 ε_(t-2)-…θ_q ε_(t-q)
سری زمانی Z_t را می توان به دو بخش خطی و غیر خطی تقسیم کرد .
(1-2)
Z_t=L_t+N_t
در این مدل Y_t به عنوان بخش خطی وN_t به عنوان بخش غیرخطی مدل ترکیبی معرفی می شود. در معادله زیر (L_t ) ̂ بیانگر پیشبینی بخش خطی مدل از طریق مدل خودرگرسیو میانگین متحرک انباشته در زمان t است و e_t نشان دهنده پسماند در زمان t است که از طریق مدل خود رگرسیو میانگین متحرک انباشته محاسبه شده است .
(1-3)
e_t=Z_t-L ̂_t
پسماندها که از طریق شبکه عصبی پیشخور و بردار پشتیبان مدل سازی شده و به صورت زیر نمایش داده می شوند .
(1-4)
e_t=f(e_(t-1,) e_(t-2, …,) e_(t-n) )+ε_t

در معادله بالا f بیانگر تابع غیرخطی است که از طریق ماشین بردار پشتیبان و شبکه عصبی پیشخور برازش می شود و ε_t به عنوان جزء اخلال معرفی می شود. ( N) ̂_tبیانگر پیشبینی پسماندها یا همان جزء غیر خطی است که به بخش خطی مدل اضافه می شود .
(1-5)
e ̂_t=N ̂_t
و با اضافه کردن پییش بینی بخش غیر خطی به پیش بینی بخش خطی، پیش بینی زیر برای سری زمانی حاصل می شود .
(1-6)
Z ̂_t=L ̂_t+N ̂_t

هدف ما پیشبینی شاخص بورس اوراق بهادار تهران از طریق مدلهای خودرگرسیو میانگین متحرک انباشته ، رگرسیون بردار پشتیبان، شبکه عصبی و مدلهای ترکیبی است. به منظور مقایسه دقت مدلهای مذکور نسبت به یکدیگر از توابع زیان مجذور خطا و قدر مطلق خطا و آزمون مقایسهای دایبورد ماریانو بهره میگیریم.
1-8-2) روشهای گردآوری اطلاعات
داده‌های به کار رفته در این پایان‌نامه از نرم افزار رهآورد نوین استخراج شده است.
1-8-3) قلمرو تحقیق
الف ) دوره ی زمانی گردآوری اطلاعات:
از شهریور سال 1388 تا پایان شهریور 1393
ب) دوره‌های زمانی انجام تحقیق :
دوره زمانی این تحقیق از ابتدای بهار 1393 تا پایان تابستان 1393 انجام شده است.
ج ) مکان تحقیق :
بورس اوراق بهادار تهران
1-8-4) جامعهی آماری
مقدار شاخص کل بورس اوراق بهادار تهران
1-8-5) نمونهی آماری
مقدار روزانه شاخص کل تهران طی سالهای 1388 تا پایان شهریور 1393
1-8-6 ) روش یا روشهای نمونه گیری
روش نمونه‌گیری قضاوتی می‌باشد.
به دلیل ثبات سیاسی در دولت دهم، از شهریور سال 1388 تا شهریور 1393 این دوره مورد بررسی قرار میگیرد
1-8-7) روشهای مورد نظر برای تجزیه و تحلیل اطلاعات و آزمون فرضیه‌ها
به منظور بررسی و مقایسه عملکرد مدلهای ترکیبی نسبت به یکدیگر و آزمون فرضیههای تحقیق مبنی بر افزایش دقت پیشبینی از آزمون دایبورد ماریانو به ترتیب زیر استفاده میشود:
با در نظر گرفتن y_t به عنوان یکسریزمانی، اگر y_(t+H|t)^1 ، پیشبینی سری زمانی با مدل ترکیبی نوع اول و y_(t+H|t)^2، مدل ترکیبی نوع دوم برای H مرحله پیشرو درنظر میگیریم، خطای پیش بینی به صورت زیر بدست می آید:
〖ε_(t+H|t)〗^1=y_(t+H)-y_(t+H|t)^1
〖ε_(t+H|t)〗^2=y_(t+H)-y_(t+H|t)^2
از انجا که در پیش بینی های سری زمانی برای H مرحله پیشرو از داده های روی هم افتاده استفاده مینماییم، خطای پیش بینی 〖ε_(t+H|t)〗^2 و 〖ε_(t+H|t)〗^1 به صورت سریالی همبستگی خواهد داشت. دقت هر پیش بینی بوسیله تابع زیان خاص21 اندازه گرفته می شود:
L(ε_(t+H|t)^i ), i=1,2
تابعهای زیان خاص که معمولاً مورد استفاده قرار میگیرند عبارتند از :
مجذور خطا :
L(ε_(t+H|t)^i )=(ε_(t+H|t)^i )^2 i=1,2
قدر مطلق خطا :
L(ε_(t+H|t)^i )=|ε_(t+H|t)^i | i=1,2
برای تعیین اینکه آیا یک مدل بهتر از مدل دیگر پیش بینی می نماید می توانیم از فرضیه صفر ذیل استفاده نماییم:
H_0 : E[L(ε_(t+H|t)^1 )]=E[L(ε_(t+H|t)^2 )]
و فرضیه جایگزین برابر خواهد بود با:
H_1 : E[L(ε_(t+H|t)^1 )]≠E[L(ε_(t+H|t)^2 )]
آزمون دایبولد – ماریانو براساس تفاضل این دو تابع است:
d_t=L(ε_(t+H|t)^1 )-L(ε_(t+H|t)^2 )
آماره دایبولد – ماریانو به صورت زیر بدست می آید:
S=d ̅/((avar) ̂(d ̅ ))^(1⁄2) =d ̅/((LRV) ̂_d ̅ /T)^(1⁄2)
d ̅=1/T_0 ∑_(t=t_0)^T▒d_t
LRV_d ̅ =γ_0+2∑_(j=1)^∞▒γ_j , γ_j=cov(d_t, d_(t-j) )
LRV_d ̅ ، تخمین سازگاری از واریانس مجانبی d ̅√T است. دایبولد و ماریانو (1995) نشان میدهند که تحت فرضیه قدرت پیشبینی کنندگی یکسان داریم:
S~N(0,1)
بنابراین فرضیه قدرت پیش بینی یکسان را در سطح 95% زمانی رد می کنیم که داشته باشیم:
|S|>1/96
اما این آماره سالهای بعدها توسط هاروی – لیبورن- نیوبولد برای نمونههای کوچک و تابع زیان خاص مجذور خطا به صورت زیر اصلاح گردید:
S^*=d ̅/((avar) ̂(d ̅ ))^(1⁄2) =d ̅/√((var) ̂_m )
(var) ̂_m=〖[N+1-2h+(n^(-1)*h(h-1))]〗^(-1)×(γ_0 ) ̂+2∑_(j=1)^(h-1)▒(γ_j ) ̂
آمارهیS^* دارای توزیع t-student از درجهی آزادی N-1میباشد.
1-9)تعریف واژهها و اصطلاحات تخصصی طرح
سری‌های زمانی (Time Series): داده‌هایی که طی زمان ثبت شده و یک دنباله‌ی زمانی را بوجود می‌آورند.
خودرگرسیو میانگین متحرک انباشته (ARIMA): مدل ترکیبی از مدل‌های میانگین متحرک و خودرگرسیو با احتساب شرط مانایی است که به مدل باکس و جنکینز شناخته می‌شود.
شاخص بازده نقدی و قیمت : نشان دهنده تغییرات قیمتی و بازده نقدی سهام در بورس اوراق بهادار میباشد .به عبارتی نشان دهنده تغییرات بازدهی کل سرمایهگذاری در بورس اوراق بهادار میباشد.
مانایی (Stationarity): اگر در طول زمان تمامی گشتاور‌های یک سری ثابت، اکیداً مانا و اگر فقط گشتاور مرتبه‌ی اول و دوم ثابت باشد، مانای ضعیف نامیده میشود.
SVM: ماشین بردار پشتیبان که به عنوان یک تکنیک نوین شبکه عصبی معرفی می شود و معمولاً در سری‌های زمانی به دلیل کارایی بالای آن در عمل استفاده می‌شود.
شبکهی عصبی پیشخور (FFNN): شبکه‌ی عصبی پیشخور یکی از انواع شبکه که معمولاً در سری‌های زمانی از آن استفاده می‌شود.
روش ترکیبی (Hybrid): این مدل ترکیبی از دو روش خودرگرسیو میانگین متحرک انباشته و شبکه‌ی عصبی می‌باشد.
فصل دوم:
مبانی نظری و مروری بر ادبیات تحقیق
2-1) مقدمه
در زمینه مدل‌سازی سریهای زمانی، روشهای متفاوتی مورد استفاده قرار می‌گیرد. مدل‌های سنتی مانند میانگین متحرک، هموارسازی نمایی و ARIMAپیش‌بینی آینده را به روابط خطی از گذشته محدود می‌نمایند و الگوهای خطی را مدل سازی میکنند. از این مدل‌ها به دلیل سادگی در فهم و کاربرد در دهه‌های اخیر بسیار استفاده شده است. با وجود انعطاف پذیری بالای مدل خودرگرسیو میانگین متحرک انباشته در مدل سازی الگوهای خطی این مدل نمیتواند الگوهای غیر خطی را خوب مدل سازی کند.
به دلیل مشاهده الگوهای غیرخطی در دنیای واقعی یک سری از مدل‌های غیرخطی مانند22ARCH GARCH, 23 ،24TGARCH مطرح گردیدند. همگی این مدل‌ها، الگوهای غیرخطی بخصوصی را توضیح می‌دهند.
اما شبکه عصبی مجازی(25ANN) توان و قدرت پیش‌بینی روابط غیرخطی را داراست و کاملاً انعطاف پذیر عمل می‌نماید. شبکههای عصبی مصنوعی از عناصر عملیاتی سادهای ساخته میشوند که به صورت موازی در کنار یکدیگر عمل میکنند. این عناصر که از سیستمهای عصبی زیستی الهام گرفته شدهاند، در تلاشاند که به صورت ناپارامتریک، مغز انسان را شبیه سازی نمایند. نکته حائز اهمیت در استفاده از مدل شبکه عصبی وجود نتایج متفاوت برای روابط خطی است. برای مثال مارکهام26 و راکس27 اذعان داشتند عملکرد شبکه عصبی برای مساله‌های رگرسیون خطی وابسته به اندازه نمونه و سطح شوک (Noise) می‌باشد.
از طرفی ماشین بردار پشتیبان (SVM)28 به عنوان تکنیک نوین یکی از روشهای یادگیری ماشینی است که بر مبنای تئوری یادگیری آماری واپنیک29 در دهه 90 میلادی توسط واپنیک و همکارانش ارائه گردید. این روش از جمله روش‌های نسبتاً جدیدی است که در سال‌های اخیر کارایی خوبی نسبت به روش‌های قدیمی‌تر از جمله شبکه‌های عصبی پرسپترون نشان داده است. رگرسیون بردار پشتیبان این عمل را با تابعی که انحراف از مقدار واقعی در آن به میزان کمتر از ɛ مجاز است، انجام میدهد.
همانطور که ذکر شد با وجود مزایای متعدد، شبکه های عصبی با محدودیت هایی از جمله مدلسازی روابط خطی و همچنین نیازمند بودن به شمار بالای نمونه برای آموزش( به منظور انجام فرآیند یادگیری) مواجه میباشد. اما چون دانستن خصوصیات دادهها مبنی بر خطی و یا غیر خطی بودن در واقعیت کمی دشوار است و از طرفی به ندرت روابط کاملا خطی و یا کاملا غیر خطی مشاهده میشود، بنابراین این ایده به ذهن میرسد که ترکیب مدل خطی آریما با مدلهای غیر خطی شبکه عصبی پیشخور و ماشین بردار پشتیبان میتواند باعث بهبود دقت پیشبینی گردد.
در مدل ترکیبی سعی بر این داریم ابتدا روابط غیرخطی در پسماندها را با استفاده از شبکهی عصبی و رگرسیون بردار پشتیبان شناسایی کرده سپس پسماندهای بدست آمده را به مدل خودرگرسیو میانگین متحرک انباشته اضافه کنیم. با این ترکیب، بخش خطی بوسیله‌ی مدل خودرگرسیو میانگین متحرک انباشته و بخش غیرخطی بوسیله‌ی شبکه عصبی و رگرسیون بردار پشتیبان پیش‌بینی خواهد شد.
با عنایت به مطالبی که ذکر شد این سوال پیش میآید که کدامیک از مدلهای رگرسیون بردار پشتیبان، شبکه عصبی، خودرگرسیو میانگین متحرک انباشته و مدلهای ترکیبی، با دقت بالاتر و خطای کمتری توانایی پیشبینی شاخص بورس اوراق بهادار تهران را دارد؟
از آنجا که الگوی دادهها در واقعیت اغلب پیچیده میباشد، مطالعات زیادی به منظور ترکیب مدلهای خطی و غیرخطی انجام پذیرفته است. بنابراین در ابتدا به معرفی مدل خودرگرسیو میانگین متحرک انباشته و اجزای تشکیل دهندهی آن یعنی AR ، MA و ARMA میپردازیم. سپس بعد از معرفی کلی شبکههای عصبی، اجزا و ساختارهای آن، شبکهی عصبی پیشخور با الگوریتم یادگیری پس انتشار خطا را که اغلب در سریهای زمانی از آن استفاده می شود شرح خواهیم داد. بعد از مرور بر مبانی نظری مدلهای خودرگرسیو میانگین متحرک انباشته و شبکههای عصبی، نگاهی بر نتایج پیچیدهی شبکههای عصبی و خودرگرسیو میانگین متحرک انباشته در سریهای زمانی مختلف خواهیم انداخت و در پایان به مرور برخی از مطالعات در زمینهی ترکیب مدلهای خطی و غیرخطی میپردازیم.
2-2) انواع داده ها
انواع داده های مورد استفاده در مباحث اقتصادی مالی را میتوان به سه دسته کلی تقسیم نمود: سریهای زمانی، دادههای مقطعیو دادههای پانل(ترکیبی)]11[
2-2-1) داده های سری زمانی30
داده های سری زمانی مربوط به یک دوره زمانی معین است که ممکن است سالانه، فصلی، ماهانه، هفتگی، روزانه باشد. داده های سری زمانی به فراوانی خاصی از مشاهدات و یا مجموعه ای از داده های نقطهای مربوط می شود. فراوانی ، تابعی از فاصله و یا ترتیب زمانی است که داده ها بر اساس آن جمع آوری وثبت شده است .
2-2-2 (داده های مقطعی31
داده های مقطعی بیانگر اطلاعات مربوط به یک متغیر در یک زمان معین میباشد.
2-2-3(داده های پانل32
داده های ترکیبی یا پانل ترکیبی از دادههای سری زمانی و مقطعی است. داده های قیمت روزانه تعدادی از سهام با رشد بالا در طول دو سال از نوع داده های پانل هستند .
2-3)مدلهای سری زمانی تک متغیره33
در مدلهای سری زمانی تک متغیره تلاش میشود تا متغیرهای اقتصادی و مالی را بر اساس مقادیر گذشته و جاری آن متغیر و همچنین مقادیر جاری و گذشته جملات خطا، مدل سازی و پیش بینی نمایند. مدلهای سریزمانی در مقابل مدلهای ساختاری34 مطرح میگردند. مدلهای ساختاری ماهیتاٌ چند متغیره بوده و تغییرات یک متغیر را توسط تغییرات مقادیر جاری و گذشته متغیرهای دیگر توضیح دهند. اما این مدلها نسبت به مدلهای ساختاری دارای دو مزیت عمده به قرار زیر میباشند:]32،60[
مدلهای ساختاری یک پیشفرض تئوریک را مبنای برقراری رابطهی علت و معلول بین متغیرهای مستقل و وابسته قرار میدهند، در حالی که مدلهای سری زمانی نیازی به این پیش فرض ندارند.
مدلهای ساختاری در پیشبینی خارج از نمونهای35 چندان خوب عمل نمیکنند.
2-4) برخی مفاهیم سریهای زمانی :
2-4-1) فرآیندهای اکیداً مانا36
فرآیندهای اکیداً مانا ، فرایندی است که به ازای T=1,2,…,k;kϵz و〖 t〗_1,t_2,…,t_T ϵZ رابطه زیر برقرار باشد .
معادله (2-1)
F_(Y_(t_1 ),Y_(t_2 ),…,Y_(t_T ) ) (Y_1,Y_2,…,Y_T )=F_(Y_(t_1+k),Y_(t_2+k),…,Y_(t_T+k) ) (Y_1,Y_2,…,Y_T)
که Fتابع توزیع مشترک مجموعه ای از متغیرهای تصادفی است.این را می توان بدین صورت نیز بیان نمود که احتمال سری {Y_t}با احتمال سری{Y_(t+k)}به ازای هرk یکسان است .به عبارتی دیگر یک سری زمانی در صورتی اکیداً مانا است که توزیع مقادیر آن ، همراه با گذشت زمان یکسان بماند.این شرط دلالت بر این دارد که احتمال این که Yدر یک فاصله معین قرار گیرد، در زمان حال، آینده و گذشته یکسان است[11].
2-4-2) فرآیندهای مانای ضعیف37
اگر یک سری زمانی شرایط زیر را به ازای هر t تامین کند ، آن را مانای ضعیف گویند :
معادله (2-2)
1)E(Y_t )=µ
معادله (2-3)
2)E〖(Y_t-µ)〗^2=Var(Y_t )=σ^2<∞
معادله (2-4)
3)Cov(Y_(t_1 ),Y_(t_2 ) )=E(Y_(t_1 )-µ)(Y_(t_2 )-µ)=γ_(t_2-t_1 )
شرایط سه گانه فوق بیان می کندکه فرآیندهای مانا بایستی دارای میانگین ثابت، واریانس ثابت وساختار خودکواریانس ثابت باشند. [11]

2-4-3 ) خودکوواریانس38، خودهمبستگی39، خودهمبستگی جزئی40 [48,27]
به کوواریانس بین یک سری زمانی مانند با وقفههای زمانی خودش خودکوواریانس و به ضریب همبستگی آن سری زمانی با وقفههایش، خودهمبستگی گویند.
معادله 2-5)

معادله 2-6)
: ضریب همبستگی بین و
اما از آن جایی که همبستگی بین یک سری زمانی با وقفههایش اثر زمانهای بین آن را لحاظ میکند، برای حذف اثر این زمانها از همبستگی جزئی استفاده میشود. خودهمبستگی جزئی برای یک و دو وقفه زمانی به قرار زیر محاسبه می گردد:
معادله 2-7)
: ضریب همبستگی بین و
: ضریب همبستگی بین و
2-4-4) تابع خودهمبستگی41 و خودهمبستگی جزئی42 [27]
اگر مقادیر خودهمبستگی و خودهمبستگی جزئی را به ازای در قالب نمودار رسم نماییم، اشکال حاصله را به ترتیب تابع خودهمبستگی و خودهمبستگی جزئی مینامند.
2-4-5) فرآیندهای کاملاً تصادفی43
اگر برای سری زمانی Y_t، شرایط زیر برقرار باشدآن را کاملاً تصادفی گویند:
(2-8)
E(Y_t )=µ
(2-9)
Var(Y_t )=σ^2
(2-10)
γ_(t-r =) {█( σ^2 t=r@0 t≠r)┤
بنابراین یک فرایند کاملاً تصادفی دارای میانگین و واریانس ثابت است و مقادیر خودکواریانس آن صفر میباشد. شرط آخر بیانگر این است که هر مشاهده با تمامی مقادیر قبلی خودش هیچگونه همبستگی ندارد.این متغیرها را نمیتوان بر اساس مقادیر گذشته آنها پیش بینی نمود، زیرا کاملاً تصادفی بوده وهیچ ارتباطی با مقادیر گذشته خود ندارند. [11]
2-4-6) فرآیند نوفهی سفید44 27],[48
چنانچه یک فرآیند دارای سه شرط زیر باشد ، نوفه ی سفید نامیده میشود:
میانگین سری زمانی در طول زمان ثابت و معین باشد.
واریانس سری زمانی در طول زمان ثابت و معین باشد.
کوواریانس سری زمانی با وقفه هایش برابر صفر باشد.
از این رو داریم:
(2-11)
1)
(2-12)
2)
(2-13)
3)
2-4-7 ) آماره ی Q45 [27]
برای بررسی آزمون معناداری ضرایب خودهمبستگی در یک سری زمانی مانند باکس و پیرس46 در سال 1970 آمارهای را ارائه دادند که در آن به جای بررسی معناداری تک تک ضرایب همبستگی، معناداری کلی مورد آزمون قرار میگیرد و در واقع فروض و آن به قرار زیر است:
: ضریب خودهمبستگی
آماره Q دارای توزیع X^2 از درجه آزادی تعداد وقفهی لحاظ شده است و به روش زیر محاسبه می گردد.
معادله 2-14)
m: حداکثر تعداد وقفه
T: تعداد مشاهدات
اما از آن جا که آمارهی باکس- پیرس در نمونههای کوچک منجر به تصمیمات اشتباه میشد در سال 1978 باکس و الژانگ47 این آماره را به صورت زیر تعدیل نمودند:
معادله 2-15)
Q^*=T(T+2)∑_(i=1)^m▒(ρ_i^2)/(T-i)
2-5) فرآیندهای خودرگرسیون48 (AR) 27],[32
در یک مدل خودرگرسیون، کقدار جاری یک متغیر صرفاٌ وابسته به مقادیر قبلی آن به علاوه جمله خطا میباشد. مدل خودرگرسیون مرتبه p که با AR(p) نشان داده میشود عبارتست از:
معادله 2-16)
Y_t=µ+ϕ_1 Y_(t-1)+ϕ_2 Y_(t-2)+…+ϕ_P Y_(t-p)+u_t
Y_T=µ+∑_(i=1)^p▒〖ϕ_i Y_(t-i) 〗+u_t
با استفاده از عملگرهای وقفه می توان عبارت بالا را به صورت زیر نوشت:
(2-17)
Y_t=µ+∑_(i=1)^p▒〖ϕ_i L^i Y_t+u_(t ) 〗
ϕ(L) Y_t=µ+u_t ; ϕ(L)=1-ϕ_1 L-ϕ_2 L^2-…-ϕ_p L^(p )
: Lعملگر وقفه49
: U_t یک فرآیند نوفه سفید
2-6) فرآیندهای میانگین متحرک50 (MA)
فرآیندهای میانگین متحرک، ترکیب خطی سادهای از فرآیندهای نوفه سفید میباشند که در آن ارزش جاری به ارزشهای جاری و گذشته اجزاء اخلال، وابسته است.
در صورتی که u_tیک فرآیند نوفه سفید و t =1,2,3,.. باشد. با توجه به اینکه E(u_t )=0 و var (u_t) = σ^2 باشد.
(2-18)
Y_t=μ+θ_1+θ_2 u_(t-2)+…+θ_q u_(t-q)
معادله بالا به عنوان فرآیند میانگین متحرک با مرتبه q شناخته می شود وبه صورت MA(q)نشان داده می شود.
همچنین این معادله را میتوان بصورت زیر نیز نمایش داد:
(2-19)
Y_t=µ+∑_(i=1)^q▒〖θ_i u_(t-i) 〗+u_t
معادله بالا را همچنین میتوان با استفاده از نماد عملگر وقفه تعدیل کرد.طبق تعریف عملگر وقفه عبارت است از:
(2-20)
LY_t=Y_(t-1) , L^i Y_t=t-i
بنابراین مدل میانگین متحرک را با توجه به عملگر وقفه به صورت ذیل می توان نوشت :
(2-21)
Y_t=µ+∑_(i=1)^q▒〖θ_i u_(t-i) 〗+u_t
Y_t=µ+∑_(i=1)^q▒〖θ_i L^i u_t 〗+u_(t )
Y_t=µ+θ (L)u_t ; θ(L)=1+θ_1 L+θ_2 L^2+…+θ_q L^q
2-7) فرآیندهای خودرگرسیو میانگین متحرک51 (ARMA) [32,27]
مدلهای (p,q)ARMA از ترکیب مدلهای خودرگرسیو از مرتبهی p و میانگین متحرک از مرتبهی q حاصل میشوند. در این مدلها ارزش جاری سری زمانی به صورت خطی به ارزشهای گذشتهی خودش و ارزشهای جاری و گذشتهی اجزاء اخلال، وابسته است.
مدلها خودرگرسیو میانگین متحرک را به صورتهای زیر میتوان نمایش داد:
معادله 2-22)
Y_t=µ+ϕ_1 Y_(t-1)+ϕ_2 Y_(t-2)+…+ϕ_p Y_(t-p)+u_t+θ_1 u_(t-1)+θ_2 u_(t-2)+…+θ_q ϕ_(t-q)
Y_t=μ+∑_(i=1)^p▒〖Q_i L^i Y_t+∑_(j=1)^q▒〖θ_j L^J u_t+u_t 〗〗
ϕ(L)Y_t=µ+θ(L)u_t
ϕ(L)=1-ϕ_1 L-ϕ_2 L^2-…-ϕ_p L^p
θ(L)=1+θ_1 L+θ_2 L^2+…+θ_q L^q
مدلهای رگرسیو میانگین متحرک، هم خصوصیات مدلهای خودرگسیو (AR) و هم خصوصیات مدلهای میانگین متحرک (MA) را در بر میگیرند. در مدلهای خودرگسیو، تابع خودهمبستگی به صورت نمایی کاهش پیدا میکند در حالی که تابع خودهمبستگی جزئی تعداد وقفههای مورد نیاز برای مدل را معین میسازد، اما در مدلهای میانگین متحرک، این دو تابع برعکس مدلهای خودرگسیو، عمل مینمایند.
2-8) مدل خود رگرسیو میانگین متحرک انباشته (ARIMA)52
در روش خودرگرسیو میانگین متحرک انباشته برای پیش بینی مقادیر آینده متغیر از مقادیر گذشته متغیر واطلاعات حال و گذشته اجزاء اخلال استفاده می شود .
شرط بهرهگیری از مدلهای خودرگرسیو میانگین متحرک انباشته، مانا بودن سری زمانی می باشد. برای مانا کردن سریهای زمانی مالی و اقتصادی اغلب از روش تفاضل استفاده می شود. جزء یکپارچگی در مدل خودرگرسیو میانگین متحرک انباشته بیانگر میزان تفاضل مورد نیاز برای مانا کردن سری زمانی است.[60, 31]
مدلهای خودرگرسیو میانگین متحرک انباشته را معمولاً به صورت ARIMA(p,d,q) نمایش میدهند. که در آنp مرتبه مورد نیاز برای خود رگرسیو،d میزان تفاضل مورد نیاز برای مانا کردن سری زمانی وq میزان مرتبهی مورد نیاز برای میانگین متحرک است .
2-9) مراحل ساخت مدل های [27] ARIMA
مانا کردن سری زمانی: با استفاده از روش تفاضل، به منظور استفاده از مدلهای خودرگرسیو میانگین متحرک انباشته ، سری زمانی را مانا میکنیم.
شناسایی مدل53: در این مرحله مرتبههای مورد نیاز برای ساخت مدل تعیین میگردد. برای این منظور میتوان از توابع خودهمبستگی (ACF) و خودهمبستگی جزئی (PACF) بهره گرفت.
تخمین مدل54: تخمین ضرایب با استفاده از تکنیکهایی مانند حداقل مربعات، حداکثر درست نمایی و از این قبیل.
بررسی مدل55: در این مرحله با استفاده از توابع خودهمبستگی و خودهمبستگی جزئی و آمارهی باکس و الژانگ، مستقل بودن سری پسماندها، مورد آزمون قرار میگیرد. مدل خودرگرسیو میانگین متحرک انباشته بهینه مدلی است که پسماندهای آن فاقد همبستگی خطی باشند.
پیش‌بینی56: با استفاده از مدل خودرگرسیو میانگین متحرک انباشته بهینه، ارزش متغیر در آینده را پیش‌بینی میکنیم.
2-10) انواع نامانایی [27]
اغلب دو مدل به منظور مشخص کردن نامانایی به کار گرفته میشود:
مدل گشت تصادفی با رانش57
معادله 2-23)
فرآیند روند- مانا58 (اطراف خط روند مانا می باشند)
معادله 2-24)
که مدل اول را نامانای تصادفی59 و مدل دوم را نامانای معین60 می نامند.
برای مانا کردن مدلهای گشت تصادفی، معمولاً از تفاضل61 و برای مانا کردن مدلهای روند- مانا معمولاً از روند زدایی استفاده میگردد.
2-11 ) آزمون ریشهی واحد62 [32,27]
یک سری، وقتی مانا است که تابع خودهمبستگی و یا خودهمبستگی جزئی آن به صورت نمایی کاهش پیدا کند اما از آن جایی که این روش بررسی مانایی سریهای زمانی، قضاوتی است اغلب از آزمون ریشه واحد برای بررسی مانایی یک سری زمانی استفاده میشود.

دسته بندی : پایان نامه ارشد

دیدگاهتان را بنویسید