هموارسازی تحلیلی سری های زمانی. معادله روند

خط مستقیم - مقادیر روند سودآوری (روند خطی، ساخته شده بر اساس مقادیر واقعی سودآوری).


مثال 14.6. اجازه دهید یک روند خطی در نرخ بهره وام ها بر اساس داده های آماری منتشر شده در بولتن آمارهای بانکی شماره 4 (47) برای سال 1997 ایجاد کنیم.

مرحله دوم جستجوی مقادیر پارامترهای معادله است. پارامترهای مدل های روند با استفاده از یک سیستم معادلات نرمال تعیین می شوند. در مورد روند خطی از سیستم معادلات زیر استفاده می شود که با روش حل می شود کمترین مربعات

مثال 14.7. با فرض وجود نوسانات چرخه ای، ما یک تحلیل هارمونیک از پویایی انحرافات از روند خطی داده ها در مورد نرخ بهره وام ها (y, - y,) انجام خواهیم داد.

یک روند خطی به خوبی روند تغییرات را تحت تأثیر عوامل مختلفی منعکس می کند که با توجه به الگوهای مختلف به روش های مختلف تغییر می کنند. حاصل این عوامل در لغو متقابل ویژگی های عوامل فردی است

در b = 1 یک روند خطی داریم، b = 2 - سهمی و غیره. فرم قدرت - انعطاف پذیر، مناسب برای نمایش تغییرات با معیارهای متفاوت تناسب تغییرات در طول زمان. یک شرط سخت عبور اجباری از مبدا در t = 0، y = 0 است. شما می توانید شکل روند y = a + th یا y = a + th را پیچیده کنید، اما این معادلات نمی توانند لگاریتمی باشند، دشوار است پارامترها را محاسبه کنید و به ندرت از آنها استفاده می شود.

برای یک روند خطی، معادلات حداقل مربعات نرمال شکل دارند

در فرمول (9.33) جمع = -(l-1) 2 تا / = (l-1) 2 به عنوان یک کل، فرمول (9.33) شبیه فرمول یک روند خطی (9.29) است.

طبق فرمول (9.29)، پارامترهای روند خطی a = 1894/11 = 172.2 q/ha 2>L= 486/110 = 4.418 q/ha است. معادله روند خطی به شکل y = 172.2 + 4.418/ است، که در آن (= 0 در سال 1987. این بدان معنی است که میانگین سطح واقعی و تراز شده که به اواسط دوره، یعنی تا سال 1991 اشاره شده است، برابر با 172 qs 1 ha است. و میانگین افزایش سالانه 418/4 کلسیم در هکتار در سال است.

از آنجایی که طبق جدول. 9.4، قبلاً ثابت شده است که روند یک شکل خطی دارد، ما میانگین افزایش مطلق سالانه را محاسبه می کنیم، یعنی پارامتر b معادله روند خطی را محاسبه می کنیم.

نوسانات متوسط ​​است، نه قوی. برای مقایسه، ما شاخص‌های (بدون محاسبه) را برای نوسانات عملکرد سیب‌زمینی ارائه می‌کنیم، داده‌های جداول 9.1 و 9.5 - انحراف از روند خطی s(t) = 14.38 سنت در هر هکتار، v(t) = 8.35٪.

برای به دست آوردن مرزهای قابل اطمینان کافی برای پیش بینی موقعیت روند، مثلاً با احتمال 0.9 که خطا بیش از حد مشخص شده نباشد، باید خطای متوسطضرب در مقدار /-معیار دانش آموز در احتمال نشان داده شده (یا اهمیت 1 - 0.9 = 0.1) و با تعداد درجه آزادی برابر است، برای یک روند خطی، N-2، یعنی 15. این مقدار برابر است با 1.753. ما خطای حاشیه ای را با احتمال داده شده دریافت می کنیم

روش دیگر برای اندازه گیری همبستگی در سری های زمانی می تواند همبستگی بین شاخص های زنجیره ای سری ها باشد که ثابت روند آنها هستند. با روندهای خطی، اینها دستاوردهای مطلق زنجیره ای هستند. با محاسبه آنها از سری زمانی اصلی (axl, ayi)، ضریب همبستگی بین تغییرات مطلق را با استفاده از فرمول (9.52) یا به طور دقیق تر، با استفاده از فرمول (9.51) پیدا می کنیم، زیرا در مقابل میانگین تغییرات برابر با صفر نیست. به میانگین انحراف از روند. قابل قبول بودن این روش مبتنی بر این واقعیت است که تفاوت بین سطوح مجاور عمدتاً شامل نوسانات است و سهم روند در آنها کم است، بنابراین اعوجاج همبستگی از روند بسیار زیاد است و تأثیر تجمعی بر آن دارد. یک دوره طولانی، بسیار کوچک - برای هر سال به طور جداگانه. با این حال، باید به خاطر داشت که این فقط برای سری هایی با ضریب c به طور قابل توجهی کمتر از یک صادق است. در مثال ما، برای سری بازده، ضریب c 0.144 است، برای قیمت تمام شده 0.350 است. ضریب همبستگی تغییرات مطلق زنجیره 0.928 بود که بسیار نزدیک به ضریب همبستگی انحرافات روند است.

در یکی از نمونه های قبلی، پیش بینی تولید دو ماهه یک شرکت در دوبلین را بررسی کردیم. برآوردها برای سال 1997 با استفاده از روند خطی و روش جمع به دست آمد. مقادیر پیش بینی شده به تن داده شده است

مقادیر k برای تخمین فواصل اطمینان پیش بینی نسبت به روند خطی با احتمال 0.8

مدلسازی تطبیقی ​​روند خطی با استفاده از میانگین متحرک نمایی

الگوریتم محاسبه پارامترهای یک روند خطی

در تقریب اول پارامترهای روند خطی را محاسبه کنید

مقادیر نهایی پارامترهای روند خطی را تعیین کنید

خطاهای EMA می توانند کیفیت پیش بینی را کاهش دهند. در این حالت، هنگام محاسبه پارامترهای یک روند خطی، باید در مرحله 2 این الگوریتم توقف کنید.

LN - روند خطی، فصلی در نظر گرفته نمی شود

اگر فرض کنیم که تغییرات قیمت، بر خلاف ملاحظات کارایی در دوره‌های زمانی طولانی، توسط بازخوردهای متعدد و اغلب غیرخطی تعیین می‌شود، بر اساس تئوری آشوب، می‌توان مدل‌های بهبودیافته‌ای ساخت که تأثیر گذشته بر حاضر (نگاه کنید به -). سقوط چشمگیر بازار در غیاب تغییرات قابل توجهاطلاعات، تغییرات ناگهانی در شرایط دسترسی و شرایط زمانی که یک شرکت از آستانه نامرئی در بخش اعتبار عبور می کند - همه اینها جلوه هایی از غیر خطی بودن است. رفتار واقعی بازارهای مالی به جای تایید قوانین معکوس روند خطی در تضاد است.

روش تفاوت های متوالی به شرح زیر است: اگر سری حاوی یک روند خطی باشد، داده های اصلی با تفاوت های اول جایگزین می شوند.

مقادیر Lu روند مشخصی ندارند، آنها در حدود سطح متوسط ​​متفاوت هستند، به این معنی که یک روند خطی (روند خطی) در سری دینامیک وجود دارد. برای سری x نیز می توان نتیجه ای مشابه گرفت، افزایش های مطلق جهت سیستماتیک ندارند، تقریباً پایدار هستند و بنابراین، سری با روند خطی مشخص می شود.

این به ایده اندازه گیری همبستگی نه سطوح x، uy، بلکه اولین تفاوت های Dx، = x، -، 6y، - y، - y، ..، (با روندهای خطی) منجر شد. AT مورد کلیارتباط انحراف از روندها (منهای جزء چرخه ای) Ey -y، -٪، Ex = x، -٪ (y،٪ - روندهای سری زمانی) ضروری است.

در نمودار در شکل 5.3 به وضوح وجود روند افزایشی را نشان می دهد. ممکن است روند خطی وجود داشته باشد.

پارامترهای روند خطی را می توان به صورت زیر تفسیر کرد: a - سطح اولیه سری زمانی در زمان t = 0 b - میانگین افزایش مطلق در سطوح سری در طول دوره. در رابطه با این سری زمانی می توان گفت که نرخ رشد دستمزد اسمی ماهانه 10 ماهه در سال 1378 از سطح 82.66 درصد با میانگین افزایش مطلق ماهانه معادل 4.72 درصد تغییر کرده است. مورد مقادیر سطوح سری زمانی محاسبه شده بر اساس روند خطی به دو صورت تعیین می شود. ابتدا، می توان مقادیر / = 1، 2،...، n را به ترتیب در معادله روند یافت شده جایگزین کرد، یعنی.

ثانیاً، مطابق با تفسیر پارامترهای روند خطی، هر سطح بعدی از سری مجموع سطح قبلی و میانگین افزایش مطلق زنجیره است، یعنی.

بنابراین، سطح اولیه سری طبق معادله روند نمایی 83.96 (در مقایسه با سطح اولیه 82.66 در روند خطی) و میانگین نرخ رشد زنجیره 1.046 است. بنابراین، می توان گفت که

معادله روند خطی y = at + b است.

پارامترهای معادلات تابع روند با استفاده از نظریه همبستگی حداقل مربعات یافت می شوند.

1. روش حداقل مربعات.
روش حداقل مربعات (LSM) یکی از راه های مقاومت در برابر خطاهای اندازه گیری است.(مانند خطای انحراف فیزیک)
این روش معمولاً برای یافتن پارامترهای معادلات (خط ها، هذلول ها، سهمی ها و غیره) استفاده می شود.
این روش برای به حداقل رساندن مجموع انحرافات مربع است.
معنای MNC را می توان از طریق این نمودار بیان کرد

2. تجزیه و تحلیل دقت تعیین تخمین پارامترهای معادله روند (طبق جدول دانش آموز، TTab را پیدا کرده و پیش بینی فاصله ای انجام می دهیم، یعنی ریشه میانگین مربعات خطا را شناسایی می کنیم)

3. آزمون فرضیه ها در خصوص ضرایب معادله خطیروند (معیار آماری دانش آموز، فیشر)

همبستگی خودکار باقیمانده ها را بررسی کنید.
یک پیش نیاز مهم برای ساخت یک مدل رگرسیون با کیفیت بالا برای حداقل مربعات، استقلال مقادیر است. انحرافات تصادفیاز مقادیر انحراف در تمام مشاهدات دیگر. این تضمین می کند که هیچ ارتباطی بین انحرافات و به ویژه بین انحرافات مجاور وجود ندارد.
خودهمبستگی (همبستگی سریالی) خود همبستگی باقیمانده ها (اغلب) معمولاً در تحلیل رگرسیون هنگام استفاده از داده های سری زمانی و به ندرت هنگام استفاده از داده های مقطعی مشاهده می شود.
بررسی ناهمسانی.
1) با روش تحلیل گرافیکی باقیمانده ها.
در این حالت، مقادیر متغیر توضیحی X در امتداد ابسیسا رسم می‌شوند و انحرافات e i یا مربع‌های آن‌ها e2 i در امتداد مختصات رسم می‌شوند.
اگر رابطه مشخصی بین انحرافات وجود داشته باشد، ناهمسانی اتفاق می افتد. فقدان وابستگی احتمالاً نشان دهنده عدم وجود ناهمسانی است.
2) استفاده از آزمون همبستگی رتبهنیزه دار.
ضریب همبستگی رتبه اسپیرمن.

36. روشهای سنجش پایداری روندها در دینامیک (ضریب رتبه اسپیرمن).

مفهوم "پایداری" در معانی بسیار متفاوتی به کار می رود. در رابطه با مطالعه اتفاقی دینامیک، دو جنبه از این مفهوم را در نظر خواهیم گرفت: 1) ثبات به عنوان مقوله ای در مقابل نوسانات. 2) ثبات جهت تغییرات، یعنی. ثبات روند

ثبات در معنای دوم نه خود سطوح، بلکه روند تغییر جهت دار آنها را مشخص می کند. برای مثال می توان فهمید که روند کاهش هزینه واحد منابع برای تولید یک واحد خروجی چقدر پایدار است، آیا روند کاهش مرگ و میر کودکان پایدار است و غیره قبلی (رشد پایدار) یا کمتر از همه. موارد قبلی (کاهش پایدار). هرگونه تخطی از ترتیب دقیق سطوح نشان دهنده ثبات ناقص تغییرات است.


از تعریف مفهوم ثبات یک روند، روش ساخت اندیکاتور آن به دست می آید که به عنوان شاخص پایداری می توان از ضریب همبستگی رتبه های اسپیرمن - rx استفاده کرد.

که در آن n تعداد سطوح است.

I - تفاوت بین رتبه سطوح و تعداد دوره های زمانی.

با تطابق کامل رتبه‌های سطوح، شروع از کوچک‌ترین، و تعداد دوره‌ها (لحظه‌های) زمانی با توجه به آنها ترتیب زمانیضریب همبستگی رتبه +1 است. این مقدار مربوط به حالت پایداری کامل افزایش سطح است. زمانی که رتبه ترازها کاملاً مخالف رتبه سال ها باشد، ضریب اسپیرمن برابر با 1- است که به این معنی است که روند کاهش سطوح کاملاً پایدار است. با تناوب بی نظم سطوح رتبه، ضریب نزدیک به صفر است، که به معنای بی ثباتی هر روند است.

معنی منفی rx نشان دهنده وجود روند نزولی در سطوح است و ثبات این روند کمتر از حد متوسط ​​است.

در عین حال باید در نظر داشت که حتی با ثبات 100 درصدی روند در سری دینامیک، ممکن است نوساناتی در سطوح وجود داشته باشد و ضریب پایداری آنها زیر 100 درصد باشد. با یک نوسان ضعیف، اما یک روند حتی ضعیف تر، برعکس، یک ضریب ثبات سطح بالا امکان پذیر است، اما ضریب ثبات روند نزدیک به صفر است. به طور کلی، هر دو شاخص، البته، با یک رابطه مستقیم به هم مرتبط هستند: اغلب، ثبات بیشتر سطوح به طور همزمان با ثبات بیشتر روند مشاهده می شود.

37. مدل سازی روند یک سری از دینامیک در حضور تغییرات ساختاری.

تغییرات یکباره در ماهیت روند سری زمانی ناشی از تغییرات ساختاری در اقتصاد یا سایر عوامل را باید از نوسانات فصلی و چرخه ای متمایز کرد. در این حالت، با شروع از یک نقطه خاص در زمان t، ماهیت پویایی شاخص مورد مطالعه تغییر می کند، که منجر به تغییر در پارامترهای روندی می شود که این پویایی را توصیف می کند.

لحظه t با تغییرات قابل توجهی در تعدادی از عوامل همراه است که تأثیر قوی بر شاخص مورد مطالعه دارد. اگر سری زمانی مورد مطالعه شامل نقطه زمانی متناظر باشد، یکی از وظایف مطالعه آن روشن کردن این سوال است که آیا تغییرات کلی ساختاری به طور قابل توجهی بر ماهیت این روند تأثیر گذاشته است یا خیر.

اگر این تأثیر قابل توجه باشد، باید از مدل‌های رگرسیون خطی تکه‌ای برای مدل‌سازی روند این سری زمانی استفاده شود. مجموعه اولیه را به 2 زیر مجموعه (قبل از زمان t و بعد از آن) تقسیم کنید و برای هر زیر مجموعه معادله رگرسیون خطی جداگانه بسازید.

اگر تغییرات ساختاری اندکی بر ماهیت روند سری تأثیر گذاشته باشد.

هر یک از رویکردهایی که در بالا توضیح داده شد، جوانب مثبت و منفی خود را دارد. هنگام ساخت یک مدل خطی تکه ای، مجموع مربعات باقیمانده در مقایسه با معادله روند که برای کل جمعیت یکنواخت است کاهش می یابد. اما تقسیم جمعیت به قطعات منجر به کاهش تعداد مشاهدات و کاهش درجات آزادی در هر معادله یک مدل خطی تکه‌ای می‌شود. ساخت یک معادله روند واحد به شما امکان می دهد تعداد مشاهدات جمعیت اصلی را ذخیره کنید، اما مجموع مربعات باقیمانده طبق این معادله در مقایسه با مدل خطی تکه ای بیشتر خواهد بود. بدیهی است که انتخاب مدل به رابطه بین کاهش بستگی دارد پراکندگی باقی ماندهو از دست دادن تعداد درجات آزادی در انتقال از یک معادله رگرسیون منفرد به یک مدل خطی تکه‌ای.

38. تحلیل رگرسیون سری های زمانی متصل.

سری‌های زمانی چند متغیره که وابستگی ویژگی مؤثر را به یک یا چند فاکتوریل نشان می‌دهند، سری‌های زمانی متصل نامیده می‌شوند. استفاده از روش های حداقل مربعات برای پردازش سری های زمانی نیازی به هیچ فرضی در مورد قوانین توزیع داده های اولیه ندارد. با این حال، هنگام استفاده از روش حداقل مربعات برای پردازش سری های متصل، باید حضور خودهمبستگی (خودرگرسیون) را در نظر گرفت، که در پردازش سری های دینامیکی یک بعدی در نظر گرفته نشد، زیرا وجود آن به متراکم تر و واضح تر کمک می کند. شناسایی روند توسعه پدیده اجتماعی-اقتصادی مورد بررسی در زمان.

شناسایی خودهمبستگی در سطوح یک سری از دینامیک

در مجموعه پویایی فرآیندهای اقتصادی، بین سطوح به ویژه سطوح با فاصله نزدیک رابطه وجود دارد. راحت است که آن را به عنوان یک همبستگی بین سری y1،y2،y3،…..yn h y1+h، y2+h،…، yn+h نشان دهیم. شیفت زمانی L را شیفت و خود پدیده رابطه را خودهمبستگی می نامند.

وابستگی خودهمبستگی به ویژه بین سطوح بعدی و قبلی سری زمانی قابل توجه است.

دو نوع خودهمبستگی وجود دارد:

خود همبستگی در مشاهدات یک یا چند متغیر.

خودهمبستگی خطاها یا خودهمبستگی در انحراف از روند.

وجود دومی منجر به تحریف مقادیر میانگین می شود خطاهای درجه دومضرایب رگرسیون، که ایجاد فاصله های اطمینان برای ضرایب رگرسیون و همچنین بررسی اهمیت آنها را دشوار می کند.

خودهمبستگی با استفاده از یک ضریب خود همبستگی چرخه ای اندازه گیری می شود، که می تواند نه تنها بین سطوح مجاور، یعنی. با یک دوره جابجا می شود، بلکه بین جابجایی هر تعداد واحد زمانی (L) نیز تغییر می کند. این تغییر، که تاخیر زمانی نامیده می شود، ترتیب ضرایب خودهمبستگی را نیز تعیین می کند: مرتبه اول (در L=1)، مرتبه دوم (در L=2)، و غیره. با این حال، محاسبه ضریب غیر چرخه ای (از مرتبه اول) بیشترین علاقه را برای مطالعه دارد، زیرا قوی ترین اعوجاج نتایج تجزیه و تحلیل در طول همبستگی بین سطوح اولیه سری و سطوح مشابه تغییر می کند. یک واحد زمان

برای قضاوت در مورد وجود یا عدم وجود خودهمبستگی در سری مورد مطالعه، مقدار واقعی ضرایب خودهمبستگی با مقدار جدولی (بحرانی) برای سطح معنی‌داری 5% یا 1% مقایسه می‌شود.

اگر مقدار واقعی ضریب خود همبستگی کمتر از مقدار جدول باشد، می توان فرضیه عدم وجود خودهمبستگی در سری را پذیرفت. وقتی مقدار واقعی بزرگتر از مقدار جدول باشد، می‌توان نتیجه گرفت که یک همبستگی خودکار در سری دینامیک وجود دارد.

هنگام استفاده از چند جمله ای های درجات مختلف، تخمین پارامترهای معادله روند با روش حداقل مربعات (LSM) همانند برآورد پارامترهای معادله رگرسیون بر اساس داده های مکانی انجام می شود. سطوح سری زمانی به عنوان متغیر وابسته و عامل زمان به عنوان متغیر مستقل در نظر گرفته می شود. تی،که معمولا در کنار بیان می شود اعداد طبیعی 1, 2, ..., پ.

ارزیابی پارامترهای توابع غیرخطی پس از خطی‌سازی با حداقل مربعات انجام می‌شود. آنها را به شکل خطی می آورد. بیایید کاربرد حداقل مربعات را برای برخی از توابع غیر خطی که در فصل رگرسیون به تفصیل توضیح داده نشده اند، در نظر بگیریم.

برای تخمین پارامترهای منحنی نمایی y = ab 1 یا غرفه داران y = e a+s (یا y = aeس ) با گرفتن لگاریتم، توابع به شکل خطی lny = ln a + t ln b یا توان: lny = کاهش می یابد. آ + btبعد، سیستم ساخته می شود معادلات عادی

مثال 5.1

تعداد تصادفات جاده ای ثبت شده (به ازای هر 100000 نفر) در منطقه نوگورود در سال 2000-2008 با داده مشخص می شود:

بر اساس نمودار، منحنی نمایی انتخاب شد / برای ساختن یک سیستم معادلات نرمال، کمیت های کمکی محاسبه شدند.

سیستم معادلات نرمال بود

با حل آن، مقادیر را بدست می آوریم

بر این اساس، منحنی نمایی یا نمایی داریم

در بازه زمانی 2000 تا 2008، تعداد تصادفات رانندگی به طور متوسط ​​سالانه 13.5 درصد افزایش یافته است. توان به خوبی روند سری زمانی اولیه را توصیف می کند: ضریب تعیین 0.9202 بود. در نتیجه این روند 92 درصد از نوسانات سطوح سری را توضیح می دهد و تنها 8 درصد آن با عوامل تصادفی همراه است.

برخی ویژگی ها دارای تخمین پارامترهای منحنی با اشباع است: اصلاح نمایی، منحنی لجستیک، منحنی گومپرتز، هذلولی شکل برای این توابع، ابتدا باید مجانبی تعیین شود. اگر محقق بتواند آن را بر اساس تحلیل سری های زمانی تنظیم کند، سایر پارامترها را می توان با حداقل مربعات تخمین زد. در این موارد، این توابع به شکل خطی کاهش می یابد. اجازه دهید تخمین پارامترهای این منحنی ها را بر روی نمونه های جداگانه در نظر بگیریم و با توان اصلاح شده شروع کنیم.

مثال 5.2

سطح مکانیزاسیون نیروی کار (در درصد) مشخص می شود سری پویا(جدول 5.2)

جدول 5.2.محاسبه پارامترهای توان اصلاح شده y = c اب"تی

Y = با

از آنجایی که سطح مکانیزاسیون کار نمی تواند از 100٪ تجاوز کند، یک مجانب فوقانی مشخص شده به طور عینی c = 100 وجود دارد. برای تخمین پارامترها آو بتابع در نظر گرفته شده را به شکل خطی می آوریم. نشان دهنده (c-y) از طریق Yو پرولوگاریتم:

برای مثال ما، بر اساس داده های خط نهایی جدول. 3، ما یک سیستم معادلات داریم

با حل آن، به ln می رسیم آ= 3.06311; لوگاریتم ب= -0.19744. بر این اساس با تقویت، دریافت می کنیم: i.e. معادله .

اگر از Yبه سطوح اولیه سری، معادله توان اصلاح شده خواهد بود مقادیر تخمینی y، یعنی. را می توان با جایگزین کردن مقادیر t مربوطه در معادله 0.8208 پیدا کرد. یا بر اساس معادله 7 \u003d 3.06311 - 0.19744 گرم، در Y در طول پردازش کامپیوتری تعیین می شود و سپس 100 - ه 1pu. بنابراین، در t = 8 اینچ Y\u003d \u003d 1.48363 و 100 - e1 "48363 \u003d 100 - 4.40892 \u003d 95.59108 \u003d 95.6) (به ستون آخر جدول مراجعه کنید). اف Hu، اگرچه در مثال این مقادیر کاملاً به یکدیگر نزدیک هستند.

اگر مجانب c مشخص نشده باشد، تخمین پارامترهای توان اصلاح شده پیچیده تر می شود. در این موارد می توان از روش های تخمین مختلفی استفاده کرد: روش سه جمع، روش سه امتیاز، با استفاده از رگرسیون، روش بریانت. استفاده از روش رگرسیون را برای تخمین پارامترهای توان اصلاح شده شکل y = c - در نظر بگیرید. abج.

مثال 5.3

این جدول داده های مربوط به هزینه های تبلیغاتی شرکت را برای 10 ماه ارائه می دهد. از سال.

جدول 5.3.داده های مربوط به هزینه های تبلیغاتی شرکت برای 10 ماه. سال (به هزار روبل)

اجازه دهید افزایش های مطلق زنجیره ای را در سری خود پیدا کنیم و آنها را بر حسب پارامترهای تابع خود نشان دهیم، T.e.z = تاکسی"– با + ab"~ل =ab" 1 (1 - ب). مشخص است که برای توان اصلاح شده، لگاریتم افزایش مطلق به صورت خطی به ضریب زمان t بستگی دارد. بنابراین، می توانیم بنویسیم که lnz = Ιηα + (f – 1) lnb + ln(l – b). Ιηα + ln(l – b) را با علامت گذاری کنید دسپس lnz = d+(t- 1) lnb، i.e. معادله خطی در لگاریتم با اعمال حداقل مربعات، تخمین هایی را برای پارامترهای d، lnb، و بر این اساس، برای پارامتر به دست می آوریم. بدر مثال مورد بررسی، بر اساس ستون جدول. 5.3lnz و (t- 1) معادله رگرسیون پیدا شد: lnz = 4.519641 - 0.20882 (t - 1). بر اساس آن، lnb = -0.20882; b = 0.811538. 4.519641 = در a + In (1 - b) = در [α (1 - b)]. سپس α (1 – b) = e4.519641، از آنجا پارامتر =91.80264/(1-0.811538) = 487.1145 است.

در مرحله بعد، می‌توانیم تخمینی از پارامتر c به عنوان مقدار متوسط ​​مقادیر c = پیدا کنیم در+ ab"، یافت شده برای هر ماه (به ستون آخر جدول 5.3 مراجعه کنید). مقدار حدی هزینه های تبلیغات 516.4 هزار روبل خواهد بود. معادله روند مورد نظر به شکل خواهد بود.

روش در نظر گرفته شده در صورتی قابل اجرا است که افزایش مطلق مقادیر مثبت باشد. اگر برخی از افزایش ها کمتر از صفر باشد، باید سطوح سری های زمانی را با استفاده از روش میانگین متحرک صاف کرد.

برای منحنی لجستیک Pearl-Read، به طور مشابه، اگر مجانب c داده شود، پارامترهای a و b را می توان با حداقل مربعات یافت. سپس عملکرد داده شدهاز لگاریتم به خطی تبدیل می شود با نشان دادن Yو لگاریتم را بگیرید، یعنی. ). پارامترهای بیشتر الف و ب MNC ها مانند مثال مطابق جدول تعیین می شوند. 5.3.

برای یک منحنی لجستیک از فرم، اگر مجانب c داده شود، پارامترهای a و b را می توان با حداقل مربعات تخمین زد، زیرا در این حالت تابع خطی شدنی است: ; با نشان دادن Yمقدار و لگاریتم را بگیرید: سپس با استفاده از روش حداقل مربعات، پارامترها را تخمین می زنیم آو ب

در محاسبات عملی، مقدار مجانب بالای منحنی لجستیک را می توان بر اساس ماهیت توسعه پدیده تعیین کرد. انواع مختلفمحدودیت برای رشد آن (استانداردهای مصرف، قوانین قانونی)، و همچنین گرافیکی.

اگر مجانب بالایی مشخص نشده باشد، می توان از روش های مختلفی برای تخمین پارامترها استفاده کرد: فیشر، یول، رودز، نیر و غیره. ارزیابی مقایسه ای و بررسی این روش ها در کار E. M. Chetyrkin ارائه شده است.

بیایید با مثال محاسبه پارامترهای منحنی لجستیک را با استفاده از روش فیشر نشان دهیم.

مثال 5.4

تولید با داده های ارائه شده در جدول مشخص می شود. 5.4.

جدول 5.4.محاسبه پارامترهای منحنی لجستیک

روش فیشر بر اساس تعریف مشتق برای منحنی لجستیک است. با افتراق این تابع نسبت به t، معادله را بدست می آوریم

اجازه دهید نرخ رشد منحنی لجستیک را به صورت . سپس، یعنی برای ما داریم تابع خطیبا پارامترها آو . برای یافتن راه حل، باید z، را ارزیابی کرد. با فرض مساوی بودن فواصل بین سطوح در سری های زمانی، فیشر پیشنهاد کرد که تقریباً در قالب یک معادله تخمین بزند که در آن پ- 1. برای مثال ما، مقادیر z در ستون 3 جدول ارائه شده است. 5.4. سپس حداقل مربعات را به معادله اعمال می کنیم: , i.e. ما یک رگرسیون z(otmu( می سازیم که داده ها را از t = 2 تا f = 8 می گیریم. معادله رگرسیون به شکل نوشته می شود بر اساس آن، پارامترهای a و c را برای منحنی لجستیک پیدا می کنیم. a = 0.806. این معادله از نظر آماری معنادار است: F-test برابر با 689.6 است. آر 2 = 0.996. بر این اساس، پارامترها نیز برای آن مهم هستند: f-معیار برای پارامتر آ 47.2 و برای پارامتر – برابر 26.2- است. از آن به بعد آن ها مجانب بالای تولید 403 واحد است.

پس از یافتن پارامترهای a و c، پارامتر را پیدا می کنیم ب. برای این کار تابع را به صورت Denote by نشان می دهیم Yعبارت در سمت چپ برابری، یعنی.-پس معادله را داریم بیایید یک لگاریتم از آن بگیریم:. در این معادله عبارت آزاد In b است. می توان آن را از اولین معادله سیستم معادلات عادی تعیین کرد، یعنی برای مثال ما معادله را داریم. بر این اساس، منحنی لجستیک به شکل نوشته خواهد شد

مقادیر نظری این تابع در ستون 6 جدول ارائه شده است. 5.4 (با جایگزینی مقادیر مناسب t یافت می شود). آنها کاملاً به داده های اصلی نزدیک هستند: ضریب همبستگی بین آنها 0.999 است. با توجه به اینکه از لگاریتم در محاسبات استفاده شده است. اگر مقدار حدی حجم تولید را 400 واحد فرض کنیم، یعنی. LSM را به معادله اعمال می کنیم، سپس و را به دست می آوریم b==67.5; پارامتر آدر پردازش کامپیوتری به این صورت تعریف می شود -a =-0.8. بر این اساس، معادله روند به صورت . نتایج دو معادله کاملاً نزدیک است.

پارامترهای منحنی گومپرتز را نیز می توان با حداقل مربعات تخمین زد اگر مجانب c داده شود، زیرا در این حالت این تابع به شکل خطی قابل تقلیل است.با گرفتن لگاریتم آن، معادله را به دست می آوریم.

با گرفتن لگاریتم برای بار دوم، معادله را بدست می آوریم ، نشان دادن با y*، lgb با ATو Ig(lga) تا A، منحنی گومپرتز را به صورت خطی می نویسیم، برای تخمین پارامترهای آن از LSM استفاده می کنیم.

در کاربرد عملیمنحنی گومپرتز، ممکن است مشکلاتی در آن وجود داشته باشد سری پویابا روند صعودی در این حالت مجانب بالایی c و لگاریتم ها مشخص می شوند.در محاسبات لگاریتمی مکرر فقط ارزش های مثبتاجازه دهید امکان تخمین پارامترهای منحنی گومپرتز را با مجانب بالایی با استفاده از مثال دینامیک موجودی شرکت در ابتدای هر ماه (هزار دلار) نشان دهیم.

جدول 5.5.محاسبه پارامترهای منحنی گومپرتز

بر اساس فرمول (9.29)، پارامترهای روند خطی هستند a = 1894/11 = 172.2 q/ha; ب= 486/110 = 4.418 q/ha. معادله روند خطی:

û = 172,2 + 4,418تی، جایی که t = 0 در سال 1987 به این معنی است که میانگین سطح واقعی و تعدیل شده به اواسط دوره، یعنی. تا سال 1991، معادل 172 سنتر در هر رادیو، میانگین افزایش سالانه 4.418 سنتر در هکتار در سال است.

پارامترهای روند سهموی مطابق (9.23) هستند b= 4,418; آ = 177,75; c =-0.5571. معادله روند سهموی شکل دارد ũ = 177,75 + 4,418تی - 0.5571t2; تی= 0 در سال 1991. این به این معنی است که افزایش مطلق عملکرد به طور متوسط ​​2·0.56 c/ha در سال در سال کاهش می یابد. خود رشد مطلق دیگر ثابت روند سهموی نیست، بلکه مقدار متوسط ​​دوره است. در سالی که به عنوان نقطه مرجع در نظر گرفته شده است، یعنی. در سال 1991، روند از نقطه ای با حد 77.75 c/ha عبور می کند. ترم آزاد روند سهموی سطح متوسط ​​دوره نیست. پارامترهای روند نمایی با فرمول های (9.32) و (9.33) ln محاسبه می شوند. آ= 56.5658/11 = 5.1423; تقویت می کنیم آ= 171.1; لوگاریتم ک= 2.853:110 = 0.025936; تقویت می کنیم ک = 1,02628.

معادله روند نمایی: y = 171.1 1.02628 تی .

این بدان معناست که میانگین نرخ بازده سالانه پس از آن برای دوره 102.63 درصد بوده است. در نقطه ای که به مبدأ می رسد، روند از نقطه ای با مقدار 171.1 q/ha عبور می کند.

سطوح محاسبه شده بر اساس معادلات روند در سه ستون آخر جدول ثبت شده است. 9.5. همانطور که از این داده ها پیداست. مقادیر محاسبه‌شده سطوح برای هر سه نوع روند تفاوت چندانی با هم ندارند، زیرا هم شتاب سهمی و هم نرخ رشد توان کوچک هستند. سهمی تفاوت قابل توجهی دارد - رشد سطوح از سال 1995 متوقف شده است، در حالی که با روند خطی، سطوح به رشد خود ادامه می دهند و با نمایی، OST آنها شتاب می گیرد. بنابراین، برای پیش‌بینی‌های آینده، این سه روند برابر نیستند: در هنگام برون‌یابی سهمی برای سال‌های آینده، سطوح به شدت از خط مستقیم و توان، همانطور که از جدول مشاهده می‌شود، متفاوت خواهند بود. 9.6. این جدول چاپی از راه حل را در رایانه شخصی با استفاده از برنامه Statgraphics برای همان سه گرایش نشان می دهد. تفاوت بین شرایط رایگان آنها و موارد ذکر شده در بالا با این واقعیت توضیح داده می شود که برنامه سال ها را نه از وسط، بلکه از ابتدا شماره گذاری می کند، به طوری که شرایط رایگان گرایش ها به سال 1986 اشاره می کند که برای آن t = 0. معادله نمایی روی پرینت به صورت لگاریتمی باقی مانده است. پیش بینی برای 5 سال آینده انجام شده است، یعنی. تا سال 2001. هنگامی که مبدأ مختصات (مرجع زمانی) در معادله سهمی تغییر می کند، میانگین افزایش مطلق، پارامتر بزیرا در نتیجه شتاب منفی، رشد دائماً در حال کاهش است و حداکثر آن در ابتدای دوره است. ثابت سهمی فقط شتاب است.


خط "داده" شامل سطوح سری اصلی است. "خلاصه پیش بینی" به معنای داده های خلاصه برای پیش بینی است. در خطوط زیر - معادلات یک خط مستقیم، سهمی، توان - به صورت لگاریتمی. ستون ME به معنای میانگین اختلاف بین سطوح سری اصلی و سطوح روند (تعدیل شده) است. برای یک خط مستقیم و یک سهمی، این اختلاف همیشه صفر است. سطوح توان به طور متوسط ​​0.48852 کمتر از سطوح سری اصلی است. تطابق دقیق ممکن است اگر روند واقعی نمایی باشد. در این مورد تصادفی وجود ندارد، اما تفاوت کوچک است. ستون MAE واریانس است s2-اندازه گیری نوسانات سطوح واقعی نسبت به روند، همانطور که در بند 9.7 توضیح داده شده است. ستون MAE - میانگین انحراف خطی سطوح از مدول روند (به بند 5.8 مراجعه کنید). ستون MARE - انحراف خطی نسبی بر حسب درصد. در اینجا آنها به عنوان شاخص های مناسب بودن نوع روند انتخابی ارائه می شوند. سهمی دارای واریانس و مدول انحراف کمتری است: برای دوره 1986 - 1996 است. به سطوح واقعی نزدیک تر است. اما انتخاب نوع روند را نمی توان تنها به این معیار تقلیل داد. در واقع، کاهش رشد نتیجه یک انحراف منفی بزرگ، یعنی شکست محصول در سال 1996 است.

نیمه دوم جدول پیش بینی سطوح بازده برای سه نوع روند برای سالها است. t = 12، 13، 14، 15 و 16 از مبدا (1986). سطوح پیش‌بینی به صورت تصاعدی تا سال 16 خیلی بیشتر از یک خط مستقیم نیست. سطوح سهمی روند رو به کاهش است و بیشتر و بیشتر از سایر روندها فاصله می گیرد.

همانطور که در جدول مشاهده می شود. 9.4، هنگام محاسبه پارامترهای روند، سطوح سری اولیه با وزن - مقادیر مختلف وارد می شود. tpو مربع های آنها بنابراین، تأثیر نوسانات سطح بر پارامترهای روند بستگی به این دارد که کدام عدد از سال در یک سال تولیدی یا ناب قرار می گیرد. اگر یک انحراف شدید در یک سال با عدد صفر رخ دهد ( ti = 0), در این صورت هیچ تاثیری روی پارامترهای روند نخواهد داشت و اگر به ابتدا و انتهای سری برخورد کند تأثیر قوی خواهد داشت. در نتیجه، یک تراز تحلیلی منفرد پارامترهای روند را کاملاً از تأثیر نوسانات رها نمی کند و با نوسانات شدید می توان آنها را به شدت تحریف کرد، که در مثال ما با سهمی اتفاق افتاد. برای حذف بیشتر اثر اعوجاج نوسانات بر پارامترهای روند، باید اعمال شود روش هم ترازی کشویی چندگانه

این تکنیک شامل این واقعیت است که پارامترهای روند بلافاصله برای کل سری محاسبه نمی شوند، اما روش کشویی، اول برای اولین تیدوره های زمانی یا لحظه ها، سپس برای دوره از 2 تا t+ 1، 3 به (t + 2)-ام سطح و غیره اگر تعداد سطوح اولیه سری باشد پ،و طول هر پایه محاسبه پارامتر لغزشی برابر است با تی،سپس تعداد چنین پایه های متحرک t یا مقادیر جداگانه پارامترهایی که از آنها تعیین می شود، خواهد بود:

L = n+ 1 - تی

همانطور که از محاسبات بالا مشاهده می شود، تنها در صورتی می توان کاربرد تکنیک تراز چندگانه کشویی را در نظر گرفت اعداد بزرگسطوح ردیف، معمولاً 15 یا بیشتر. این تکنیک را در مثال داده های جدول در نظر بگیرید. 9.4 - پویایی قیمت برای کالاهای غیر سوختی در کشورهای در حال توسعه، که دوباره به خواننده اجازه می دهد تا در یک بخش کوچک شرکت کند. تحقیق علمی. در همین مثال، تکنیک پیش‌بینی را در بخش 9.10 ادامه خواهیم داد.

اگر در سری خود پارامترهای 11 را محاسبه کنیم -دوره های سال(در 11 سطح)، سپس تی= 17 + 1 - 11 = 7. منظور از هم ترازی کشویی چندگانه این است که با جابجایی های متوالی پایه برای محاسبه پارامترها، در انتهای آن و در وسط آن وجود خواهد داشت. سطوح مختلفبا انحرافات علامت و بزرگی متفاوت از روند. بنابراین، با برخی جابه‌جایی‌ها در مبنا، پارامترها بیش از حد تخمین زده می‌شوند، با برخی دیگر کمتر برآورد می‌شوند و با میانگین‌گیری بعدی مقادیر پارامتر بر روی همه جابه‌جایی‌های پایه محاسباتی، اعوجاج پارامترهای روند بیشتر می‌شود. با نوسانات سطح جبران می شود.

تراز لغزشی چندگانه نه تنها امکان به دست آوردن تخمین دقیق تر و قابل اعتمادتر از پارامترهای روند را فراهم می کند، بلکه انتخاب صحیح نوع معادله روند را نیز کنترل می کند. اگر معلوم شود که پارامتر روند پیشرو، ثابت آن، هنگام محاسبه با پایه های متحرک، به طور تصادفی نوسان نمی کند، اما به طور سیستماتیک مقدار آن را به میزان قابل توجهی تغییر می دهد، در این صورت نوع روند به اشتباه انتخاب شده است، این پارامتر ثابت نیست.

در مورد عبارت آزاد با تراز چندگانه، نیازی نیست و علاوه بر این، محاسبه مقدار آن به عنوان میانگین در تمام جابجایی های پایه، صرفاً نادرست است، زیرا با این روش، سطوح جداگانه سری اصلی در آن لحاظ می شود. محاسبه میانگین با وزن های مختلف، و مجموع سطوح تراز شده با مجموع شرایط سری اصلی متفاوت خواهد بود. مدت آزاد روند است مقدار متوسطسطح دوره، مشروط بر اینکه زمان از اواسط دوره محاسبه شود. هنگام شمارش از ابتدا، اگر سطح اول است تی من= 1، عبارت آزاد برابر خواهد بود با: a 0 = у̅ - b((N-1)/2). توصیه می شود طول پایه متحرک را برای محاسبه پارامترهای روند حداقل 9-11 سطح انتخاب کنید تا به اندازه کافی نوسانات سطح را کاهش دهید. اگر ردیف اصلی بسیار طولانی باشد، پایه می تواند تا 0.7 - 0.8 طول آن باشد. برای از بین بردن تأثیر نوسانات دوره طولانی (دوره ای) بر پارامترهای روند، تعداد جابجایی های پایه باید برابر یا مضربی از طول چرخه نوسان باشد. سپس ابتدا و انتهای پایه به طور متوالی در تمام مراحل چرخه "اجرا می کند" و زمانی که پارامتر در تمام جابجایی ها به طور میانگین محاسبه شود، اعوجاج آن از نوسانات چرخه ای یکدیگر را خنثی می کند. راه دیگر این است که طول پایه لغزنده را برابر با طول چرخه بگیرید، به طوری که ابتدا و انتهای پایه همیشه روی یک فاز از چرخه نوسان قرار می گیرند.

از آنجایی که طبق جدول. 9.4، قبلاً ثابت شده است که روند یک شکل خطی دارد، ما میانگین افزایش مطلق سالانه را محاسبه می کنیم، یعنی پارامتر بمعادلات روند خطی به صورت لغزشی در پایه های 11 ساله (جدول 9.7 را ببینید). همچنین شامل محاسبه داده های لازم برای مطالعه بعدی نوسانات در بند 9.7 است. اجازه دهید با جزئیات بیشتر در مورد روش تراز چندگانه با پایه های کشویی صحبت کنیم. پارامتر را محاسبه کنید ببرای همه پایه ها:


ما نمونه ای از محاسبه دقیق پارامترهای معادله روند را بر اساس داده های زیر نشان خواهیم داد (جدول را ببینید) با استفاده از یک ماشین حساب.

معادله روند خطی y = at + b است.
1. پارامترهای معادله را با روش حداقل مربعات بیابید.
سیستم معادلات حداقل مربعات:
a 0 n + a 1 ∑t = ∑y
a 0 ∑t + a 1 ∑t 2 = ∑yt

تی y t2 y2 t y y(t) (y-y cp) 2 (y-y(t)) 2 (t-t p) 2 (y-y(t)) : y
1 17.4 1 302.76 17.4 12.26 895.01 26.47 30.25 0.3
2 26.9 4 723.61 53.8 18.63 416.84 68.39 20.25 0.31
3 23 9 529 69 25 591.3 4.02 12.25 0.0872
4 23.7 16 561.69 94.8 31.38 557.75 58.98 6.25 0.32
5 27.2 25 739.84 136 37.75 404.68 111.4 2.25 0.39
6 34.5 36 1190.25 207 44.13 164.27 92.72 0.25 0.28
7 50.7 49 2570.49 354.9 50.5 11.45 0.0383 0.25 0.0039
8 61.4 64 3769.96 491.2 56.88 198.34 20.44 2.25 0.0736
9 69.3 81 4802.49 623.7 63.25 483.27 36.56 6.25 0.0872
10 94.4 100 8911.36 944 69.63 2216.84 613.62 12.25 0.26
11 61.1 121 3733.21 672.1 76 189.98 222.11 20.25 0.24
12 78.2 144 6115.24 938.4 82.38 953.78 17.46 30.25 0.0534
78 567.8 650 33949.9 4602.3 567.8 7083.5 1272.21 143 2.41

برای داده های ما، سیستم معادلات به شکل زیر است:
12a 0 + 78a 1 = 567.8
78a 0 + 650a 1 = 4602.3
از معادله اول 0 را بیان می کنیم و به معادله دوم جایگزین می کنیم
ما 0 = 6.37، 1 = 5.88 دریافت می کنیم

توجه: مقادیر ستون #6 y(t) بر اساس معادله روند به دست آمده محاسبه می شود. به عنوان مثال، t = 1: y (1) = 6.37 * 1 + 5.88 = 12.26

معادله روند

y = 6.37 t + 5.88

اجازه دهید کیفیت معادله روند را با استفاده از خطای تقریب مطلق ارزیابی کنیم.


از آنجایی که خطا بیشتر از 15 درصد است، استفاده از این معادله به عنوان روند مطلوب نیست.

مقادیر متوسط:


پراکندگی

انحراف معیار

ضریب الاستیسیته


ضریب کشش کمتر از 1 است. بنابراین، اگر X 1٪ تغییر کند، Y کمتر از 1٪ تغییر می کند. به عبارت دیگر، تأثیر X بر Y قابل توجه نیست.

ضریب تعیین

آن ها در 04/82 درصد موارد بر تغییرات داده ها تأثیر می گذارد. به عبارت دیگر دقت انتخاب معادله روند بالاست

2. تجزیه و تحلیل دقت تعیین تخمین پارامترهای معادله روند..
واریانس خطای معادله

که m = 1 تعداد عوامل تاثیرگذار در مدل روند است.

خطای استاندارد معادله



3. آزمون فرضیه ها در خصوص ضرایب معادله روند خطی.
1) آمار t. معیار دانش آموز.
با توجه به جدول Student، Ttable را پیدا می کنیم
جدول T (n-m-1؛ α / 2) \u003d (10؛ 0.025) \u003d 2.228

>
اهمیت آماری ضریب a 0 تایید می شود. تخمین پارامتر a 0 معنی دار است و سری زمانی دارای روند است.


اهمیت آماری ضریب a 1 تایید نمی شود.

فاصله اطمینان برای ضرایب معادله روند.
اجازه دهید فواصل اطمینان ضرایب روند را تعیین کنیم که با پایایی 95% به صورت زیر خواهد بود:
(a 1 - t obs S a 1 ;a 1 + t obs S a 1)
(6.375 - 2.228*0.943; 6.375 + 2.228*0.943)
(4.27;8.48)
(a 0 - t obs S a 0 ;a 0 + t obs S a 0)
(5.88 - 2.228*6.942; 5.88 + 2.228*6.942)
(-9.59;21.35)
از آنجایی که نقطه 0 (صفر) درون آن قرار دارد فاصله اطمینان، سپس تخمین فاصلهضریب a 0 از نظر آماری ناچیز است.
2) آمار F. معیار فیشر


fkp = 4.84
از آنجایی که F > Fkp، ضریب تعیین از نظر آماری معنادار است

همبستگی خودکار باقیمانده ها را بررسی کنید.
یک پیش نیاز مهم برای ساخت یک مدل رگرسیون کیفی با استفاده از LSM، استقلال مقادیر انحرافات تصادفی از مقادیر انحرافات در سایر مشاهدات است. این تضمین می کند که هیچ ارتباطی بین انحرافات و به ویژه بین انحرافات مجاور وجود ندارد.
خودهمبستگی (همبستگی سریالی)به عنوان همبستگی بین معیارهای مشاهده شده ترتیب داده شده در زمان (سری های زمانی) یا مکان (سری متقاطع) تعریف می شود. خود همبستگی باقیمانده ها (اغلب) معمولاً در تحلیل رگرسیون هنگام استفاده از داده های سری زمانی و به ندرت هنگام استفاده از داده های مقطعی مشاهده می شود.
در کارهای اقتصادی بسیار رایج است خود همبستگی مثبتنسبت به. تا خود همبستگی منفی. در بیشتر موارد، خودهمبستگی مثبت ناشی از تأثیر ثابت جهتی برخی از عواملی است که در مدل در نظر گرفته نشده اند.
خودهمبستگی منفیدر واقع به این معنی است که یک انحراف مثبت به دنبال یک انحراف منفی است و بالعکس. اگر همان رابطه بین تقاضای نوشابه و درآمد با توجه به داده های فصلی (زمستان و تابستان) در نظر گرفته شود، چنین وضعیتی می تواند رخ دهد.
در میان علل اصلی ایجاد خودهمبستگی، موارد زیر را می توان تشخیص داد:
1. خطاهای مشخصات. در نظر نگرفتن هر متغیر توضیحی مهم در مدل یا انتخاب اشتباه شکل وابستگی معمولاً منجر به انحراف سیستمیک نقاط مشاهده از خط رگرسیون می شود که می تواند منجر به همبستگی خودکار شود.
2. اینرسی. زیاد نشانگرهای اقتصادی(تورم، بیکاری، تولید ناخالص ملی و غیره) دارای چرخه خاصی هستند که با نوسان فعالیت های تجاری مرتبط است. بنابراین، تغییر در شاخص ها بلافاصله رخ نمی دهد، بلکه دارای یک اینرسی خاص است.
3. جلوه وب. در بسیاری از حوزه های صنعتی و سایر حوزه ها، شاخص های اقتصادی نسبت به تغییرات شرایط اقتصادی با تاخیر (تأخیر زمانی) واکنش نشان می دهند.
4. هموارسازی داده ها. اغلب، داده‌ها برای یک دوره زمانی طولانی با میانگین‌گیری داده‌ها در بازه‌های زمانی تشکیل‌دهنده آن به‌دست می‌آیند. این می تواند منجر به هموارسازی خاصی از نوسانات موجود در دوره مورد بررسی شود که به نوبه خود می تواند باعث همبستگی خودکار شود.
اثرات خودهمبستگی مشابه آن است دگرگونی: نتیجه گیری در مورد آماره های t و F که اهمیت ضریب رگرسیون و ضریب تعیین را تعیین می کند ممکن است نادرست باشد.

تشخیص خودهمبستگی
1. روش گرافیکی
تعدادی گزینه برای تعریف گرافیکی همبستگی وجود دارد. یکی از آنها انحراف e i را به لحظه های دریافت آنها مرتبط می کند. در همان زمان، یا زمان به دست آوردن داده های آماری یا شماره سریال مشاهده در امتداد محور ابسیسا رسم می شود و انحرافات e i (یا برآورد انحرافات) در امتداد محور ارتین رسم می شوند.
طبیعی است که فرض کنیم اگر رابطه معینی بین انحرافات وجود داشته باشد، خودهمبستگی صورت می گیرد. عدم وجود وابستگی احتمالاً نشان دهنده عدم وجود خودهمبستگی است.
اگر e i را در مقابل e i-1 رسم کنید، خودهمبستگی واضح‌تر می‌شود
تست دوربین واتسون.
این معیار بهترین شناخته شده برای تشخیص خودهمبستگی است.
در تحلیل آماریمعادلات رگرسیون در مرحله اولیهاغلب آنها امکان سنجی یک فرض را بررسی می کنند: شرایط استقلال آماری انحرافات از یکدیگر. در این مورد، عدم همبستگی مقادیر همسایه e i بررسی می شود.

y y(x) e i = y-y(x) e 2 (e i - e i-1) 2
17.4 12.26 5.14 26.47 0
26.9 18.63 8.27 68.39 9.77
23 25 -2 4.02 105.57
23.7 31.38 -7.68 58.98 32.2
27.2 37.75 -10.55 111.4 8.26
34.5 44.13 -9.63 92.72 0.86
50.7 50.5 0.2 0.0384 96.53
61.4 56.88 4.52 20.44 18.71
69.3 63.25 6.05 36.56 2.33
94.4 69.63 24.77 613.62 350.63
61.1 76 -14.9 222.11 1574.09
78.2 82.38 -4.18 17.46 115.03
1272.21 2313.98

برای تجزیه و تحلیل همبستگی انحرافات، استفاده کنید آمار دوربین واتسون:


مقادیر بحرانی d 1 و d 2 بر اساس جداول ویژه برای سطح اهمیت مورد نیاز α، تعداد مشاهدات n = 12 و تعداد متغیرهای توضیحی m = 1 تعیین می شوند.
اگر شرط زیر درست باشد، خودهمبستگی وجود ندارد:
d1< DW и d 2 < DW < 4 - d 2 .
بدون رجوع به جداول، می‌توانیم از قانون تقریبی استفاده کنیم و فرض کنیم که در صورت 1.5 هیچ همبستگی خودکاری بین باقیمانده‌ها وجود ندارد.< DW < 2.5. Поскольку 1.5 < 1.82 < 2.5, то автокорреляция остатков گم شده.
برای نتیجه گیری مطمئن تر، توصیه می شود به مقادیر جدولی مراجعه کنید.
با توجه به جدول دوربین-واتسون برای n=12 و k=1 (سطح معنی داری 5%) در می یابیم: d 1 = 1.08; d2 = 1.36.
از 1.08< 1.82 и 1.36 < 1.82 < 4 - 1.36, то автокорреляция остатков گم شده.

بررسی ناهمسانی.
1) با روش تحلیل گرافیکی باقیمانده ها.
در این حالت، مقادیر متغیر توضیحی X در امتداد ابسیسا رسم می‌شوند و انحرافات e i یا مربع‌های آن‌ها e2 i در امتداد مختصات رسم می‌شوند.
اگر رابطه مشخصی بین انحرافات وجود داشته باشد، ناهمسانی اتفاق می افتد. فقدان وابستگی احتمالاً نشان دهنده عدم وجود ناهمسانی است.
2) با استفاده از آزمون همبستگی رتبه اسپیرمن.
ضریب همبستگی رتبه اسپیرمن.
به مشخصه Y و ضریب X رتبه بندی کنید. مجموع اختلاف مربع های d 2 را پیدا کنید.
با استفاده از فرمول، ضریب همبستگی رتبه اسپیرمن را محاسبه می کنیم.

جدول t (n-m-1؛ α / 2) \u003d (10؛ 0.05 / 2) \u003d 2.228
از آنجایی که توبل< tтабл, то принимаем гипотезу о равенстве 0 коэффициента ранговой корреляции. Другими словами, коэффициент ранговой корреляции статистически - не значим.
بیایید فرضیه H 0 را بررسی کنیم: هیچ ناهمسانی وجود ندارد.
از آنجایی که 2.228 > 0.45، فرضیه عدم وجود ناهمسانی پذیرفته شده است.
تی e i رتبه X، dx رتبه e i، d y (dx - dy) 2
1 -5.14 1 4 9
2 -8.27 2 2 0
3 2 3 7 16
4 7.68 4 9 25
5 10.55 5 11 36
6 9.63 6 10 16
7 -0.2 7 6 1
8 -4.52 8 5 9
با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

بارگذاری...