یافتن ضرایب یک معادله رگرسیون زوجی. رگرسیون خطی جفت شده (با نسخه نمایشی)

1. تعاریف و فرمول های اساسی

رگرسیون زوجی- رگرسیون (رابطه) بین دو متغیر و غیره. نمای مدل:

متغیر وابسته کجاست (ویژگی نتیجه)؛

- متغیر توضیحی مستقل (عامل صفت)؛

یک اختلال یا متغیر تصادفی که شامل تأثیر عواملی است که در مدل در نظر گرفته نشده اند.

تقریباً در هر مورد جداگانه، مقدار از دو عبارت تشکیل شده است:

مقدار واقعی ویژگی حاصل کجاست.

ارزش نظری مشخصه حاصل که بر اساس معادله رگرسیون یافت می شود. علامت "^" به این معنی است که هیچ رابطه عملکردی دقیقی بین متغیرها و.

تمیز دادن خطیو غیر خطیپسرفت.

رگرسیون خطیبا معادله خط توصیف می شود

رگرسیون های غیرخطیبه دو دسته تقسیم می شوند:

1) رگرسیون، در متغیرهای توضیحی غیرخطی، اما در پارامترهای تخمینی خطی است، مثلا:

چند جمله ای درجات مختلف

هذلولی متساوی الاضلاع

2) رگرسیون، غیر خطی در پارامترهای برآورد شده است، مثلا:

قدرت

نشان دهنده

نمایی

برای ساخت رگرسیون خطی زوجی، کمیت های کمکی محاسبه می شوند (- تعداد مشاهدات).

معنی نمونه: و

کوواریانس نمونهبین و

یا

کوواریانس- این مشخصه عددیتوزیع مشترک دو متغیر تصادفی

واریانس نمونه برای

یا

واریانس نمونه برای

یا

واریانس نمونهدرجه پراکندگی مقادیر یک متغیر تصادفی در اطراف مقدار متوسط ​​(تغییرپذیری، تغییرپذیری) را مشخص می کند.

نزدیکی ارتباط بین پدیده های مورد مطالعه ارزیابی می شود ضریب همبستگی نمونهبین و

ضریب همبستگی از 1- تا 1+ متغیر است. هرچه از مدول به 1 نزدیکتر باشد، رابطه آماری بین و به یک تابعی خطی نزدیکتر است.

اگر =0 باشد، هیچ رابطه خطی بین و وجود ندارد.<0,3 - связь слабая; 0,3<0,7 - связь умеренная; 0,7<0,9 - связь сильная; 0,9<0,99 - связь весьма сильная.

مقدار مثبت ضریب نشان می دهد که رابطه بین ویژگی ها مستقیم است (با رشد مقدار افزایش می یابد)، مقدار منفی نشان دهنده یک رابطه معکوس (با رشد مقدار کاهش می یابد).

ساخت رگرسیون خطیبه تخمین پارامترهای آن می رسد و رویکرد کلاسیک برای تخمین پارامترهای رگرسیون خطی بر اساس روش کمترین مربعات (MNC). روش حداقل مربعات به ما امکان می دهد چنین برآوردهای پارامتری را به دست آوریم که در آن مجموع انحرافات مجذور مقادیر واقعی مشخصه حاصل از موارد نظری حداقل باشد، یعنی.

برای رگرسیون خطی، پارامترها و از سیستم پیدا می شوند معادلات عادی:

حل سیستم، پیدا می کنیم Vبر

و پارامتر

ضریببا یک متغیر عامل نشان می دهد که در صورت تغییر فاکتور بر اساس واحد اندازه گیری، مقدار میانگین چقدر تغییر خواهد کرد.

پارامتر زمانی که If نمی تواند برابر با 0 باشد، پس هیچ معنای اقتصادی ندارد. تنها زمانی می‌توانید علامت را تفسیر کنید که تغییر نسبی در نتیجه کندتر از تغییر عامل رخ دهد، یعنی. تغییرات نتیجه کمتر از تغییر عامل است و بالعکس.

برای ارزیابی کیفیت مدل رگرسیون ساخته شده، می توانید استفاده کنید ضریب تعیینیا میانگین خطای تقریب.

بهضریب تعیین

یا

سهم واریانس توضیح داده شده توسط رگرسیون در واریانس کل ویژگی حاصل را نشان می دهد. بر این اساس ، مقدار سهم واریانس در شاخص ناشی از تأثیر عواملی را که در مدل و دلایل دیگر در نظر گرفته نشده است ، مشخص می کند.

هر چه به 1 نزدیکتر باشد، مدل رگرسیون بهتر است، یعنی. مدل ساخته شده به خوبی داده های اصلی را تقریب می کند.

میانگین خطای تقریب- این میانگین انحراف نسبی مقادیر نظری از مقادیر واقعی است، یعنی.

معادله رگرسیون ساخته شده در صورتی رضایت بخش در نظر گرفته می شود که مقدار از 10-12٪ تجاوز نکند.

برای رگرسیون خطی ضریب کشش متوسطبا فرمول پیدا می شود:

ضریب کشش متوسطنشان می دهد که به طور میانگین با چه درصدی نتیجه از مقدار خود تغییر می کند زمانی که عامل به میزان 1٪ از مقدار خود تغییر می کند.

رتبه بندیناچیموستومعادلات رگرسیونبه طور کلی با استفاده از آزمون فیشر ، که شامل آزمایش فرضیه در مورد ناچیز آماری معادله رگرسیون است ، داده می شود . برای این کار مقایسه ای انجام می شود واقعیهآسمانو بحرانیمقادیر (جدولی). - تست فیشر .

از نسبت مقادیر فاکتور و واریانس باقیمانده محاسبه شده به ازای درجه آزادی، یعنی.

- حداکثر مقدار ممکن معیار تحت تأثیر عوامل تصادفی با درجه آزادی = 1 ، = -2 و سطح اهمیت از جدول معیار فیشر (جدول 1 پیوست) یافت می شود.

سطح اهمیت- این احتمال رد یک فرضیه صحیح با توجه به صحت آن است.

اگر سپس فرضیه در مورد عدم وجود ارتباط بین شاخص مورد مطالعه و عامل رد می شود و نتیجه گیری در مورد اهمیت این ارتباط با سطح اهمیت (یعنی معادله رگرسیون معنی دار است).

اگر سپس فرضیه پذیرفته شده و بی اهمیت بودن و غیرقابل اعتماد بودن معادله رگرسیون تشخیص داده می شود.

برای رگرسیون خطی اهمیتضرایب رگرسیونبا استفاده از - آزمون دانشجویی که بر اساس آن فرضیه ای در مورد ماهیت تصادفی شاخص ها مطرح می شود، یعنی. در مورد تفاوت ناچیز آنها از صفر. در مرحله بعد، مقادیر واقعی معیار برای هر یک از ضرایب رگرسیون تخمین زده شده محاسبه می شود، یعنی.

کجا و - خطاهای استانداردپارامترهای رگرسیون خطی با فرمول های زیر تعیین می شوند:

- حداکثر ارزش ممکن آزمون دانش آموز تحت تأثیر عوامل تصادفی برای درجه ای از آزادی = -2 و سطح اهمیت از جدول آزمون دانش آموز (جدول 2 پیوست) یافت می شود.

اگر سپس فرضیه بی اهمیت بودن ضریب رگرسیون با سطح معنی داری رد می شود. ضریب (یا) به طور تصادفی با صفر متفاوت نیست و تحت تأثیر یک عامل به طور سیستماتیک عمل می کند.

اگر سپس فرضیه رد نمی شود و ماهیت تصادفی شکل گیری پارامتر تشخیص داده می شود.

اهمیت ضریب همبستگی خطیهمچنین بررسی شده است - آزمون دانشجویی، یعنی

فرضیه بی اهمیت بودن ضریب همبستگی با سطح معنی داری رد می شود

اظهار نظر.برای رگرسیون جفت خطی ، آزمایش فرضیه در مورد اهمیت ضریب و ضریب همبستگی معادل آزمایش فرضیه در مورد اهمیت معادله رگرسیون به عنوان یک کل است ، یعنی.

برای محاسبه فاصله اطمینان، تعیین کنید خطای حاشیه ای برای هر شاخص، یعنی

فاصله اطمینانبرای ضرایب رگرسیون خطی:

اگر صفر در بازه اطمینان قرار گیرد، یعنی. حد پایین منفی و حد بالایی مثبت است، سپس پارامتر تخمین زده شده صفر در نظر گرفته می شود، زیرا نمی تواند به طور همزمان هر دو معنای مثبت و منفی را به خود بگیرد.

ارزش پیش بینی شدهبا جایگزینی مقدار پیش بینی شده مربوطه در معادله رگرسیون تعیین می شود و سپس محاسبه می شود میانگین خطای استاندارد پیش بینی

جایی که

و در حال ساخت است فاصله اطمینانپیش بینی

این فاصله به دلیل حجم کم مشاهدات می تواند بسیار گسترده باشد.

رگرسیون ها، غیر خطی در متغیرهای گنجانده شده , با یک تغییر ساده متغیرها به شکل خطی کاهش می‌یابند و تخمین بیشتر پارامترها با استفاده از حداقل مربعات انجام می‌شود.

جیهذلولیرگرسیون کالبدی:

آر خروج , غیر خطی ه با توجه به پارامترهای ارزیابی شده ، به دو نوع تقسیم می شوند: داخلی غیر خطیو غیره (به شکل خطی تقلیل نمی یابد) و درونی خطی(با استفاده از تبدیل های مناسب به شکل خطی کاهش می یابد)، به عنوان مثال:

رگرسیون نمایی:

تبدیل خطی سازی:

رگرسیون توان:

تبدیل خطی سازی:

فهرست مطالبرگرسیون جدید:

تبدیل خطی سازی:

لگاریتمیرگرسیون هفتم:

تبدیل خطی سازی:

2. حل مسائل معمولی

مثال9 .1 . برای 15 شرکت کشاورزی (جدول 9.1) موارد زیر مشخص است: - تعداد تجهیزات در واحد سطح زیر کشت (واحد در هکتار) و - حجم محصولات رشد یافته (هزار واحد پولی). لازم:

1) وابستگی را تعیین کنید

2) زمینه های همبستگی و نمودار معادله رگرسیون خطی را بسازید

3) در مورد کیفیت مدل نتیجه گیری کنید و مقدار پیش بینی را با مقدار پیش بینی 112 درصد از سطح متوسط ​​محاسبه کنید.

جدول 9.1

راه حل:

1) در اکسل، جدول کمکی 9.2 ایجاد کنید.

جدول 9.2

برنج.9 .1. جدول برای محاسبه مقادیر میانی

بیایید تعداد اندازه گیری ها را محاسبه کنیم برای انجام این کار، در سلول B19قرار دادن = COUNT(A2:A16 ) .

با استفاده از تابع ∑ (AutoSum) در نوار ابزار استاندارد تی نایا جمع همه (سلول) را بیابید B17) و (سلول C17).

برنج. 9.2. محاسبه مجموع مقادیر و میانگین ها

برای محاسبه مقادیر متوسط، از تابع داخلی MS Excel AVERAGE() استفاده می کنیم؛ محدوده مقادیر برای تعیین میانگین در پرانتز نشان داده شده است. به این ترتیب، میانگین حجم محصولات کشت شده برای 15 مزرعه 210.833 هزار است. واحد و میانگین میزان تجهیزات 6.248 واحد در هکتار است.

برای پر کردن ستون ها D, E, اففرمول محاسبه محصول: را در سلول وارد کنید D2 قرار دادن = B2*C2، سپس ENTER را روی صفحه کلید خود فشار دهید. روی سلول کلیک چپ کنید D2 و با گرفتن گوشه سمت راست پایین این سلول (علامت مثبت سیاه)، آن را به سمت سلول پایین بکشید D16 . محدوده به طور خودکار پر می شود D3 - D16 .

برای محاسبه در به طور انتخابیاوه کوواریانسبین و از فرمول i.e استفاده می کنیم. به سلول ب21 قرار دادن = D18- ب18* سی18 و 418.055 بدست می آوریم (شکل 9.3).

برنج.9 .3. محاسبه

انتخابیوایپراکندگییوزیرا ما با استفاده از فرمول پیدا می کنیم برای این در سلول ب22 قرار دادن = E18-B18^2 (^- علامت نشان دهنده قدرت ) و 11.337 می گیریم. به طور مشابه، ما =16745.05556 را تعیین می کنیم (شکل 9.4)

برنج.9 .4. محاسبهVar(ایکس) وVar (y)

سپس، با استفاده از تابع استاندارد MS Excel "CORREL"، مقدار ضریب همبستگی خطی را برای مسئله خود محاسبه می کنیم؛ تابع به شکل "=CORREL(B2:B16;C2:C16)" و مقدار rxy= خواهد بود. 0.96. مقدار حاصل از ضریب همبستگی نشان دهنده ارتباط مستقیم و قوی بین در دسترس بودن تجهیزات و حجم محصولات رشد یافته است.

ما پیدا می کنیم Vنمونه ضریب رگرسیون خطی =36.87; پارامتر = -17.78. این به این معنی است که معادله رگرسیون خطی زوجی به شکل =-17.78+36.87 است.

ضریب نشان می دهد که با افزایش میزان تجهیزات 1 واحد در هکتار ، حجم محصولات رشد یافته به طور متوسط ​​36.875 هزار افزایش می یابد. واحدها (شکل 9.5)

برنج.9 .5. محاسبه پارامترهای معادله رگرسیون.

بنابراین، معادله رگرسیون به صورت زیر خواهد بود:

مقادیر واقعی را در معادله به دست آمده جایگزین می کنیم ایکس(تعداد تجهیزات) مقادیر نظری حجم محصولات رشد یافته را پیدا می کنیم (شکل 9.6).

برنج.9 .6. محاسبه مقادیر نظری حجم محصولات رشد یافته

استفاده كردن جادوگر نمودارما زمینه های همبستگی (ستون های برجسته با مقادیر و) و یک معادله رگرسیون خطی (برجسته ستون ها با مقادیر و) ایجاد می کنیم. انتخاب نوع نمودار - تی تماشایی در نمودار حاصل، پارامترهای لازم (عنوان، برچسب های محور، افسانه و غیره) را پر کنید. در نتیجه نمودار نشان داده شده در شکل 1 را بدست می آوریم. 9.7.

برنج.9 .7. نمودار وابستگی حجم محصولات رشد یافته به مقدار تجهیزات

برای ارزیابی کیفیت مدل رگرسیون ساخته شده، محاسبه می کنیم:

. بهضریب تعیین= 0.92 ، که نشان می دهد تغییر در هزینه های تولید 92 ٪ با تغییر حجم تولید توضیح داده شده است ، و 8 ٪ به دلیل عواملی است که در مدل در نظر گرفته نشده است ، که نشان دهنده کیفیت مدل رگرسیون ساخته شده است.

. باقرمزیویوخطادرتقریب ها. برای انجام این کار، در ستون اچبیایید تفاوت بین مقادیر واقعی و نظری a را در ستون محاسبه کنیم من- اصطلاح . لطفاً توجه داشته باشید که تابع استاندارد MS Excel "ABS" برای محاسبه مقادیر مدول استفاده می شود. هنگام ضرب مقدار متوسط ​​(سلول من18 ) در 100 ٪ ما 18.2 ٪ دریافت می کنیم. در نتیجه، به طور متوسط، مقادیر نظری 18.2٪ از مقادیر واقعی انحراف دارند (شکل 1.8).

با استفاده از معیار فیشر، تخمین می زنیم ساعتناچیموستبمعادلاتثبت نامبااینها به طور کلی: 150,74.

در سطح معنی داری 0.05 = 4.67، ما با استفاده از تابع آماری داخلی تعیین می کنیم سریعتر(شکل 1.9). لازم به یادآوری است که "درجات_آزادی1" مخرج است و "درجات_آزادی2" صورت شمار است، جایی که تعداد پارامترها در معادله رگرسیون است (ما 2 داریم). n- تعداد جفت مقادیر اولیه (ما 15 عدد داریم).

زیرا سپس معادله رگرسیون در 05/0 = معنادار است.

برنج.9 .8. تعیین ضریب تعیین وخطای متوسطتقریب

برنج. 9 . 9 . پنجره گفتگوکارکردسریعتر

بعد تعریف می کنیم باضریب کشش متوسططبق فرمول یافته ها نشان می دهد که با افزایش 1 درصدی حجم محصولات تولیدی، هزینه های تولید این محصولات به طور میانگین در مجموع 1.093 درصد افزایش می یابد.

بیایید محاسبه کنیم مقدار پیش بینیبا جایگزینی در معادله رگرسیون =-19.559+36.8746 مقدار پیش بینی شده ضریب =1.12=6.248*1.12=6.9978. ما = 238.48 دریافت می کنیم. در نتیجه با مقدار تجهیزات به میزان 6.9978 واحد در هکتار، حجم خروجی 238.48 هزار خواهد بود. واحدها

بیایید واریانس باقیمانده را پیدا کنیم؛ برای انجام این کار، مجموع مجذورات تفاوت بین مقادیر واقعی و نظری را محاسبه می کنیم. =39.166 با قرار دادن فرمول زیر = ROOT (J17/(B19-2))به سلول اچ2 1 (شکل 9.10).

برنج.9 .10. تعیین واریانس باقیمانده

باقرمزیایااستانداردخطای هفتمپیش بینی:

در سطح معنی داری 0.05 = با استفاده از تابع آماری داخلی مطالعه کنیدبیایید 2.1604 = را تعریف کنیم و حداکثر خطای پیش بینی را محاسبه کنیم که در 95٪ موارد بیشتر از آن نخواهد بود. .

Dفاصله اطمینان پیش بینی:

یا .

پیش بینی تکمیل شده هزینه های تولید قابل اعتماد است (1-0.05 = 0.95) ، اما نادرست ، زیرا دامنه محدودیت های فوقانی و پایین فاصله اطمینان است بار. این به دلیل حجم کم مشاهدات اتفاق افتاد.

لازم به ذکر است که MS Excel دارای عملکردهای آماری داخلی است که می تواند تعداد محاسبات میانی را به طور قابل توجهی کاهش دهد ، به عنوان مثال (شکل 9.11.):

برای محاسبه Vانتخابیایکسمیانگینایکساز تابع استفاده کنید AVERAGE(number1:numberن) از دسته آماری .

کوواریانس نمونهبین و با استفاده از تابع پیدا می شود KOVAR(آرایهایکس؛آرایهY) از دسته آماری .

انتخابیسپراکندگیوتوسط تابع آماری تعیین می شود DISPR(number1:numberن) .

برنج.9 یازده. محاسبه nارائه دهندگان با توابع داخلیام‌اسبرتری داشتن

پپارامترسرگرسیون خطیدر اکسل می توانید آن را به چند روش تعریف کنید.

1 مسیر) با استفاده از تابع داخلی LINEST. روند کار به صورت زیر است:

1. یک منطقه 5x2 از سلولهای خالی (5 ردیف ، 2 ستون) را برای نمایش نتایج آمار رگرسیون یا یک منطقه 1x2 انتخاب کنید تا فقط ضرایب رگرسیون را بدست آورید.

2. با Function Wizardsدر میان آماری عملکرد را انتخاب کنید LINESTو آرگومان های آن را پر کنید (شکل 9.12):

برنج. 9 . 12 . کادر گفتگو برای وارد کردن آرگومان های تابعLINEST

مقادیر_شناخته_y

مقادیر_شناخته_ایکس

Const- یک مقدار منطقی (1 یا 0)، که نشان دهنده وجود یا عدم وجود یک عبارت آزاد در معادله است. مجموعه 1;

آمار- یک مقدار منطقی (1 یا 0)، که نشان می دهد آیا اطلاعات اضافی در تجزیه و تحلیل رگرسیون نمایش داده می شود یا خیر. آن را روی 1 تنظیم کنید.

3. شماره اول جدول در سلول سمت چپ بالای ناحیه انتخاب شده ظاهر می شود. برای باز کردن کل جدول، دکمه را فشار دهید < اف2> ، و سپس - به ترکیب کلید < CTRL> + < تغییر مکان> + < وارد> .

آمار رگرسیون اضافی به صورت (جدول 9.3) نمایش داده می شود:

جدول 9.3

مقدار ضریب

مقدار ضریب

RMS
انحراف

RMS
انحراف

ضریب
عزم

RMS
انحراف

آمار

تعداد درجات آزادی

مجموع رگرسیون مربع ها

جمع باقیمانده مربع ها

در نتیجه اعمال تابع LINESTما گرفتیم:

( 2 مسیر) استفاده از ابزار تجزیه و تحلیل داده ها پسرفت می توانید نتایج آمار رگرسیون را دریافت کنید، تحلیل واریانس، فواصل اطمینان، باقیمانده ها، نمودارهای برازش خط رگرسیون، نمودارهای احتمال باقیمانده و نرمال. روند کار به صورت زیر است:

1. باید دسترسی به را بررسی کنید بسته تحلیلی. برای انجام این کار، در منوی اصلی (از طریق دکمه مایکروسافت آفیس، دسترسی به پارامترهای MS Excel) در کادر محاوره ای "گزینه ها" ام‌اسبرتری داشتن» دستور «افزونه ها» را انتخاب کنید و افزونه سمت راست را انتخاب کنید تجزیه و تحلیل بسته آ سپس بر روی دکمه "Go" کلیک کنید (شکل 9.13). در کادر محاوره‌ای که باز می‌شود، کادر کنار «Analysis package» را علامت بزنید و روی «OK» کلیک کنید (شکل 9.14).

در تب Data در گروه Analysis به افزونه نصب شده دسترسی خواهید داشت. (شکل 9.15).

برنج.9 .13. فعال کردن افزونه ها درام‌اسبرتری داشتن

برنج.9 .14. جعبه گفتگوی افزودنی ها

برنج.9 .15. افزودنی تجزیه و تحلیل داده در روبانام‌اسبرتری داشتن 2007 .

2. در گروه "Analysis" "Data" را انتخاب کرده و دستور را انتخاب کنید تحلیل بله n نیخ در کادر محاوره‌ای که باز می‌شود، ابزار تحلیل رگرسیون را انتخاب کرده و روی «OK» کلیک کنید (شکل 9.16):

برنج.9 .16. جعبه گفتگوی تجزیه و تحلیل داده ها

در کادر محاوره ای ظاهر شده (شکل 9.17)، فیلدها را پر کنید:

فاصله ورودیY- محدوده حاوی داده های مشخصه حاصل از Y.

فاصله ورودیایکس- محدوده حاوی داده های مشخصه توضیحی X.

برچسب ها- پرچمی که نشان می دهد خط اول شامل نام ستون است یا خیر.

Constضد صفر- پرچمی که وجود یا عدم وجود یک عبارت آزاد در معادله را نشان می دهد.

فاصله خروجی- کافی است سلول سمت چپ بالای محدوده آینده را نشان دهید.

کاربرگ جدید- می توانید یک نام دلخواه برای یک برگه جدید که نتایج در آن نمایش داده می شود تعیین کنید.

برنج.9 .17. جعبه گفتگوی رگرسیون

برای به دست آوردن اطلاعات در مورد باقیمانده ها ، توطئه های باقیمانده ، اتصالات و احتمال طبیعی ، باید جعبه های مناسب را در کادر گفتگو بررسی کنید.

برنج. 9 . 18 . نتایج استفاده از ابزارپسرفت

که در ام‌اسبرتری داشتن خط روندرا می توان به نمودار یا نمودار ناحیه هیستوگرام اضافه کرد. برای این:

1. لازم است منطقه نقشه برداری نمودار را انتخاب کرده و "طرح" را در روبان انتخاب کرده و دستور "خط روند" را در گروه تجزیه و تحلیل انتخاب کنید (شکل 9.19.). "گزینه های خط روند پیشرفته" را از آیتم منوی کشویی انتخاب کنید.

برنج. 1.19.روبان

2. در کادر گفتگوی که ظاهر می شود ، مقادیر واقعی را انتخاب کنید ، سپس کادر گفتگوی "فرمت خط روند" باز می شود (شکل 9.20.) که در آن نوع خط روند را انتخاب می کنید و پارامترهای مناسب را تنظیم می کنید.

برنج. 9 . 20 . پنجره گفتگو"فرمت خط روند"

برای یک روند چند جمله ای ، لازم است درجه چند جمله ای تقریبی را برای فیلتر خطی - تعداد نقاط میانگین تنظیم کنید.

انتخاب کنید خطیبرای ساخت یک معادله رگرسیون خطی.

مانند اطلاعات اضافیمی توان معادله را در دی نشان دهیدآگرمو روی نمودار یک مقدار قرار دهید(شکل 9.21).

برنج. 9 . 21 . روند خطی

مدل های رگرسیون غیرخطی هنگام محاسبه پارامترهای معادله با استفاده از تابع آماری انتخاب شده در اکسل نشان داده شده است. LGRFPRIBL. روش محاسبه مانند استفاده از تابع LINEST است.

رگرسیون خطی جفت شده

محاسبات اولیه:

;
;
;
;
;

;
.

ساخت جدولی از فرم

مقدار متوسط

فرمول های محاسبه پارامترها:

,
.

لینن

ارزیابی تنگی اتصال:

الف) ضریب همبستگی
، یا
;

هنگام استفاده از انتخاب رایانه، از عملکرد داخلی استفاده کنید کورل

ب) ضریب کشش
;

ج) ضریب تعیین .

ارزیابی اهمیت معادله رگرسیون به عنوان یک کل:

محاسبات اولیه با ساخت جدول فرم

آ) اف -معیار فیشربا تعداد درجات آزادی
و
و سطح معنی داری 0.05، جدول را ببینید. ارزش معیار تخمینی:

.

اگر مقدار محاسبه شده آزمون F بزرگتر از جدول یک باشد، فرض صفر این است که بین ویژگی ها رابطه معنی داری وجود ندارد. ایکسو y رد می شود و نتیجه گیری می شود که این ارتباط قابل توجه است.

ب) میانگین خطای تقریب

.

ارزیابی اهمیت پارامترهای رگرسیون:

الف) خطای پارامتر استاندارد آ با فرمول محاسبه می شود

، جایی که
.

ب) خطای استاندارد ضریب رگرسیون ببا فرمول محاسبه می شود

.

ج) خطای استاندارد ضریب همبستگی با فرمول محاسبه می شود

.

تی-معیار دانش آموز برای تعداد درجات آزادی
و سطح معنی داری 0.05، جدول را ببینید.

ارزش های واقعی تی-آمار:

,
,
.

اگر مقدار واقعی در قدر مطلق از مقدار جدول شده بیشتر شود، فرضیه در مورد بی اهمیت بودن پارامتر رگرسیون را می توان رد کرد و این پارامتر معنی دار در نظر گرفته شد.

اتصال بیناف - معیار فیشر و تی -معیار دانش آموزیبا برابری بیان می شود

.

محاسبه فواصل اطمینان برای پارامترهای رگرسیون:

فاصله اطمینان برای پارامتر آ که تعریف میشود
;

فاصله اطمینان برای ضریب رگرسیون که تعریف میشود
.

برای تجزیه و تحلیل کامپیوتری از Excel استفاده کنید سرویس / تجزیه و تحلیل داده ها / رگرسیون.

بر اساس پیش بینی بازه زمانی معادله خطیرگرسیون ها:

اجازه دهید - ارزش پیش بینی ویژگی عامل؛
- پیش بینی نقطه ای از مشخصه موثر. سپس

الف) میانگین خطای پیش بینی :

;

ب) فاصله اطمینان پیش بینی

با استفاده از ویرایشگر جدولام‌اس برتری داشتن

فعال کردن یک افزونهبسته تحلیلی

برای فعال کردن افزونه بسته تحلیلیشما باید موارد زیر را انجام دهید:

1. یک تیم را انتخاب کنید خدمات/افزونه ها.

2. در کادر محاوره ای که ظاهر می شود، کادر را علامت بزنید بسته تحلیلی

مطابق با گزینه انتساب، با استفاده از مواد آماری، لازم است:

2. نزدیکی رابطه بین متغیر وابسته (عامل حاصل) و متغیر توضیحی را با استفاده از شاخص های همبستگی و تعیین ارزیابی کنید.

3. ارزیابی با استفاده از اف-معیار فیشر برای پایایی آماری مدلسازی.

4. اهمیت آماری پارامترهای رگرسیون و همبستگی را ارزیابی کنید.

5. میانگین خطای تقریب را تعیین کنید.

6. با استفاده از ضریب کشش، ارزیابی کمی از تأثیر عامل توضیحی بر نتیجه را انجام دهید.

7. پیش بینی های نقطه ای و فاصله ای از ویژگی موثر را زمانی انجام دهید که ویژگی توضیحی 25٪ از مقدار متوسط ​​آن افزایش یابد (پایایی پیش بینی 95٪).

8. در یک نمودار، فیلد همبستگی داده های منبع و خط رگرسیون را نمایش دهید.

مثال

اطلاعاتی در مورد قیمت سالانه برنامه کارشناسی ارشد مدیریت بازرگانی و تعداد دانشجویان در موسسه آموزشی وجود دارد.

I. داده های اولیه را در سند وارد کنید برتری داشتن.

II. تماس با افزونه تحلیل داده هادر منو سرویس.

III. انتخاب یک ابزار پسرفت.

IV. موقعیت های مربوط به پنجره را پر کنید پسرفت.

V. پس از کلیک بر روی OK، یک پروتکل برای حل مشکل دریافت می کنیم.

VI. ما پروتکل حاصل را تجزیه و تحلیل می کنیم.

1) ضریب رگرسیون;

عبارت آزاد معادله رگرسیون
.

توجه داشته باشید. در صورت لزوم، نتایج به دقت مورد نیاز گرد می شوند. الزام گرد کردن را می توان در ابتدا با تنظیم تعداد ارقام اعشار در منو انجام داد قالب سلولی

معادله رگرسیون خطی زوجی به شکل زیر است: .

2) ضریب همبستگی
، که نشان دهنده ارتباط نزدیک بین ویژگی ها است yو ایکس. ضریب تعیین
. معادله رگرسیون حاصل 53 درصد از تغییرات در صفت را توضیح می دهد y 47 درصد باقیمانده از تغییرپذیری این مشخصه به دلیل تأثیر عواملی است که در مدل لحاظ نشده است.

3) اجازه دهید اهمیت آماری (پایایی مدل سازی) معادله را به عنوان یک کل ارزیابی کنیم. مقدار محاسبه شده معیار فیشر در پروتکل نشان داده شده است،
. مقدار بحرانی این معیار را می توان با استفاده از تابع آماری یافت افكشف كردنویرایشگر جدول Excel.

پارامترهای ورودی این تابع عبارتند از:

– سطح معنی داری (احتمال)، یعنی احتمال خطا در رد فرضیه صحیح در مورد بی اهمیت بودن آماری معادله رگرسیون ساخته شده. به عنوان یک قاعده، سطح معنی داری 0.05 یا 0.01 انتخاب می شود.

- تعداد درجات آزادی 1 - منطبق با تعداد پارامترهای یک متغیر در معادله رگرسیون، برای رگرسیون خطی زوجی
این عدد برابر با یک است.

- تعداد درجه آزادی برای رگرسیون خطی زوجی 2 است
، جایی که n- حجم داده های آماری اولیه

انجام اقدامات درج / تابع، مورد نیاز خود را انتخاب کنید.

از آنجایی که مقدار محاسبه شده معیار F بزرگتر از مقدار جدول برابر با 4.84 است، فرضیه صفر مبنی بر عدم وجود رابطه معنی دار بین ویژگی های x و y رد شده و در مورد معنی دار بودن این رابطه نتیجه گیری می شود.

4) بیایید اهمیت آماری پارامترها را ارزیابی کنیم آو بدر معادله رگرسیون با استفاده از تی- آزمون دانش آموزی

مقادیر محاسبه شده آماره t Student
,
. مقدار جدول مربوطه را می توان با استفاده از تابع آماری تعیین کرد STUDRASPOBR، تعداد درجات آزادی برابر است با
.

از آنجایی که مقادیر واقعی در قدر مطلق از مقدار جدول 2.2 بیشتر است، فرضیه در مورد بی اهمیت بودن پارامترهای رگرسیون را می توان رد کرد.

5) اجازه دهید میانگین خطای تقریب را تعیین کنیم،
. شما باید محاسبات کمکی را انجام دهید که در قالب یک جدول ارائه شده است.

بنابراین، میانگین خطای تقریب برای این معادله رگرسیون 12.66 درصد است؛ مدل رگرسیون خطی زوجی را می توان رضایت بخش و برای پیش بینی مناسب دانست.

6) بیایید یک ارزیابی کمی از تأثیر عامل انجام دهیم ایکسبه ازای هر عامل y، با استفاده از ضریب کشش. برای رگرسیون خطی زوجی می توان آن را با استفاده از فرمول پیدا کرد
. ما داریم

.

بنابراین، اگر تعداد شنوندگان 1 درصد افزایش یابد، قیمت سالانه 0.4 درصد کاهش می یابد.

7) بیایید پیش بینی را محاسبه کنیم yبا فاکتور افزایشی ایکس 25 درصد از میانگین.

ارزش پیش بینی شده

پیش بینی نقطه ای یک ویژگی y: .

میانگین خطای پیش بینی،

جایی که
- پراکندگی باقیمانده،
- پراکندگی فاکتور ایکس.

ارزش عددی مبلغ
در پروتکل به عنوان SS باقی مانده تعیین شده است.

سپس
,
.

سریع ترین راه برای به دست آوردن ویژگی های کمکی - میانگین مقدار عامل ایکسو - پراکندگی، از ابزار استفاده کنید آمار توصیفیدر بسته بندی تحلیل داده ها.

پروتکل خروجی نتایج به نظر می رسد

فاصله اطمینان پیش بینی: کجا - مقدار جدول مربوط به معیار Student (پیش از این با استفاده از تابع پیدا شده است STUDRASPOBR,
).

از این رو،

آن ها می توانید 95% مطمئن باشید که قیمت یک دوره سالانه با 35 دانشجو در محدوده های مشخص شده متفاوت خواهد بود (با پیش بینی قیمت امتیاز 3.65825 هزار دلار).

8) برای ساختن نمودار مراحل زیر را انجام دهید:

مرحله 1 درج / نمودار / نمودار

مرحله 3ردیف/افزودن/مقادیر/ستونی از مقادیر رگرسیون عاملی را انتخاب کنید - .

مرحله 4برچسب های محورایکس/ ستون مقدار را انتخاب کنید ایکس.

مرحله 4به هر یک از سری ها یک نام اختصاص دهید، محورهای مختصات و نام نمودار را برچسب بزنید.

توجه داشته باشید.

برای رسم نمودار مقدار عامل ایکسباید با حفظ مقدار مربوطه به ترتیب صعودی مرتب شوند y. اینجوری میشه انجام داد داده/مرتب سازی/ستونی را که می خواهید در آن مرتب کنید انتخاب کنید. مثلا،

وظایف برای کار مستقل

انتخاب 1

ایکس

y

گزینه 2

ایکس- منبع تغذیه در 10 شرکت، کیلووات؛

y- بهره وری نیروی کار، هزار روبل.

گزینه 3

ایکس- کیفیت زمین، امتیاز؛

y- عملکرد، c/ha.

گزینه 4

ایکس- کیفیت زمین، امتیاز؛

y- عملکرد، c/ha.

گزینه 5

ایکس- گردش تجاری؛

y- هزینه های توزیع در رابطه با گردش تجاری.

گزینه 6

ایکس- تجهیزات الکتریکی برای هر کارگر؛

y– خروجی محصولات نهایی به ازای هر کارگر.

گزینه 7

ایکس- سطح درآمد خانواده؛

y- هزینه های غذا (به ازای هر 100 روبل درآمد).

ارسال کار خوب خود در پایگاه دانش ساده است. از فرم زیر استفاده کنید

کار خوببه سایت">

دانشجویان، دانشجویان تحصیلات تکمیلی، دانشمندان جوانی که از دانش پایه در تحصیل و کار خود استفاده می کنند از شما بسیار سپاسگزار خواهند بود.

نوشته شده در http:// www. همه بهترین. ru/

وزارت آموزش و پرورش و علوم فدراسیون روسیه

بودجه ایالتی فدرال موسسه تحصیلیآموزش عالی

"دانشگاه فنی دولتی کومسومولسک-آن-آمور"

دانشکده اقتصاد و مدیریت

گروه اقتصاد، دارایی و حسابداری

محاسبه و کار گرافیکی

در رشته "اقتصاد سنجی"

دانش آموز گروهی

A.Yu. زایچنکو

معلم

I.I. آنتونوا

میز 1

شماره منطقه

متوسط ​​دستمزد سرانه زندگی در روز یک فرد توانمند، روبل،

متوسط ​​دستمزد روزانه، روبل،

ضروری:

1. یک معادله خطی برای رگرسیون زوجی از.

3. اهمیت آماری پارامترهای رگرسیون و همبستگی را با استفاده از آزمون فیشر و آزمون تی دانشجویی ارزیابی کنید.

4. پیش بینی را اجرا کنید دستمزدبا ارزش پیش‌بینی میانگین سرانه سطح معیشتی 107 درصد از سطح متوسط.

5. صحت پیش بینی را با محاسبه خطای پیش بینی و فاصله اطمینان آن ارزیابی کنید.

6. داده های اولیه و خط مستقیم نظری را روی یک نمودار رسم کنید.

1. برای محاسبه پارامترهای معادله رگرسیون خطی، جدول محاسبه 2 را می سازیم. همبستگی خطیرگرسیون تقریبی

جدول 2

مقدار متوسط

معادله رگرسیون بدست آمده به صورت زیر است:

با افزایش متوسط ​​سرانه سطح معیشت 1 روبل. متوسط ​​دستمزد روزانه به طور متوسط ​​0.89 روبل افزایش می یابد.

2. نزدیکی اتصال خطی با ضریب همبستگی ارزیابی می شود:

این بدان معنی است که 51٪ از تغییرات دستمزد () با تغییر در عامل - متوسط ​​دستمزد سرانه زندگی توضیح داده می شود.

کیفیت مدل با میانگین خطای تقریب تعیین می شود:

کیفیت مدل ساخته شده خوب ارزیابی می شود، زیرا از 8-10٪ تجاوز نمی کند.

3. ما اهمیت معادله رگرسیون را به عنوان یک کل با استفاده از معیار فیشر ارزیابی خواهیم کرد. ارزش واقعی معیار:

مقدار جدول بندی معیار در سطح معناداری پنج درصد و درجات آزادی عبارت است از: از آنجایی که معادله رگرسیون از نظر آماری معنی دار در نظر گرفته می شود.

ارزیابی اهمیت آماریپارامترهای رگرسیون با استفاده از آماره t Student و با محاسبه فاصله اطمینان هر شاخص انجام خواهد شد.

مقدار جدول بندی شده معیار برای تعداد درجات آزادی خواهد بود:

بیایید خطاهای تصادفی را تعریف کنیم:

مقادیر واقعی آمار از مقدار جدول بیشتر است:

بنابراین، پارامترها به طور تصادفی با صفر تفاوت ندارند، اما از نظر آماری معنی دار هستند. بیایید فواصل اطمینان را برای پارامترهای رگرسیون و. برای انجام این کار، ما حداکثر خطا را برای هر نشانگر تعیین می کنیم:

فاصله اطمینان:

تجزیه و تحلیل حدود بالا و پایین فواصل اطمینان به این نتیجه می رسد که با احتمال، پارامترها و با قرار گرفتن در محدوده های مشخص شده، مقادیر صفر را نمی گیرند، یعنی. از نظر آماری ناچیز نیستند و تفاوت معنی داری با صفر دارند.

4. تخمین های بدست آمده از معادله رگرسیون امکان استفاده از آن را برای پیش بینی فراهم می کند. اگر هزینه زندگی پیش بینی شده باشد:

در این صورت ارزش پیش بینی شده دستمزدها به صورت زیر خواهد بود:

خطای پیش بینی این خواهد بود:

حداکثر خطای پیش‌بینی که در مواردی از آن تجاوز نمی‌شود، خواهد بود:

فاصله اطمینان پیش بینی:

پیش بینی تکمیل شده متوسط ​​حقوق ماهانه قابل اعتماد است () و از 131.66 روبل متغیر است. تا 190.62 روبل. برای نتیجه‌گیری راه‌حل مسئله، داده‌های اولیه و خط مستقیم نظری را روی یک نمودار رسم می‌کنیم (شکل 1).

تصویر 1

ارسال شده در Allbest.ru

اسناد مشابه

    ساخت معادله خطی رگرسیون زوج، محاسبه ضریب خطی همبستگی جفت و میانگین خطای تقریب. تعیین ضرایب همبستگی و کشش، شاخص همبستگی، ماهیت کاربرد معیار فیشر در اقتصاد سنجی.

    تست، اضافه شده در 2010/05/05

    محاسبه پارامترهای رگرسیون خطی جفتی. ارزیابی اهمیت آماری معادله رگرسیون و پارامترهای آن با استفاده از آزمون‌های فیشر و دانشجو. ساخت ماتریس ضرایب همبستگی جفت. تحلیل آماریبا استفاده از نرم افزار MS EXCEL

    تست، اضافه شده در 2008/05/14

    محاسبه ضریب خطی جفت و همبستگی جزئی. اهمیت آماری پارامترهای رگرسیون و همبستگی. تجزیه و تحلیل فیلد داده های همبستگی. دقت پیش بینی، محاسبه خطا و فاصله اطمینان. ضریب تعیین چندگانه.

    تست، اضافه شده در 12/11/2010

    تفسیر اقتصادی ضریب رگرسیون. یافتن مجموع آماری مربع ها و تخمین واریانس باقیمانده ها. بررسی معنی داری پارامترهای معادله رگرسیون با استفاده از آزمون t-student. محاسبه میانگین خطای مربوطهتقریب ها

    تست، اضافه شده در 2010/03/23

    ایجاد فاصله اطمینان برای ضریب رگرسیون. تعیین خطای تقریب، شاخص همبستگی و آزمون F فیشر. ارزیابی کشش تغییرات در شدت مواد محصولات. ساخت معادله رگرسیون چندگانه خطی.

    تست، اضافه شده در 04/11/2015

    محاسبه پارامترهای معادله رگرسیون خطی، ارزیابی نزدیکی رابطه با استفاده از شاخص های همبستگی و تعیین. تعیین میانگین خطای تقریب. پایایی آماری مدلسازی با استفاده از آزمون F فیشر و آزمون تی دانشجویی.

    تست، اضافه شده در 10/17/2009

    تعیین وابستگی کمی جرم یک حیوان خزدار به سن آن. ساخت معادله رگرسیون زوجی، محاسبه پارامترهای آن و تایید کفایت. ارزیابی اهمیت آماری پارامترهای رگرسیون، محاسبه فاصله اطمینان آنها.

    کارهای آزمایشگاهی، اضافه شده در 2014/06/02

    ساختن یک فرضیه در مورد شکل ارتباط بین درآمد سرانه پولی و مخارج مصرف کننده در مناطق اورال و سیبری غربی فدراسیون روسیه. محاسبه پارامترهای معادلات رگرسیون زوجی، ارزیابی کیفیت آنها با استفاده از میانگین خطای تقریب.

    تست، اضافه شده در 11/05/2014

    تحلیل روش حداقل مربعات برای رگرسیون زوجی به عنوان روشی برای تخمین پارامترهای رگرسیون خطی. در نظر گرفتن معادله خطی رگرسیون زوجی. مطالعه رگرسیون خطی چندگانه. بررسی خطاهای ضرایب رگرسیون.

    تست، اضافه شده در 2018/03/28

    ساخت میدان همبستگی. محاسبه پارامترهای معادلات رگرسیون زوجی. وابستگی میانگین امید به زندگی به برخی عوامل. بررسی «معیار فیشر». ارزیابی نزدیکی یک اتصال با استفاده از شاخص های همبستگی و تعیین.

معادله رگرسیون زوجی.

بر اساس میدان همبستگی، می‌توانیم (برای جامعه) فرض کنیم که رابطه بین تمام مقادیر ممکن X و Y خطی است.

معادله رگرسیون خطی y = bx + a + ε است

سیستم معادلات عادی

a n + b∑x = ∑y

a∑x + b∑x 2 = ∑y x

برای داده های ما، سیستم معادلات شکل دارد

12a + 1042 b = 1709

1042 a + 91556 b = 149367

از معادله اول که بیان می کنیم آو معادله دوم را جایگزین کنید:

ما ضرایب رگرسیون تجربی را بدست می آوریم: b = 0.9، a = 64.21

معادله رگرسیون (معادله رگرسیون تجربی):

y = 0.9 x + 64.21

ضرایب رگرسیون تجربی آو بفقط تخمینی از ضرایب نظری β i هستند و خود معادله فقط روند کلی در رفتار متغیرهای مورد بررسی را منعکس می کند.

برای محاسبه پارامترهای رگرسیون خطی، یک جدول محاسباتی می سازیم (جدول 1).

1. پارامترهای معادله رگرسیون.

معنی نمونه.

واریانس های نمونه:

انحراف معیار

1.1. ضریب همبستگی

کوواریانس.

ما نشانگر نزدیکی اتصال را محاسبه می کنیم. این شاخص نمونه ضریب همبستگی خطی است که با فرمول محاسبه می شود:

1.2. معادله رگرسیون(تخمین معادله رگرسیون).

معادله رگرسیون خطی y = 0.9 x + 64.21 است

1.3. ضریب الاستیسیته.

ضریب کشش با فرمول بدست می آید:

1.4. خطای تقریب.

خطای تقریبی بین 5 تا 7 درصد نشان‌دهنده تناسب خوب معادله رگرسیون با داده‌های اصلی است.

1.5. رابطه همبستگی تجربی.

نسبت همبستگی تجربی برای همه اشکال ارتباط محاسبه می شود و برای اندازه گیری نزدیکی رابطه عمل می کند. در داخل متفاوت است.

شاخص همبستگی.

برای رگرسیون خطی، شاخص همبستگی برابر با ضریب همبستگی r xy = 0.79 است.

برای هر شکلی از وابستگی، تنگی اتصال با استفاده از آن تعیین می شود ضریب همبستگی چندگانه:

1.6. ضریب تعیین.

بیشتر اوقات ، هنگام تفسیر ضریب تعیین ، به صورت درصد بیان می شود.

R2 = 0.792 = 0.62

برای ارزیابی کیفیت پارامترهای رگرسیون خطی، یک جدول محاسباتی می سازیم (جدول 2)

2. برآورد پارامترهای معادله رگرسیون.

2.1. اهمیت ضریب همبستگی.

به منظور آزمون فرضیه صفر در سطح معناداری α که ضریب همبستگی کلی یک متغیر تصادفی دو بعدی نرمال برابر با صفر در فرضیه رقیب H 1 ≠ 0 است، لازم است مقدار مشاهده شده معیار محاسبه شود.

و طبق جدول نقاط بحرانیتوزیع دانش آموز، با توجه به سطح اهمیت α و تعداد درجات آزادی k = n - 2، نقطه بحرانی t منطقه بحرانی دو طرفه را پیدا کنید. اگر t obs.< t крит оснований отвергнуть нулевую гипотезу. Если |t набл | >t crit - فرضیه صفر رد می شود.

با استفاده از جدول Student با سطح معناداری 0.05= α و درجه آزادی k=10، t کریت را پیدا می کنیم:

که m = 1 تعداد متغیرهای توضیحی است.

2.2. برآورد فاصله برای ضریب همبستگی (فاصله اطمینان).

2.3. تجزیه و تحلیل دقت تعیین برآورد ضریب رگرسیون.

یک تخمین بی طرفانه از پراکندگی اختلالات مقدار زیر است:

S 2 y = 53.63 - واریانس غیر قابل توضیح (اندازه گیری از گسترش متغیر وابسته در اطراف خط رگرسیون).

S y = 7.32 - خطای استاندارد برآورد (خطای استاندارد رگرسیون).

S a - انحراف معیارمتغیر تصادفی a.

S b - انحراف معیار متغیر تصادفی b.

2.4. فواصل اطمینان برای متغیر وابسته.

(a + bx p ± ε)

اجازه دهید مرزهای فاصله ای را محاسبه کنیم که در آن 95٪ از مقادیر ممکن Y با تعداد نامحدود مشاهدات متمرکز می شود و X p = 107

فواصل اطمینان فردی برای Y در مقدار معین X.

(a + bx i ± ε)

t crit (n-m-1;α/2) = (10;0.025) = 2.228

2.5. آزمون فرضیه های مربوط به ضرایب معادله رگرسیون خطی.

1) آمار t. آزمون تی دانشجویی

t crit (n-m-1;α/2) = (10;0.025) = 2.228

فاصله اطمینان برای ضرایب معادله رگرسیون.

(b - t crit S b ؛ b + t crit S b)

(a - t crit S a ؛ a + t crit S a)

2) آمار F. معیار فیشر

مقدار جدول معیار با درجه آزادی k 1 = 1 و k 2 = 10، جدول F = 4.96

هدف از خدمات. با استفاده از خدمات آنلاین می توانید پیدا کنید:
  • پارامترهای معادله رگرسیون خطی y=a+bx، ضریب خطیهمبستگی با آزمون اهمیت آن؛
  • نزدیکی اتصال با استفاده از شاخص‌های همبستگی و تعیین، تخمین OLS، پایایی استاتیکی مدل‌سازی رگرسیون با استفاده از آزمون F فیشر و آزمون تی دانشجویی، فاصله اطمینان پیش‌بینی برای سطح معناداری α

معادله رگرسیون زوجی اشاره دارد معادله رگرسیون مرتبه اول. اگر یک مدل اقتصادسنجی فقط دارای یک متغیر توضیحی باشد، آن را رگرسیون زوجی می نامند. معادله رگرسیون مرتبه دومو معادله رگرسیون مرتبه سومبه معادلات رگرسیون غیرخطی مراجعه کنید.

مثال. برای ساخت یک مدل رگرسیون زوجی، متغیر وابسته (توضیح داده شده) و توضیحی را انتخاب کنید. دادن . معادله نظری رگرسیون زوجی را تعیین کنید. کفایت مدل ساخته شده را ارزیابی کنید (تفسیر R-squared، t-statistics، F-statistics).
راه حلبر این اساس انجام خواهیم داد فرآیند مدلسازی اقتصادسنجی.
مرحله اول (بیانیه) - تعیین اهداف نهایی مدل سازی، مجموعه عوامل و شاخص های شرکت کننده در مدل و نقش آنها.
مشخصات مدل - تعریف هدف مطالعه و انتخاب متغیرهای اقتصادی مدل.
تکلیف موقعیتی (عملی). برای 10 شرکت در منطقه، وابستگی تولید به ازای هر کارمند y (هزار روبل) به سهم کارگران بسیار واجد شرایط در تعداد کل کارگران x (بر حسب %) مورد مطالعه قرار گرفته است.
مرحله 2 (پیشینی) - تجزیه و تحلیل پیش مدل جوهره اقتصادیپدیده مورد مطالعه، شکل‌گیری و رسمی‌سازی اطلاعات پیشینی و مفروضات اولیه، به‌ویژه مربوط به ماهیت و پیدایش داده‌های آماری اولیه و اجزای تصادفی باقیمانده در قالب تعدادی فرضیه است.
در حال حاضر در این مرحله، می‌توان در مورد وابستگی آشکار سطح مهارت کارگر و خروجی او صحبت کرد، زیرا هر چه کارگر با تجربه‌تر باشد، بهره‌وری او بالاتر می‌رود. اما چگونه می توان این وابستگی را ارزیابی کرد؟
رگرسیون زوجینشان دهنده یک رگرسیون بین دو متغیر - y و x است، یعنی مدلی از فرم:

جایی که y متغیر وابسته است (ویژگی نتیجه)؛ x - متغیر مستقل یا توضیحی (ویژگی-عامل). علامت "^" به این معنی است که هیچ رابطه عملکردی دقیقی بین متغیرهای x و y وجود ندارد، بنابراین تقریباً در هر مورد جداگانه مقدار y مجموع دو عبارت است:

جایی که y مقدار واقعی ویژگی حاصل است. y x - ارزش نظری مشخصه مؤثر که بر اساس معادله رگرسیون یافت می شود. ε – مقدار تصادفی، مشخص کردن انحراف مقدار واقعی مشخصه حاصل از نظری که با استفاده از معادله رگرسیون یافت می شود.
بیایید آن را به صورت گرافیکی نشان دهیم وابستگی رگرسیونبین تولید به ازای هر کارگر و سهم کارگران بسیار ماهر.


مرحله 3 (پارامترسازی) - مدل سازی واقعی، به عنوان مثال. انتخاب نمای کلیمدل، شامل ترکیب و شکل روابط بین متغیرهای موجود در آن. به انتخاب نوع وابستگی تابعی در معادله رگرسیون، پارامترسازی مدل می گویند. انتخاب کنید معادله رگرسیون زوجی، یعنی نتیجه نهایی y تنها تحت تاثیر یک عامل خواهد بود.
مرحله 4 (اطلاعات) - جمع آوری اطلاعات آماری لازم، به عنوان مثال. ثبت مقادیر عوامل و شاخص های شرکت کننده در مدل. نمونه شامل 10 شرکت در این صنعت است.
مرحله 5 (شناسایی مدل) - تخمین پارامترهای مدل ناشناخته با استفاده از داده های آماری موجود.
برای تعیین پارامترهای مدل، استفاده می کنیم OLS - روش حداقل مربعات. سیستم معادلات عادی به صورت زیر خواهد بود:
a n + b∑x = ∑y
a∑x + b∑x 2 = ∑y x
برای محاسبه پارامترهای رگرسیون، یک جدول محاسباتی می سازیم (جدول 1).
ایکسyx 2y 2x y
10 6 100 36 60
12 6 144 36 72
15 7 225 49 105
17 7 289 49 119
18 7 324 49 126
19 8 361 64 152
19 8 361 64 152
20 9 400 81 180
20 9 400 81 180
21 10 441 100 210
171 77 3045 609 1356

داده ها را از جدول 1 (ردیف آخر) می گیریم و در نتیجه داریم:
10a + 171 b = 77
171 a + 3045 b = 1356
این SLAE را با استفاده از روش کرامر یا روش ماتریس معکوس حل می کنیم.
ما ضرایب رگرسیون تجربی را بدست می آوریم: b = 0.3251، a = 2.1414
معادله رگرسیون تجربی:
y = 0.3251 x + 2.1414
مرحله 6 (تأیید مدل) - مقایسه داده های واقعی و مدل، بررسی کفایت مدل، ارزیابی دقت داده های مدل.
ما تجزیه و تحلیل را با استفاده از
با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

بارگذاری...