یافتن ضرایب معادله رگرسیون زوجی. رگرسیون جفت خطی

1. تعاریف و فرمول های اساسی

رگرسیون جفت- رگرسیون (رابطه) بین دو متغیر و غیره. مشاهده مدل:

متغیر وابسته کجاست (علامت حاصل)؛

- متغیر توضیحی مستقل (عامل علامت)؛

اغتشاش یا متغیر تصادفی، از جمله تأثیر عواملی که در مدل در نظر گرفته نشده است.

تقریباً در هر مورد، مقدار از دو عبارت تشکیل شده است:

ارزش واقعی ویژگی موثر کجاست.

ارزش نظری ویژگی حاصل که بر اساس معادله رگرسیون یافت می شود. علامت "^" به این معنی است که هیچ رابطه عملکردی دقیقی بین متغیرها و.

تمیز دادن خطیو غیر خطیپسرفت.

رگرسیون خطیبا معادله یک خط مستقیم توصیف می شود

رگرسیون های غیرخطیبه دو دسته تقسیم می شوند:

1) رگرسیون، در متغیرهای توضیحی غیر خطی، اما در پارامترهای تخمینی خطی است، مثلا:

چند جمله ای درجات مختلف

هذلولی متساوی الاضلاع

2) رگرسیون، غیر خطی در پارامترهای برآورد شده است، مثلا:

قدرت

تظاهرات

نمایی

برای ایجاد یک رگرسیون خطی زوجی، کمیت های کمکی محاسبه می شوند (- تعداد مشاهدات).

معنی نمونه: و

کوواریانس نمونهبین و

یا

کوواریانس- این هست مشخصه عددیتوزیع مشترک دو متغیر تصادفی

واریانس نمونه برای

یا

واریانس نمونه برای

یا

واریانس نمونهدرجه گسترش مقادیر یک متغیر تصادفی در اطراف مقدار میانگین (تغییرپذیری، تغییرپذیری) را مشخص می کند.

نزدیکی ارتباط بین پدیده های مورد مطالعه توسط برآورد می شود ضریب همبستگی نمونهبین و

ضریب همبستگی از 1- تا 1+ متغیر است. هرچه از مدول به 1 نزدیکتر باشد، رابطه آماری بین و به یک تابعی خطی نزدیکتر است.

اگر =0 باشد، هیچ رابطه خطی بین و وجود ندارد.<0,3 - связь слабая; 0,3<0,7 - связь умеренная; 0,7<0,9 - связь сильная; 0,9<0,99 - связь весьма сильная.

مقدار مثبت ضریب نشان می دهد که رابطه بین علائم مستقیم است (مقدار با رشد افزایش می یابد)، مقدار منفی نشان دهنده یک رابطه معکوس است (مقدار با رشد کاهش می یابد).

ساخت رگرسیون خطیبه تخمین پارامترهای آن تقلیل می‌یابد و رویکرد کلاسیک برای تخمین پارامترهای رگرسیون خطی مبتنی بر روش کمترین مربعات (MNK). LSM به دست آوردن چنین تخمین هایی از پارامترها را امکان پذیر می کند که تحت آن مجموع انحرافات مجذور مقادیر واقعی ویژگی حاصل از موارد نظری حداقل است، به عنوان مثال.

برای رگرسیون خطی، پارامترها و از سیستم معادلات نرمال پیدا می شوند:

حل سیستم، پیدا می کنیم که دربر روی

و پارامتر

ضریببا یک متغیر عامل نشان می دهد که با تغییر فاکتور در واحد اندازه گیری، مقدار به طور متوسط ​​چقدر تغییر می کند.

پارامتر زمانی که If نمی تواند برابر با 0 باشد، پس منطقی نیست. فقط می توان علامت if را تفسیر کرد که تغییر نسبی در نتیجه کندتر از تغییر عامل است، یعنی. واریانس نتیجه کمتر از واریانس عامل است و بالعکس.

برای ارزیابی کیفیت مدل رگرسیون ساخته شده، می توانید استفاده کنید ضریب تعیینیا میانگین خطای تقریب.

بهضریب تعیین

یا

سهم واریانس توضیح داده شده توسط رگرسیون را در کل واریانس صفت حاصل نشان می دهد. بر این اساس، مقدار سهم واریانس شاخص ناشی از تأثیر عوامل در نظر گرفته نشده در مدل و دلایل دیگر را مشخص می کند.

هر چه به 1 نزدیکتر باشد، مدل رگرسیون بهتر است، یعنی. مدل ساخته شده به خوبی داده های اولیه را تقریب می کند.

میانگین خطای تقریبمیانگین انحراف نسبی مقادیر نظری از مقادیر واقعی است، یعنی.

معادله رگرسیون ساخته شده در صورتی رضایت بخش در نظر گرفته می شود که مقدار از 10-12٪ تجاوز نکند.

برای رگرسیون خطی میانگین ضریب کششطبق فرمول پیدا می شود:

میانگین ضریب کششنشان می دهد که به طور متوسط ​​چند درصد در جمعیت نتیجه از مقدار خود تغییر می کند زمانی که عامل 1٪ از مقدار خود تغییر می کند.

درجه hناچیموستومعادلات رگرسیونبه طور کلی با استفاده از آزمون فیشر داده می شود که شامل آزمون فرضیه بی اهمیت بودن آماری معادله رگرسیون است. . برای این، مقایسه ای انجام می شود واقعیهآسمانو بحرانی(جدول) مقادیر - معیار فیشر .

از نسبت مقادیر فاکتور و واریانس های باقیمانده محاسبه شده برای یک درجه آزادی، یعنی.

- حداکثر مقدار ممکن معیار تحت تأثیر عوامل تصادفی با درجات آزادی = 1، =-2 و سطح معنی داری از جدول معیار فیشر (جدول 1 پیوست).

سطح اهمیت- احتمال رد یک فرضیه صحیح با توجه به صحت آن است.

اگر یک سپس فرضیه عدم وجود ارتباط بین شاخص مورد مطالعه و عامل رد شده و در مورد معنی دار بودن این ارتباط با سطح معناداری (یعنی معادله رگرسیون معنی دار است) نتیجه گیری می شود.

اگر یک سپس فرضیه پذیرفته شده و بی اهمیت بودن و غیرقابل اعتماد بودن معادله رگرسیون تشخیص داده می شود.

برای رگرسیون خطی اهمیتضرایب رگرسیونارزیابی شده با - معیار دانشجویی که بر اساس آن فرضیه ای در مورد ماهیت تصادفی شاخص ها مطرح می شود، یعنی. در مورد تفاوت ناچیز آنها از صفر. در مرحله بعد، مقادیر واقعی معیار برای هر یک از ضرایب رگرسیون تخمین زده شده محاسبه می شود، یعنی.

کجا و - خطاهای استانداردپارامترهای رگرسیون خطی با فرمول های زیر تعیین می شوند:

- حداکثر مقدار ممکن معیار دانش آموز تحت تأثیر عوامل تصادفی برای درجه آزادی معین = -2 و سطح معنی داری از جدول معیار دانش آموز (جدول 2 پیوست).

اگر یک سپس فرضیه بی اهمیت بودن ضریب رگرسیون با سطح معنی داری رد می شود. ضریب (یا) به طور تصادفی با صفر متفاوت نیست و تحت تأثیر یک عامل سیستماتیک عمل کننده تشکیل شده است.

اگر یک سپس فرضیه رد نمی شود و ماهیت تصادفی شکل گیری پارامتر تشخیص داده می شود.

اهمیت ضریب خطیهمبستگی هاهمچنین بررسی شده است - معیار دانش آموز، یعنی.

فرضیه ناچیز بودن ضریب همبستگی با سطح معنی داری رد می شود اگر

اظهار نظر.برای رگرسیون زوجی خطی، آزمون فرضیه‌ها در مورد اهمیت ضریب و ضریب همبستگی معادل آزمایش فرضیه در مورد اهمیت معادله رگرسیون به عنوان یک کل است، یعنی.

برای محاسبه فاصله اطمینانتعیین کنند خطای حاشیه ای برای هر شاخص، یعنی

فاصله اطمینانبرای ضرایب رگرسیون خطی:

اگر صفر در مرزهای فاصله اطمینان قرار گیرد، یعنی. کران پایین منفی و کران بالایی مثبت است، پس پارامتر تخمین زده شده صفر در نظر گرفته می شود، زیرا نمی تواند همزمان ارزش های مثبت و منفی را به خود بگیرد.

ارزش پیش بینی شدهبا جایگزینی مقدار پیش بینی مربوطه در معادله رگرسیون تعیین می شود سپس محاسبه می شود میانگین خطای استاندارد پیش بینی

جایی که

و در حال ساخت است فاصله اطمینان پیش بینی

این فاصله به دلیل حجم کم مشاهدات می تواند بسیار گسترده باشد.

رگرسیون ها، غیر خطی در متغیرهای موجود است , با تغییر ساده متغیرها به شکل خطی کاهش می‌یابد و تخمین بیشتر پارامترها با استفاده از روش حداقل مربعات انجام می‌شود.

جیهایپربالرگرسیون کالبدی:

آر خروج , غیر خطی ه با توجه به پارامترهای برآورد شده به دو نوع تقسیم می شوند: درونی غیر خطیو غیره. (به شکل خطی تقلیل نمی یابد) و درونی خطی(با استفاده از تبدیل های مناسب به شکل خطی تقلیل می یابد)، به عنوان مثال:

رگرسیون نمایی:

تبدیل خطی سازی:

رگرسیون توان:

تبدیل خطی سازی:

فهرست مطالبرگرسیون نایا:

تبدیل خطی سازی:

لگاریتمیرگرسیون ام:

تبدیل خطی سازی:

2. حل مشکلات معمولی

مثال9 .1 . برای 15 شرکت کشاورزی (جدول 9.1)، موارد زیر مشخص است: - تعداد تجهیزات در واحد سطح زیر کشت (واحد در هکتار) و - حجم محصولات رشد یافته (هزار واحد). لازم:

1) وابستگی را تعیین کنید

2) فیلدهای همبستگی را رسم کنید و معادله رگرسیون خطی را روی آن رسم کنید

3) در مورد کیفیت مدل نتیجه گیری کنید و مقدار پیش بینی شده را با مقدار پیش بینی شده 112 درصد از سطح متوسط ​​محاسبه کنید.

جدول 9.1

راه حل:

1) در اکسل، جدول کمکی 9.2 را جمع آوری می کنیم.

جدول 9.2

برنج.9 یک جدول برای محاسبه مقادیر میانی

محاسبه تعداد اندازه گیری ها برای انجام این کار، در یک سلول B19قرار دادن = COUNT(A2:A16 ) .

با استفاده از تابع ∑ (AutoSum) در نوار ابزار استاندارد تی نایا جمع همه (سلول) را بیابید B17) و (سلول C17).

برنج. 9.2. محاسبه مجموع مقادیر و میانگین ها

برای محاسبه مقادیر میانگین، از تابع داخلی MS Excel AVERAGE() استفاده می کنیم، محدوده مقادیر برای تعیین میانگین در پرانتز نشان داده شده است. به این ترتیب، متوسط ​​حجم محصولات کشت شده برای 15 مزرعه 210.833 هزار دکه است. واحد و میانگین تعداد وسایل نقلیه 6.248 واحد در هکتار است.

برای پر کردن ستون ها D, E, اففرمول محاسبه محصول: را در سلول وارد کنید D2 قرار دادن = B2*C2، سپس ENTER را روی صفحه کلید فشار دهید. روی سلول کلیک چپ کنید D2 و با گرفتن گوشه سمت راست پایین این سلول (سیاه پلاس)، به سمت سلول پایین بکشید D16 . محدوده به طور خودکار پر می شود. D3 - D16 .

برای محاسبه در انتخابیاوه کوواریانسبین و از فرمول i.e استفاده کنید. به یک سلول ب21 قرار دادن = D18- ب18* سی18 و 418.055 را دریافت کنید (شکل 9.3).

برنج.9 .3. محاسبه

انتخابیوایپراکندگییوبرای یافتن با فرمول برای این در یک سلول ب22 قرار دادن = E18-B18^2 (^- علامت نشان دهنده قدرت ) و 11.337 دریافت کنید. به طور مشابه، ما 16745.05556 را تعیین می کنیم (شکل 9.4)

برنج.9 چهار. محاسبهVar(ایکس) وVar (y)

علاوه بر این، با استفاده از تابع استاندارد MS Excel "CORREL"، مقدار ضریب همبستگی خطی را برای کار خود محاسبه می کنیم، تابع شبیه "=CORREL(B2:B16;C2:C16)" و مقدار rxy=0.96 خواهد بود. . مقدار به دست آمده از ضریب همبستگی نشان دهنده رابطه مستقیم و قوی بین در دسترس بودن تجهیزات و حجم محصولات رشد یافته است.

ما پیدا می کنیم که درضریب نمونه رگرسیون خطی =36.87; پارامتر = -17.78. بنابراین، معادله رگرسیون خطی زوجی به نظر می رسد = -17.78 + 36.87

این ضریب نشان می دهد که با افزایش تعداد تجهیزات به میزان 1 واحد در هکتار، حجم محصولات کشت شده به طور متوسط ​​36.875 هزار den افزایش می یابد. واحدها (شکل 9.5)

برنج.9 .5. محاسبه پارامترهای معادله رگرسیون.

بنابراین، معادله رگرسیون به صورت زیر خواهد بود:

مقادیر واقعی را در معادله به دست آمده جایگزین می کنیم ایکس(تعداد تجهیزات) مقادیر نظری حجم محصولات رشد یافته را پیدا می کنیم (شکل 9.6).

برنج.9 .6. محاسبه مقادیر نظری حجم محصولات رشد یافته

استفاده كردن جادوگر نمودارما فیلدهای همبستگی (انتخاب ستون ها با مقادیر و ) و یک معادله رگرسیون خطی (انتخاب ستون هایی با مقادیر و ) می سازیم. نوع نمودار را انتخاب کنید - تی تماشایی در نمودار حاصل، پارامترهای لازم (عنوان، برچسب‌های محورها، افسانه و غیره) را پر کنید. در نتیجه، نمودار نشان داده شده در شکل را دریافت می کنیم. 9.7.

برنج.9 .7. نمودار وابستگی حجم محصولات رشد یافته به تعداد تجهیزات

برای ارزیابی کیفیت مدل رگرسیون ساخته شده، محاسبه می کنیم:

. بهضریب تعیین\u003d 0.92، که نشان می دهد که تغییر در هزینه های تولید 92٪ به دلیل تغییر در حجم تولید است، و 8٪ به سهم عواملی است که در مدل در نظر گرفته نشده اند، که نشان دهنده کیفیت رگرسیون ساخته شده است. مدل؛

. باقرمزیویوخطادرتقریب ها. برای انجام این کار، در ستون اچتفاوت بین مقادیر واقعی و نظری a را در ستون محاسبه کنید من- اصطلاح . لطفاً توجه داشته باشید که تابع استاندارد MS Excel "ABS" برای محاسبه مقدار مدول استفاده می شود. هنگام ضرب مقدار متوسط ​​(سلول من18 ) در 100٪ ما 18.2٪ دریافت می کنیم. در نتیجه، به طور متوسط، مقادیر نظری 18.2٪ از مقادیر واقعی انحراف دارند (شکل 1.8).

با استفاده از معیار Fisher، تخمین می زنیم ساعتناچیموستبمعادلاتپشیمانیبااینها به طور کلی: 150,74.

در سطح معنی داری 0.05 = 4.67، ما با استفاده از تابع آماری داخلی تعیین می کنیم F توزیع(شکل 1.9). در عین حال، باید به خاطر داشت که "Degrees_of_freedom1" مخرج است و "Degrees_of_freedom2" عددی است، جایی که تعداد پارامترها در معادله رگرسیون است (ما 2 داریم). n- تعداد جفت مقادیر اولیه (ما 15 عدد داریم).

زیرا سپس معادله رگرسیون در 05/0 = معنادار است.

برنج.9 .8. تعیین ضریب تعیین وخطای متوسطتقریب ها

برنج. 9 . 9 . پنجره گفتگوکارکردF توزیع

بعد تعریف می کنیم باضریب کشسانی متوسططبق فرمول یافته ها نشان می دهد که با افزایش 1 درصدی حجم محصولات تولیدی، هزینه های تولید این محصولات در مجموع به طور متوسط ​​1.093 درصد افزایش می یابد.

محاسبه ارزش پیش بینی شدهبا جایگزینی مقدار پیش‌بینی‌شده ضریب =1.12=6.248*1.12=6.9978 در معادله رگرسیون =-19.559+36.8746. ما =238.48 بدست می آوریم. در نتیجه با تعداد تجهیزات به میزان 6.9978 واحد در هکتار، حجم خروجی 238.48 هزار den خواهد بود. واحدها

واریانس باقیمانده را پیدا کنید، برای این ما مجموع مجذورات تفاوت بین مقادیر واقعی و نظری را محاسبه می کنیم. =39.166 با قرار دادن فرمول زیر = ROOT (J17/(B19-2))به یک سلول اچ2 1 (شکل 9.10).

برنج.9 ده تعیین واریانس باقیمانده

از جانبقرمزبلهاستانداردخطای هفتمپیش بینی:

در سطح معنی داری 0.05 = با استفاده از تابع آماری داخلی استودرسپوبرما 2.1604 = را تعریف می کنیم و خطای پیش بینی حاشیه ای را محاسبه می کنیم که در 95٪ موارد بیشتر از آن نخواهد بود. .

Dفاصله اطمینان پیش بینی:

یا .

پیش‌بینی هزینه‌های تولید قابل اعتماد بود (1-0.05=0.95)، اما نادرست بود، زیرا محدوده مرزهای بالایی و پایینی فاصله اطمینان است. بار. این به دلیل حجم کم مشاهدات اتفاق افتاد.

باید لغو شود که MS Excel دارای توابع آماری داخلی است که می تواند به طور قابل توجهی تعداد محاسبات میانی را کاهش دهد، به عنوان مثال (شکل 9.11.):

برای محاسبه که درانتخابیایکسمیانگینایکساز تابع استفاده کنید AVERAGE(number1:numberن) از دسته آماری .

کوواریانس نمونهبین و با استفاده از تابع پیدا می شود COVAR(آرایهایکس؛آرایهY) از دسته آماری .

انتخابیسپراکندگیوتوسط تابع آماری تعیین می شود VARP(شماره1:عددن) .

برنج.9 یازده. محاسبات nتوابع داخلی را نمایه می کندام‌اسبرتری داشتن

پپارامترسرگرسیون خطیدر اکسل می توان به روش های مختلفی تعریف کرد.

1 مسیر) با عملکرد داخلی LINEST. روند کار به صورت زیر است:

1. ناحیه ای از سلول های خالی 5x2 (5 ردیف، 2 ستون) را برای نمایش نتایج انتخاب کنید. آمار رگرسیونیا منطقه 1x2 - فقط ضرایب رگرسیون را بدست آورید.

2. استفاده از Function Wizardsدر میان آماری عملکرد را انتخاب کنید LINESTو آرگومان های آن را پر کنید (شکل 9.12):

برنج. 9 . 12 . جعبه گفتگوی ورودی آرگومان تابعLINEST

مقادیر_شناخته_y

مقادیر_شناخته_ایکس

کنست- یک مقدار منطقی (1 یا 0)، که نشان دهنده وجود یا عدم وجود یک عبارت آزاد در معادله است. قرار دادن 1;

آمار- مقدار بولی (1 یا 0) که نشان می دهد آیا اطلاعات اضافی در تجزیه و تحلیل رگرسیون نمایش داده می شود یا خیر. قرار دادن 1.

3. شماره اول جدول در سلول سمت چپ بالای ناحیه انتخاب شده ظاهر می شود. دکمه را فشار دهید تا کل جدول باز شود. < اف2> ، و سپس - روی ترکیب کلید < CTRL> + < تغییر مکان> + < وارد> .

آمار رگرسیون اضافی به شکل (جدول 9.3) نمایش داده می شود:

جدول 9.3

مقدار ضریب

مقدار ضریب

RMS
انحراف

RMS
انحراف

ضریب
تعیین ها

RMS
انحراف

آمار

تعداد درجات آزادی

مجموع رگرسیون مربع ها

جمع باقیمانده مربع ها

در نتیجه اعمال تابع LINESTما گرفتیم:

( 2 مسیر) استفاده از ابزار تجزیه و تحلیل داده ها پسرفت می توانید نتایج آمار رگرسیون را دریافت کنید، تحلیل واریانس، فواصل اطمینان، باقیمانده ها، نمودارهای برازش رگرسیون، نمودارهای باقیمانده، و نمودارهای احتمال عادی. روند کار به صورت زیر است:

1. باید دسترسی به را بررسی کنید بسته تحلیلی. برای انجام این کار، در منوی اصلی (از طریق دکمه مایکروسافت آفیس برای دسترسی به گزینه های MS Excel) در "گزینه ها" ام‌اسبرتری داشتن» دستور «افزونه ها» را انتخاب کنید و افزونه سمت راست را انتخاب کنید تجزیه و تحلیل بسته آ سپس روی دکمه "برو" کلیک کنید (شکل 9.13). در کادر محاوره‌ای که باز می‌شود، کادر کنار «بسته تحلیل» را علامت بزنید و روی «OK» کلیک کنید (شکل 9.14).

در تب "داده" در گروه "تجزیه و تحلیل"، به افزونه نصب شده دسترسی خواهید داشت. (شکل 9.15).

برنج.9 .13. فعال کردن افزونه ها درام‌اسبرتری داشتن

برنج.9 .چهارده. جعبه گفتگوی افزودنی ها

برنج.9 .15. افزودنی تجزیه و تحلیل داده ها در روبانام‌اسبرتری داشتن 2007 .

2. در گروه "تجزیه و تحلیل" روی "داده ها" را انتخاب کنید، دستور را انتخاب کنید تحلیل بله n nyh در کادر محاوره ای باز شده، ابزار تجزیه و تحلیل "Regression" را انتخاب کرده و روی "OK" کلیک کنید (شکل 9.16):

برنج.9 .16. جعبه گفتگوی تجزیه و تحلیل داده ها

در کادر محاوره ای ظاهر شده (شکل 9.17)، فیلدها را پر کنید:

فاصله ورودیY- محدوده حاوی داده های مشخصه موثر Y؛

فاصله ورودیایکس- محدوده حاوی داده های ویژگی توضیحی X؛

برچسب ها- پرچمی که نشان می دهد خط اول شامل نام ستون ها است یا خیر.

کنستمورچه صفر- پرچمی که وجود یا عدم وجود یک عبارت آزاد در معادله را نشان می دهد.

فاصله خروجی- کافی است سلول سمت چپ بالای محدوده آینده را نشان دهید.

کاربرگ جدید- می توانید یک نام دلخواه برای برگه جدیدی که نتایج در آن نمایش داده می شود تعیین کنید.

برنج.9 .17. جعبه گفتگوی رگرسیون

برای اطلاعات باقیمانده، نمودارهای باقیمانده، برازش و احتمال عادی، کادرهای انتخاب مناسب را در کادر محاوره ای انتخاب کنید.

برنج. 9 . 18 . نتایج استفاده از ابزارپسرفت

AT ام‌اسبرتری داشتن خط روندرا می توان به نمودار میله ای یا نمودار خطی اضافه کرد. برای این:

1. لازم است ناحیه ساخت نمودار را انتخاب کرده و در نوار "Layout" را انتخاب کرده و در گروه تحلیل دستور "Trend line" را انتخاب کنید (شکل 9.19.). در آیتم منوی کشویی، "گزینه های خط روند پیشرفته" را انتخاب کنید.

برنج. 1.19.روبان

2. در کادر محاوره ای که ظاهر می شود، مقادیر واقعی را انتخاب کنید، سپس کادر محاوره ای "Trend Line Format" (شکل 9.20.) باز می شود که در آن نوع خط روند انتخاب شده و پارامترهای مناسب تنظیم شده است.

برنج. 9 . 20 . پنجره گفتگو"فرمت خط روند"

برای یک روند چند جمله ای، باید درجه چند جمله ای تقریبی، برای فیلتر خطی، تعداد نقاط میانگین را مشخص کنید.

انتخاب کنید خطیبرای ساخت یک معادله رگرسیون خطی

مانند اطلاعات اضافیمی توان معادله را روی دی نشان دهیدآگرمو یک مقدار روی نمودار قرار دهید(شکل 9.21).

برنج. 9 . 21 . روند خطی

مدل های رگرسیون غیرخطی هنگام محاسبه پارامترهای معادله با استفاده از تابع آماری انتخاب شده در اکسل نشان داده شده است. LGRFPRIBL. روش محاسبه مشابه با استفاده از تابع LINEST است.

ارسال کار خوب خود در پایگاه دانش ساده است. از فرم زیر استفاده کنید

کار خوببه سایت">

دانشجویان، دانشجویان تحصیلات تکمیلی، دانشمندان جوانی که از دانش پایه در تحصیل و کار خود استفاده می کنند از شما بسیار سپاسگزار خواهند بود.

نوشته شده در http:// www. همه بهترین ها. en/

وزارت آموزش و پرورش و علوم فدراسیون روسیه

بودجه ایالت فدرال موسسه تحصیلیآموزش عالی

"دانشگاه فنی دولتی کومسومولسک-آن-آمور"

دانشکده اقتصاد و مدیریت

گروه اقتصاد، دارایی و حسابداری

محاسبه و کار گرافیکی

در رشته "اقتصاد سنجی"

دانش آموز گروهی

A.Yu. زایچنکو

معلم

I.I. آنتونوا

میز 1

شماره منطقه

میانگین سرانه حداقل معیشت در روز برای یک فرد توانمند، روبل،

میانگین حقوق روزانه، روبل،

ضروری:

1. یک معادله رگرسیون جفت خطی از.

3. اهمیت آماری پارامترهای رگرسیون و همبستگی را با استفاده از آزمون تی فیشر و آزمون تی دانشجویی ارزیابی کنید.

4. یک پیش بینی انجام دهید دستمزدبا مقدار پیش بینی شده میانگین سرانه حداقل معیشتی که 107 درصد سطح متوسط ​​است.

5. صحت پیش بینی را با محاسبه خطای پیش بینی و فاصله اطمینان آن ارزیابی کنید.

6. داده های اولیه و خط نظری را روی یک نمودار رسم کنید.

1. برای محاسبه پارامترهای معادله رگرسیون خطی، جدول محاسبه 2 را می سازیم. همبستگی خطیرگرسیون تقریبی

جدول 2

منظور داشتن

معادله رگرسیون به دست آمد:

با افزایش سرانه حداقل 1 روبل. متوسط ​​دستمزد روزانه به طور متوسط ​​0.89 روبل افزایش می یابد.

2. تنگی رابطه خطی با ضریب همبستگی تخمین زده می شود:

این بدان معنی است که 51٪ از تغییرات دستمزد () با تغییر عامل - میانگین سرانه حداقل معیشت توضیح داده می شود.

کیفیت مدل با میانگین خطای تقریب تعیین می شود:

کیفیت مدل ساخته شده خوب ارزیابی می شود، زیرا از 8-10٪ تجاوز نمی کند.

3. ما اهمیت معادله رگرسیون را با استفاده از معیار فیشر برآورد خواهیم کرد. ارزش واقعی - معیارها:

مقدار جدولی این معیار در سطح پنج درصد معنی‌داری و درجات آزادی است. از آنجایی که معادله رگرسیون از نظر آماری معنی دار در نظر گرفته می شود.

تخمین زدن اهمیت آماریپارامترهای رگرسیون با استفاده از آمار دانشجویی و با محاسبه فاصله اطمینان برای هر یک از شاخص ها انجام می شود.

مقدار جدولی معیار برای تعداد درجات آزادی و خواهد بود.

بیایید خطاهای تصادفی را تعریف کنیم:

مقادیر واقعی -statistics از مقدار جدول بیشتر است:

بنابراین، پارامترها و به طور تصادفی با صفر تفاوت ندارند، اما از نظر آماری معنادار هستند. بیایید فواصل اطمینان را برای پارامترهای رگرسیون و. برای انجام این کار، خطای حاشیه ای را برای هر نشانگر تعریف می کنیم:

فاصله اطمینان:

تجزیه و تحلیل مرزهای بالایی و پایینی فواصل اطمینان به این نتیجه می رسد که با یک احتمال، پارامترها و با قرار گرفتن در مرزهای نشان داده شده، مقادیر صفر را نمی گیرند، یعنی. از نظر آماری معنی دار نیستند و تفاوت معنی داری با صفر دارند.

4. تخمین های بدست آمده از معادله رگرسیون به ما امکان می دهد از آن برای پیش بینی استفاده کنیم. اگر مقدار پیش‌بینی حداقل معیشت:

سپس ارزش پیش بینی شده دستمزدها به صورت زیر خواهد بود:

خطای پیش بینی این خواهد بود:

خطای پیش‌بینی حاشیه‌ای که در مواردی از آن فراتر نمی‌رود، به صورت زیر خواهد بود:

فاصله اطمینان پیش بینی:

پیش بینی برآورده شده متوسط ​​حقوق ماهانه قابل اعتماد است () و در محدوده 131.66 روبل است. تا 190.62 روبل. در پایان، داده های اولیه و خط مستقیم نظری را روی همان نمودار رسم می کنیم (شکل 1).

تصویر 1

میزبانی شده در Allbest.ru

اسناد مشابه

    ساختمان معادله خطیرگرسیون جفتی، محاسبه ضریب خطی همبستگی جفت و میانگین خطای تقریب. تعیین ضرایب همبستگی و کشش، شاخص همبستگی، ماهیت کاربرد معیار فیشر در اقتصاد سنجی.

    تست، اضافه شده در 2010/05/05

    محاسبه پارامترهای رگرسیون خطی زوجی. ارزیابی معناداری آماری معادله رگرسیون و پارامترهای آن با استفاده از آزمون های فیشر و دانشجو. ساخت ماتریسی از ضرایب همبستگی زوجی. تحلیل آماریبا استفاده از PPP MS EXCEL.

    تست، اضافه شده در 2008/05/14

    محاسبه ضریب خطی جفت و همبستگی جزئی. اهمیت آماری پارامترهای رگرسیون و همبستگی. تجزیه و تحلیل زمینه داده های همبستگی. دقت پیش بینی، محاسبه خطا و فاصله اطمینان. ضریب تعیین چندگانه.

    کار کنترل، اضافه شده در 12/11/2010

    تفسیر اقتصادی ضریب رگرسیون. یافتن مجموع مربعات باقیمانده و تخمین واریانس باقیمانده ها. بررسی معنی داری پارامترهای معادله رگرسیون با استفاده از آزمون t-student. محاسبه میانگین خطای مربوطهتقریب ها

    تست، اضافه شده در 2010/03/23

    ایجاد فاصله اطمینان برای ضریب رگرسیون. تعیین خطای تقریب، شاخص همبستگی و آزمون F فیشر. ارزیابی کشش تغییرات در مصرف مواد محصولات. ساخت یک معادله رگرسیون چندگانه خطی.

    تست، اضافه شده در 04/11/2015

    محاسبه پارامترهای معادله رگرسیون خطی، برآورد تنگی رابطه با استفاده از شاخص های همبستگی و تعیین. تعیین میانگین خطای تقریب. پایایی آماری مدلسازی با استفاده از آزمون F فیشر و آزمون تی دانشجویی.

    تست، اضافه شده در 10/17/2009

    تعیین وابستگی کمی جرم یک حیوان خزدار به سن آن. ساخت معادله رگرسیون زوجی، محاسبه پارامترهای آن و تایید کفایت. ارزیابی اهمیت آماری پارامترهای رگرسیون، محاسبه فاصله اطمینان آنها.

    کارهای آزمایشگاهی، اضافه شده در 2014/06/02

    ساختن یک فرضیه در مورد شکل ارتباط بین درآمد نقدی سرانه و مخارج مصرف کننده در مناطق اورال و سیبری غربی فدراسیون روسیه. محاسبه پارامترهای معادلات رگرسیون زوجی، ارزیابی کیفیت آنها با استفاده از میانگین خطای تقریب.

    تست، اضافه شده در 11/05/2014

    تحلیل روش حداقل مربعات برای رگرسیون زوجی به عنوان روشی برای تخمین پارامترهای رگرسیون خطی. در نظر گرفتن معادله خطی رگرسیون زوجی. مطالعه رگرسیون خطی چندگانه. بررسی خطاهای ضرایب رگرسیون.

    تست، اضافه شده در 2018/03/28

    ساخت میدان همبستگی. محاسبه پارامترهای معادلات رگرسیون زوجی. وابستگی میانگین امید به زندگی به برخی عوامل. بررسی «معیار فیشر». ارزیابی تنگی اتصال با استفاده از شاخص های همبستگی و تعیین.

معادله رگرسیون جفت.

بر اساس میدان همبستگی، می توان (برای جمعیت عمومی) فرض کرد که رابطه بین تمام مقادیر ممکن X و Y خطی است.

معادله رگرسیون خطی y = bx + a + ε است

سیستم معادلات عادی

a n + b∑x = ∑y

a∑x + b∑x 2 = ∑y x

برای داده های ما، سیستم معادلات شکل دارد

12a + 1042 b = 1709

1042 a + 91556 b = 149367

از معادله اول که بیان می کنیم آو معادله دوم را جایگزین کنید:

ما ضرایب رگرسیون تجربی را دریافت می کنیم: b = 0.9، a = 64.21

معادله رگرسیون (معادله رگرسیون تجربی):

y = 0.9 x + 64.21

ضرایب رگرسیون تجربی آو بفقط تخمینی از ضرایب نظری β i هستند و خود معادله فقط روند کلی در رفتار متغیرهای مورد بررسی را منعکس می کند.

برای محاسبه پارامترهای رگرسیون خطی، یک جدول محاسباتی می سازیم (جدول 1).

1. پارامترهای معادله رگرسیون.

معنی نمونه.

واریانس های نمونه:

انحراف معیار

1.1. ضریب همبستگی

کوواریانس.

ما شاخص نزدیکی ارتباطات را محاسبه می کنیم. چنین شاخصی یک ضریب همبستگی خطی انتخابی است که با فرمول محاسبه می شود:

1.2. معادله رگرسیون(ارزیابی معادله رگرسیون).

معادله رگرسیون خطی y = 0.9 x + 64.21 است

1.3. ضریب الاستیسیته.

ضریب کشش با فرمول بدست می آید:

1.4. خطای تقریب.

خطای تقریب در محدوده 7-5 درصد نشان دهنده انتخاب خوب معادله رگرسیون به داده های اصلی است.

1.5. رابطه همبستگی تجربی.

نسبت همبستگی تجربی برای همه اشکال اتصال محاسبه می شود و برای اندازه گیری نزدیکی وابستگی به کار می رود. تغییرات درون .

شاخص همبستگی.

برای رگرسیون خطی، شاخص همبستگی برابر با ضریب همبستگی r xy = 0.79 است.

برای هر شکلی از وابستگی، تنگی اتصال با استفاده از آن تعیین می شود ضریب همبستگی چندگانه:

1.6. ضریب تعیین.

اغلب، با ارائه تفسیری از ضریب تعیین، به صورت درصد بیان می شود.

R2 = 0.792 = 0.62

برای ارزیابی کیفیت پارامترهای رگرسیون خطی، یک جدول محاسباتی می سازیم (جدول 2)

2. برآورد پارامترهای معادله رگرسیون.

2.1. اهمیت ضریب همبستگی.

به منظور آزمون فرضیه صفر در سطح معناداری α که ضریب همبستگی کلی یک متغیر تصادفی دو بعدی نرمال برابر با صفر با فرضیه رقیب H 1 ≠ 0 است، لازم است مقدار مشاهده شده معیار محاسبه شود.

و طبق جدول نقاط بحرانیتوزیع دانش آموز، با توجه به سطح اهمیت α و تعداد درجات آزادی k = n - 2، نقطه بحرانی t منطقه بحرانی دو طرفه را پیدا می کند. اگر t obs< t крит оснований отвергнуть нулевую гипотезу. Если |t набл | >t crit - فرضیه صفر رد می شود.

با توجه به جدول Student با سطح معنی داری 0.05=α و درجه آزادی k=10، t کریت را پیدا می کنیم:

که m = 1 تعداد متغیرهای توضیحی است.

2.2. برآورد فاصله برای ضریب همبستگی (فاصله اطمینان).

2.3. تجزیه و تحلیل دقت تعیین برآورد ضرایب رگرسیون.

تخمین بی طرفانه واریانس اغتشاشات مقدار:

S 2 y = 53.63 - واریانس غیر قابل توضیح (معیار پراکندگی متغیر وابسته در اطراف خط رگرسیون).

S y = 7.32 - خطای استاندارد برآورد (خطای استاندارد رگرسیون).

سا- انحراف معیارمتغیر تصادفی a.

S b - انحراف معیار متغیر تصادفی b.

2.4. فواصل اطمینان برای متغیر وابسته.

(a + bx p ± ε)

اجازه دهید مرزهای فاصله ای را محاسبه کنیم که در آن 95٪ از مقادیر ممکن Y با تعداد نامحدود مشاهدات متمرکز می شود و X p = 107

فواصل اطمینان فردی برای Y با توجه به مقدار X.

(a + bx i ± ε)

t crit (n-m-1;α/2) = (10;0.025) = 2.228

2.5. آزمون فرضیه ها در رابطه با ضرایب معادله رگرسیون خطی.

1) آمار t. معیار دانش آموز.

t crit (n-m-1;α/2) = (10;0.025) = 2.228

فاصله اطمینان برای ضرایب معادله رگرسیون.

(b - t crit S b؛ b + t crit S b)

(a - t crit S a؛ a + t crit S a)

2) آمار F. معیار فیشر

مقدار جدولی معیار با درجه آزادی k 1 \u003d 1 و k 2 \u003d 10 ، جدول F \u003d 4.96

رگرسیون خطی جفت شده

کارگاه

اتاق بخار رگرسیون خطی: کارگاه. -

مطالعه اقتصاد سنجی شامل کسب تجربه در ساخت مدل های اقتصادسنجی، تصمیم گیری در مورد مشخصات و شناسایی یک مدل، انتخاب روشی برای تخمین پارامترهای مدل، ارزیابی کیفیت آن، تفسیر نتایج، به دست آوردن تخمین های پیش بینی و غیره است. این کارگاه به دانشجویان کمک خواهد کرد. مهارت های عملی را در این موارد کسب کنید.

مصوب شورای تحریریه و انتشارات

گردآوری شده توسط: M.B. پرووا، دکترای اقتصاد، پروفسور

مقررات عمومی

تحقیقات اقتصاد سنجی با نظریه ای آغاز می شود که روابط بین پدیده ها را ایجاد می کند. از کل طیف عوامل مؤثر بر ویژگی مؤثر، مهم ترین عوامل متمایز می شوند. پس از مشخص شدن وجود رابطه بین ویژگی های مورد مطالعه، شکل دقیق این رابطه با استفاده از تحلیل رگرسیون مشخص می شود.

تجزیه و تحلیل رگرسیونشامل تعریف یک عبارت تحلیلی (در تعریف یک تابع) است که در آن تغییر در یک مقدار (ویژگی حاصل) به دلیل تأثیر یک مقدار مستقل (ویژگی فاکتوریال) است. این رابطه را می توان با ساخت یک معادله رگرسیون یا یک تابع رگرسیون کمی سازی کرد.

مدل رگرسیون پایه یک مدل رگرسیون زوجی (تک عاملی) است. رگرسیون جفت– معادله اتصال دو متغیر درو ایکس:

جایی که - متغیر وابسته (علامت حاصل)؛

– متغیر مستقل و توضیحی (ویژگی فاکتوریال).

بسته به ماهیت تغییر دربا تغییر ایکسبین رگرسیون خطی و غیر خطی تمایز قائل شوید.

رگرسیون خطی

این تابع رگرسیون یک چند جمله ای درجه اول نامیده می شود و برای توصیف فرآیندهایی که به طور یکنواخت در زمان توسعه می یابند استفاده می شود.

داشتن یک عضو تصادفی (خطاهای رگرسیون) با تأثیر بر متغیر وابسته عوامل دیگری که در معادله در نظر گرفته نشده اند، با غیرخطی بودن احتمالی مدل، خطاهای اندازه گیری همراه است، بنابراین، ظاهر معادله خطای تصادفیرگرسیون ممکن است به دلیل هدف زیر باشد دلایل:

1) غیر نمایندگی بودن نمونه. مدل رگرسیون زوجی شامل عاملی است که قادر به توضیح کامل تغییر در متغیر نتیجه نیست، که ممکن است تحت تأثیر بسیاری از عوامل دیگر (متغیرهای گمشده) تا حد بسیار بیشتری قرار گیرد. اشتغال، دستمزد ممکن است علاوه بر مدارک تحصیلی، به سطح تحصیلات، تجربه کاری، جنسیت و غیره بستگی داشته باشد.

2) این احتمال وجود دارد که متغیرهای درگیر در مدل به اشتباه اندازه گیری شوند. برای مثال، داده‌های مربوط به هزینه‌های غذایی خانواده از سوابق شرکت‌کنندگان در نظرسنجی جمع‌آوری می‌شود، که انتظار می‌رود هزینه‌های روزانه خود را به دقت ثبت کنند. البته این می تواند منجر به خطا شود.

بر اساس مشاهدات نمونه، معادله رگرسیون نمونه برآورد می شود ( خط رگرسیون):

,

جایی که
- تخمین پارامترهای معادله رگرسیون (
).

شکل تحلیلی وابستگیبین جفت ویژگی های مورد مطالعه (تابع رگرسیون) با استفاده از موارد زیر تعیین می شود مواد و روش ها:

    بر اساس تحلیل نظری و منطقیماهیت پدیده های مورد مطالعه، ماهیت اجتماعی-اقتصادی آنها. به عنوان مثال، اگر رابطه بین درآمد جمعیت و حجم سپرده های مردم در بانک ها بررسی شود، آشکار است که رابطه مستقیم است.

    روش گرافیکیزمانی که ماهیت رابطه به صورت بصری ارزیابی می شود.

این وابستگی را می توان به وضوح مشاهده کرد اگر با ترسیم مقدار مشخصه در محور x یک نمودار بسازید. ایکسو در محور y - مقادیر ویژگی در. قرار دادن نقاط مربوط به مقادیر روی نمودار ایکسو در، ما گرفتیم زمینه همبستگی:

الف) اگر نقاط به طور تصادفی در سراسر میدان پراکنده شوند، این نشان دهنده عدم وجود رابطه بین این ویژگی ها است.

ب) اگر نقاط حول محوری متمرکز شوند که از گوشه پایین سمت چپ به سمت راست بالا امتداد دارد، آنگاه رابطه مستقیمی بین علائم وجود دارد.

ج) اگر نقاط حول محوری متمرکز شوند که از گوشه سمت چپ بالا به سمت راست پایین حرکت می کند، پس رابطه معکوسبین نشانه ها

اگر نقاط میدان همبستگی را با پاره های خط مستقیم وصل کنیم، یک خط شکسته با یک روند صعودی مشخص به دست می آید. این یک پیوند تجربی خواهد بود یا خط رگرسیون تجربی. با ظاهر آن می توان نه تنها حضور، بلکه شکل رابطه بین ویژگی های مورد مطالعه را نیز قضاوت کرد.

ساخت یک معادله رگرسیون زوجی

ساخت معادله رگرسیون به تخمین پارامترهای آن کاهش می یابد. این تخمین پارامترها را می توان به روش های مختلفی یافت. یکی از آنها روش حداقل مربعات (LSM) است. ماهیت روش به شرح زیر است. هر مقدار با مقدار تجربی (مشاهده شده) مطابقت دارد . با ساختن یک معادله رگرسیون، به عنوان مثال، یک معادله خط مستقیم، هر مقدار با مقدار نظری (محاسبه شده) مطابقت دارد . مقادیر مشاهده شده دقیقاً روی خط رگرسیون دراز نکشید، یعنی. مطابقت ندارد . تفاوت بین مقادیر واقعی و محاسبه شده متغیر وابسته نامیده می شود باقی مانده:

LSM به شما امکان می دهد چنین تخمین هایی از پارامترها را بدست آورید که در آن مجموع انحرافات مجذور مقادیر واقعی ویژگی مؤثر است. دراز نظری ، یعنی مجموع مربعات باقیمانده، حداقل:

برای معادلات خطی و معادلات غیرخطی قابل تقلیل به خطی، سیستم زیر با توجه به آو ب:

جایی که n- اندازهی نمونه.

با حل سیستم معادلات، مقادیر را به دست می آوریم آو ب، که به ما امکان نوشتن را می دهد معادله رگرسیون(معادله رگرسیون):

جایی که متغیر توضیحی (مستقل) است.

متغیر توضیح داده شده (وابسته)؛

خط رگرسیون از نقطه ( ,) و برابری ها برآورده می شوند:

می توانید از فرمول های آماده استفاده کنید که از این سیستم معادلات به دست می آید:

جایی که - مقدار متوسط ​​ویژگی وابسته؛

مقدار متوسط ​​یک ویژگی مستقل است.

میانگین حسابی حاصل ضرب ویژگی های وابسته و مستقل است.

واریانس یک ویژگی مستقل است.

کوواریانس بین ویژگی های وابسته و مستقل است.

کوواریانس نمونهدو متغیر ایکس, درتماس گرفت مقدار متوسطحاصل ضرب انحراف این متغیرها از میانگین آنها

پارامتر بدر ایکساهمیت عملی زیادی دارد و ضریب رگرسیون نامیده می شود. ضریب رگرسیوننشان می دهد که مقدار به طور متوسط ​​چند واحد تغییر می کند در ایکس 1 واحد اندازه گیری آن

علامت پارامتر بدر معادله رگرسیون زوجی جهت رابطه را نشان می دهد:

اگر
، سپس رابطه بین شاخص های مورد مطالعه مستقیم است، یعنی. با افزایش علامت عامل ایکسعلامت حاصل افزایش می یابد در، و بالعکس؛

اگر
، سپس رابطه بین شاخص های مورد مطالعه معکوس است، یعنی. با افزایش علامت عامل ایکسنشانه موثر درکاهش می یابد و بالعکس.

مقدار پارامتر آدر معادله رگرسیون جفتی در برخی موارد می توان به عنوان مقدار اولیه ویژگی موثر تفسیر شد در. این تفسیر از پارامتر آتنها در صورتی امکان پذیر است که مقدار
معنی دارد.

پس از ساخت معادله رگرسیون، مقادیر مشاهده شده yمی توان چنین تصور کرد:

باقی و همچنین خطاها ، هستند متغیرهای تصادفی، اما آنها در مقابل خطاها ، قابل مشاهده باقیمانده آن قسمت از متغیر وابسته است y، که با معادله رگرسیون قابل توضیح نیست.

بر اساس معادله رگرسیون می توان محاسبه کرد ارزش های نظری ایکسبرای هر ارزشی ایکس.

در تحلیل اقتصادی، اغلب از مفهوم کشش یک تابع استفاده می شود. قابلیت ارتجاعی عملکرد
به عنوان تغییر نسبی محاسبه می شود yبه تغییر نسبی ایکس. الاستیسیته نشان می دهد که عملکرد چقدر تغییر می کند
زمانی که متغیر مستقل 1% تغییر کند.

از آنجایی که کشش یک تابع خطی است
ثابت نیست، اما بستگی دارد ایکس، سپس ضریب کشش معمولاً به عنوان میانگین شاخص کشش محاسبه می شود.

ضریب الاستیسیتهنشان می دهد که مقدار مشخصه مؤثر به طور متوسط ​​در مجموع چند درصد تغییر می کند درهنگام تغییر علامت فاکتور ایکس 1% از مقدار متوسط ​​آن:

جایی که
- مقادیر متوسط ​​متغیرها ایکسو دردر نمونه

ارزیابی کیفیت مدل رگرسیون ساخته شده

کیفیت مدل رگرسیون- کفایت مدل ساخته شده به داده های اولیه (مشاهده شده).

برای اندازه گیری تنگی اتصال، به عنوان مثال. برای اندازه گیری میزان نزدیک بودن آن به عملکرد، باید واریانسی را که انحرافات را اندازه گیری می کند، تعیین کنید دراز جانب در ایکسو مشخص کردن تغییرات باقیمانده به دلیل عوامل دیگر. آنها زیربنای شاخص هایی هستند که کیفیت مدل رگرسیون را مشخص می کنند.

کیفیت رگرسیون زوجی با استفاده از ضرایب مشخص کننده تعیین می شود

1) تنگی اتصال - شاخص همبستگی، ضریب همبستگی خطی جفت.

2) خطای تقریب؛

3) کیفیت معادله رگرسیون و پارامترهای فردی آن - میانگین مربعات خطاهای معادله رگرسیون به عنوان یک کل و پارامترهای فردی آن.

برای معادلات رگرسیون از هر نوعی تعریف شده است شاخص همبستگی، که فقط تنگی وابستگی همبستگی را مشخص می کند، یعنی. درجه تقریب آن به یک اتصال عملکردی:

,

جایی که - واریانس فاکتوریل (نظری)؛

واریانس کل است.

شاخص همبستگی مقادیری را می گیرد
، که در آن،

اگر

اگر
رابطه بین ویژگی ها است ایکسو درعملکردی است، نزدیک تر است تا 1، هر چه رابطه نزدیک‌تر بین صفات مورد مطالعه در نظر گرفته شود. اگر یک
، پس رابطه را می توان نزدیک در نظر گرفت

واریانس های مورد نیاز برای محاسبه شاخص های تنگی اتصال محاسبه می شود:

واریانس کل، که تغییرات کل را به دلیل عملکرد همه عوامل اندازه گیری می کند:

واریانس عاملی (نظری)،اندازه گیری تنوع صفت حاصل دربه دلیل عمل یک علامت عامل ایکس:

پراکندگی باقیمانده، که تنوع این صفت را مشخص می کند دربه دلیل همه عوامل به جز ایکس(یعنی با مستثنی شدگان ایکس):

سپس طبق قاعده جمع واریانس:

کیفیت اتاق بخار خطیرگرسیون را می توان با استفاده از ضریب همبستگی خطی زوجی:

,

جایی که
- کوواریانس متغیرها ایکسو در;

- انحراف استاندارد یک ویژگی مستقل؛

انحراف معیار ویژگی وابسته است.

ضریب همبستگی خطی تنگی و جهت رابطه بین ویژگی های مورد مطالعه را مشخص می کند. در [-1; +1]:

اگر
- پس رابطه بین علائم مستقیم است.

اگر
- پس رابطه بین علائم معکوس است.

اگر
- پس هیچ ارتباطی بین علائم وجود ندارد;

اگر
یا
- پس رابطه بین ویژگی ها کاربردی است، یعنی. با تطابق کامل بین ایکسو در. نزدیکتر تا 1، هر چه رابطه نزدیک‌تر بین صفات مورد مطالعه در نظر گرفته شود.

اگر شاخص همبستگی (ضریب همبستگی خطی زوجی) مجذور شود، ضریب تعیین به دست می آید.

ضریب تعیین- سهم واریانس عامل را در کل نشان می دهد و نشان می دهد که چند درصد تغییرات صفت حاصل را نشان می دهد دربا تغییر صفت عامل توضیح داده می شود ایکس:

این همه تغییرات را پوشش نمی دهد. دراز یک صفت عاملی ایکس، اما فقط آن قسمت از آن که با معادله رگرسیون خطی مطابقت دارد، یعنی. وزن مخصوص تغییرات صفت حاصل را نشان می دهد که به طور خطی با تغییرات صفت عامل مرتبط است.

ارزش
- نسبت تغییرات صفت حاصل که مدل رگرسیون نتوانست آن را در نظر بگیرد.

پراکندگی نقاط در میدان همبستگی می‌تواند بسیار زیاد باشد و معادله رگرسیون محاسبه‌شده می‌تواند خطای بزرگی در تخمین شاخص تحلیل‌شده بدهد.

میانگین خطای تقریبمیانگین انحراف مقادیر محاسبه شده از مقادیر واقعی را نشان می دهد:

حداکثر مقدار مجاز 12-15٪ است.

خطای استاندارد به‌عنوان اندازه‌گیری پراکندگی متغیر وابسته در اطراف خط رگرسیون استفاده می‌شود. برای کل مجموعه مقادیر مشاهده‌شده، استاندارد (rms) خطای معادله رگرسیون، که انحراف معیار مقادیر واقعی است درنسبت به مقادیر نظری محاسبه شده توسط معادله رگرسیون در ایکس .

,

جایی که
تعداد درجات آزادی است.

مترتعداد پارامترهای معادله رگرسیون (برای معادله خط مستقیم متر=2).

مقدار میانگین را تخمین بزنید خطای درجه دوممی توانید آن را مقایسه کنید

الف) با مقدار متوسط ​​ویژگی مؤثر در;

ب) با انحراف معیار ویژگی در:

اگر
، پس استفاده از این معادله رگرسیون مناسب است.

به طور جداگانه ارزیابی می شود استاندارد (rms) خطاهای پارامترهای معادله و شاخص همبستگی:

;
;
.

ایکس- انحراف معیار ایکس.

بررسی اهمیت معادله رگرسیون و شاخص های تنگی اتصال

برای اینکه از مدل ساخته شده برای محاسبات اقتصادی بیشتر استفاده شود، بررسی کیفیت مدل ساخته شده کافی نیست. همچنین لازم است اهمیت (اهمیت) برآوردهای معادله رگرسیون و نشانگر نزدیکی اتصال به دست آمده با استفاده از روش حداقل مربعات بررسی شود. لازم است آنها را از نظر انطباق با پارامترهای واقعی رابطه بررسی کنید.

این به دلیل این واقعیت است که شاخص های محاسبه شده برای یک جمعیت محدود عنصر تصادفی ذاتی در مقادیر فردی ویژگی را حفظ می کنند. بنابراین، آنها فقط تخمینی از یک نظم آماری معین هستند. ارزیابی میزان دقت و اهمیت (قابلیت اطمینان، اهمیت) پارامترهای رگرسیون ضروری است. زیر اهمیتدرک این احتمال که مقدار پارامتر بررسی شده برابر با صفر نیست، مقادیر علائم مخالف را شامل نمی شود.

آزمون اهمیت- بررسی این فرض که پارامترها با صفر متفاوت هستند.

ارزیابی اهمیت معادله رگرسیون زوجیبه آزمایش فرضیه هایی در مورد اهمیت معادله رگرسیون به عنوان یک کل و پارامترهای فردی آن می رسد ( آ, بجفت ضریب تعیین یا شاخص همبستگی.

در این صورت می توان موارد زیر را مطرح کرد فرضیه های اصلیاچ 0 :

1)
- ضرایب رگرسیون ناچیز و معادله رگرسیون نیز ناچیز است.

2)
– ضریب تعیین جفت ناچیز و معادله رگرسیون نیز ناچیز است.

جایگزین (یا معکوس) فرضیه های زیر است:

1)
- ضرایب رگرسیون به طور قابل توجهی با صفر متفاوت است و معادله رگرسیون ساخته شده معنادار است.

2)
- ضریب تعیین جفت با صفر تفاوت معنی داری دارد و معادله رگرسیون ساخته شده معنادار است.

آزمون فرضیه اهمیت معادله رگرسیون زوجی

برای آزمون فرضیه عدم اهمیت آماری معادله رگرسیون به عنوان یک کل و ضریب تعیین، از اف-معیار(معیار فیشر):

یا

جایی که ک 1 = متر–1 ; ک 2 = nمتر تعداد درجات آزادی است.

nتعداد واحدهای جمعیتی است؛

مترتعداد پارامترهای معادله رگرسیون است.

- پراکندگی عامل؛

واریانس باقیمانده است.

فرضیه به صورت زیر آزمایش می شود:

1) اگر مقدار واقعی (مشاهده شده). اف-معیار از مقدار بحرانی (جدول) این معیار بیشتر است
، سپس با احتمال
فرضیه اصلی در مورد بی اهمیت بودن معادله رگرسیون یا ضریب تعیین جفت رد شده و معادله رگرسیون معنی دار تشخیص داده می شود.

2) اگر مقدار واقعی (مشاهده شده) معیار F کمتر از مقدار بحرانی این معیار باشد.
، سپس با احتمال (
) فرضیه اصلی در مورد بی اهمیت بودن معادله رگرسیون یا ضریب تعیین جفت پذیرفته شده و معادله رگرسیون ساخته شده ناچیز تشخیص داده می شود.

ارزش بحرانی اف- معیار با توجه به جداول مربوطه بسته به سطح اهمیت یافت می شود و تعداد درجات آزادی
.

تعداد درجات آزادی- نشانگر، که به عنوان تفاوت بین حجم نمونه تعریف می شود ( n) و تعداد پارامترهای تخمین زده شده برای این نمونه ( متر). برای مدل رگرسیون زوجی، تعداد درجات آزادی به صورت محاسبه می شود
از آنجایی که دو پارامتر از نمونه تخمین زده می شود (
).

سطح اهمیت - مقدار تعیین شده
,

جایی که احتمال اطمینان است که پارامتر برآورد شده در فاصله اطمینان قرار می گیرد. معمولا 0.95 گرفته می شود. به این ترتیب احتمال این است که پارامتر برآورد شده در فاصله اطمینان برابر با 0.05 (5%) قرار نگیرد.

سپس در صورت ارزیابی اهمیت معادله رگرسیون زوجی، مقدار بحرانی معیار F به صورت محاسبه می شود.
:

.

آزمون فرضیه معنی دار بودن پارامترهای معادله رگرسیون زوجی و شاخص همبستگی

هنگام بررسی اهمیت پارامترهای معادله (فرض تفاوت پارامترها با صفر)، فرضیه اصلی در مورد بی اهمیت بودن برآوردهای به دست آمده مطرح می شود.
. به عنوان یک فرضیه جایگزین (معکوس) در مورد اهمیت پارامترهای معادله (
).

برای آزمون فرضیه های پیشنهادی از تی -معیار (تی-آمار) دانشجو. ارزش مشاهده شده تی-معیار با مقدار مقایسه می شود تی-معیار تعیین شده توسط جدول توزیع دانشجو (مقدار بحرانی). ارزش بحرانی تی- شاخص
به دو پارامتر بستگی دارد: سطح معناداری و تعداد درجات آزادی
.

فرضیه های پیشنهادی به صورت زیر مورد آزمون قرار می گیرند:

1) اگر مدول مقدار مشاهده شده تی- معیار بزرگتر از مقدار بحرانی است تی-معیارها، یعنی
، سپس با احتمال
فرضیه اصلی در مورد بی اهمیت بودن پارامترهای رگرسیون رد می شود، یعنی. پارامترهای رگرسیون برابر با 0 نیستند.

2) اگر مدول مقدار مشاهده شده تی- معیار کمتر یا مساوی با مقدار بحرانی باشد تی-معیارها، یعنی
، سپس با احتمال
فرضیه اصلی در مورد بی اهمیت بودن پارامترهای رگرسیون پذیرفته می شود، یعنی. پارامترهای رگرسیون تقریباً با 0 تفاوت ندارند یا برابر با 0 هستند.

ارزیابی اهمیت ضرایب رگرسیون با استفاده از آزمون دانشجویی با مقایسه برآوردهای آنها با مقدار خطای استاندارد انجام می شود:

;

برای ارزیابی معناداری آماری شاخص (ضریب خطی) همبستگی نیز از آن استفاده می شود. تی-معیار دانش آموزی

رگرسیون خطی جفت شده

محاسبات اولیه:

;
;
;
;
;

;
.

ساخت جدول دید

منظور داشتن

فرمول های محاسبه پارامترها:

,
.

خطی

تخمین تنگی ارتباط:

الف) ضریب همبستگی
، یا
;

برای انتخاب رایانه، از عملکرد داخلی استفاده کنید همبستگی

ب) ضریب کشسانی
;

ج) ضریب تعیین .

ارزیابی اهمیت معادله رگرسیون به عنوان یک کل:

محاسبات اولیه با ساخت جدول فرم

آ) اف - معیار فیشربا تعداد درجات آزادی
و
و سطح معنی داری 0.05، جدول را ببینید. ارزش تخمینی معیار:

.

اگر مقدار محاسبه شده از معیار F بزرگتر از جدول جدول باشد، فرضیه صفر در مورد عدم وجود رابطه معنی دار ویژگی ها وجود دارد. ایکسو y رد می شود و در مورد اهمیت این رابطه نتیجه گیری می شود.

ب) میانگین خطای تقریب

.

برآورد اهمیت پارامترهای رگرسیون:

الف) خطای استاندارد پارامتر آ با فرمول محاسبه می شود

، جایی که
.

ب) خطای استاندارد ضریب رگرسیون ببا فرمول محاسبه می شود

.

ج) خطای استاندارد ضریب همبستگی با فرمول محاسبه می شود

.

تی-معیار دانش آموز با تعداد درجات آزادی
و سطح معنی داری 0.05، جدول را ببینید.

ارزش های واقعی تی- آمار:

,
,
.

اگر مقدار واقعی از مقدار جدول در مقدار مطلق بیشتر شود، فرضیه ناچیز بودن پارامتر رگرسیون را می توان رد کرد، پارامتر به عنوان معنی دار شناخته می شود.

اتصال بیناف - معیار فیشر و تی -معیار دانش آموزیبا برابری بیان می شود

.

محاسبه فواصل اطمینان برای پارامترهای رگرسیون:

فاصله اطمینان برای پارامتر آ که تعریف میشود
;

فاصله اطمینان برای ضریب رگرسیون که تعریف میشود
.

استفاده در اکسل برای تجزیه و تحلیل کامپیوتری سرویس / تجزیه و تحلیل داده ها / رگرسیون.

پیش بینی فاصله بر اساس معادله رگرسیون خطی:

اجازه دهید - ارزش پیش بینی ویژگی عامل؛
- پیش بینی نقطه ای از ویژگی موثر. سپس

الف) میانگین خطای پیش بینی :

;

ب) فاصله اطمینان پیش بینی

با استفاده از ویرایشگر صفحه گستردهام‌اس برتری داشتن

فعال سازی افزونهبسته تحلیلی

برای فعال کردن یک افزونه بسته تحلیلیشما باید موارد زیر را انجام دهید:

1. یک تیم انتخاب کنید خدمات/افزونه ها.

2. در کادر محاوره ای که ظاهر می شود، کادر را علامت بزنید بسته تحلیلی

مطابق با گزینه انتساب، با استفاده از مواد آماری، لازم است:

2. نزدیکی رابطه بین متغیر وابسته (عامل حاصل) و متغیر توضیحی را با استفاده از شاخص های همبستگی و تعیین ارزیابی کنید.

3. با اف- پایایی آماری معیار فیشر مدلسازی.

4. اهمیت آماری پارامترهای رگرسیون و همبستگی را ارزیابی کنید.

5. میانگین خطای تقریب را تعیین کنید.

6. با استفاده از ضریب کشش، تأثیر عامل توضیحی بر نتیجه را کمی کنید.

7. پیش بینی نقطه ای و بازه ای یک ویژگی حاصل را با افزایش ویژگی توضیحی به میزان 25 درصد از مقدار متوسط ​​آن (95 درصد قابلیت اطمینان پیش بینی) انجام دهید.

8. فیلد همبستگی داده های اولیه و خط رگرسیون را در یک نمودار نشان دهید.

مثال

داده ها در مورد هزینه سالانه برنامه کارشناسی ارشد مدیریت بازرگانی و تعداد دانشجویان در یک موسسه آموزشی موجود است.

I. وارد کردن داده های اولیه در سند برتری داشتن.

II. ما افزونه را صدا می زنیم تحلیل داده هادر منو سرویس.

III. انتخاب یک ابزار پسرفت.

IV. موقعیت های پنجره مناسب را پر کنید پسرفت.

V. پس از کلیک بر روی OK، یک پروتکل برای حل مشکل دریافت می کنیم.

VI. ما پروتکل دریافتی را تجزیه و تحلیل می کنیم.

1) ضریب رگرسیون;

ترم آزاد معادله رگرسیون
.

توجه داشته باشید. در صورت لزوم، نتایج به دقت مورد نظر گرد می شوند. الزام گرد کردن را می توان در ابتدا با تنظیم تعداد ارقام اعشار در منو انجام داد قالب سلولی

معادله رگرسیون خطی زوجی به شکل زیر است: .

2) ضریب همبستگی
، نشان دهنده رابطه نزدیک بین صفات است yو ایکس. ضریب تعیین
. معادله رگرسیون حاصل 53 درصد از تغییرات ویژگی را توضیح می دهد y 47 درصد باقیمانده از تغییرپذیری این ویژگی به دلیل تأثیر عواملی است که در مدل لحاظ نشده است.

3) اهمیت آماری (پایایی شبیه سازی) معادله را به عنوان یک کل ارزیابی کنید. مقدار محاسبه شده معیار فیشر در پروتکل نشان داده شده است،
. مقدار بحرانی این معیار را می توان با استفاده از تابع آماری یافت افتوزیعویرایشگر صفحه گسترده Excel.

پارامترهای ورودی این تابع عبارتند از:

- سطح معنی داری (احتمال)، به معنای احتمال خطا برای رد فرضیه صحیح در مورد بی اهمیت بودن آماری معادله رگرسیون ساخته شده. به عنوان یک قاعده، سطح معنی داری 0.05 یا 0.01 انتخاب می شود.

– تعداد درجات آزادی 1 – منطبق بر تعداد پارامترهای متغیر در معادله رگرسیون، برای رگرسیون خطی زوجی
این عدد برابر با یک است.

– تعداد درجات آزادی 2 برابر است با رگرسیون خطی زوجی
، جایی که n- حجم داده های آماری اولیه

انجام اقدامات درج / تابع، یکی را که می خواهید انتخاب کنید.

از آنجایی که مقدار محاسبه شده معیار F بزرگتر از جدولی برابر با 84/4 است، فرضیه صفر مبنی بر عدم وجود رابطه معنی دار بین ویژگی های x و y رد شده و در مورد معنی دار بودن این رابطه نتیجه گیری می شود.

4) اهمیت آماری پارامترها را ارزیابی کنید آو بدر معادله رگرسیون با استفاده از تی- ملاک دانشجو.

مقادیر تخمینی آمار دانشجویی
,
. مقدار جدول مربوطه را می توان با استفاده از تابع آماری تعیین کرد STUDRASPOBR، تعداد درجات آزادی است
.

از آنجایی که مقادیر واقعی در مقدار مطلق بیش از مقدار جدولی برابر با 2.2 است، فرضیه ناچیز بودن پارامترهای رگرسیون را می توان رد کرد.

5) میانگین خطای تقریب را تعیین کنید،
. شما باید محاسبات کمکی را که در قالب یک جدول ترسیم شده است انجام دهید.

بنابراین، میانگین خطای تقریب برای این معادله رگرسیون 12.66 درصد است، مدل رگرسیون خطی زوجی را می توان رضایت بخش و مناسب برای پیش بینی در نظر گرفت.

6) ارزیابی کمی از تأثیر عامل را انجام دهید ایکسبه ازای هر عامل yبا استفاده از ضریب کشش برای رگرسیون خطی زوجی، می توان آن را با فرمول پیدا کرد
. ما داریم

.

بنابراین با افزایش 1 درصدی تعداد شنوندگان، قیمت سالانه 0.4 درصد کاهش می یابد.

7) بیایید پیش بینی را محاسبه کنیم yبا فاکتور افزایشی ایکس 25 درصد از میانگین.

ارزش پیش بینی

پیش بینی نقطه ویژگی y: .

میانگین خطای پیش بینی،

جایی که
واریانس باقیمانده است،
واریانس عامل است ایکس.

مقدار عددی حاصل جمع
در پروتکل به عنوان SS باقی مانده تعیین شده است.

سپس
,
.

سریع ترین راه برای دریافت آمار ابزار - مقدار متوسط ​​فاکتور ایکسو - واریانس، از ابزار استفاده کنید آمار توصیفیدر بسته بندی تحلیل داده ها.

پروتکل خروجی نتیجه به نظر می رسد

فاصله اطمینان پیش بینی: کجا - مقدار جدولی مربوط به معیار Student (که قبلاً توسط تابع پیدا شده است STUDRASPOBR,
).

در نتیجه،

آن ها می توانید 95% مطمئن باشید که قیمت یک دوره سالانه با 35 دانشجو در محدوده های مشخص شده متفاوت خواهد بود (با پیش بینی قیمت امتیاز 3.65825 هزار دلار).

8) برای ساختن نمودار، موارد زیر را انجام دهید:

مرحله 1 درج / نمودار / نمودار

مرحله 3ردیف/افزودن/مقادیر/ستونی از مقادیر فاکتور رگرسیون را برجسته کنید .

مرحله 4برچسب های محورایکس/ ستون مقادیر را برجسته کنید ایکس.

مرحله 4به هر یک از سری ها یک نام اختصاص دهید، محورهای مختصات و نام نمودار را امضا کنید.

توجه داشته باشید.

برای رسم مقدار یک عامل ایکسباید با حفظ مقدار مربوطه به ترتیب صعودی مرتب شوند y. اینجوری میشه انجام داد داده/مرتب/ستونی را که می خواهید در آن مرتب کنید انتخاب کنید. مثلا،

وظایف برای کار مستقل

انتخاب 1

ایکس

y

گزینه 2

ایکس- نسبت قدرت به وزن در 10 شرکت، کیلووات؛

y- بهره وری نیروی کار، هزار روبل.

گزینه 3

ایکس- کیفیت زمین، امتیاز؛

y- بهره وری، c/ha.

گزینه 4

ایکس- کیفیت زمین، امتیاز؛

y- بهره وری، c/ha.

گزینه 5

ایکس- حجم معاملات؛

y- هزینه های توزیع در رابطه با گردش مالی.

گزینه 6

ایکس- توان الکتریکی به ازای هر کارگر؛

y- انتشار محصولات نهایی به ازای هر کارگر.

گزینه 7

ایکس- سطح درآمد خانواده؛

y- هزینه های غذا (به ازای هر 100 روبل درآمد).

با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

بارگذاری...