رتبه های توزیع ساخت سری های رتبه بندی شده، فاصله ای و تجمعی

یک سری تغییرات ترتیبی از مقادیر یک ویژگی هر واحد آماری در یک ترتیب معین است. در این مورد، مقادیر فردی یک ویژگی معمولاً یک نوع (نوع) نامیده می شود. . به هر یک از اعضای سری تغییرات (واریانت) آمار ترتیبی و تعداد متغیرها را رتبه (ترتیب) آمار می گویند.

مهمترین ویژگی های سری تغییرات، انواع شدید آن (X 1 = Xmin؛ X n = Xmax) و محدوده تغییرات (Rx = Xn - X 1) است.

سری های متغیر به طور گسترده ای در پردازش اولیه اطلاعات آماری به دست آمده در نتیجه استفاده می شود مشاهده آماری. آنها به عنوان مبنایی برای ساخت تابع توزیع تجربی واحدهای آماری در جامعه آماری عمل می کنند. بنابراین سری متغیر نامیده می شود ردیف های توزیع.

در آمار، او انواع زیر را از سری های متغیر متمایز می کند: رتبه بندی، گسسته، فاصله.

سری رتبه بندی شده (از لاتین rang - rank).- این مجموعه ای از توزیع واحدهای جامعه آماری است که در آن انواع صفت به ترتیب صعودی یا نزولی هستند. هر سری رتبه بندی شده از اعداد رتبه بندی (1 تا n) و نوع مربوط به آنها تشکیل شده است. تعداد گزینه‌های یک سری رتبه‌بندی که بر اساس یک ویژگی ضروری شکل می‌گیرد معمولاً برابر با تعداد واحدهای جامعه آماری است.

برای تشکیل یک سری رتبه بندی شده بر اساس معین (مثلاً بر اساس تعداد کارگران دام در 100 شرکت کشاورزی)، می توانید از طرح جدول استفاده کنید. 5.1.

T a b l e 5.1. ترتیب تشکیل یک سری رتبه بندی شده

پایان کار -

این موضوع متعلق به:

آمار

و غذای جمهوری بلاروس .. وزارت آموزش، علوم و پرسنل ..

اگر احتیاج داری مواد اضافیدر مورد این موضوع، یا آنچه را که به دنبال آن بودید پیدا نکردید، توصیه می کنیم از جستجو در پایگاه داده آثار ما استفاده کنید:

با مطالب دریافتی چه خواهیم کرد:

اگر این مطالب برای شما مفید بود، می توانید آن را در صفحه خود در شبکه های اجتماعی ذخیره کنید:

تمامی موضوعات این بخش:

شوندالوف بی.ام.
نظریه عمومی آمار. آموزشبرای تخصص های اقتصادی مؤسسات آموزش عالی کشاورزی. راهنمای مطالعه با

موضوع آمار
کلمه "statistics" از کلمه لاتین "status" (status) گرفته شده است که به معنای وضعیت، وضعیت امور است. این امکان تأکید بر جوهر شناختی نظری را فراهم می کند

ماهیت مشاهده آماری
هر مطالعه آماری، همانطور که در بالا ذکر شد (مبحث 1)، همیشه با جمع آوری اطلاعات اولیه (اولیه) در مورد هر واحد از جامعه آماری آغاز می شود. با این حال، نه همه

برنامه نظارت آماری
در فصل اول، توجه به این نکته جلب شد که هر واحد آماری به عنوان یک شیء به عنوان یک کل دارای خواص، کیفیت ها، ویژگی های خاص بسیاری است که معمولاً به آنها می گویند.

فهرستی از ویژگی های ثبت شده در طول فرآیند مشاهده معمولاً برنامه مشاهده آماری نامیده می شود.
توسعه برنامه یکی از مهمترین مسائل نظری و عملی مشاهده آماری است. کیفیت برنامه تا حد زیادی کیفیت را تعیین می کند مواد جمع آوری شده، قابلیت اطمینان آن و

اشکال مشاهده آماری
کل تنوع مشاهدات آماری به دو شکل کاهش می یابد: گزارش آماری و مشاهدات آماری سازماندهی شده خاص. گزارش آماری

فرم های آماری
فرم آماری، بانکی است حاوی سوالات برنامه آمارگیری و محلی برای پاسخگویی به آنها. فرم حامل اطلاعات آماری به دست آمده در نتیجه است

انواع مشاهدات آماری
مشاهدات آماری به انواعی طبقه بندی می شوند که ممکن است بر اساس اصول مختلف متفاوت باشند. بنابراین، بسته به میزان پوشش شی مورد مطالعه، مشاهدات آماری را می توان تقسیم بندی کرد

روشهای انجام مشاهدات آماری
مشاهدات آماری را می توان به روش های مختلفی انجام داد، که در میان آنها اغلب موارد زیر یافت می شود: گزارش، اعزامی، خود محاسبه، ثبت نام، پرسشنامه، خبرنگار.

مکان، تاریخ و دوره مشاهدات آماری
در طرح هر مشاهده آماری، محل این مشاهده باید به وضوح مشخص شود، یعنی. مکانی که اطلاعات جمع آوری شده در آن ثبت می شود، به صورت آماری پر می شود

خطاهای مشاهدات آماری و اقدامات لازم برای مبارزه با آنها
یکی از مهمترین الزامات نتایج مشاهدات آماری دقت آنهاست که به عنوان معیاری برای انطباق دانش آماری درک می شود.

خلاصه آماری اولیه
نتایج مشاهدات آماری حاوی اطلاعات همه کاره در مورد هر واحد از جمعیت یا شی است و معمولاً بی نظم هستند. این منبع از قبل لازم است

ماهیت و اهمیت شاخص های آماری نسبی
نمرات نسبی هستند آماربیانگر میزان نسبت کمی مقادیر مطلق صفت و نمایش اندازه های نسبی پدیده ها و فرآیندها. O

انواع شاخص های نسبی شاخص های نسبی دینامیک
بسته به وظایف حل شده با کمک مقادیر نسبی، انواع زیر از شاخص های نسبی متمایز می شوند: پویایی، ساختار، هماهنگی، شدت، مقایسه، انجام سفارش،

شاخص های نسبی سازه
یکی از مهمترین ویژگی های همه پدیده ها پیچیدگی آنهاست. حتی یک مولکول آب مقطر از اتم های هیدروژن و اکسیژن تشکیل شده است. بسیاری از پدیده های طبیعت، جامعه، انسان

شاخص های نسبی هماهنگی
شاخص های نسبی هماهنگی نسبت اندازه های مطلق به یکدیگر است قطعات تشکیل دهندهدر یک کلیت مطلق برای محاسبه این شاخص ها یکی از مولفه های

شاخص های شدت نسبی
شاخص‌های نسبی شدت (درجه) نسبت اندازه‌های مطلق دو ویژگی کیفی متفاوت، اما مرتبط با هم در اسکوپ آماری است.

شاخص های مقایسه نسبی
شاخص های نسبی مقایسه (مقایسه) با نسبتی به همین نام به دست می آیند شاخص های مطلقمربوط به واحدهای آماری مختلف، cos

نرخ های نسبی انجام سفارش
شاخص‌های عملکرد نسبی یک سفارش (وظیفه، طرح) نسبت شاخص‌های مطلق و واقعی به دست آمده برای یک دوره معین یا از آن تاریخ است.

شاخص های نسبی سطح توسعه اقتصادی
شاخص های نسبی سطح توسعه اقتصادینسبت اندازه های مطلق دو ویژگی کیفی متفاوت (متضاد)، اما به هم پیوسته نامیده می شود. همزمان

ماهیت و معنای روش گرافیکی
شاخص های آماری مطلق به دست آمده در نتیجه مشاهدات آماری و محاسبه شده بر این اساس عملکرد نسبیمی تواند بهتر، عمیق تر، قابل دسترس تر باشد

الزامات اساسی برای ساخت نمودارهای مختصات
رایج ترین و راحت ترین راه تصویر گرافیکیشاخص های مطلق و نسبی دینامیک، شاخص های مقایسه و غیره، یک نمودار مختصات در نظر گرفته شده است.

روش های نمایش گرافیکی شاخص های دینامیک و ساختار
در بسیاری از موارد، نیاز به تأمل در نمودار مختصات یکسان وجود دارد، نه یک، بلکه چندین خط که پویایی شاخص های مختلف مطلق یا نسبی را مشخص می کند، یا

روش های نمایش گرافیکی شاخص های مقایسه
در یک مفهوم گسترده، مقایسه شاخص ها هم در زمان و هم در مکان انجام می شود، یعنی. روش‌های مقایسه می‌توانند پویایی، ساختار و اشیاء سرزمینی را پوشش دهند. بنابراین، pr

ماهیت و معنای کارتوگرام و کارتوگرام
در بسیاری از موارد، نیاز به ترسیم گرافیکی مهم ترین ویژگی های مشخصه اشیاء سرزمینی وسیع وجود دارد. در سیستم مجتمع کشت و صنعت، اینها می توانند سکونتگاه، کشاورزی باشند

کنترل سوالات مبحث 4
1. روش گرافیکی چیست و بر چه اساسی استوار است؟ 2. برای چه اهداف اصلی از روش گرافیکی استفاده می شود. 3. چگونه طبقه بندی می شوند

جوهر تنوع انواع علائم تغییرات
تنوع (از variatio لاتین - تغییر) تغییر در یک ویژگی (نوع) در یک جامعه آماری است، یعنی. پذیرش دانش مختلف توسط واحدهای جمعیت یا گروه های آنها به رسمیت شناخته می شود

بر اساس تعداد کارگران دام
شماره رتبه (#) گزینه مربوط به شماره رتبه (#) نماد تعداد کارگران دام

محدوده توزیع گسسته
یک سری گسسته (جداکننده) یک سری متغیر است که در آن گروه های آن بر اساس یک ویژگی که به طور ناپیوسته تغییر می کند، تشکیل می شود. از طریق تعداد معینیکی

کارگران دام
تعداد انواع متغیر (مقدار علامت)، Х علائم فرکانس فرکانس‌های محلی، fl فرکانس‌های تجمعی، fn

سری توزیع فاصله
در بسیاری از موارد، این مجموعه آماری شامل تعداد زیادی یا حتی بیشتر از آن تعداد بی نهایت گزینه است که اغلب با تغییرات مداوم رخ می دهد، عملا غیر ممکن و نامناسب است.

ماهیت میانگین ها
سری‌های تنوع، طیف گسترده‌ای از پدیده‌ها و فرآیندهایی را منعکس می‌کنند که جوهر واقعیت ما را تشکیل می‌دهند. برای مطالعه کاملتر و عمیق تر پدیده ها و فرآیندهای جهان پیرامون

میانگین حسابی
اگر مقدار K = 1 را در فرمول 6.2 جایگزین کنیم، آنگاه مقدار میانگین حسابی را بدست می آوریم، یعنی. .

در توزیع رتبه بندی شده
رتبه №№ انواع (مقادیر کاراکتر) نمادها منطقه برش، هکتار

توزیع ردیف
شماره p.p. متغیرها فرکانسهای محلی میانگین وزنی متغیرها نمادها بازده

ویژگی های اساسی میانگین حسابی
میانگین حسابی دارای خواص ریاضی زیادی است که از نظر ریاضی در محاسبه آن مهم است. آگاهی از این خواص به کنترل صحیح و دقیق کمک می کند

میانگین ارزش زمانی
یکی از انواع میانگین حسابی، میانگین زمانی است. مقدار متوسط ​​محاسبه شده بر اساس مجموع مقادیر مشخصه در لحظات مختلف یا برای دوره های مختلف در

RMS
به شرط تنظیم مقدار K=2 در فرمول 6.2. مقدار میانگین مربع را بدست می آوریم. در یک سری رتبه بندی شده، مقدار مجذور میانگین از وزن نشده محاسبه می شود (pr

میانگین هندسی
اگر در فرمول 6.2 مقدار K = 0 را جایگزین کنیم، در نتیجه به میانگین هندسی می رسیم که شکلی ساده (بدون وزن) و وزن دار دارد. میانگین هندسی ساده است

مقدار هارمونیک متوسط
تحت شرط جایگزینی در فرمول کلی 6.2، مقدار K \u003d -1، می توانید مقدار هارمونیک متوسط ​​را دریافت کنید که شکلی ساده و وزن دارد. نام آکاردئون میانی

میانگین ساختاری جوهر و معنای مد
در برخی موارد، برای به دست آوردن یک مشخصه تعمیم دهنده جامعه آماری برای هر ویژگی، باید از اصطلاح استفاده کرد. میانگین های ساختاری شامل می شوند

ماهیت و معنای میانه
میانه - گزینه هایی که در وسط سری تغییرات قرار دارند. میانه در سری های رتبه بندی شده به شرح زیر است. ابتدا تعداد میانه گزینه ها را محاسبه کنید:

مفهوم ساده ترین شاخص های تنوع
ماهیت تنوع در فصل 5 کتاب درسی مورد توجه قرار گرفت، جایی که اشاره شد که تغییر نوسان است، تغییر در مقدار یک ویژگی در یک جامعه آماری، به عنوان مثال. پذیرش توسط واحدها

انحراف معیار
انحراف معیار بر اساس میانگین محاسبه می شود مقدار درجه دوم. به اشکال غیر وزنی (ساده) و وزن دار ظاهر می شود. برای رتبه بندی p

ضریب تغییرات
ضریب تغییرات یک شاخص نسبی است که با استفاده از فرمول زیر قابل محاسبه است:

کنترل سوالات مبحث 6
1. مقدار متوسط ​​چیست و چه چیزی را بیان می کند؟ 2. ویژگی تعیین کننده یک جمعیت چیست و چرا در آمار استفاده می شود؟ 3. انواع اصلی رسانه کدامند

ماهیت جامعه عمومی و نمونه
در آمار، یک نوع مشاهده مستمر نسبتاً نادر است، مانند سرشماری عمومی جمعیت. با این حال، اغلب لازم است از مشاهدات ناپیوسته استفاده شود، که

مفهوم جمعیت تصادفی
در شرایط واقعی، موارد کار آماری با جمعیت عمومی نسبتاً نادر است و بنابراین، دستیابی به ویژگی های آماری اصلی همیشه امکان پذیر نیست.

جوهر متوپ انتخابی
کار آماری در بیشتر موارد به نحوی با داده های به دست آمده در نتیجه استفاده از روش نمونه گیری مرتبط است. بسیاری از مطالعات بدون استفاده از آن غیرممکن خواهد بود

مزایا و معایب روش نمونه گیری
روش نمونه گیری نسبت به مشاهده مستمر دارای مزایای متعددی است. اولاً، مشاهده انتخابی می تواند به طور قابل توجهی در کار، پول و زمان برای اجرای آن صرفه جویی کند. جغد

روش های انتخاب، مزایا و معایب آنها
انتخاب واحدهای آماری از جامعه عمومی می تواند به روش های مختلفی انجام شود و به شرایط زیادی بستگی دارد. روش نمونه گیری شامل روش های زیر برای انتخاب واحدهای آماری می باشد

ماهیت خطاهای نمایندگی و روش محاسبه آنها
یکی از سوالات محوری برای روش نمونه گیرییک محاسبه نظری از ویژگی های آماری اصلی و مهمتر از همه، میانگین مقدار یک علامت در اسکوپ آماری عمومی در نظر گرفته می شود.

مفهوم یک نمونه کوچک. برآورد نقطه ای از ویژگی های آماری اصلی
استفاده از روش نمونه گیری می تواند بر اساس انتخاب هر تعداد واحد آماری از جامعه عمومی باشد. از نظر ریاضی ثابت شده است که جمعیت نمونه می تواند باشد

خطای نمونه برداری حاشیه ای برآورد فاصله ای از ویژگی های آماری اصلی
خطای حاشیه اینمونه اختلاف بین ویژگی های آماری به دست آمده در نمونه و جامعه عمومی است.همانطور که در بالا نشان داده شده است (فرمول

روش‌های محاسبه حجم نمونه برای روش‌های مختلف انتخاب
کارهای مقدماتی برای مشاهده انتخابیارتباط مستقیم با تعیین حجم نمونه مورد نیاز دارد که به روش انتخاب و تعداد واحدها در حالت کلی بستگی دارد.

مفهوم خلاصه آماری ثانویه (پیچیده).
نتایج یک خلاصه ساده، که محتوای آن در مبحث 2 مورد بحث قرار گرفته است، همیشه نمی تواند محقق را راضی کند، زیرا آنها فقط یک ایده کلی از موضوع مورد مطالعه ارائه می دهند، یعنی. از آمار تی

گروه بندی های گونه شناختی
گروه‌بندی گونه‌شناختی، تقسیم‌بندی جامعه آماری به گروه‌های گونه‌شناختی با کیفیت اساساً یکسان است. گروه بندی تیپولوژیک

گروه بندی های ساختاری
گروه بندی ساختاری شامل تقسیم یک مجموعه همگن و کیفی از واحدهای آماری به گروه هایی است که ترکیب یک شی پیچیده را مشخص می کند. از طریق ساختاری

ماهیت و روش انجام یک گروه بندی ساده و تحلیلی
گروه بندی تحلیلی که در آن جامعه آماری بر اساس یکی از ویژگی های عاملی به گروه های همگن تقسیم می شود، ساده نامیده می شود.

گروه بندی تحلیلی
شماره p.p. گروه ها مزارعبا دوز کود، تن در هکتار. علائم فراوانی در گروه ها (تعداد واحدهای جمعیتی در یک گروه)

شاخص های عملکرد در کشت سیب زمینی
شماره p.p. شاخص‌ها گروه‌های مزرعه در دوز کود، تن در هکتار مجموع (متوسط) 10-20

ماهیت و معنای جداول آماری
نتایج پردازش داده‌های مشاهده‌ای با استفاده از روش‌های آماری متنوع (خلاصه، نسبی، مقادیر متوسط، تشکیل‌ها، سری تغییرات، شاخص‌های تغییرات، تحلیلی

ترکیب ابتدایی جداول آماری
یکپارچه پردازش آمارینتایج مشاهدات معمولاً با استفاده از جداول متعدد همراه است. بنابراین، به هر جدول یک شماره اختصاص داده می شود.

انواع و اشکال جداول آماری
بسته به ساختار موضوع جدولی، انواع جداول آماری زیر متمایز می شوند: ساده، گروهی و ترکیبی. جدول آماری ساده - هارا

جداول آماری کمکی و حاصل
جداول آماری می توانند نقش های عملکردی مختلفی را انجام دهند. برخی از آنها، به عنوان مثال، برای خلاصه کردن نتایج مشاهدات آماری و کمک به عملکرد عملکرد اولیه هستند.

نتایج تولید، 2003
(جدول ترکیبی) شماره p.p. گروه های مزارع بر اساس بار زمین کشاورزی در هر 1 تراکتور، هکتار زیر گروه های مزارع بر اساس بار

شرکت های فرآوری کتان مجتمع کشت و صنعت در سال 1382
(کاربرگ) شماره p.p. اعتماد حجم پردازش سالانه، t تعداد کارکنان، افراد ظرفیت حمل a

ثبت جداول آماری
دستیابی به اهداف تعیین شده با استفاده از روش جدولی در مواردی امکان پذیر است که الزامات لازم برای طراحی جداول آماری برآورده شود. به طور کلی، همه جداول باید داشته باشند

مفهوم روش پراکندگی
نام این روش به دلیل استفاده گسترده است انواع مختلفپراکندگی هایی که ماهیت و روش های محاسبه آن در مبحث ششم کتاب درسی مورد توجه قرار گرفته است. شایان ذکر است که واریانس در مقدار

نتیجه-نشانه
№ p / n گزینه های فردی انحرافات خطی فردی. متغیری از میانگین مربعات انحرافات خطی

مزارع دهقانی
شماره عملکرد، q/ha انحراف خطی بازده فردی از میانگین، q/ha مربع انحرافات خطی عملکرد

سوختگی دیررس، بر عملکرد سیب زمینی
تعداد گروه‌های مزارع بر اساس سهم محصولات زیر کشت، درصد تعداد مزارع در گروه میانگین سهم محصولات تیمار شده،

نتیجه-نشانه
تعداد گروه فواصل بر اساس شاخص عامل فرکانس محلی میانگین متغیر نشانگر حاصل

انواع پراکندگی. قانون جمع واریانس
اصل محاسبه واریانس (میانگین مجذور انحرافات) در نمای کلیدر مبحث 6 مورد بحث قرار گرفت. در رابطه با روش پراکندگی، این بدان معنی است که هر نوع تغییر با یک نوع خاص مطابقت دارد.

محصول سیب زمینی (گروه اول)
شماره p.p. عملکرد، c/ha انحراف خطی از میانگین بازده گروه مربع انحرافات خطی

مفهوم معیار آر فیشر
روش پراکندگی شامل تخمین نسبت واریانس اصلاح شده است که نوسانات سیستماتیک مقادیر میانگین گروه صفت مؤثر مورد مطالعه را مشخص می کند، به پراکندگی اصلاح شده.

کمپلکس پراکندگی دو عاملی
راه حل این مجموعه با هدف بررسی تأثیر کیفی دو علامت عامل تأثیر دو علامت عامل بر یک یا چند نشانه مؤثر است. مجتمع دو عاملی

محصولات غلات
شماره زیرگروه تعداد مزارع در زیرگروه میانگین عملکرد در هر هکتار انحراف خطی عملکرد در زیر گروه از

ویژگی های کمپلکس پراکندگی چند عاملی
مطالعه کیفیت ارتباطات، یعنی. اهمیت تأثیر چند ویژگی (سه، چهار یا بیشتر) عامل بر شاخص های عملکرد، در اصل مدت زمان مصرف ترکیبی است

بازده محصولات غلات
شماره p.p. عناصر تنوع نمادها تنوع کل تنوع سیستماتیک تغییرات باقیمانده

ماهیت و انواع همبستگی ها
در فصل قبل نشان داده شد که کیفیت (معنی داری) رابطه بین ویژگی های عامل و نتیجه در جامعه آماری با استفاده از پراکندگی تعیین و ارزیابی می شود.

اشکال اصلی همبستگی بین ویژگی ها
شناسایی شکل ارتباط بین نشانه ها با تعیین رابطه علی بین آنها مقدم است. این مهم ترین و تعیین کننده ترین نکته برای استفاده صحیح از روش همبستگی است. توسط

شاخص های تنگاتنگی همبستگی ها. رابطه همبستگی
یکی از مسائل محوری که با کمک روش همبستگی حل می شود، تعریف و ارزیابی یک معیار کمی از نزدیکی رابطه بین عامل و ویژگی های حاصل است. در

ضرایب همبستگی جفت مستقیم
اگر رابطه بین ویژگی های جفت ویژگی مورد مطالعه به شکلی نزدیک به یک خط مستقیم بیان شود، می توان درجه نزدیکی رابطه بین این ویژگی ها را با استفاده از ضریب pr محاسبه کرد.

ضریب همبستگی رتبه
مشخصات آماری اصلی در مواردی که جمعیت عمومی، که نمونه از آن گرفته شده است، معلوم می شود که خارج از پارامترهای قانون توزیع نرمال یا نزدیک به آن است.

ضریب همبستگی چندگانه
هنگام مطالعه نزدیکی رابطه بین چندین ویژگی فاکتوریل و موثر، ضریب تجمعی محاسبه می شود. همبستگی چندگانه. بنابراین، هنگام تعیین مجموع m

شاخص های تعیین
هنگام مطالعه تأثیر کمی صفات - عوامل بر نتایج، مهم است که مشخص شود چه بخشی از نوسانات صفت حاصل مستقیماً به دلیل تأثیر تغییرات است.

ماهیت، انواع و معنای معادلات رگرسیون
رگرسیون به عنوان یک تابع طراحی شده برای توصیف وابستگی تغییر در علائم مؤثر تحت تأثیر نوسانات علائم - عوامل درک می شود. مفهوم رگرسیون در آمار معرفی شد

معادله رگرسیون خط مستقیم
همبستگی در یک فرم نزدیک به یک خط مستقیم را می توان به عنوان یک معادله خط مستقیم نشان داد:

معادله رگرسیون هایپربولیک
اگر شکل رابطه بین ویژگی-عامل و ویژگی-نتیجه که با استفاده از نمودار مختصات (میدان همبستگی) شناسایی شده است، هذلولی باشد، باید معادله را ایجاد و حل کرد.

رگرسیون ها
شماره p.p. Feature-factor Feature-result مقدار معکوس ضریب ویژگی مربع مقدار معکوس

رگرسیون هایپربولیک
شماره p.p. عملکرد نخود، dt/ha X هزینه نخود، هزار روبل/dt Y مقادیر تخمینی

معادله رگرسیون سهموی
در برخی موارد، داده‌های تجربی جامعه آماری که با استفاده از نمودار مختصات تجسم شده‌اند، نشان می‌دهند که افزایش ضریب با افزایش بیش از حد واکنش همراه است.

رگرسیون سهموی
شماره p.p. X Y XY X2 X2Y X4

رگرسیون سهموی
شماره p.p. وزن مخصوص محصولات سیب زمینی، Х عملکرد سیب زمینی، هزار ج. محاسبات ارزش

معادله رگرسیون چندگانه
استفاده از روش همبستگی در مطالعه وابستگی یک ویژگی - نتیجه بر روی چندین ویژگی عامل بر اساس طرحی شبیه به یک همبستگی ساده (جفت) شکل می گیرد. یکی از

ضرایب کشسانی
برای توصیف (تفسیر) معنی دار و در دسترس نتایج، که منعکس کننده وابستگی همبستگی-رگرسیون بین نشانه ها از طریق معادلات رگرسیونی مختلف است، معمولاً از آن استفاده می شود.

ماهیت سری زمانی
همه پدیده های جهان پیرامون در زمان دستخوش تغییرات مداوم می شوند. در طول زمان، یعنی حجم، سطح، ترکیب، ساختار و غیره آنها در دینامیک تغییر می کنند. ذکر این نکته مناسب است

بنگاه های کشاورزی
(ابتدای سال؛ هزار واحد فیزیکی) شاخص ها 2000 2001 2002 2003

شاخص های اصلی سری پویا
تجزیه و تحلیل جامع سری پویا این امکان را به شما می دهد تا الگوهایی را که در مراحل مختلف توسعه پدیده ها ظاهر می شوند را آشکار و مشخص کنید تا روندها و ویژگی های توسعه این پدیده ها را شناسایی کنید. در حرفه ای

افزایش سطح مطلق
یکی از ساده ترین شاخص های توسعه دینامیک افزایش مطلق سطح است. رشد مطلق تفاوت بین دو سطح از محدوده دینامیکی است

سطح نرخ رشد
برای توصیف نرخ نسبی تغییر، شاخص نرخ رشد. نرخ رشد- این نسبت یک سطح از سری پویا به سطح دیگر است که به عنوان مبنای مقایسه در نظر گرفته شده است. نرخ رشد می تواند باشد

سطح نرخ رشد
اگر نرخ مطلق افزایش در سطوح سری پویا با بزرگی افزایش مطلق مشخص شود، آنگاه سرعت نسبیسطوح رشد - نرخ رشد. تمپو در

قدر مطلق یک درصد افزایش می یابد
هنگام تجزیه و تحلیل سری های زمانی، اغلب این وظیفه مطرح می شود: پیدا کردن اینکه چه مقادیر مطلقی 1٪ افزایش (کاهش) در سطوح را بیان می کنند، زیرا در تعدادی از موارد، با کاهش (کاهش) در سطوح

برای 1999-2003
سال بهره وری، c/ha افزایش عملکرد مطلق، c/ha نرخ رشد، % نرخ رشد، %

تکنیک های تراز سری دینامیک
برای شناسایی الگوهای زمانی، به عنوان یک قاعده، به اندازه کافی نیاز است عدد بزرگسطوح، سری پویا. اگر سری پویا از تعداد محدودی از سطوح تشکیل شده باشد، تراز آن

روش‌هایی برای هم‌ترازی سری‌های زمانی تحلیلی
شناسایی روند کلی در توسعه سطوح سری پویا را می توان با استفاده از روش های مختلف تراز تحلیلی انجام داد که اغلب انجام می شود.

تراز تحلیلی به منحنی نمایی
در برخی موارد، به عنوان مثال، در فرآیند راه اندازی و توسعه جدید ظرفیت تولید، سری پویا ممکن است با تغییر سریع در حال رشد در سطوح مشخص شود، به عنوان مثال. زنجیره ای

تراز سهموی تحلیلی مرتبه دوم
اگر سری پویا مورد مطالعه با افزایش مطلق مثبت مشخص شود، با شتاب توسعه سطوح، آنگاه تراز سری را می توان طبق یک سهمی مرتبه دوم انجام داد.

تراز تحلیلی بر اساس معادله هذلولی
اگر سری پویا با کاهش مطلق میرا در سطوح مشخص شود (به عنوان مثال، پویایی شدت کار محصولات، عرضه نیروی کار تولید در کشاورزی، و غیره)، پس

مفهوم درون یابی و برون یابی سطوح سری های زمانی
در برخی موارد، یافتن مقادیر سطوح میانی گمشده سری زمانی بر اساس مقادیر شناخته شده آن ضروری است. در چنین مواردی می توان از درون یابی استفاده کرد

تولید سیب زمینی رتبه بندی آماری

بر اساس شاخص‌های جدول 2، ردیف‌های رتبه‌بندی تولید سیب‌زمینی در هر 100 هکتار زمین زراعی را تهیه می‌کنیم. بر عملکرد سیب زمینی؛ در هزینه رابطه بین این شاخص ها به صورت گرافیکی نشان داده شده است.

اولین گام در مطالعه آماری تنوع، ساخت یک سری تغییرات است - توزیع مرتب واحدهای جمعیت بر اساس مقادیر افزایشی (بیشتر) یا کاهشی (کمتر) یک صفت.

سه شکل از یک سری تغییرات وجود دارد: یک سری محدوده، یک سری گسسته، یک سری فاصله. یک سری متغیر اغلب سری توزیع نامیده می شود.

سری رتبه‌بندی‌شده فهرستی از واحدهای فردی جمعیت به ترتیب صعودی (نزولی) صفت مورد مطالعه است.

رتبه بندی رویه ای برای سفارش اشیاء مطالعه است که بر اساس اولویت انجام می شود. دامنه تغییرات نشان می دهد که تفاوت بین واحدهای جمعیت چقدر زیاد است.

رتبه، تعداد ترتیبی مقادیر صفت است که به ترتیب صعودی یا نزولی مقادیر آنها مرتب شده اند. اگر مقدار مشخصه یکسان باشد کمی سازی، سپس رتبه همه این مقادیر برابر با میانگین حسابی تعداد متناظر مکان هایی است که تعیین می کنند. به این رتبه ها متصل می گویند.

نمودارها در آمار راهی برای تجسم شاخص های آماری به شکل اشکال و نشانه های هندسی، نقشه ها یا نقشه های شماتیک هستند. یک تصویر بصری درک اطلاعات را تسهیل می کند، به شما امکان می دهد مجموعه ای از شاخص ها را در ارتباط متقابل پوشش دهید، روند توسعه و نسبت های معمولی شاخص ها را شناسایی کنید.

برای نمایش شاخص های دینامیک، توصیه می شود از آن استفاده کنید نمودارهای خطییا نمودارهای میله ای نمودار باید بصری، قابل فهم، آسان برای خواندن و در صورت امکان طراحی هنرمندانه باشد که توجه را به آن جلب کند.

هنگام ساختن نمودارهای پراکنده، مجموعه ای از نقاط به عنوان نمونه های گرافیکی استفاده می شود. هنگام ساخت خطوط خطی. نمودارسازی همیشه یک فرآیند خلاقانه است. در اینجا کمی جستجو لازم است. تنها پس از جمع آوری و مقایسه چندین نسخه پیش نویس، می توان ترکیب صحیح نمودار را تعیین کرد، مقیاس و مکان علائم را در فیلد نمودار تنظیم کرد.

از سری رتبه بندی شده برای تولید سیب زمینی در هر 100 هکتار زمین زراعی، می توان نتیجه گرفت که کمترین میزان تولید در منطقه بالاگانسکی مشاهده می شود و منطقه آنگارسکی با بالاترین بهره وری سیب زمینی از 100 هکتار زمین زراعی متمایز است.

کمترین عملکرد در منطقه کاچوگسکی - 10 سنت در هکتار و بالاترین در Usolsky - 195.5 سنتر در هکتار بود.

در منطقه Chunsky، با تولید سیب زمینی بالا در هر 100 هکتار زمین قابل کشت، کمترین هزینه 1 c. حداکثر هزینه در منطقه Nizhne-Ilimsk مشاهده می شود. دامنه تغییرات در هزینه یک سانتی متر سیب زمینی بسیار زیاد و برابر با 1161.01 روبل است.

انتشارات دیگر

تجزیه و تحلیل فعالیت های اقتصادی شرکت
گذار به اقتصاد بازار مستلزم افزایش بهره وری تولید، رقابت پذیری محصولات و خدمات از طریق معرفی اشکال موثر مدیریت اقتصادی و مدیریت تولید، دستاوردهای پیشرفت علمی و فناوری و فعال سازی ...

تجزیه و تحلیل فعالیت های مالی و اقتصادی JSC TransContainer
تجزیه و تحلیل مالی فرآیندی است که مبتنی بر مطالعه داده های وضعیت مالی شرکت و نتایج فعالیت های آن در گذشته به منظور ارزیابی شرایط و عملکرد آتی است. بنابراین، وظیفه اصلی آنالیز مالییاول...

مهمترین گام در مطالعه پدیده ها و فرآیندهای اجتماعی-اقتصادی، نظام مند کردن داده های اولیه و بر این اساس، به دست آوردن یک ویژگی خلاصه از کل شی با استفاده از شاخص های تعمیم است که با جمع بندی و گروه بندی مواد اولیه آماری حاصل می شود.

خلاصه آماری - این مجموعه ای از عملیات متوالی برای تعمیم حقایق منفرد خاص است که یک مجموعه را تشکیل می دهد، برای شناسایی ویژگی ها و الگوهای معمولی ذاتی در پدیده مورد مطالعه به عنوان یک کل. انجام خلاصه آماری شامل مراحل زیر می باشد :

  • انتخاب ویژگی گروه بندی؛
  • تعیین ترتیب تشکیل گروه ها؛
  • توسعه یک سیستم از شاخص های آماری برای توصیف گروه ها و شی به عنوان یک کل؛
  • توسعه طرح بندی جداول آماری برای ارائه نتایج خلاصه.

گروه بندی آماری تقسیم واحدهای جمعیت مورد مطالعه به گروه های همگن با توجه به ویژگی های خاصی که برای آنها ضروری است نامیده می شود. گروه بندی مهمترین روش آماری خلاصه سازی داده های آماری، مبنای محاسبه صحیح شاخص های آماری است.

انواع زیر گروه بندی وجود دارد: گونه شناسی، ساختاری، تحلیلی. همه این گروه بندی ها با این واقعیت متحد می شوند که واحدهای شیء بر اساس برخی ویژگی ها به گروه هایی تقسیم می شوند.

علامت گروه بندی به علامتی گفته می شود که توسط آن واحدهای جمعیت به گروه های جداگانه تقسیم می شوند. از جانب انتخاب صحیحصفت گروه بندی به نتیجه گیری بستگی دارد تحقیق آماری. به عنوان مبنایی برای گروه بندی، لازم است از ویژگی های قابل توجه و اثبات شده نظری (کمی یا کیفی) استفاده شود.

نشانه های کمی گروه بندی دارای عبارت عددی (حجم معاملات، سن فرد، درآمد خانواده و غیره) و ویژگی های کیفی گروه بندی منعکس کننده وضعیت واحد جمعیت (جنسیت، وضعیت تأهل، وابستگی صنعتی شرکت، شکل مالکیت آن و غیره).

پس از مشخص شدن مبنای گروه بندی، باید در مورد تعداد گروه هایی که جامعه مورد مطالعه باید به آنها تقسیم شود، تصمیم گیری شود. تعداد گروه ها به اهداف مطالعه و نوع شاخص زیربنایی گروه بندی، حجم جامعه، درجه تنوع صفت بستگی دارد.

به عنوان مثال، گروه بندی شرکت ها با توجه به اشکال مالکیت، شهرداری، فدرال و اموال موضوعات فدراسیون را در نظر می گیرد. اگر گروه بندی بر اساس یک ویژگی کمی انجام شود، لازم است به تعداد واحدهای شی مورد مطالعه و میزان نوسان ویژگی گروه بندی توجه ویژه ای شود.

وقتی تعداد گروه ها مشخص شد، باید فواصل گروه بندی مشخص شود. فاصله - اینها مقادیر یک مشخصه متغیر هستند که در محدوده خاصی قرار دارند. هر بازه مقدار خود، حد بالا و پایین یا حداقل یکی از آنها را دارد.

حد پایین فاصله کوچکترین مقدار صفت در بازه و نامیده می شود کران بالا - بزرگترین مقدار ویژگی در بازه زمانی. مقدار بازه تفاوت بین حد بالا و پایین است.

فواصل گروه بندی بسته به اندازه آنها عبارتند از: مساوی و نابرابر. اگر تنوع صفت خود را در مرزهای نسبتاً باریک نشان دهد و توزیع یکنواخت باشد، گروه بندی با فواصل مساوی ساخته می شود. مقدار یک بازه مساوی با فرمول زیر تعیین می شود :

که در آن Xmax، Xmin - مقادیر حداکثر و حداقل ویژگی در مجموع؛ n تعداد گروه هاست.

ساده ترین گروه بندی، که در آن هر گروه انتخاب شده با یک شاخص مشخص می شود، یک سری توزیع است.

سری توزیع آماری - این توزیع منظم واحدهای جمعیت به گروه ها بر اساس یک ویژگی خاص است. بسته به صفت زیربنایی تشکیل یک سری توزیع، سری توزیع اسنادی و متغیر متمایز می شوند.

نسبتی آنها سری توزیع را بر اساس ویژگی های کیفی ساخته شده می نامند، یعنی علائمی که بیان عددی ندارند (توزیع بر اساس نوع کار، جنسیت، حرفه و غیره). سری های توزیع صفات ترکیب جمعیت را با توجه به یک یا آن ویژگی اساسی مشخص می کند. این داده ها که در چندین دوره گرفته شده اند، به ما اجازه می دهند تا تغییر در ساختار را مطالعه کنیم.

ردیف های تنوع سری توزیع نامیده می شود که بر مبنای کمی ساخته شده است. هر سری متغیر از دو عنصر تشکیل شده است: انواع و فرکانس ها. گزینه ها مقادیر فردی ویژگی که در سری تغییرات می گیرد، یعنی مقدار خاص ویژگی متغیر نامیده می شود.

فرکانس ها تعداد انواع مختلف یا هر گروه از سری تغییرات نامیده می شود، یعنی اینها اعدادی هستند که نشان می دهند چند بار گونه های خاصی در سری توزیع رخ می دهند. مجموع همه فرکانس ها اندازه کل جمعیت، حجم آن را تعیین می کند. فرکانس ها فرکانس ها نامیده می شوند که در کسری از واحد یا به صورت درصدی از کل بیان می شوند. بر این اساس مجموع فرکانس ها برابر با 1 یا 100 درصد است.

بسته به ماهیت تنوع صفت، سه شکل از سری تغییرات متمایز می شود: یک سری رتبه بندی، یک سری گسسته، و یک سری فاصله.

سری تغییرات رتبه بندی شده - این توزیع واحدهای فردی جمعیت به ترتیب صعودی یا نزولی صفت مورد مطالعه است. رتبه بندی تقسیم داده های کمی را به گروه ها آسان می کند، بلافاصله کوچکترین و بزرگترین مقادیر یک ویژگی را شناسایی می کند، مقادیری را که اغلب تکرار می شوند برجسته می کند.

سری تغییرات گسسته توزیع واحدهای جمعیت را بر اساس یک ویژگی گسسته که فقط مقادیر صحیح را می گیرد مشخص می کند. به عنوان مثال، دسته تعرفه، تعداد فرزندان در خانواده، تعداد کارکنان در شرکت و غیره.

اگر یک علامت دارای یک تغییر مداوم است که در محدوده خاصی می تواند هر مقدار را به خود بگیرد ("از - به") ، برای این علامت باید بسازید سری تغییرات بازه ای . به عنوان مثال، میزان درآمد، سابقه کار، هزینه دارایی های ثابت شرکت و غیره.

نمونه هایی از حل مسائل با موضوع "خلاصه آماری و گروه بندی"

وظیفه 1 . اطلاعاتی در مورد تعداد کتاب های دریافت شده توسط دانش آموزان با اشتراک در سال تحصیلی گذشته وجود دارد.

یک سری توزیع متغیر گسسته و گسسته بسازید که عناصر سری را نشان می دهد.

راه حل

این مجموعه مجموعه ای از گزینه ها برای تعداد کتاب هایی است که دانش آموزان دریافت می کنند. اجازه دهید تعداد این گونه ها را بشماریم و آنها را در قالب یک سری توزیع گسسته رتبه بندی شده و متغیر مرتب کنیم.

وظیفه 2 . داده هایی در مورد ارزش دارایی های ثابت برای 50 شرکت، هزار روبل وجود دارد.

ساخت یک سری توزیع، برجسته کردن 5 گروه از شرکت ها (در فواصل مساوی).

راه حل

برای راه حل، ما بزرگترین و کوچکترین مقادیر هزینه دارایی های ثابت شرکت ها را انتخاب می کنیم. اینها 30.0 و 10.2 هزار روبل هستند.

اندازه فاصله را بیابید: h \u003d (30.0-10.2): 5 \u003d 3.96 هزار روبل.

سپس گروه اول شامل شرکت هایی می شود که مقدار دارایی های ثابت آنها از 10.2 هزار روبل است. تا 10.2 + 3.96 = 14.16 هزار روبل. 9 شرکت از این دست وجود خواهد داشت. گروه دوم شامل شرکت هایی است که مقدار دارایی های ثابت آنها از 14.16 هزار روبل خواهد بود. تا 14.16 + 3.96 = 18.12 هزار روبل. 16 بنگاه از این دست وجود خواهد داشت و به همین ترتیب تعداد بنگاه‌های موجود در گروه‌های سوم، چهارم و پنجم را می‌یابیم.

سری توزیع حاصل در جدول قرار داده شده است.

وظیفه 3 . برای تعدادی از شرکت ها صنعت سبکداده های زیر را دریافت کرد:

یک گروه بندی از شرکت ها با توجه به تعداد کارگران، تشکیل 6 گروه در فواصل مساوی. برای هر گروه بشمارید:

1. تعداد شرکت ها
2. تعداد کارگران
3. حجم محصولات تولیدی در سال
4. میانگین تولید واقعی به ازای هر کارگر
5. مقدار دارایی های ثابت
6. اندازه متوسط ​​دارایی های ثابت یک شرکت
7. میانگین ارزش محصولات تولید شده توسط یک شرکت

نتایج محاسبات را در جداول ثبت کنید. نتیجه گیری خودتان را بگیرید.

راه حل

برای راه حل، ما بزرگترین و کوچکترین مقادیر میانگین تعداد کارگران شرکت را انتخاب می کنیم. اینها 43 و 256 هستند.

اندازه فاصله را بیابید: h = (256-43): 6 = 35.5

سپس گروه اول شامل شرکت هایی با میانگین تعداد کارگران از 43 تا 43 + 35.5 = 78.5 نفر خواهد بود. از این دست 5 شرکت وجود خواهد داشت.گروه دوم شامل بنگاه هایی خواهد بود که میانگین تعداد کارگران آنها از 78.5 تا 78.5 + 35.5 = 114 نفر خواهد بود. 12 بنگاه از این دست وجود خواهد داشت و به همین ترتیب تعداد بنگاه‌ها را در گروه‌های سوم، چهارم، پنجم و ششم می‌یابیم.

مجموعه توزیع حاصل را در جدول قرار می دهیم و شاخص های لازم را برای هر گروه محاسبه می کنیم:

نتیجه : همانطور که از جدول مشخص است، گروه دوم بنگاه ها بیشترین تعداد را دارند. شامل 12 شرکت است. کوچکترین گروه پنجم و ششم (هر کدام دو شرکت) هستند. اینها بزرگترین شرکتها (از نظر تعداد کارگران) هستند.

از آنجایی که گروه دوم پرتعدادترین است، حجم تولید در سال توسط بنگاه های این گروه و حجم دارایی های ثابت بسیار بیشتر از سایرین است. در عین حال، میانگین تولید واقعی یک کارگر در شرکت های این گروه بالاترین نیست. شرکت های گروه چهارم در اینجا پیشتاز هستند. این گروه همچنین مقدار نسبتاً زیادی از دارایی های ثابت را به خود اختصاص می دهد.

در نتیجه، ما متذکر می شویم که میانگین اندازه دارایی های ثابت و میانگین ارزش خروجی یک شرکت با اندازه شرکت (از نظر تعداد کارگران) نسبت مستقیم دارد.

اولین گام در مطالعه آماری تغییرات، ساخت یک سری تغییرات است - توزیع مرتب واحدهای جمعیت بر اساس مقادیر افزایشی (بیشتر) یا کاهشی (کمتر) یک صفت و شمارش تعداد واحدها با یک. یا مقدار دیگری از صفت.

سه شکل از سری تغییرات وجود دارد: محدوده، گسسته، فاصله. یک سری متغیر اغلب سری توزیع نامیده می شود. این اصطلاح هنگام مطالعه تغییرات صفات کمی و غیر کمی استفاده می شود. سری توزیع یک گروه بندی ساختاری است (فصل 6).

سری رتبه‌بندی‌شده فهرستی از واحدهای فردی جمعیت به ترتیب صعودی (نزولی) صفت مورد مطالعه است.

در زیر اطلاعاتی در مورد بانک های بزرگ سن پترزبورگ، رتبه بندی شده بر اساس سرمایه سهام تا 1999/01/10 آمده است.

نام سرمایه سهام بانک، میلیون روبل بانک بالتونکسیم 169

بانک سن پترزبورگ 237

پتروفسکی 268

بالتیک 290

Promstroybank 1007

اگر تعداد واحدهای جمعیت به اندازه کافی زیاد باشد، سری رتبه بندی شده دست و پا گیر می شود و ساخت آن، حتی با کمک کامپیوتر، طول می کشد. مدت زمان طولانی. در چنین مواردی، سری تغییرات با گروه بندی واحدهای جمعیت بر اساس مقادیر صفت مورد مطالعه ساخته می شود.


تعیین تعداد گروه ها

تعداد گروه ها در یک سری تغییرات گسسته با تعداد مقادیر واقعی موجود مشخصه متغیر تعیین می شود. اگر این صفت مقادیر گسسته ای داشته باشد، اما تعداد آنها بسیار زیاد باشد (به عنوان مثال، تعداد دام ها در اول ژانویه سال در شرکت های مختلف کشاورزی می تواند از صفر تا ده ها هزار راس باشد)، سپس یک سری تغییرات بازه ای ساخته می شود. . یک سری تغییرات بازه‌ای نیز برای مطالعه ویژگی‌هایی ساخته شده است که می‌توانند هر عدد صحیح و کسری را در

مناطق وجودی آن اینها به عنوان مثال، سودآوری محصولات فروخته شده، هزینه یک واحد تولید، درآمد به ازای هر ساکن شهر، نسبت افراد با آموزش عالیدر میان جمعیت مناطق مختلف و به طور کلی، همه ویژگی های ثانویه، که مقادیر آنها با تقسیم ارزش یک ویژگی اصلی بر ارزش دیگری محاسبه می شود (به فصل 3 مراجعه کنید).

سری تغییرات بازه ای جدولی است متشکل از دو ستون (یا ردیف) - فواصل صفتی که تغییرات آنها در حال مطالعه است و تعداد واحدهای جمعیتی که در این بازه (فرکانس ها) قرار می گیرند یا نسبت این تعداد از کل جمعیت (فرکانس ها).

دو نوع سری تغییرات بازه ای بیشتر مورد استفاده قرار می گیرند: فاصله مساوی و فرکانس مساوی. اگر تغییر صفت خیلی قوی نباشد، از سری با فاصله مساوی استفاده می شود. برای یک جمعیت همگن که توزیع آن بر اساس یک صفت معین نزدیک به قانون عادی است. (چنین سری در جدول 5.6 ارائه شده است.) اگر تنوع ویژگی بسیار قوی باشد، اما توزیع نرمال نباشد، اما مثلاً هذلولی باشد (جدول 5.5) از یک سری فرکانس مساوی استفاده می شود.

هنگام ساخت یک سری با فاصله مساوی، تعداد گروه ها به گونه ای انتخاب می شود که تنوع مقادیر صفت در مجموع به اندازه کافی منعکس شود و در عین حال، نظم توزیع، شکل آن به طور تصادفی تحریف نشود. نوسانات فرکانس اگر گروه‌ها خیلی کم باشند، هیچ الگوی تنوع وجود نخواهد داشت. اگر گروه‌ها خیلی زیاد باشند، جهش‌های فرکانس تصادفی شکل توزیع را مخدوش می‌کند.



مرزهای بازه ها را می توان به روش های مختلفی مشخص کرد: مرز بالایی بازه قبلی، مرز پایینی فاصله بعدی را تکرار می کند، همانطور که در جدول نشان داده شده است. 5.5 یا تکرار نمی شود.

در مورد دوم، فاصله دوم به عنوان 15.1-20 تعیین می شود، سوم - به عنوان 20.1-25، و غیره، یعنی. فرض بر این است که تمام مقادیر بازدهی لزوماً به یک دهم گرد می شوند. علاوه بر این، یک عارضه نامطلوب با وسط فاصله 15.1-20 ایجاد می شود، که، به طور دقیق، در حال حاضر برابر با 17.5 نیست، بلکه 17.55 خواهد بود. بر این اساس، هنگام جایگزینی فاصله گرد شده 40-60 با 40.1-60، به جای مقدار گرد شده 50 وسط آن، 50.5 می گیریم. بنابراین، ترجیح داده می شود که فواصل با یک مرز گرد تکرار شونده باقی بماند و توافق شود که واحدهای جمعیتی که دارای یک مقدار مشخصه برابر با مرز فاصله هستند، در بازه ای که این مقدار دقیق برای اولین بار گزارش می شود، لحاظ شود. بدین ترتیب مزرعه ای با عملکرد 15 سنت در هکتار در گروه اول قرار می گیرد که ارزش آن 20 سنت در هکتار است.

در دومی و غیره

یک سری متغیر با فرکانس مساوی با یک تنوع بسیار قوی از یک صفت ضروری است، زیرا با یک توزیع فاصله مساوی، اکثر واحدهای جمعیت به نظر می رسد


جدول 5.5

توزیع 100 بانک روسی بر اساس ارزیابی مانده دارایی ها از 01.01.2000


مرزهای فواصل برای توزیع مساوی مقادیر واقعی دارایی های بانک های اول، دهم، یازدهم، بیستم و غیره است.

نمایش گرافیکی سری تغییرات

کمک قابل توجهی در تجزیه و تحلیل سری تغییرات و ویژگی های آن توسط یک نمایش گرافیکی ارائه می شود. سری بازه ها با یک نمودار میله ای نشان داده می شود که در آن پایه های میله های واقع در محور آبسیسا فواصل مقادیر ویژگی متغیر هستند و ارتفاع میله ها فرکانس های مربوط به مقیاس در امتداد محور y یک نمایش گرافیکی از توزیع مزارع در منطقه از نظر عملکرد غلات در شکل 1 نشان داده شده است.

5.1. نموداری از این نوع اغلب هیستوگرام (gr. histos - بافت) نامیده می شود.

داده های جدول 5.6 و شکل. 5.1 شکل توزیع مشخصه بسیاری از صفات را نشان می دهد: مقادیر متوسط ​​فواصل صفت رایج تر است، کمتر اوقات مقادیر شدید، کوچک و بزرگ صفت. شکل این توزیع نزدیک به آنچه در دوره در نظر گرفته شده است آمار ریاضیقانون توزیع نرمال ریاضیدان بزرگ روسی A. M. Lyapunov (1857-1918) ثابت کرد که طبیعی است.

جدول 5.6 توزیع مزارع در منطقه بر اساس عملکرد محصول غلات


یک توزیع کوچک زمانی تشکیل می شود که یک متغیر تحت تأثیر تعداد زیادی از عوامل قرار می گیرد که هیچ یک از آنها تأثیر غالب ندارند. ترکیب تصادفی بسیاری از عوامل تقریباً مساوی که بر تغییرات عملکرد محصولات غلات، اعم از طبیعی و کشاورزی، اقتصادی تأثیر می‌گذارند، توزیعی از مزارع منطقه را بر اساس عملکرد نزدیک به قانون توزیع نرمال ایجاد می‌کند.


برنج. 5.2. تجمع و توزیع مزارع توسط

بهره وری

به چنین مجموعه ای تجمعی می گویند. شما می توانید یک توزیع تجمعی "نه کمتر از" بسازید یا می توانید

"بیشتر از". در مورد اول، نمودار توزیع تجمعی تجمعی نامیده می شود، در مورد دوم - ogive (شکل 5.2).

چگالی توزیع

اگر باید با یک سری متغیر با فواصل نامساوی برخورد کنید، برای مقایسه باید فرکانس یا فرکانس را به واحد بازه بیاورید. نسبت حاصل را چگالی توزیع می نامند:


چگالی توزیع هم برای محاسبه شاخص های تعمیم دهنده و هم برای نمایش گرافیکی سری های تغییرات با فواصل نابرابر استفاده می شود.

اولین مرحله در مطالعه آماری تغییرات، ساخت است سری تغییرات - توزیع منظم واحدهای جمعیت با توجه به افزایش (بیشتر) یا کاهش (کمتر) مقادیر ویژگی و شمارش تعداد واحدها با یک یا مقدار دیگری از ویژگی.

سه شکل از یک سری تغییرات وجود دارد: یک سری محدوده، یک سری گسسته، یک سری فاصله. سری تغییرات اغلب نامیده می شود نزدیک توزیعاین اصطلاح در بررسی تنوع در صفات کمی و غیر کمی استفاده می شود. سری توزیع است گروه بندی ساختاری(به فصل 6 مراجعه کنید).

ردیف رتبه بندی شده -این فهرستی از واحدهای فردی جمعیت به ترتیب صعودی (نزولی) صفت مورد مطالعه است.

جدول 1 می تواند به عنوان نمونه ای از یک سری رتبه بندی شده باشد. 5.5.

جدول 5.5

بانک های بزرگ سن پترزبورگ، رتبه بندی شده بر اساس اندازهسرمایه خود از تاریخ 96/07/01

اگر تعداد واحدهای جمعیتی به اندازه کافی زیاد باشد، سری رتبه بندی شده دست و پا گیر می شود و ساخت آن، حتی با کمک کامپیوتر، زمان زیادی می برد. در چنین مواردی، سری تغییرات با گروه بندی واحدهای جمعیت بر اساس مقادیر صفت مورد مطالعه ساخته می شود.

اگر مشخصه تعداد کمی از مقادیر را بگیرد، یک سری تغییرات گسسته ساخته می شود. نمونه ای از این سری ها توزیع مسابقات فوتبال بر اساس تعداد گل های زده شده است (جدول 5.1). سری تغییرات گسسته -این یک جدول متشکل از دو ردیف یا یک نمودار است: مقادیر خاص یک ویژگی متغیر ایکسمنو تعداد واحدهای جمعیت با مقدار داده شده ویژگی فیفرکانس ها (f حرف ابتدایی کلمه انگلیسی فرکانس است).

تعیین تعداد گروه ها

تعداد گروه ها در یک سری تغییرات گسسته با تعداد مقادیر واقعی موجود مشخصه متغیر تعیین می شود. اگر این صفت بتواند مقادیر گسسته ای داشته باشد، اما تعداد آنها بسیار زیاد باشد (به عنوان مثال، تعداد دام ها در اول ژانویه سال در شرکت های مختلف کشاورزی می تواند از صفر تا ده ها هزار راس باشد)، آنگاه یک سری تغییرات بازه ای است. ساخته شده. یک سری تغییرات بازه‌ای نیز برای مطالعه ویژگی‌هایی ساخته شده است که می‌توانند هر مقدار، اعم از عدد صحیح و کسری، را در ناحیه وجود خود بگیرند. به عنوان مثال، سودآوری محصولات فروخته شده، هزینه یک واحد تولید، درآمد به ازای هر 1 ساکن یک شهر، نسبت افراد دارای تحصیلات عالی در میان جمعیت مناطق مختلف، و به طور کلی تمام ویژگی های ثانویه، مقادیری که با تقسیم مقدار یک ویژگی اصلی بر مقدار دیگری محاسبه می شود (به فصل 3 مراجعه کنید).

سری تغییرات فاصلهجدولی است (شامل دو ستون (یا خط) - فواصل صفت که تنوع آن در حال مطالعه است و تعداد واحدهای جمعیتی که در این بازه (فرکانس ها) قرار می گیرند یا نسبت این تعداد از کل جمعیت (فرکانس ها).

هنگام ساخت یک سری تغییرات بازه ای، لازم است تعداد بهینه گروه ها (فاصله کاراکترها) را انتخاب کرده و طول بازه را تنظیم کنید. از آنجایی که هنگام تجزیه و تحلیل یک سری متغیر، فرکانس ها در بازه های مختلف مقایسه می شوند، لازم است مقدار بازه ثابت باشد. تعداد بهینه گروه ها به گونه ای انتخاب می شود که تنوع مقادیر صفت در کل به اندازه کافی منعکس شود و در عین حال نظم توزیع، شکل آن با نوسانات فرکانس تصادفی تحریف نشود. اگر گروه‌ها خیلی کم باشند، هیچ الگوی تنوع وجود نخواهد داشت. اگر گروه‌ها خیلی زیاد باشند، جهش‌های فرکانس تصادفی شکل توزیع را مخدوش می‌کند.

اغلب، تعداد گروه‌ها در سری تغییرات با رعایت فرمول توصیه شده توسط آماردان آمریکایی استرجس تعیین می‌شود. (استرجس):

جایی که ک- تعداد گروه ها؛ n- اندازه جمعیت

این فرمول نشان می دهد که تعداد گروه ها تابعی از مقدار داده است.

فرض کنید که لازم است یک سری متغیر از توزیع شرکت ها در منطقه با توجه به عملکرد محصولات غلات برای یک سال خاص ایجاد شود. تعداد شرکت های کشاورزی با محصولات غلات 143 بود. کمترین مقدار عملکرد 10.7 سانتی‌گراد در هکتار و بیشترین آن 53.1 سانتی‌گراد در هکتار است. ما داریم:

از آنجایی که تعداد گروه ها عدد صحیح است، توصیه می شود 8 یا 9 گروه بسازید.

تعیین اندازه فاصله

با دانستن تعداد گروه ها، مقدار فاصله را محاسبه کنید:

در مثال ما، مقدار بازه:

الف) با 8 گروه

ب) با 9 گروه

برای ساخت یک سری و تجزیه و تحلیل تغییرات، در صورت امکان، مقادیر گرد شده اندازه فاصله و مرزهای آن بسیار بهتر است. بنابراین بهترین راه حل ساخت یک سری تغییرات با 9 گروه با فاصله 5 q/ha خواهد بود. این سری تغییرات در جدول آورده شده است. 5.6، و نمایش گرافیکی آن در شکل. 5.1.

مرزهای بازه ها را می توان به روش های مختلفی مشخص کرد: مرز بالایی بازه قبلی، مرز پایینی فاصله بعدی را تکرار می کند، همانطور که در جدول نشان داده شده است. 5.6 یا تکرار نمی شود.

در مورد دوم، فاصله دوم به عنوان 15.1-20، سوم به عنوان 20.1-25، و غیره تعیین می شود، یعنی. فرض بر این است که تمام مقادیر بازدهی لزوماً به یک دهم گرد می شوند. علاوه بر این، یک عارضه نامطلوب با وسط فاصله 15.1-20 ایجاد می شود، که، به طور دقیق، در حال حاضر برابر با 17.5 نیست، بلکه 17.55 خواهد بود. بر این اساس، هنگام جایگزینی فاصله گرد شده 40-60 با 40.1-6.0، به جای مقدار گرد شده 50 وسط آن، 50.5 به دست می آید.بنابراین، ترجیح داده می شود که فواصل را با یک حاشیه گرد تکراری رها کنیم و موافقت کنیم که واحدهای جمعیتی که دارای یک مقدار مشخصه برابر با مرز فاصله هستند، در بازه‌ای که برای اولین بار این مقدار دقیق گزارش می‌شود، لحاظ می‌شوند. به این ترتیب مزرعه ای با عملکرد 15 سنت در هکتار در گروه اول، ارزش 20 سنت در هکتار در گروه دوم و غیره قرار می گیرد.

برنج. 5.1. توزیع مزارع بر اساس عملکرد

جدول 5.6

توزیع مزارع در منطقه بر اساس عملکرد غلات

گروه های مزارع بر اساس عملکرد،

c/ha ایکسj

تعداد مزارع

وسط فاصله

c/ha ایکسj"

فرکانس انباشته شده f'j

نمایش گرافیکی سری تغییرات

کمک قابل توجهی در تجزیه و تحلیل سری تغییرات و ویژگی های آن توسط یک نمایش گرافیکی ارائه می شود. سری بازه ها با یک نمودار میله ای نشان داده می شود که در آن پایه های میله های واقع در محور آبسیسا فواصل مقادیر ویژگی متغیر هستند و ارتفاع میله ها فرکانس های مربوط به مقیاس در امتداد محور y یک نمایش گرافیکی از توزیع مزارع در منطقه از نظر عملکرد غلات در شکل 1 نشان داده شده است. 5.1. این نوع نمودار اغلب نامیده می شود هیستوگرام(از کلمه یونانی "histos" - بافت، ساختار).

داده های جدول 5.5 و شکل. 5.1 شکل توزیع مشخصه بسیاری از علائم را نشان می دهد: مقادیر میانگین فواصل علامت رایج تر است، کمتر - شدید. مقادیر کوچک و بزرگ ویژگی شکل این توزیع به قانون توزیع نرمال در نظر گرفته شده در درس آمار ریاضی نزدیک است. ریاضیدان بزرگ روسی A. M. Lyapunov (1857 - 1918) ثابت کرد که توزیع نرمال زمانی شکل می گیرد که متغیر متغیر تحت تأثیر تعداد زیادی از عوامل قرار گیرد که هیچ یک از آنها تأثیر غالب ندارند. ترکیب تصادفی بسیاری از عوامل تقریباً مساوی مؤثر بر تغییر عملکرد محصولات غلات، اعم از طبیعی و کشاورزی، اقتصادی، توزیعی از مزارع منطقه را از نظر عملکرد نزدیک به قانون توزیع عادی ایجاد می کند.

اگر یک سری تغییرات گسسته وجود داشته باشد یا از نقاط میانی فواصل استفاده شود، نمایش گرافیکی چنین سری تغییراتی نامیده می شود. چند ضلعی(از کلمات یونانی - چند ضلعی). هر یک از شما می توانید به راحتی این نمودار را با اتصال نقاط با مختصات با خطوط مستقیم بسازید ایکس،و /.

نسبت ارتفاع یک چند ضلعی یا نمودار به قاعده آن در نسبت تقریباً 5:8 توصیه می شود.

مفهوم فرکانس

اگر در جدول 5.6 تعداد مزارع با سطح خاصی از بهره وری را به صورت درصدی از کل بیان کنید و تعداد کل مزارع (143) را 100% در نظر بگیرید، سپس متوسط ​​عملکرد را می توان به صورت زیر محاسبه کرد:

جایی که w- فرکانس دسته هفتم سری تغییرات؛

توزیع تجمعی

شکل تبدیل شده سری تغییرات است تعدادی از فرکانس های انباشته شده،در جدول آورده شده است 5.6، ستون 5. این مجموعه ای از مقادیر برای تعداد واحدهای جمعیت با کمتر از و برابر با مرز پایینی مقادیر فاصله مربوط به ویژگی است. چنین سریالی نامیده می شود انباشته.می توانید یک توزیع تجمعی "نه کمتر از" یا "بیشتر از" بسازید. در حالت اول، نمودار توزیع تجمعی نامیده می شود انباشته کردن،در دوم - دادن(شکل 5.2).

چگالی، توزیع

اگر باید با یک سری متغیر با فواصل نابرابر مقابله کنید، برای مقایسه باید فرکانس یا فرکانس را به واحد بازه بیاورید. نسبت حاصل نامیده می شود چگالی توزیع:

چگالی توزیع هم برای محاسبه شاخص های تعمیم دهنده و هم برای نمایش گرافیکی سری های تغییرات با فواصل نابرابر استفاده می شود.

برنج. 5.2. Ogiva و توزیع عملکرد تجمعی

5.7. ویژگی های ساختاری متغیر ردیف

میانه توزیع

هنگام مطالعه تنوع، از چنین ویژگی هایی از سری تغییرات استفاده می شود که ساختار، ساختار آن را به طور کمی توصیف می کند. چنین است، برای مثال، میانه-مقدار ویژگی متغیر که جمعیت را به دو قسمت مساوی تقسیم می کند ~ با مقادیر ویژگی کمتر از میانه و با مقادیر ویژگی بزرگتر از میانه (سومین بانک از پنج در جدول 5.5، یعنی 196 میلیارد روبل).

در مثال جدول. 5.5 دیده شده است تفاوت اساسیبین میانه و میانگین میانه به مقادیر ویژگی در لبه های سری رتبه بندی شده بستگی ندارد. حتی اگر سرمایه بزرگترین بانک در سن پترزبورگ ده برابر بزرگتر بود، ارزش متوسط ​​تغییر نمی کرد. بنابراین، میانه اغلب به عنوان یک شاخص قابل اعتمادتر از مقدار معمولی یک ویژگی نسبت به میانگین حسابی استفاده می شود، اگر سری مقادیر ناهمگن باشد، شامل انحرافات شدید از میانگین است. در این مجموعه، میانگین ارزش حقوق صاحبان سهام، معادل 269 میلیارد روبل، تحت تأثیر قوی بزرگترین گزینه تشکیل شد. 80 درصد بانک ها کمتر از متوسط ​​سرمایه دارند و تنها 20 درصد بیشتر. بعید است که چنین میانگینی را بتوان یک مقدار معمولی در نظر گرفت. با تعداد واحدهای جمعیتی زوج، میانه به عنوان میانگین حسابی دو گزینه مرکزی، به عنوان مثال، با ده مقدار ویژگی، میانگین مقادیر پنجم و ششم در سری رتبه‌بندی شده در نظر گرفته می‌شود.

در یک سری تغییرات بازه ای، از فرمول (5.14) برای یافتن میانه استفاده می شود.

جایی که من میانه هستم.

x 0 -حد پایین بازه ای که میانه در آن قرار دارد.

f M e-1 - فرکانس انباشته شده در فاصله قبل از میانه.

f Me- فرکانس در بازه میانه؛

من- مقدار فاصله؛

ک - تعداد گروه ها

روی میز. 5.6 میانه میانگین 143 مقدار است، یعنی. هفتاد و دومین از ابتدای سری ارزش بهره وری. همانطور که از تعداد فرکانس های انباشته شده مشخص است، در بازه چهارم قرار دارد. سپس

با تعداد فرد واحدهای جمعیت، عدد میانه، همانطور که می بینیم، برابر است با نه , همانطور که در فرمول (5.14)، a ، اما این تمایز قابل توجه نیست و معمولا در عمل نادیده گرفته می شود.

در یک سری تغییرات گسسته، میانه باید مقدار ویژگی در گروهی که در آن فرکانس انباشته شده در نظر گرفته شود.

بیش از نیمی از جمعیت به عنوان مثال، برای داده های جدول. 5.1 میانگین تعداد گل های زده شده در هر بازی 2 گل خواهد بود.

چارک های توزیع

به طور مشابه با میانه، مقادیر مشخصه محاسبه می شود و جمعیت را به چهار قسمت مساوی از نظر تعداد واحدها تقسیم می کند. این مقادیر نامیده می شوند یک چهارمو با حرف بزرگ لاتین نشان داده می شوند سبا نشان شماره چارک امضا شده. واضح است که س 2 با من مطابقت دارد. برای چارک اول و سوم، فرمول و محاسبه را مطابق جدول ارائه می دهیم. 5.6.

زیرا س 2 = Me = 29.5 c/ha، مشاهده می شود که تفاوت بین چارک اول و میانه کمتر از چارک میانه و سوم است. این واقعیت نشان دهنده وجود مقداری عدم تقارن در ناحیه میانی توزیع است که در شکل 1 نیز قابل توجه است. 5.1.

مقادیر مشخصه ای که سری را به پنج قسمت مساوی تقسیم می کنند نامیده می شوند پنجک هابه ده قسمت دهک ها،صد قسمت صدک هااز آنجایی که این ویژگی ها تنها زمانی مورد استفاده قرار می گیرند که نیاز به مطالعه دقیق ساختار سری های متغیر باشد، فرمول و محاسبه آنها را ارائه نمی دهیم.

حالت توزیع

بی شک اهمیتدارای چنین مقداری از صفت است که در سری مورد مطالعه، در مجموع اغلب رخ می دهد. این مقدار نامیده می شود روشو Mo را نشان می دهند. در یک سری گسسته، حالت بدون محاسبه به عنوان مقدار ویژگی با بالاترین فرکانس تعیین می شود. به عنوان مثال، طبق جدول. 5.1 اغلب 2 گل در یک مسابقه فوتبال به ثمر رسید - 71 بار. حالت شماره 2 است. معمولاً ردیف هایی با یک مقدار مودال ویژگی وجود دارد. اگر دو یا چند مقدار برابر (و حتی چندین متفاوت، اما بزرگتر از همسایه) یک ویژگی در سری تغییرات وجود داشته باشد، به ترتیب دو وجهی ("شتر مانند") یا چندوجهی در نظر گرفته می شود. این نشان دهنده ناهمگونی مجموعه است، که احتمالاً نشان دهنده مجموعه ای از چندین مجموعه با حالت های مختلف است.

بنابراین در ازدحام گردشگرانی که از آنجا آمده بودند کشورهای مختلف، به جای یک لباس شیک که در بین ساکنان محلی غالب باشد، می توانید ترکیبی از "مدهای" مختلف را پیدا کنید که توسط مردمان مختلفصلح

در یک سری تغییرات بازه ای، به ویژه با تغییرات مداوم یک ویژگی، به طور دقیق، هر مقدار از ویژگی فقط یک بار رخ می دهد. بازه مودال بازه ای با بیشترین فرکانس است.در این بازه، مقدار شرطی صفت پیدا می شود که در نزدیکی آن چگالی توزیع، یعنی. تعداد واحدهای جمعیت در واحد اندازه گیری یک ویژگی متغیر به حداکثر می رسد. این یک مقدار شرطی است و در نظر گرفته می شود مد نقطهمنطقی است که فرض کنیم چنین حالت نقطه ای نزدیک تر به مرزهای بازه قرار دارد، که فراتر از آن فرکانس در بازه همسایه بیشتر از فرکانس در بازه فراتر از مرز دیگر بازه مدال است. از این رو ما فرمول رایج (5.15) را داریم:

جایی که ایکس 0 - حد پایین بازه مودال؛

fMo - فرکانس در بازه مودال؛

fMo -1 - فرکانس در بازه قبلی؛

fMo +1 - فرکانس در بازه بعدی بعد از مدال.

من - مقدار فاصله

طبق جدول. 5.6 محاسبه مد:

محاسبه حالت در سری بازه ایبسیار مشروط تقریباً، Mo را می توان به صورت گرافیکی تعیین کرد (شکل 5.1 را ببینید).

مقدار میانگین حسابی نیز به مطالعه ساختار سری تغییرات مربوط است، اگرچه مقدار اصلی این شاخص تعمیم‌دهنده متفاوت است. در سری توزیع مزارع بر اساس عملکرد (جدول 5.6)، میانگین عملکرد به عنوان وسط فواصل وزنی فراوانی محاسبه می شود. ایکس(با فرمول (5.2)):

رابطه میانگین، میانه و حالت

تفاوت بین میانگین حسابی، میانه و مد در این توزیع کم است. اگر توزیع از نظر شکل به قانون عادی نزدیک باشد، آنگاه میانه بین حالت و مقدار میانگین و به میانگین نزدیکتر از حالت است.

با عدم تقارن سمت راست ایکس̅ > من > مو.

با عدم تقارن سمت چپ ایکس̅ < من< Mo.

برای توزیع‌های دارای اریب متوسط، برابری درست است:

5.8. اندازه گیری اندازه و شدت تغییرات

میانگین مطلق اندازه های تنوع

مرحله بعدی در مطالعه تغییر صفت در کل، اندازه گیری ویژگی های نیرو، بزرگی تغییرات است. ساده ترین آنها می تواند باشد محدودهیا دامنه تغییرات -تفاوت مطلق بین مقادیر حداکثر و حداقل یک صفت از مقادیر موجود در مجموعه مقادیر مورد مطالعه. بنابراین، دامنه تغییرات با فرمول محاسبه می شود

از آنجایی که بزرگی محدوده فقط حداکثر تفاوت در مقادیر ویژگی را مشخص می کند، نمی تواند قدرت منظم تغییرات آن را در کل جمعیت اندازه گیری کند. شاخصی که برای این منظور در نظر گرفته شده است باید تمام تفاوت های مقادیر ویژگی را در مجموع بدون استثنا در نظر گرفته و تعمیم دهد. تعداد این تفاوت ها برابر است با تعداد ترکیبات دو نفره از همه واحدهای جمعیت. مطابق جدول 5.6 خواهد بود: C^= 10 153. با این حال، نیازی به در نظر گرفتن، محاسبه و میانگین تمام انحرافات وجود ندارد. استفاده از میانگین انحراف مقادیر مشخصه از مقدار میانگین حسابی ویژگی آسانتر است و تنها 143 عدد از آنها وجود دارد. اما میانگین انحراف مقادیر مشخصه از مقدار میانگین حسابی، با توجه به به خاصیت معروف دومی، صفر است. بنابراین، شاخص قدرت تغییرات جبری نیست انحراف متوسط، آ میانگین مدول انحرافات:

طبق جدول. 5.6 ماژول وسط یا انحراف خطی متوسط،در قدر مطلق به عنوان مدول انحراف وزن دار فرکانس، نقاط میانی فواصل از میانگین حسابی محاسبه می شود، یعنی. طبق فرمول

به این معنی که به طور متوسط ​​عملکرد در مجموعه مزارع مورد مطالعه 6.85 سانتی‌گراد در هکتار از میانگین عملکرد منطقه انحراف داشت. سادگی محاسبه و تفسیر جنبه های مثبت این شاخص است، با این حال، ویژگی های ریاضی ماژول ها "بد" هستند: آنهارا نمی توان با هیچ قانون احتمالی از جمله توزیع نرمال، که پارامتر آن میانگین ماژول انحرافات نیست، بلکه انحراف معیار(در برنامه های کامپیوتری انگلیسی به نام "انحراف معیار"، به اختصار "s.d." یا به سادگی « س», به زبان روسی - NKO). در ادبیات آماری، انحراف معیار از مقدار میانگین معمولاً با یک کوچک (کوچک) نشان داده می شود. نامه یونانیسیگما (st) یا س(به فصل 7 مراجعه کنید):

برای سریال های رتبه بندی شده

برای سری های فاصله ای

طبق جدول. 5.6 انحراف معیار عملکرد دانه:

لازم به ذکر است که مقداری گرد کردن مقدار متوسط ​​و نقاط میانی فواصل، به عنوان مثال، به اعداد صحیح، تأثیر کمی بر مقدار σ دارد که در این صورت به 8.55 c/ha می رسد.

انحراف استاندارد در بزرگی در جمعیت های واقعی همیشه بیشتر از مدول انحراف متوسط ​​است. نسبت (در: آبه وجود انحرافات شدید و برجسته در سنگدانه ها بستگی دارد و می تواند به عنوان نشانگر "آلودگی" سنگدانه با عناصر ناهمگن با جرم اصلی باشد: هر چه این نسبت بزرگتر باشد، چنین "آلودگی" قوی تر است. برای قانون عادیتوزیع σ : a = 1,2.

مفهوم پراکندگی

مربع انحراف معیار مقدار را می دهد پراکندگی σ 2 .فرمول پراکندگی:

ساده (برای داده های گروه بندی نشده):

وزن دار (برای داده های گروه بندی شده):

تقریباً تمام روش های آمار ریاضی بر اساس پراکندگی است. قانون اضافه کردن واریانس از اهمیت عملی زیادی برخوردار است (به فصل 6 مراجعه کنید).

سایر معیارهای تغییر

یکی دیگر از شاخص های قدرت تنوع، که آن را نه در کل جمعیت، بلکه فقط در بخش مرکزی آن مشخص می کند، این است. میانگین فاصله یک چهارم،آن ها میانگین مقدار اختلاف بین چارک ها که در زیر نشان داده شده است q:

برای توزیع شرکت های کشاورزی بر اساس عملکرد در جدول. 5.2

q\u003d (36.25 - 25.09): 2 \u003d 5.58 کیلوگرم در هکتار. قدرت تنوع در بخش مرکزی جمعیت معمولا کمتر از کل جمعیت است. نسبت بین میانگین مدول انحرافات و میانگین انحراف سه ماهه نیز برای مطالعه ساختار تغییرات مفید است: مقدار زیادی از این نسبت نشان دهنده وجود یک "هسته" با متغیر ضعیف و یک محیط به شدت پراکنده در اطراف این هسته یا "هاله" است. " در جامعه مورد مطالعه. برای داده های جدول نسبت 5.6 الف: ق= 1.23، که نشان دهنده تفاوت کمی در قدرت تغییرات در بخش مرکزی جمعیت و در حاشیه آن است.

برای ارزیابی شدت تنوع و مقایسه آن در جمعیت های مختلف و حتی بیشتر از آن برای صفات مختلف، لازم است شاخص های نسبی تنوعآنها به عنوان نسبت شاخص های مطلق قدرت تغییرات، که قبلاً بحث شد، به مقدار میانگین حسابی صفت محاسبه می شوند. ما شاخص های زیر را دریافت می کنیم:

1) محدوده نسبی تغییرات p:

2) مدول انحراف نسبی t:

3) ضریب تغییرات به عنوان انحراف مربع نسبی v:

4) فاصله ربع نسبی د:

جایی که q - میانگین فاصله چارکی

برای تغییر عملکرد بر اساس جدول. 5.6 این شاخص ها عبارتند از:

ρ = 42.4: 30.3 = 1.4 یا 140%؛

تی= 6.85: 30.3 = 0.226، یا 22.6٪.

v = 8.44: 30.3 = 0.279 یا 27.9%؛

د= 5.58: 30.3 = 0.184 یا 18.4%.

ارزیابی درجه شدت تغییرات فقط برای هر ویژگی فردی یک جمعیت از یک ترکیب خاص امکان پذیر است. بنابراین، برای مجموعه‌ای از شرکت‌های کشاورزی، تغییرات عملکرد در همان منطقه طبیعی را می‌توان ضعیف ارزیابی کرد اگر v < 10%, умеренная при 10% < v < 25% и сильная при v > 25%.

در مقابل، تغییر قد در جمعیت مردان یا زنان بالغ در حال حاضر با ضریب برابر با 7٪ باید توسط مردم ارزیابی و درک شود. بنابراین، ارزیابی شدت تغییرات شامل مقایسه تغییرات مشاهده شده با مقداری از شدت معمول آن است که به عنوان یک استاندارد در نظر گرفته شده است. ما به این واقعیت عادت کرده ایم که بهره وری، درآمد یا درآمد سرانه، تعداد اتاق های نشیمن در یک ساختمان می تواند چندین یا حتی ده ها برابر متفاوت باشد، اما تفاوت قد افراد حداقل یک و نیم برابر قبلاً به عنوان بسیار قوی.

قدرت متفاوت، شدت تغییر به دلیل دلایل عینی. به عنوان مثال، قیمت فروش دلار آمریکا در بانک های تجاری در سن پترزبورگ در 24 ژانویه 1997 از 5675 تا 5640 روبل متغیر بود. با قیمت متوسط ​​5664 روبل. محدوده نسبی تنوع ρ = 35:5664 = 0.6%. چنین تغییر کوچکی به این دلیل است که با تفاوت قابل توجهی در نرخ دلار، بلافاصله خروج خریداران از بانک "گران قیمت" به بانک های "ارزان تر" رخ می دهد. برعکس، قیمت یک کیلوگرم سیب زمینی یا گوشت گاو در مناطق مختلف روسیه بسیار متفاوت است - ده ها درصد یا بیشتر. این به دلیل هزینه های متفاوت برای تحویل کالا از منطقه تولید کننده به منطقه مصرف کننده است، یعنی. ضرب المثل "یک تلیسه در خارج از کشور نصف است، اما یک روبل حمل می شود."

5.9. لحظه های توزیع و شاخص ها اشکال آن

لحظه های مرکزی توزیع

برای مطالعه بیشتر ماهیت تغییرات، از مقادیر متوسط ​​درجات مختلف انحراف مقادیر فردی یک صفت از مقدار میانگین حسابی آن استفاده می شود. این شاخص ها نامیده می شوند لحظات مرکزیتوزیع‌هایی از ترتیب مربوط به قدرتی که انحرافات به آن افزایش می‌یابد (جدول 5.7)، یا به سادگی ممان‌ها (لمان‌های غیرمرکزی به ندرت استفاده می‌شوند و در اینجا در نظر گرفته نمی‌شوند). مقدار لحظه سوم ts- مانند علامت آن به غلبه مکعب های مثبت انحراف بر مکعب های منفی بستگی دارد یا برعکس. در حالت عادی و هر توزیع کاملاً متقارن دیگری، مجموع مکعب‌های مثبت کاملاً برابر با مجموع مکعب‌های منفی است.

شاخص های عدم تقارن

بر اساس لحظه مرتبه سوم، می توان شاخصی ساخت که درجه عدم تقارن توزیع را مشخص می کند:

مانندتماس گرفت ضریب عدم تقارنمی توان آن را از داده های گروه بندی شده و گروه بندی نشده محاسبه کرد. طبق جدول. 5.6 شاخص عدم تقارن بود:

آن ها عدم تقارن اندک است K. Pearson آماردان انگلیسی، بر اساس تفاوت بین مقدار متوسط ​​و حالت، شاخص دیگری از عدم تقارن را پیشنهاد کرد.

جدول 5.7

لحظات محوری

طبق جدول. 5.6 شاخص پیرسون:

شاخص پیرسون به درجه عدم تقارن در قسمت میانی سری توزیع بستگی دارد و شاخص عدم تقارن بر اساس لحظه مرتبه سوم به مقادیر شدید صفت بستگی دارد. بنابراین، در مثال ما، در قسمت میانی توزیع، عدم تقارن قابل توجه تر است که از نمودار نیز قابل مشاهده است (شکل 5.1). توزیع‌هایی با چولگی قوی سمت راست و چپ (مثبت و منفی) در شکل‌ها نشان داده شده است. 5.3.

خصوصیات کشش توزیع

با کمک لحظه مرتبه چهارم، ویژگی پیچیده‌تر سری توزیع نسبت به عدم تقارن، نامیده می‌شود کشیدگی


برنج. 5.3. عدم تقارن، توزیع ها

شاخص کشش با فرمول محاسبه می شود

(5.30)

اغلب کشش به عنوان "شیب" توزیع تفسیر می شود، اما این نادقیق و ناقص است. نمودار توزیع بسته به قدرت تغییر صفت می‌تواند به‌طور دلخواه شیب‌دار به نظر برسد: هرچه این تغییرات ضعیف‌تر باشد، منحنی توزیع در یک مقیاس معین تندتر است. ناگفته نماند که با تغییر مقیاس ها در امتداد ابسیسا و در امتداد منتخب، می توان هر توزیعی را به طور مصنوعی "تند" و "شیب" کرد. برای نشان دادن میزان کشیدگی توزیع و تفسیر صحیح آن، باید سری‌هایی را با قدرت تغییر یکسان (مقدار یکسان σ) و شاخص‌های کشیدگی مختلف مقایسه کنید. برای اینکه کشیدگی با چولگی اشتباه نشود، تمام ردیف های مقایسه شده باید متقارن باشند. چنین مقایسه ای در شکل نشان داده شده است. 5.4.

شکل 5.4. کشش توزیع

برای یک سری متغیر با توزیع نرمال، مقادیر من شاخص کشش، محاسبه شده با فرمول (5.30)، j برابر با سه است.

با این حال ، چنین شاخصی را نباید اصطلاح "kurtosis" نامید که در ترجمه به معنای "زیاد" است. اصطلاح "کورتوز" را باید نه بر خود نسبت طبق فرمول (5.30) بلکه برای مقایسه چنین نسبتی برای توزیع مورد مطالعه با مقدار نسبت داده شده توزیع نرمال به کار برد. با مقدار 3. از این رو فرمول های نهایی برای شاخص کشیدگی، i.e. مازاد در مقایسه با توزیع نرمال با قدرت تغییرات یکسان، به شکل زیر است:

برای سریال های رتبه بندی شده

برای سری تغییرات بازه ای و گسسته

وجود یک کشش مثبت، و همچنین تفاوت قابل توجهی که قبلاً ذکر شد بین یک فاصله کوچک سه ماهه و یک انحراف استاندارد بزرگ، به این معنی است که در توده پدیده های مورد مطالعه یک "هسته" وجود دارد که در این ویژگی کمی متفاوت است، که توسط یک پراکنده "هاله". با یک کشش منفی قابل توجه، چنین "هسته ای" به هیچ وجه وجود ندارد.

با مقادیر شاخص های چولگی و کشیدگی توزیع، می توان نزدیکی توزیع به نرمال را قضاوت کرد که می تواند برای ارزیابی نتایج همبستگی و نیز ضروری باشد. تجزیه و تحلیل رگرسیون، احتمالات ارزیابی احتمالی پیش بینی ها (به فصل های 7،8،9 مراجعه کنید). توزیع را می توان نرمال در نظر گرفت، یا به طور دقیق تر، فرضیه شباهت توزیع واقعی با توزیع نرمال را نمی توان رد کرد اگر شاخص های چولگی و کشیدگی از انحراف استاندارد دو برابری سانتی متر تجاوز نکنند. این انحرافات استاندارد با فرمول های زیر محاسبه می شوند:

5.10. حداکثر مقادیر ممکن شاخص های تنوع و کاربرد آنها

هنگام استفاده از هر نوع شاخص آماری، دانستن اینکه حداکثر مقادیر ممکن یک شاخص معین برای سیستم مورد مطالعه چقدر است و نسبت مقادیر واقعی مشاهده شده به حداکثر ممکن چقدر است مفید است. این مشکل به ویژه هنگام مطالعه تغییرات شاخص های حجم، مانند حجم تولید یک نوع خاص از محصول، در دسترس بودن منابع خاص، توزیع سرمایه گذاری های سرمایه، درآمدها و سود بسیار مهم است. اجازه دهید به صورت نظری و عملی این موضوع را به عنوان مثال توزیع تولید سبزی بین بنگاه های کشاورزی منطقه بررسی کنیم.

بدیهی است که حداقل مقدار ممکن شاخص های تغییرات با توزیع کاملاً یکنواخت صفت حجم بین همه واحدهای جمعیت، یعنی با حجم یکسان تولید در هر یک از شرکت های کشاورزی به دست می آید. در چنین توزیع محدود کننده (البته در عمل بسیار بعید) هیچ گونه تغییری وجود ندارد و همه شاخص ها، تغییرات برابر با صفر هستند.

حداکثر مقدار ممکن شاخص‌های تغییرات با چنین توزیعی از صفت حجمی در جمعیت به دست می‌آید که در آن کل حجم آن در یک واحد از جمعیت متمرکز می‌شود. به عنوان مثال، کل حجم تولید سبزیجات - در یک شرکت کشاورزی منطقه در غیاب تولید آنها در مزارع دیگر. احتمال چنین غلظت فوق العاده ممکنی از حجم یک ویژگی در یک واحد جمعیت چندان کم نیست. در هر صورت، بسیار بیشتر از احتمال توزیع کاملاً یکنواخت است.

توان های تغییر را برای حالت محدود نشان داده شده حداکثر آن در نظر بگیرید. اجازه دهید تعداد واحدهای جمعیت را مشخص کنیم پ،مقدار متوسط ​​ویژگی ایکس̅ , سپس حجم کل ویژگی در مجموع به صورت بیان می شود ایکس̅ پ.تمام این حجم در یک واحد جمعیت متمرکز شده است، به طوری که ایکسحداکثر= x̅ ص xدقیقه = 0, از این رو نتیجه می شود که حداکثر مقدار دامنه (محدوده تغییرات) برابر است با:

برای محاسبه حداکثر مقادیر میانگین مدول و انحرافات درجه دوم، جدول انحرافات را می سازیم (جدول 5.8).

جدول 5.8

ماژول ها و مربع های انحراف از میانگین در حداکثرتنوع ممکن

اعداد واحد جمعیت

مقادیر ویژگی

انحراف از میانگین

x i - ایکس̅

ماژول های انحراف

|x i - x̅|

مربع های انحراف

(ایکسمن- ایکس̅ ) 2

ایکس̅ پ

ایکس̅ (پ - 1)

-ایکس̅

-ایکس̅

-ایکس̅

ایکس̅ (پ - 1)

ایکس̅

ایکس̅

ایکس̅

ایکس̅ 2 (پ - 1) 2

ایکس̅ 2

ایکس̅ 2

ایکس̅ 2

ایکس̅ پ

2ایکس̅ (پ - 1)

ایکس̅ 2 [(پ - 1) 2 +(n-1)]

بر اساس عبارات خط پایانی جدول. 5.8، ما حداکثر مقادیر ممکن زیر را از شاخص های تغییرات بدست می آوریم.

میانگین مدول انحرافات یا انحراف خطی متوسط:

انحراف معیار:

انحراف مدولار نسبی (خطی):

ضریب تغییرات:

در مورد فاصله سه ماهه، سیستم با حداکثر تغییرات ممکن دارای ساختار منحط توزیع ویژگی است که در آن هیچ ویژگی ("کار نمی کند") ساختار وجود ندارد: میانه، چارک ها و موارد مشابه.

بر اساس فرمول های به دست آمده برای حداکثر مقادیر ممکن شاخص های اصلی تغییرات، اول از همه، نتیجه گیری در مورد وابستگی این مقادیر به حجم جمعیت است. پ.این وابستگی در جدول خلاصه شده است. 5.9.

باریک‌ترین محدودیت‌های تغییر و وابستگی ضعیف به اندازه جمعیت، مدول متوسط ​​و انحراف خطی نسبی را نشان می‌دهد. برعکس، انحراف معیار و ضریب تغییرات به شدت به تعداد واحدهای جمعیت بستگی دارد. این وابستگی باید در هنگام مقایسه شدت تنوع در جمعیت های با اندازه های مختلف در نظر گرفته شود. اگر در مجموع شش بنگاه ضریب تغییرات در حجم تولید 0.58 و در مجموع 20 بنگاه 0.72 بود، آیا منصفانه است که نتیجه بگیریم که حجم تولید در جمعیت دوم ناهموارتر است؟ در واقع، در اولین، کوچکتر، 0.58: 2.24 = 25.9٪ از حداکثر ممکن، یعنی. حد، سطح تمرکز تولید در یک شرکت از شش شرکت، و در مجموعه دوم، بزرگتر، ضریب تغییرات مشاهده شده تنها 0.72 بود: 4.36 = 16.5٪ از حداکثر ممکن.

جدول 5.9

مقادیر محدود کننده شاخص های تنوع یک ویژگی حجمی برای اندازه های مختلف جمعیت

میزان جمعیت

حداکثر مقادیر شاخص ها

ایکس̅

ایکس̅

1,5ایکس̅

1,73ایکس̅

1,67ایکس̅

2,24ایکس̅

1,80ایکس̅

3ایکس̅

1,90ایکس̅

4,36ایکس̅

1,96ایکس̅

7ایکس̅

1,98ایکس̅

9,95ایکس̅

2ایکس̅

از اهمیت عملی چنین شاخصی مانند نسبت ماژول انحراف متوسط ​​واقعی به حداکثر ممکن است. بنابراین، برای مجموع شش شرکت، این نسبت: 0.47: 1.67 = 0.281 یا 28.1٪ بود. تفسیر شاخص به‌دست‌آمده به این صورت است: برای انتقال از توزیع مشاهده شده تولید بین بنگاه‌ها به توزیع یکنواخت، نیاز به توزیع مجدد است.

23.4 درصد از کل تولید در کل. اگر درجه غلظت واقعی تولید (مقدار واقعی σ یا v) کسری معینی از ارزش نهایی در مورد انحصار تولید در یک شرکت است، سپس نسبت شاخص واقعی به حاشیه می تواند درجه تمرکز (یا انحصار) تولید را مشخص کند.

نسبت مقادیر واقعی شاخص های تغییر یا تغییر ساختار به حداکثر ممکن نیز در تجزیه و تحلیل تغییرات سازه استفاده می شود (به فصل 11 مراجعه کنید).

1. جین کی.مقادیر متوسط - م.: آمار، 1970.

2. Krivenkova L. N.، Yuzbashev M. M.حوزه وجود شاخص های تغییرات و کاربرد آن // بولتن آمار. - 1991. - شماره 6. - S. 66-70.

3. پسخاور I. S.مقادیر متوسط ​​در آمار - م.: آمار. 1979.

4. شوراکوف V. V.، Dayitbegov D. M. و دیگران.خودکار محل کارپردازش داده های آماری (فصل 4. پردازش داده های آماری اولیه). - م.: امور مالی و آمار، 1990.

با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

بارگذاری...