گروه های ثانویه مقایسه گروه بندی های آماری

ارسال کار خوب خود در پایگاه دانش ساده است. از فرم زیر استفاده کنید

کار خوببه سایت">

دانشجویان، دانشجویان تحصیلات تکمیلی، دانشمندان جوانی که از دانش پایه در تحصیل و کار خود استفاده می کنند از شما بسیار سپاسگزار خواهند بود.

نوشته شده در http://www.allbest.ru/

آکادمی مسکو S.Yu. ویت

دانشکده اقتصاد

تست

کار انجام شده:

دانشجوی سال اول،

آموزش از راه دور

Vislyaeva M.N.

شهر مسکو

هنگام انجام یک کار کنترلی، باید یک گروه بندی مجدد ثانویه برای not انجام دهید مثال پیچیده(یک مثال را خودتان انتخاب کنید) و توضیح دهید که چگونه و تحت چه شرایطی چنین محاسبه مجدد معتبر است. هنگام استفاده از برنامه های رایانه ای و مثال پیچیده تر، تأثیر و ویژگی های استفاده از فناوری اطلاعات را نیز نشان دهید.

در پاسخ کتبی خود به تکلیف، باید:

1. رابطه بین فرمول جمع واریانس و نسبت همبستگی را توضیح دهید، معنای آماری آن را توضیح دهید.

2. مقایسه تغییرات برای دو توزیع مختلف با میانگین های مختلف، شرایط مقایسه را در زمانی که میانگین ها متفاوت است توضیح دهید.

3. کامل ترین توضیح را در مورد معنای خطای حاشیه ای ارائه دهید، آن را با مفهوم نماینده بودن نمونه و حجم مورد نیاز آن مرتبط کنید.

4. رابطه بین تخمین پارامترهای مجهول توسط LSM و تأیید اهمیت نتایج بدست آمده توسط معیارهای آزمون فرضیه های آماری را توضیح دهید.

بازآرایی آمارهای گروه بندی شده قبلی را گروه بندی ثانویه می نامند. این روش در مواردی استفاده می شود که در نتیجه گروه بندی اولیه، ماهیت توزیع جمعیت مورد مطالعه به وضوح آشکار نشده است.

در این مورد، فواصل بزرگ یا کاهش می یابد. همچنین از گروه بندی ثانویه برای رساندن گروه ها به شکل قابل مقایسه در فواصل زمانی مختلف به منظور مقایسه آنها استفاده می شود. روش های گروه بندی ثانویه را با مثال در نظر بگیرید.

برای بزرگنمایی فواصل بر اساس داده های جدول 1:

میز 1

تعداد فروشگاه ها

گروه بندی فوق به اندازه کافی واضح نیست، زیرا الگوی مشخص و دقیقی در تغییر گردش مالی توسط گروه ها نشان نمی دهد.

اجازه دهید سری توزیع را متراکم کنیم و شش گروه را تشکیل دهیم. گروه های جدید با جمع بندی گروه های اصلی تشکیل می شوند (جدول 2).

جدول 2

گروه های فروشگاه ها بر اساس گردش مالی برای سه ماهه چهارم، هزار روبل

تعداد فروشگاه ها

گردش مالی برای سه ماهه چهارم، هزار روبل.

گردش مالی به طور متوسط ​​برای 1 فروشگاه، هزار روبل.

کاملاً واضح است که هر چه فروشگاه ها بزرگتر باشند، سطح گردش مالی بالاتر است.

1. با گروه بندی تحلیلی، می توانید ارتباط را با استفاده از یک رابطه همبستگی تجربی اندازه گیری کنید. این نشانگر مشخص شده است نامه یونانی h (این یکی). بر اساس قانون تجزیه واریانس است که بر اساس آن واریانس کل s2 برابر است با مجموع واریانس های درون گروهی و بین گروهی.

پراکندگی صفت مؤثر در گروه با ثبات نسبی عامل صفت به دلیل عوامل دیگر ایجاد می شود. این پراکندگی باقیمانده نامیده می شود. با فرمول تعیین می شود:

که در آن y ij مقدار مشخصه y برای آن است واحد iدر گروه j ام؛

J مقدار متوسط ​​صفت در گروه j است.

n j - عدد واحدهای j-thگروه;

j = 1، 2، 3، ...، یعنی.

واریانس های درون گروهی محاسبه شده برای گروه های فردی با میانگین واریانس درون گروهی ترکیب می شوند:

واریانس بین گروهی به عامل مورد مطالعه (و عوامل مرتبط با آن) نسبت داده می شود، بنابراین این واریانس فاکتوریل نامیده می شود. با فرمول مشخص می شود

قانون اضافه کردن واریانس را می توان نوشت:

تجربی رابطه همبستگیاندازه گیری می کند که چه مقدار از کل نوسانات صفت حاصل توسط عامل مورد مطالعه ایجاد می شود. بر این اساس، به عنوان نسبت واریانس عامل به محاسبه می شود واریانس کلنشانه موثر:

این شاخص مقادیر را در فاصله زمانی می گیرد: هر چه به 1 نزدیک تر باشد، رابطه نزدیک تر است و بالعکس.

جدول 3. داده های اولیه

جدول 4. کاربرگ

میانگین گردش مالی \u003d؟ X * f / f \u003d 17370/51 \u003d 340.58 هزار روبل.

پراکندگی عبارت است از:

G2 =؟ f*(X-Xav) 2 / ? f = 38682.36/51 = 758.48

میانگین انحراف معیار:

ضریب تغییرات:

V \u003d G / Xav \u003d 27.54 / 758.48 \u003d 0.081; 8.1 درصد

ضریب تغییرات کمتر از 33 درصد است، بنابراین، جمعیت همگن است.

جدول 5. داده های اولیه

1) میانگین زمان صرف شده برای سفر به محل کار برای کارگران = X cf =؟ Xf / ?f = (25*70 + 35*80 + 45*200 + 55*55 + 65*15) / 420 = 41.8 دقیقه.

2) محاسبه واریانس

پراکندگی عبارت است از:

G2 =؟ f انحراف:

3) ضریب * (X-Xav) 2 / ? f = 43160.8 / 420 = 102.8

میانگین تغییرات مربع عبارت است از:

V \u003d G / Xav \u003d 10.14 / 41.8 \u003d 0.24; 24%

ضریب تغییرات کمتر از 33٪ است، بنابراین، مجموعه در نظر گرفته شده همگن است و میانگین برای آن کاملا معمولی است.

مجموعه نمونه‌گیری می‌تواند بر اساس یک علامت کمی از مقادیر آماری و همچنین بر مبنای جایگزین یا اسنادی تشکیل شود. در حالت اول، مشخصه تعمیم دهنده نمونه، مقدار میانگین نمونه است که نشان داده می شود و در حالت دوم، کسر نمونه مقادیر با w نشان داده می شود. AT جمعیتبه ترتیب: میانگین عمومی و سهم عمومی r.

تفاوت -- و W -- p خطای نمونه گیری نامیده می شود که بر خطای ثبت و خطای نمایندگی تقسیم می شود. قسمت اول خطای نمونه گیری ناشی از اطلاعات نادرست یا نادرست به دلیل درک نادرست از اصل موضوع، بی احتیاطی مسئول ثبت در پر کردن پرسشنامه ها، فرم ها و غیره است. تشخیص و رفع آن نسبتاً آسان است. بخش دوم خطا از عدم انطباق ثابت یا خود به خودی با اصل انتخاب تصادفی ناشی می شود. تشخیص و حذف آن دشوار است، بسیار بزرگتر از اولی است و بنابراین توجه اصلی به آن معطوف می شود.

نقش بسیار مهمی برای توجیه و کاربرد مشاهده انتخابیقانون اعداد بزرگ را اجرا می کند. استفاده از قوانین اعداد زیاد این است که، تحت شرایط معین و با حجم کافی مشاهدات، ویژگی های خلاصه ای که بر اساس مشاهده انتخابی به دست می آید، تفاوت چندانی با ویژگی های متناظر وکالت نامه عمومی نخواهد داشت. بر این اساس می توان با افزایش حجم نمونه، از حدود خطاهای احتمالی بازنمایی کم کرد، آنها را به کوچکترین اندازه رساند. از سوی دیگر، با دانستن حدود خطاهای نمایندگی، می توان حجم نمونه مورد نیاز را تعیین کرد.

یکی از مهم ترین و مسئولیت پذیرترین وظایف در سازماندهی و انجام مشاهده نمونه، تعیین حجم مورد نیاز نمونه است. اندازه آن، که دریافت داده هایی را تضمین می کند که نسبتاً به درستی ویژگی های جمعیت عمومی مورد مطالعه را منعکس می کند.

در این مورد موارد زیر باید در نظر گرفته شود: 1) خطای نمونه برداری حاشیه ای با چه درجه ای از دقت باید به دست آید. 2) احتمال اطمینان از صحت مشروط نتایج مشاهده نمونه چقدر باید باشد. 3) درجه نوسان خواص مورد مطالعه در جمعیت عمومی مورد مطالعه.

این بدان معنی است که اندازه نمونه مورد نیاز بسته به اندازه خطای نمونه برداری حاشیه ای، مقدار ضریب اطمینان (t) و اندازه واریانس تنظیم می شود.

روش تخمین پارامتر رگرسیون خطی، به حداقل رساندن مجموع مجذور انحراف مشاهدات متغیر وابسته از مجهول تابع خطی، روش حداقل مربعات نامیده می شود.

ماهیت روش در این واقعیت نهفته است که معیار کیفیت راه حل مورد بررسی، مجموع مربعات خطاها است که به دنبال به حداقل رساندن آن است. برای اعمال این روش، لازم است تا حد امکان انجام شود بیشتراندازه گیری یک متغیر تصادفی ناشناخته (هر چه بیشتر باشد - دقت راه حل بالاتر است) و مجموعه ای از راه حل های پیشنهادی که از بین آنها باید بهترین را انتخاب کرد. اگر مجموعه راه حل ها پارامتری باشد، باید آن را پیدا کنیم مقدار بهینهمولفه های.

LSM در ریاضیات، به ویژه - در نظریه احتمال و آمار ریاضی. این روش بیشترین کاربرد را در مشکلات فیلترینگ دارد، زمانی که لازم است سیگنال مفید را از نویز قرار گرفته بر روی آن جدا کنید. همچنین در آنالیز ریاضی برای نمایش تقریبی یک تابع داده شده توسط توابع ساده تر استفاده می شود. یکی دیگر از زمینه های کاربرد LSM حل سیستم های معادلات با تعداد مجهولات کمتر از تعداد معادلات است.

مراحل آزمون فرضیه های آماری:

بیان فرضیه اصلی H 0 و فرضیه رقیب H 1 . فرضیه ها باید به وضوح در شرایط ریاضی رسمیت داده شوند.

تنظیم احتمال b که سطح اهمیت نامیده می شود و مربوط به خطاهای نوع اول است که در آینده درباره صحت فرضیه نتیجه گیری خواهد شد.

محاسبه آمار معیار به این صورت است که:

مقدار آن به نمونه اولیه بستگی دارد.

با مقدار آن می توان در مورد صحت فرضیه H 0 نتیجه گیری کرد.

خود آمار q باید از قانون توزیع شناخته شده پیروی کند، زیرا q خود بر حسب شانس تصادفی است.

ساخت منطقه بحرانی زیر مجموعه ای از چنین مقادیری از محدوده مقادیر u متمایز می شود که می تواند برای قضاوت در مورد اختلافات قابل توجه با این فرض استفاده شود. اندازه آن به گونه ای انتخاب شده است که برابری برقرار باشد. به این مجموعه منطقه بحرانی می گویند.

نتیجه گیری در مورد صحت فرضیه. مقادیر مشاهده شده نمونه در آمار u جایگزین می شود و با ضربه زدن (یا عدم برخورد) به منطقه بحرانی، تصمیم به رد (یا پذیرش) فرضیه ارائه شده H 0 گرفته می شود.

تنوع همبستگی واریانس

میزبانی شده در Allbest.ru

...

اسناد مشابه

    جدول مقادیر نمونه گسسته متغیرهای تصادفیبه صورت منظم جدول سری های آماری بازه ای فرکانس های نسبی. تنظیم یک تابع توزیع تجربی و رسم نمودار آن. چند ضلعی و توزیع یک متغیر تصادفی.

    کار عملی، اضافه شده در 2012/07/26

    ویژگی های عددی برای توزیع های آماری. ایجاد فاصله سری تغییرات، چند ضلعی فرکانس، نمودار تابع توزیع نمونه و تعیین میانگین نمونه و واریانس نمونه به دو صورت.

    ارائه، اضافه شده در 11/01/2013

    مقدار متوسط ​​شاخص (میانگین حسابی). شاخص های تغییرات - محدوده تغییرات، میانگین انحراف خطی، انحراف استاندارد، واریانس، ضریب تغییرات. حداکثر و حداقل مقدار آمار.

    تست، اضافه شده در 11/14/2008

    مفهوم جمعیت عمومی، انتظارات ریاضیو پراکندگی حصول اطمینان از تصادفی بودن و نماینده بودن نمونه در برنامه ریزی آماری. سری تغییرات گسسته و بازه ای، تخمین های نقطه ایپارامترهای توزیع صفت

    چکیده، اضافه شده در 1390/06/13

    ماهیت تحقیق نمونه گیری. روش های انتخاب واحدها در چارچوب نمونه. میانگین و خطای حاشیه ای برای اندیکاتورها سایز متوسطو شاخص ها را به اشتراک بگذارید. تعیین حجم نمونه مورد نیاز برای یک مورد معین خطای حاشیه ایمقدار متوسط

    ارائه، اضافه شده در 2014/03/16

    فرم ها، انواع و روش ها مشاهده آماری. انواع گروه بندی ها، فاصله زمانی و فراوانی آنها. ساختار یک سری از دینامیک. مطلق و نسبی آمار. ارائه نمونه در قالب یک سری آماری. تخمین نقطه و فاصله

    دوره سخنرانی ها، اضافه شده در 2013/11/29

    ساخت سری تغییرات بازه ای توسط اندیکاتورها. محاسبه میانگین حسابی، حالت و میانه، نسبی و شاخص های مطلقتغییرات. تعیین ویژگی های کمی توزیع ها، ساخت یک تابع تجربی.

    مقاله ترم، اضافه شده 01/11/2012

    نمودار پراکندگی را به عنوان نقاطی روی صفحه ترسیم کنید که مختصات آن با مقادیر متغیرهای تصادفی X و Y، ترتیب ساخت و هدف آن مطابقت دارد. یافتن ضرایب و رسم نمودار تقریب خطی، نمودار تقریب درجه دوم.

    مقاله ترم، اضافه شده 05/03/2011

    سفارش انتخاب اولیه زمان های عملیاتی تا شکست. معاینه فرضیه آماریدر مورد انطباق با توزیع نمایی و توزیع Weibull. برآورد پارامترهای توزیع و شاخص های قابلیت اطمینان، روش ها و تکنیک های اصلی آن.

    مقاله ترم، اضافه شده در 2012/01/22

    مفهوم یک سری تغییرات، توزیع آماری. تابع تجربی و ویژگی های اصلی انتظار ریاضی از واریانس نمونه. نقطه و تخمین های فاصله ایتوزیع ها نظریه فرضیه مشابه نظریه فواصل اطمینان است.

گروه‌بندی‌هایی که برای یک دوره زمانی یکسان، اما برای اشیاء مختلف، یا برعکس، برای یک شیء، اما برای دو دوره زمانی مختلف ساخته شده‌اند، ممکن است به دلیل تعداد متفاوت گروه‌های انتخاب شده یا مرزهای نابرابر فواصل، قابل مقایسه نباشند. .

گروه‌بندی ثانویه، یا گروه‌بندی مجدد داده‌های گروه‌بندی‌شده، برای توصیف بهتر پدیده مورد مطالعه (در مواردی که گروه‌بندی اولیه ماهیت توزیع واحدهای جمعیتی را به وضوح نشان نمی‌دهد)، یا برای آوردن گروه‌ها به یک نوع قابل مقایسه استفاده می‌شود. برای انجام تحلیل مقایسه ای.

گروه بندی ثانویه- این عملیاتی برای تشکیل گروه های جدید بر اساس گروه بندی قبلی است.

دو راه برای تشکیل گروه های جدید وجود دارد. اولین، ساده ترین و رایج ترین راه این است تغییر (اغلب بزرگ شدن) فواصل اولیه. روش دوم نامیده می شود بازآرایی به اشتراک بگذارید این شامل تشکیل گروه های جدید بر اساس اختصاص نسبت معینی از واحدهای جمعیتی به هر گروه است. اجازه دهید تکنیک گروه‌بندی ثانویه را با یک مثال توضیح دهیم (جدول 3.14).

جدول 3.14. توزیع سازمانی خرده فروشییکی از شهرهای منطقه مسکو با توجه به میانگین سالانه تعداد کارمندان در سال 2011 *

* داده ها مشروط هستند.

ما داده ها را دوباره گروه بندی می کنیم و گروه های جدیدی را در فواصل زمانی حداکثر 5، 5-10، 10-20، 20-30، 30 یا بیشتر تشکیل می دهیم.

اولین گروه جدید شامل کل گروه اول خرده فروشان و بخشی از گروه دوم خواهد بود. برای تشکیل یک گروه حداکثر پنج نفره باید از فاصله گروه دوم یک نفر گرفت. اندازه فاصله این گروه شش نفر است. بنابراین باید 1/6 آن را از آن گرفت. بخش مشابهی در گروه اول تازه تشکیل شده نیز باید از تعداد شرکت ها گرفته شود. 20 - = 3 شرکت. 6

سپس در گروه اول خرده فروشان 16 + 3 = 19 واحد وجود خواهد داشت.

دومین گروه جدید توسط شرکت های خرده فروشی گروه دوم منهای آنهایی که به گروه اول اختصاص داده شده اند، تشکیل می شود. 20 - 3 = 17 شرکت. گروه سوم تازه تشکیل شده شامل کلیه بنگاه های گروه سوم و بخشی از بنگاه های چهارم خواهد بود. برای تعیین این قسمت از فاصله 18 30 (عرض فاصله 12 است)، باید 2.0 را به قبلی اضافه کنید (به طوری که حد بالای فاصله برابر با 20 نفر باشد). بنابراین لازم است بخشی از فاصله را برابر با 2/12 = 1/6 گرفت. در این گروه 74 شرکت وجود دارد، بنابراین باید 74 (1/6) = 12 شرکت را در نظر بگیریم. گروه سوم جدید شامل 44 + 12 = 56 شرکت خواهد بود.

گروه چهارم که به تازگی تشکیل شده است شامل 74 - 12 = = 62 شرکت خواهد بود که از گروه چهارم قبلی باقی مانده است. پنجمین گروه تازه تشکیل شده از بنگاه‌های خرده‌فروشی گروه‌های پنجم و ششم قبلی تشکیل می‌شود: 37 + 9 = 46 بنگاه.

در نتیجه، گروه های جدیدی به دست می آوریم (جدول 3.15).

جدول 3.15. توزیع شرکت های خرده فروشی در یکی از شهرهای منطقه مسکو بر اساس میانگین سالانه تعداد کارمندان در سال 2011 پس از گروه بندی مجدد داده ها *

* داده ها مشروط هستند.

جدول آماری: ماهیت، عناصر و طبقه بندی

جدول آماری - منطقی ترین، بصری ترین و فشرده ترین شکل ارائه مطالب آماری، از جمله نتایج گروه بندی آماری. با این حال، هر جدولی آماری نیست. جدول ضرب، پرسشنامه یک نظرسنجی جامعه شناختی ممکن است به صورت جدول باشد، اما هنوز جداول آماری نیستند.

جدول آماریجدولی است که شامل یک خلاصه است مشخصه عددیاز جمعیت مورد مطالعه بر اساس یک یا چند ویژگی اساسی که با منطق تحلیل اقتصادی به هم مرتبط هستند.

عناصر اصلی جدول آماری که ستون فقرات (مبنا) آن را تشکیل می دهند در طرح 3.1 نشان داده شده است.

جدولیاین شکل از ترتیب اطلاعات عددی نامیده می شود که در آن عدد در تقاطع یک عنوان مشخص در امتداد یک ستون عمودی به نام قرار می گیرد. نمودار، و نام ها مطابق نوار افقی مربوطه - خط بنابراین، جدول از نظر خارجی محل تلاقی نمودارها و ردیف هایی است که اسکلت جدول را تشکیل می دهند.

جدول آماری شامل سه نوع عنوان کلی، بالا و کناری است. سربرگ کلی محتوای کل جدول را منعکس می کند (به چه مکان و زمانی تعلق دارد)، در بالای طرح جدول در مرکز قرار دارد و یک عنوان خارجی است. هدرهای برتر مشخص کردن محتوای نمودار (عنوان محمول) و جانبی (عنوان موضوع) - رشته ها. آنها به عنوان سربرگ داخلی عمل می کنند.

یک اسکلت جدول پر از سرصفحه، طرح جدول را تشکیل می دهد. اگر در محل تقاطع نمودار و خطوط اعداد را یادداشت کنیم، یک جدول آماری کامل بدست می آوریم. عنوان جدول (عنوان کلی)

طرح 3.1. اسکلت (مبنای) جدول آماری

مواد دیجیتال را می توان به صورت مطلق (سرمایه مجاز، حجم کالاهای نوآورانه و غیره)، نسبی (GDP سرانه، تعداد کامپیوترهای شخصیبه ازای هر 100 کارگر و غیره) و مقادیر متوسط ​​(متوسط ​​قیمت سهم، متوسط ​​تولید شیر در هر گاو و غیره).

جداول ممکن است همراه با یادداشتی باشد که در صورت لزوم برای توضیح سرفصل ها، روش های محاسبه برخی از شاخص ها، منابع اطلاعاتی و غیره استفاده می شود.

با توجه به محتوای منطقی، جدول یک «جمله آماری» است که ارکان اصلی آن موضوع و محمول است.

موضوعشیئی که با اعداد مشخص می شود نامیده می شود. این می تواند یک یا چند مجموعه، واحدهای مجزا از کل به ترتیب فهرست آنها باشد یا بر اساس برخی معیارها، واحدهای سرزمینی و غیره گروه بندی شوند. معمولاً موضوع جدول در سمت چپ و در نام ردیف ها آورده می شود.

محمولسیستمی از شاخص ها را تشکیل می دهد که موضوع مورد مطالعه را مشخص می کند، یعنی. موضوع جدول محمول عناوین بالایی را تشکیل می دهد و محتوای نمودار را با ترتیب منطقی متوالی شاخص ها از چپ به راست تشکیل می دهد.

مکان موضوع و محمول در برخی موارد می تواند با یک و کامل تر جایگزین شود راه بهترخواندن و تجزیه و تحلیل اطلاعات اولیه در مورد جمعیت مورد مطالعه.

با توجه به ساختار موضوع،بسته به گروه بندی واحدها در آن، جداول آماری ساده و پیچیده وجود دارد.

ساده یک جدول آماری نامیده می شود که در موضوع آن فهرستی از اشیا یا واحدهای سرزمینی آورده شده است. جداول آماری ساده به دو دسته تک نگاری و فهرست تقسیم می شوند.

جداول تک نگاری مشخص کردن نه کل مجموعه واحدهای شی مورد مطالعه، بلکه فقط یکی از هر واحد یا گروهی را که بر اساس یک ویژگی خاص تخصیص داده شده است (جدول 3) .16).

جدول 3.16. راه اندازی امکانات اجتماعی و فرهنگی در نهادهای تشکیل دهنده فدراسیون روسیه در سال 2009

جدول ها را فهرست کنید جداول نامیده می شوند که موضوع آنها شامل فهرستی از اشیا یا واحدهای شی مورد مطالعه است (جدول 3.17).

جداول پیچیده آماری بر خلاف موارد ساده، شناسایی انواع اجتماعی-اقتصادی پدیده های مورد مطالعه، ساختار آنها و همچنین روابط متقابل و وابستگی های متقابل بین ویژگی هایی که آنها را مشخص می کند، ممکن می سازد. این کارها را می توان با کمک جداول گروهی و مخصوصاً ترکیبی به طور کامل حل کرد.

گروه جداول آماری نامیده می شوند که موضوع آنها شامل گروه بندی واحدهای جمعیت بر اساس یک ویژگی کمی یا اسنادی است.

ساده ترین نوع جداول گروه، ردیف های توزیع هستند. اگر گزاره علاوه بر این شامل تعدادی شاخص باشد که گروه های موضوعی را مشخص می کند، جدول گروه می تواند پیچیده تر باشد. چنین جداول اغلب برای مقایسه شاخص های خلاصه در گروه ها استفاده می شود (جدول 3.18).

جدول 3.17. ورود سرمایه های خارجی به اقتصاد فدراسیون روسیه اما به کشورهای سرمایه گذار اصلی در سال 2009

گروه جمعیت بر حسب سن، سال

جمع

شامل

مردان

زنان

بنابراین، جداول گروهی امکان شناسایی و توصیف انواع اجتماعی-اقتصادی پدیده ها، ساختار آنها را، بسته به تنها یک ویژگی، ممکن می سازد.

ترکیبی آنها جداول آماری نامیده می شوند که موضوع آنها شامل گروه بندی واحدهای جمعیتی به طور همزمان بر اساس دو یا چند ویژگی است: هر یک از گروه ها که بر اساس یک پایه ساخته شده اند، به نوبه خود بر اساس ویژگی دیگری به زیر گروه ها تقسیم می شوند و غیره. (جدول 3.19).

جدول 3.19. گروه بندی آپارتمان های ساخته شده در یک ساختمان مسکونی بر اساس تعداد اتاق و اندازه متوسط

جدول 3.18. توزیع تعداد افراد شاغل در اقتصاد روسیه بر اساس گروه های سنی تا پایان نوامبر 2009، ٪ از کل

موضوع جدول، گروه های آپارتمان های ساخته شده بر اساس تعداد اتاق ها و اندازه متوسط ​​آنها است.

جداول ترکیبی این امکان را فراهم می کند که گروه های معمولی را که با توجه به چندین ویژگی شناسایی شده اند و رابطه بین آنها مشخص شود. توالی تقسیم واحدهای جمعیت به گروه های همگن با توجه به ویژگی ها یا با اهمیت یکی از آنها در ترکیب یا با ترتیب مطالعه آنها تعیین می شود.

در محمول جدول آماری، همانطور که قبلا ذکر شد، شاخص هایی آورده شده است که مشخصه شی مورد مطالعه است.

با توجه به ساختار محمول، جداول آماری ساده و پیچیده متمایز می شوند.

در توسعه محمول ساده ویژگی های ارائه شده در آن با هم تلاقی نمی کنند و مجموع مقادیر به سادگی با جمع کردن مقادیر برای هر ویژگی به طور جداگانه و مستقل از یکدیگر به دست می آیند. جدول 1 می تواند به عنوان مثالی از توسعه ساده یک محمول باشد. 3.20.

در توسعه پیچیده محمول کامل تر می شود و توصیف همراه با جزئیاتهدف - شی. در این مورد، هر دو علامت محمول (بر حسب جنسیت و سن) ارتباط نزدیکی با یکدیگر دارند. ابتدا می توانید ترکیب را تجزیه و تحلیل کنید دومای دولتیتوسط کسری

جدول 3.20.

بر اساس گروه سنی، و سپس هر گروه سنی را بر اساس جنسیت به دو زیر گروه تقسیم کنید. به عبارت دیگر، با توسعه پیچیده محمول، یک پدیده یا شی را می توان با ترکیب متفاوتی از ویژگی هایی که آنها را تشکیل می دهد، مشخص کرد.

در تمام موارد، هنگام ساخت جداول آماری، محقق باید با نسبت بهینه شاخص های محمول هدایت شود.

قوانین اساسی برای ساخت و تجزیه و تحلیل جداول آماری

جداول آماری به عنوان وسیله ای برای ارائه بصری و فشرده اطلاعات دیجیتال باید از نظر آماری صحیح باشند. تکنیک های اساسی زیر وجود دارد که تکنیک تشکیل جداول آماری را تعیین می کند.

  • 1. مطالب دیجیتال باید به گونه ای ارائه شود که هنگام تجزیه و تحلیل جدول، با خواندن خطوط از چپ به راست و از بالا به پایین، ماهیت پدیده آشکار شود.
  • 2. عنوان جدول و نام ستون ها و خطوط باید واضح، مختصر باشد، نشان دهنده یک کل کامل باشد که به طور ارگانیک در محتوای متن قرار گیرد. نام جدول باید نشان دهنده شی، علامت، زمان و مکان رویداد باشد.
  • 3. اطلاعات قرار گرفته در ستون ها (ستون ها) جدول با یک خط خلاصه به پایان می رسد.
  • 4. اگر نام تک تک ستون ها در بین خود تکرار می شوند، حاوی اصطلاحات تکرار شونده هستند یا بار معنایی واحدی را حمل می کنند، لازم است یک عنوان متحد کننده به آنها اختصاص دهیم.
  • 5. شماره گذاری ستون ها و خطوط مفید است. ستون های سمت چپ که با نام خطوط پر شده اند، معمولا نشان داده می شوند حروف بزرگالفبای (A)، (B)، و غیره، و تمام ستون های بعدی - اعداد به ترتیب صعودی.
  • 6. داده های مرتبط با هم که یکی از جنبه های پدیده تحلیل شده را مشخص می کند باید در ستون های مجاور یکدیگر قرار گیرند.
  • 7. ستون ها و خطوط باید دارای واحدهای اندازه گیری متناظر با شاخص های تعیین شده در موضوع و محمول باشند. در این مورد، از اختصارات پذیرفته شده واحدهای اندازه گیری (روبل، کیلووات ساعت و غیره) استفاده می شود.
  • 8. اعداد باید تا حد امکان گرد شوند. گرد کردن اعداد در همان ستون یا خط باید با همان درجه دقت انجام شود.
  • 9. در صورت لزوم اطلاعات اضافی(توضیحات جدول) ممکن است یادداشت ها داده شود.

رعایت قوانین فوق برای ساخت و طراحی جداول آماری آنها را به ابزار اصلی ارائه، پردازش و خلاصه سازی اطلاعات آماری در مورد وضعیت و توسعه پدیده های اجتماعی-اقتصادی تحلیل شده تبدیل می کند.

تجزیه و تحلیل جداول آماری در دو جهت ساختاری و معنادار انجام می شود.

تحلیل ساختاری شامل تجزیه ساختار جدول و مشخص کردن موارد زیر است:

  • کلیت و واحدهای مشاهده که آن را تشکیل می دهند.
  • علائم و ترکیبات آنها که موضوع و محمول جدول را تشکیل می دهند.
  • نوع جدول؛
  • وظایفی که باید حل شوند
  • تجزیه و تحلیل گروه های فردی موضوع با توجه به ویژگی های مربوط به محمول.
  • شناسایی همبستگی ها و تناسبات بین گروه های پدیده ها با علائم؛
  • تجزیه و تحلیل مقایسه ای و تدوین نتیجه گیری، ایجاد الگوها و تعیین ذخایر برای توسعه شی مورد مطالعه.

تجزیه و تحلیل ویژگی های فردی و گروه ها باید با مطالعه مقادیر مطلق و سپس ارزش های نسبی مرتبط با آنها آغاز شود.

اگر این امر توسط وظایف مطالعه مورد نیاز باشد، تجزیه و تحلیل جداول را می توان با مقادیر نسبی و متوسط ​​محاسبه شده، نمودارها، نمودارها و غیره تکمیل کرد.

تجزیه و تحلیل این جداول برای هر ویژگی به طور جداگانه و سپس در ترکیب منطقی و اقتصادی از ویژگی ها انجام می شود.

انطباق با قوانین و توالی کار با جداول آماری به محقق این امکان را می دهد که تجزیه و تحلیل اقتصادی و آماری جامع علمی از اشیا و فرآیندهای مورد مطالعه را انجام دهد.


گروه‌بندی‌هایی که در یک بازه زمانی یکسان، اما برای اشیاء مختلف، یا برعکس، برای یک شیء، اما برای دو دوره زمانی مختلف ساخته شده‌اند، ممکن است به دلیل تعداد متفاوت گروه‌های انتخابی یا تفاوت در مرزهای مختلف قابل مقایسه نباشند. فواصل
گروه‌بندی ثانویه، یا گروه‌بندی مجدد داده‌های گروه‌بندی‌شده، برای توصیف بهتر پدیده مورد مطالعه (در مواردی که گروه‌بندی اولیه ماهیت توزیع واحدهای جمعیتی را به وضوح نشان نمی‌دهد) یا برای رساندن گروه‌بندی‌ها به نوع قابل مقایسه استفاده می‌شود. به منظور انجام یک تحلیل تطبیقی
گروه بندی ثانویه - عملیاتی برای تشکیل گروه های جدید بر اساس گروه بندی قبلی انجام شده.
دو راه برای تشکیل گروه های جدید وجود دارد. اولین، ساده ترین و رایج ترین راه، تغییر (اغلب بزرگتر) فواصل اولیه است. روش دوم، گروه‌بندی مجدد مشترک نامیده می‌شود و شامل تشکیل گروه‌های جدید بر اساس تخصیص نسبت معینی از واحدهای جمعیتی به هر گروه است. اجازه دهید تکنیک گروه بندی ثانویه را با مثال زیر توضیح دهیم.
مثال:
توزیع کارکنان شرکت بر اساس سطح درآمد

ما داده ها را دوباره گروه بندی می کنیم و گروه های جدیدی را در فواصل زمانی حداکثر 5، 5-10، 10-20، 20-30، بیش از 30 هزار روبل تشکیل می دهیم.
اولین گروه جدید شامل کل گروه اول کارمندان و بخشی از گروه دوم خواهد بود. برای تشکیل یک گروه تا سقف 5 هزار روبل، لازم است 1.0 هزار روبل از فاصله گروه دوم گرفته شود. ارزش فاصله این گروه 6.0 هزار روبل است. بنابراین لازم است 1/6 (1.0:6.0) قسمت از آن گرفته شود. یک قسمت مشابه در گروه اول تازه تشکیل شده نیز باید از تعداد کارمندان گرفته شود، یعنی
20 x1 = 3 نفر سپس در گروه اول کارگران وجود خواهد داشت: 16 + 3 = 19 نفر.
6
دومین گروه جدید توسط کارگران گروه دوم منهای کسانی که به گروه اول اختصاص داده شده اند، یعنی 20-3 = 17 نفر تشکیل می شود. گروه سوم تازه تشکیل شده شامل کلیه کارکنان گروه سوم و بخشی از کارکنان گروه چهارم خواهد بود. برای تعیین این قسمت از فاصله 18-30 (عرض فاصله 12 است)، باید 2.0 را به قسمت قبلی اضافه کنید (به طوری که حد بالای فاصله برابر با 2.0 هزار روبل است). بنابراین لازم است بخشی از فاصله را برابر با . 74 نفر در این گروه وجود دارند، بنابراین باید 74x (1: 6) = 12 نفر را انتخاب کنیم. گروه سوم جدید شامل 44 + 12 = 56 نفر خواهد بود. گروه چهارم تازه تشکیل شده شامل 74-12 = 62 نفر باقی مانده از گروه چهارم قبلی خواهد بود. پنجمین گروه تازه تشکیل شده متشکل از کارگران گروه های پنجم و ششم قبلی خواهد بود: 37 + 9 = 46 نفر.
در نتیجه، گروه های جدید زیر را دریافت می کنیم:

اطلاعات بیشتر در مورد مقایسه گروه بندی های آماری. گروه بندی ثانویه:

  1. 1.3. مشاهده آماری و خلاصه. گروه بندی مواد مشاهدات آماری.
  2. 10.2. مشاهده و حسابداری آماری در سازمانهای صنایع مختلف. اطلاعات و امکانات تحلیلی گزارش های آماری

هنگام تجزیه و تحلیل و مقایسه چندین گروه، به عنوان مثال، برای چندین کارگاه، شرکت و غیره، ممکن است وضعیتی ایجاد شود که گروه بندی های اولیه به دلیل تعداد متفاوت گروه ها یا مقادیر متفاوت فواصل مورد استفاده غیرقابل مقایسه باشند. به منظور آوردن چنین گروه بندی ها به شکلی قابل مقایسه، یعنی. از روش گروه بندی ثانویه یا برای یک تعداد گروه یا به یک مقدار فاصله استفاده می شود. روش گروه بندی ثانویه - این روشی برای تشکیل گروه های جدید بر اساس گروه بندی های موجود با توجه به نیازهای مشخص شده است.برای انجام گروه بندی ثانویه، از 2 روش استفاده می شود: 1) اتحاد گروه های اصلی، 2) گروه بندی مجدد مشترک.

آوردن چندین گروه بندی متفاوت به شکلی قابل مقایسه در سه مرحله انجام می شود. در مرحله اول، تجزیه و تحلیل گروه بندی های اولیه به منظور شناسایی شرایط برای غیرقابل مقایسه بودن گروه بندی های اولیه انجام می شود. در مرحله دوم، روشی انتخاب می‌شود که گروه‌بندی‌های اصلی را به شکلی قابل مقایسه درآورد. در مرحله سوم، بازآرایی ثانویه گروه بندی های اولیه و تجزیه و تحلیل نتایج به دست آمده انجام می شود. در صورت لزوم، گروه بندی مجدد انجام می شود. روش های بازآرایی ثانویه را در نظر بگیرید.

1 راهمشاهدات آماری در مورد توزیع کارگران شرکت بر اساس طول خدمت در سال 2000 نتایج زیر را نشان داد (جدول 2.7).

جدول 2.7

در سال 2002، یک مشاهدات آماری مکرر انجام شد که نتایج زیر را نشان داد (جدول 2.8). تخمین تغییرات در توزیع کارگران بر اساس طول خدمت برای 2 سال به طور مستقیم از داده های هر دو جدول غیرممکن است. تجزیه و تحلیل هر دو جدول نشان می دهد که آنها به دلیل ناسازگاری هستند عدد متفاوتگروه ها و فواصل مختلف

جدول 2.8

برای رساندن داده های هر دو جدول به شکل قابل مقایسه، می توان هر دو گروه 1 و 2 و گروه های 3 و 4 را در جدول 2.7 ترکیب کرد. این امکان ارزیابی تغییرات توزیع کارگران بر اساس طول خدمت را که در دو سال در شرکت رخ داده است را ممکن می سازد. نتایج گروه بندی مجدد داده های مشاهدات آماری برای سال 2000 (جدول 2.7) در جدول 2.9 نشان داده شده است.

جدول 2.9

با مقایسه داده های سال 2002 (جدول 2.8) با داده های گروه بندی مجدد برای سال 2000 (جدول 2.9)، می توان نتیجه گرفت که در دو سال تعداد کارگران با تجربه تا 6 سال کاهش یافته است. جوان، و تعداد کارگران با تجربه بیشتر افزایش یافته است.

2 راهاجازه دهید مشاهدات آماری در سال 2002 چنین نتایجی را ارائه دهد (جدول 2.10). با مقایسه داده‌های سال 2000 (جدول 2.9) و داده‌های سال 2002 (جدول 2.7)، می‌توان نتیجه گرفت که به دلیل تعداد گروه‌ها و فواصل متفاوت، متناقض هستند. تجزیه و تحلیل نشان می دهد که استفاده از روش اول برای آوردن داده ها به شکل قابل مقایسه غیرممکن است. بنابراین، ما از روش 2 برای گروه بندی مجدد داده های سال 2000 (جدول 2.7) استفاده می کنیم تا با گروه بندی داده های سال 2002 مطابقت داشته باشند (جدول 2.10).

جدول 2.10

استفاده از روش دوم شامل توزیع یکنواختفرکانس های درون هر گروه این یک شرط ضروری برای استفاده از روش دوم است. برای گروه بندی مجدد داده های سال 2000 (جدول 2.7)، محاسبات زیر را انجام خواهیم داد. بنابراین گروه اول جدید (1-4) (جدول 2.10) شامل تمام داده های گروه اول قدیمی (1-3) (جدول 22.7) و داده های مربوط به تعداد کارگران با 4 سال سابقه از گروه دوم قدیمی است. . تعداد کارگران با 4 سال سابقه 3 نفر (9/3=3، چون در گروه دوم قدیم 9 کارگر وجود داشت و فاصله آن 3 نفر است). بنابراین، گروه اول جدید (1-4) شامل 18 کارگر (18=15+3) خواهد بود. یک گروه جدید(5-8) شامل 6 کارگر با 5.6 ​​سال سابقه (از گروه دوم قدیم 6=9/3 2) و 18 کارگر با 7.8 سال سابقه (از گروه سوم قدیم 18=27/3 2 2) خواهد بود. گروه دوم جدید (5-8) شامل 24 کارگر (24=6+18) خواهد بود. گروه سوم جدید (9-12) شامل کارگران با 9 سال سابقه (9=27/3) و هر 9 کارگر از گروه چهارم قدیم (10-12) خواهد بود. بدین ترتیب در گروه سوم جدید (9-12) 18 کارگر (18=9+9) وجود خواهد داشت. داده های گروه بندی مجدد برای سال 2000 و داده های سال 2002 در یک جدول خلاصه می شود (2.11) که امکان تجزیه و تحلیل مقایسه ای را فراهم می کند.

جدول 2.11

تجزیه و تحلیل توزیع کارگران شرکت بر اساس طول خدمت (جدول 2.11) نشان می دهد که در سال 2002 تعداد کارگران با سابقه بیشتر (از 9 به 12 سال) افزایش یافته است، در حالی که افراد با سابقه کمتر (از 1 تا 8 سال) کاهش یافته است. . بنابراین، گروه‌بندی مجدد داده‌ها این امکان را فراهم می‌آورد که داده‌ها را به شکل قابل مقایسه درآورد، تجزیه و تحلیل انجام داد و نتیجه‌گیری‌های لازم را گرفت.

سوالات و وظایف را کنترل کنید

1. مشاهده آماری چیست؟ چه شرایطی باید هنگام انجام یک مشاهده آماری رعایت شود (به تعریف مراجعه کنید)؟

2. مشاهدات آماری را با چه معیارهایی می توان طبقه بندی کرد؟ نمونه هایی از مشاهدات آماری را ذکر کنید.

3. چه خطاهایی در طول مشاهدات آماری رخ می دهد و از چه روش های کنترلی می توان استفاده کرد؟

4. مشخص کنید کدام مثال دارای خلاصه ساده و کدام یک خلاصه پیچیده است. مثال 1. روز دوشنبه 200 کارگر در مغازه بافندگی کار می کردند. مثال 2. روز دوشنبه 40 کارگر در بافندگی قطعه 1 و 60 کارگر در بخش شماره 2 و در مجموع 100 کارگر مشغول به کار بودند.

5. در پردازش اطلاعات آماری از چه گروه بندی هایی استفاده می شود؟ چه تفاوتی با یکدیگر دارند؟

6. در بخش فناور ارشد 15 نفر و در بخش بازاریابی و فروش 10 نفر هستند. در این صورت، تیم‌های دپارتمان‌ها دانه‌های همگن هستند و در این صورت آن‌ها دانه‌های ناهمگن هستند.

7. فروش روزانه پارچه A در فروشگاه Fabric در ماه اکتبر با داده های زیر (بر حسب متر) مشخص شد: 4، 11، 8، 14، 10، 19، 12، 11، 3، 6، 21، 9، 9 ، 5، 10، 13، 15، 7، 10، 13، 16، 12، 8، 11، 14، 15، 17. داده ها را با استفاده از فواصل مساوی گروه بندی کنید.

8. نتایج گروه بندی داده ها از بند 7 را به گروه های زیر گروه بندی کنید: (3-9)، (9-15)، 15-21).

مبحث شماره 3 سری آماری توزیع، جداول، گرافیک

3.1 سری توزیع آماری - مفهوم، انواع، اشکال ارائه

یکی از اشکال ارائه داده های مشاهده آماری، یک سری توزیع آماری است. سری های آماری توزیع یک آرایش منظم از واحدهای جمعیت به گروه ها بر اساس یک ویژگی گروه بندی است.با کمک سری های توزیع آماری، می توان ساختار و مرزهای تغییرات جمعیت را بررسی کرد، همگنی را ارزیابی کرد و الگوهای توسعه واحدها را در جامعه تعیین کرد. بر اساس نوع سری های آماریتوزیع ها به سری های اسنادی، متغیری و زمانی تقسیم می شوند.

سری صفات و تغییرات از دو عنصر تشکیل شده است: انواع و فرکانس ها (فرکانس ها یا چگالی). گونه() - این مقدار خاصی از ویژگی است که در سری توزیع می گیرد. فرکانس () - این هست عدد مطلق، نشان می دهد که چند بار (هر چند وقت یکبار) این یا آن مقدار از یک ویژگی (متغییر) در مجموع رخ می دهد یا چند واحد از جمعیت دارای یک یا مقدار دیگری از ویژگی (متغیر) هستند. فرکانس() - این یک مقدار نسبی است که سهم گزینه های فردی را در حجم کل جمعیت تعیین می کند ().فراوانی را می توان به صورت سهام بیان کرد که در این صورت حجم جمعیت برابر با یک () است یا به صورت درصد، در این حالت حجم جمعیت 100٪ است (). به طور کلی فرکانس به صورت زیر محاسبه می شود

حجم جمعیت کجاست

تراکم() یک مقدار نسبی است که نشان می دهد چند واحد جمعیت (به صورت مطلق یا نسبی) در طول واحد فاصله گروه () است.چگالی می تواند مطلق یا نسبی باشد. چگالی مطلق برابر است با

چگالی نسبیبرابر است با

هنگام محاسبه چگالی نسبی، فرکانس استفاده می شود که در کسری بیان می شود.

سری صفتسریالی است که بر اساس ویژگی کیفی جمعیت ساخته شده است.این سری ها با استفاده از گروه بندی تایپولوژیکی ساخته شده اند و می توانند در قالب یک جدول بیان شوند. به عنوان مثال، توزیع کارگران شرکت بر اساس دسته های دستمزد (جدول 3.1).

جدول 3.1

در مثال داده شده (جدول 3.1)، مجموع همه شرکت های فعال است. اندازه جمعیت 250 نفر است. واحد جمعیت یک کارگر است. به عنوان یکی از ویژگی های واحد جمعیت، دسته تعرفه انتخاب می شود. علامت چندین معنی خاص دارد - گزینه (دسته اول، دسته دوم، دسته سوم، دسته چهارم، دسته پنجم). در جدول، مقادیر ویژگی در ستون 2، مقادیر فرکانس در ستون 3، مقدار فرکانس در ستون 4 آورده شده است.

سری واریاسیون- این مجموعه ای است که بر اساس یک علامت کمی از جمعیت ساخته شده است.این سری ها عمدتاً به کمک گروه بندی ساختاری ساخته می شوند و می توان آنها را به صورت جدول بیان کرد. سری های متغیر دو نوع هستند: سری های متغیر گسسته و سری های بازه ای. سری تغییرات گسسته مجموعه ای است که در آن مقادیر مشخصه ها (گزینه ها) با مقادیر گسسته نمایش داده می شوند. سری تغییرات فاصله مجموعه ای است که در آن مقادیر مشخصه به صورت فواصل بیان می شود. بر اساس داده های مربوط به گردش مالی روزانه 34 کارآفرین فردی که در صفحه ارائه شده است، یک متغیر ایجاد خواهیم کرد. سری بازه ای(جدول 3.2)

جدول 3.2

ستون 3 فراوانی را نشان می دهد - تعداد کارآفرینانی که گردش مالی یک روزه آنها در یک بازه زمانی معین قرار می گیرد (ستون 2). در ستون 4، درصد فراوانی طبق فرمول 3.1 محاسبه می شود. بنابراین فرکانس برای گروه اول (3.1 - 3.9) برابر خواهد بود

به طور مشابه، فرکانس برای گروه های دیگر محاسبه می شود. ستون 5 فرکانس را بر حسب کسری نشان می دهد. می توان آن را یا با محاسبه به دست آورد

یا با تبدیل درصدها به سهام. هنگام محاسبه، داده ها به صورت اعشاری باید با دقت حداکثر تا 3 رقم اعشار نشان داده شوند. این امر دقت محاسبات و دریافت داده های نهایی مربوطه را بهبود می بخشد. بنابراین مجموع فرکانس ها در درصد باید برابر با 100٪ و در کسری - برابر با 1 باشد.

ستون 6 جدول 3.2 مقادیر چگالی مطلق را نشان می دهد. محاسبه طبق فرمول 3.2 انجام می شود. بنابراین برای گروه اول، چگالی مطلق برابر خواهد بود

اگر فرکانس () از ستون 3 گرفته شود، مقدار بازه () به عنوان تفاوت بین حد بالایی (3.9) و حد پایین (3.1) بازه گروه اول تعریف می شود، یعنی. . به طور مشابه، چگالی مطلق برای گروه های دیگر محاسبه می شود. پس از انجام محاسبات لازم است تفسیر اقتصادی به آنها داده شود. بنابراین، برای مثال، چگالی مطلق گروه اول نشان می دهد که برای هر هزار روبل. گردش مالی در گروه اول 5 کارآفرین بود.

ستون 7 جدول 3.2 مقادیر چگالی نسبی را نشان می دهد. محاسبه طبق فرمول 3.3 انجام می شود. بنابراین برای گروه اول، چگالی نسبی برابر خواهد بود

به طور مشابه، چگالی نسبی برای گروه های دیگر محاسبه می شود. تراکم نسبی گروه اول نشان می دهد که سهم کارآفرینانی که به هر هزار گردش مالی در گروه اول می آیند 0.147 است.

ستون 2 جدول 3.3 گردش مالی را به صورت فواصل و ستون 3 گردش مالی را به صورت مقادیر گسسته نشان می دهد. برای گروه اول مقدار گسسته به صورت زیر محاسبه می شود

به همین ترتیب، گردش مالی در فرم محاسبه می شود کمیت گسستهو برای گروه های دیگر

اغلب، هنگام تجزیه و تحلیل سری های متغیر، نیاز به درک تغییر در حجم جمعیت هنگام تغییر (عمدتا به ترتیب صعودی) مقادیر ویژگی وجود دارد. برای این کار از مفاهیمی مانند فرکانس های تجمعی یا فرکانس های تجمعی استفاده می شود. فرکانس های انباشته شده ( )مجموع فرکانس های ابتدای سری تا مقدار مشخصی از ویژگی، شامل است. فرکانس های انباشته شده مجموع فرکانس ها از ابتدای سری تا مقدار مشخصی از ویژگی، شامل است.یافتن مقادیر این شاخص ها را مطابق جدول در نظر بگیرید. 3.4 در ستون 6 جدول. 3.4 فرکانس های انباشته شده را نشان می دهد. در گروه اول (ستون 1) 4 کارآفرین (ستون 4) گردش مالی 3.1 تا 3.9 هزار روبل داشتند. (گروه 2) یا گردش مالی متوسط ​​3.5 هزار روبل. (گروه 3). از آنجایی که این اولین گروه است، فرکانس انباشته شده، یعنی. تعداد کارآفرینان برابر با 4 نفر (ستون 6) خواهد بود. در گروه دوم، تعداد کارآفرینان با گردش مالی 3.9 تا 4.7 هزار روبل. یا میانگین گردش مالی 4.3 هزار روبل. برابر با 5 نفر از این رو فرکانس انباشته شده، یعنی. تعداد کارآفرینان با گردش مالی 3.1 تا 4.7 هزار روبل. یا به طور متوسط ​​از و کمتر از 4.3 هزار روبل، برابر با 9=4+5 خواهد بود. برای گروه سوم فراوانی تجمعی 16=4+5+7 و به همین ترتیب خواهد بود. فرکانس تجمعی نیز به همین ترتیب محاسبه می شود.

گروه بندی ثانویه

در عمل، گاهی اوقات لازم است از گروه بندی های موجود استفاده شود، که ممکن است به دلیل مرزهای نابرابر فواصل یا تعداد متفاوت گروه های متمایز قابل مقایسه نباشند. برای رساندن چنین گروه‌بندی‌هایی به شکل قابل مقایسه، از روش گروه‌بندی ثانویه استفاده می‌شود.

گروه بندی ثانویهشامل تشکیل گروه های جدید بر اساس گروه بندی قبلی است.

در گروه بندی ثانویه از دو روش برای تشکیل گروه های جدید استفاده می شود:

  • § راه اول تقویت فواصل اصلی است. این ساده ترین و رایج ترین روش گروه بندی ثانویه است.
  • § روش دوم روش گروه بندی مجدد مشترک نامیده می شود و شامل این واقعیت است که نسبت معینی از واحدهای جمعیتی به هر گروه اختصاص می یابد.

رتبه های توزیع

گروه بندی را می توان بر اساس یک سری توزیع ایجاد کرد. در عین حال، ردیف ها را می توان بر اساس گروه بندی ساخت. مطالعه جامع یک پدیده آماری اگر بر اساس یک سیستم گروه بندی باشد بیشترین ثمربخشی را دارد. سیستم گروه بندی یک سری از به هم پیوسته است گروه بندی های آماریبا توجه به مهم ترین ویژگی ها، به طور جامع مهمترین جنبه های پدیده را منعکس می کند.

نزدیک به توزیعتوزیع منظم واحدهای جمعیتی به گروه ها را بر اساس برخی ویژگی ها نامید.

انواع ردیف های توزیع:

  • - اسنادی
  • - متغیر - گسسته و فاصله ای.

به عبارت دیگر، سری توزیع نتیجه گروه بندی است.

یک سری اسنادی به عنوان یک سری توزیع بر اساس یک ویژگی که معیار کمی ندارد درک می شود. به عنوان مثال، یک سری ویژگی را می توان بر اساس "وضعیت اجتماعی"، "حرفه"، "جنسیت" و غیره تدوین کرد.

هر ردیفی که به شکل جدول ارائه می شود از دو ستون تشکیل شده است. ستون اول مقادیر صفت مورد مطالعه (صنادی یا کمی) را نشان می دهد. ستون دوم تعداد واحدهای مشاهده ای را که مقدار مشخصی دارند را ثبت می کند. بنابراین، ساخت یک سری تغییرات به تعیین مقدار یک ویژگی در هر گروه طبقه بندی و تعیین تعداد عناصری که در این گروه قرار می گیرند کاهش می یابد.

هر مقدار جداگانه از یک ویژگی در یک سری توزیع، یک متغیر نامیده می شود.

تعداد عناصر در هر گروه طبقه بندی یا تعداد عناصر در ترکیب با یک نوع معین فرکانس نامیده می شود، یا به عبارت دیگر، تعداد واحدهای مشاهده موجود در هر گروه منفرد را معمولا فرکانس سری توزیع می نامند. .

نسبت این گروه در مجموع فرکانس نامیده می شود. فرکانس یا ساختار، نسبت جمعیت یک گروه طبقه بندی معین را نشان می دهد.

فرکانس - نسبت فراوانی به تعداد کل عناصر مورد مطالعه، یعنی حجم جمعیت.

فرکانس را با n یا f نشان می دهیم، فرکانس را با p یا j نشان می دهیم.

نمونه ای از یک سری گسسته.

پیشرفت در گروهی از دانشجویان 15 نفره اقتصاد در یکی از دروس.

با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

بارگذاری...