گروه بندی ثانویه گروه بندی آمار

گروه‌بندی‌هایی که برای یک دوره زمانی یکسان، اما برای اشیاء مختلف، یا برعکس، برای یک شیء، اما برای دو دوره زمانی مختلف ساخته شده‌اند، ممکن است به دلیل تعداد متفاوت گروه‌های انتخابی یا تفاوت در مرزهای مختلف قابل مقایسه نباشند. فواصل

گروه بندی ثانویهیا گروه‌بندی مجدد داده‌های گروه‌بندی‌شده، برای توصیف بهتر پدیده مورد مطالعه (در مواردی که گروه‌بندی اولیه امکان شناسایی واضح ماهیت توزیع واحدهای جمعیتی را ممکن نمی‌سازد) یا برای آوردن گروه‌ها به یک نوع قابل مقایسه استفاده می‌شود. به منظور انجام تحلیل مقایسه ای.

گروه بندی ثانویه- این عملیاتی برای تشکیل گروه های جدید بر اساس گروه بندی قبلی است.

دو راه برای تشکیل گروه های جدید وجود دارد. اولین، ساده ترین و رایج ترین راه این است تغییر (اغلب بزرگ شدن) فواصل اولیه. روش دوم نامیده می شود بازآرایی به اشتراک بگذارید این شامل تشکیل گروه های جدید بر اساس اختصاص نسبت معینی از واحدهای جمعیتی به هر گروه است. اجازه دهید تکنیک گروه‌بندی ثانویه را با یک مثال توضیح دهیم (جدول 3.14).

جدول 3.14. توزیع سازمانی خرده فروشییکی از شهرهای منطقه مسکو با توجه به میانگین سالانه تعداد کارمندان در سال 2011 *

* داده ها مشروط هستند.

ما داده ها را دوباره گروه بندی می کنیم و گروه های جدیدی را در فواصل زمانی حداکثر 5، 5-10، 10-20، 20-30، 30 یا بیشتر تشکیل می دهیم.

اولین گروه جدید شامل کل گروه اول خرده فروشان و بخشی از گروه دوم خواهد بود. برای تشکیل یک گروه حداکثر پنج نفره باید از فاصله گروه دوم یک نفر گرفت. اندازه فاصله این گروه شش نفر است. بنابراین باید 1/6 آن را از آن گرفت. بخش مشابهی در گروه اول تازه تشکیل شده نیز باید از تعداد شرکت ها گرفته شود. 20 - = 3 شرکت. 6

سپس در گروه اول خرده فروشان 16 + 3 = 19 واحد وجود خواهد داشت.

دومین گروه جدید توسط شرکت های خرده فروشی گروه دوم منهای آنهایی که به گروه اول اختصاص داده شده اند، تشکیل می شود. 20 - 3 = 17 شرکت. گروه سوم تازه تشکیل شده شامل کلیه بنگاه های گروه سوم و بخشی از بنگاه های چهارم خواهد بود. برای تعیین این قسمت از فاصله 18 30 (عرض فاصله 12 است)، باید 2.0 را به قبلی اضافه کنید (به طوری که حد بالای فاصله برابر با 20 نفر باشد). بنابراین لازم است بخشی از فاصله را برابر با 2/12 = 1/6 گرفت. در این گروه 74 شرکت وجود دارد، بنابراین باید 74 (1/6) = 12 شرکت را در نظر بگیریم. گروه سوم جدید شامل 44 + 12 = 56 شرکت خواهد بود.

گروه چهارم که به تازگی تشکیل شده است شامل 74 - 12 = = 62 شرکت خواهد بود که از گروه چهارم قبلی باقی مانده است. پنجمین گروه تازه تشکیل شده از بنگاه‌های خرده‌فروشی گروه‌های پنجم و ششم قبلی تشکیل می‌شود: 37 + 9 = 46 بنگاه.

در نتیجه، گروه های جدیدی به دست می آوریم (جدول 3.15).

جدول 3.15. توزیع شرکت های خرده فروشی در یکی از شهرهای منطقه مسکو بر اساس میانگین سالانه تعداد کارمندان در سال 2011 پس از گروه بندی مجدد داده ها *

* داده ها مشروط هستند.

جدول آماری: ماهیت، عناصر و طبقه بندی

جدول آماری - منطقی ترین، بصری ترین و فشرده ترین شکل ارائه مطالب آماری، از جمله نتایج گروه بندی آماری. با این حال، هر جدولی آماری نیست. جدول ضرب، پرسشنامه یک نظرسنجی جامعه شناختی ممکن است به صورت جدول باشد، اما هنوز جداول آماری نیستند.

جدول آماری- این جدولی است که حاوی یک مشخصه عددی خلاصه از جمعیت مورد مطالعه با توجه به یک یا چند ویژگی اساسی است که با منطق تحلیل اقتصادی به هم مرتبط هستند.

عناصر اصلی جدول آماری که ستون فقرات (مبنا) آن را تشکیل می دهند در طرح 3.1 نشان داده شده است.

جدولیاین شکل از ترتیب اطلاعات عددی نامیده می شود که در آن عدد در تقاطع یک عنوان مشخص در امتداد یک ستون عمودی به نام قرار می گیرد. نمودار، و نام ها مطابق نوار افقی مربوطه - خط بنابراین، جدول از نظر خارجی محل تلاقی نمودارها و ردیف هایی است که اسکلت جدول را تشکیل می دهند.

جدول آماری شامل سه نوع عنوان کلی، بالا و کناری است. سربرگ کلی محتوای کل جدول را منعکس می کند (به چه مکان و زمانی تعلق دارد)، در بالای طرح جدول در مرکز قرار دارد و یک عنوان خارجی است. هدرهای برتر مشخص کردن محتوای نمودار (عنوان محمول) و جانبی (عناوین موضوعی) - رشته ها. آنها به عنوان سربرگ داخلی عمل می کنند.

یک اسکلت جدول پر از سرصفحه، طرح جدول را تشکیل می دهد. اگر در محل تقاطع نمودار و خطوط اعداد را یادداشت کنیم، یک جدول آماری کامل بدست می آوریم. عنوان جدول (عنوان کلی)

طرح 3.1. اسکلت (مبنای) جدول آماری

مواد دیجیتال را می توان به صورت مطلق (سرمایه مجاز، حجم کالاهای نوآورانه و غیره)، نسبی (GDP سرانه، تعداد کامپیوترهای شخصیبه ازای هر 100 کارگر و غیره) و مقادیر متوسط (متوسط قیمت سهم، متوسط تولید شیر در هر گاو و غیره).

جداول ممکن است همراه با یادداشتی باشد که در صورت لزوم برای توضیح سرفصل ها، روش های محاسبه برخی از شاخص ها، منابع اطلاعاتی و غیره استفاده می شود.

با توجه به محتوای منطقی، جدول یک «جمله آماری» است که ارکان اصلی آن موضوع و محمول است.

موضوعشیئی که با اعداد مشخص می شود نامیده می شود. این می تواند یک یا چند مجموعه، واحدهای مجزا از کل به ترتیب فهرست آنها باشد یا بر اساس برخی معیارها، واحدهای سرزمینی و غیره گروه بندی شوند. معمولاً موضوع جدول در سمت چپ و در نام ردیف ها آورده می شود.

محمولسیستمی از شاخص ها را تشکیل می دهد که موضوع مورد مطالعه را مشخص می کند، یعنی. موضوع جدول محمول عناوین بالایی را تشکیل می دهد و محتوای نمودار را با ترتیب منطقی متوالی شاخص ها از چپ به راست تشکیل می دهد.

مکان موضوع و محمول در برخی موارد می تواند با یک و کامل تر جایگزین شود راه بهترخواندن و تجزیه و تحلیل اطلاعات اولیه در مورد جمعیت مورد مطالعه.

با توجه به ساختار موضوع،بسته به گروه بندی واحدها در آن، جداول آماری ساده و پیچیده وجود دارد.

ساده یک جدول آماری نامیده می شود که در موضوع آن فهرستی از اشیا یا واحدهای سرزمینی آورده شده است. جداول آماری ساده به دو دسته تک نگاری و فهرست تقسیم می شوند.

جداول تک نگاری مشخص کردن نه کل مجموعه واحدهای شی مورد مطالعه، بلکه فقط یکی از هر واحد یا گروهی را که بر اساس یک ویژگی خاص تخصیص داده شده است (جدول 3) .16).

جدول 3.16. راه اندازی امکانات اجتماعی و فرهنگی در نهادهای تشکیل دهنده فدراسیون روسیه در سال 2009

جدول ها را فهرست کنید جداول نامیده می شوند که موضوع آنها شامل فهرستی از اشیا یا واحدهای شی مورد مطالعه است (جدول 3.17).

جداول پیچیده آماری برخلاف موارد ساده، شناسایی انواع اجتماعی-اقتصادی پدیده های مورد مطالعه، ساختار آنها و همچنین روابط متقابل و وابستگی های متقابل بین ویژگی هایی که آنها را مشخص می کند، ممکن می سازد. این کارها را می توان با کمک جداول گروهی و مخصوصاً ترکیبی به طور کامل حل کرد.

گروه جداول آماری نامیده می شوند که موضوع آنها شامل گروه بندی واحدهای جمعیت بر اساس یک ویژگی کمی یا اسنادی است.

ساده ترین نوع جداول گروه، ردیف های توزیع هستند. اگر گزاره علاوه بر این شامل تعدادی شاخص باشد که گروه های موضوعی را مشخص می کند، جدول گروه می تواند پیچیده تر باشد. چنین جداول اغلب برای مقایسه شاخص های خلاصه در گروه ها استفاده می شود (جدول 3.18).

جدول 3.17. ورود سرمایه های خارجی به اقتصاد فدراسیون روسیه اما به کشورهای سرمایه گذار اصلی در سال 2009

گروه جمعیت بر حسب سن، سال	جمع	شامل
گروه جمعیت بر حسب سن، سال	جمع	مردان	زنان

بنابراین، جداول گروهی امکان شناسایی و توصیف انواع اجتماعی-اقتصادی پدیده ها، ساختار آنها را، بسته به تنها یک ویژگی، ممکن می سازد.

ترکیبی آنها جداول آماری نامیده می شوند که موضوع آنها شامل گروه بندی واحدهای جمعیتی به طور همزمان با توجه به دو یا چند ویژگی است: هر یک از گروه ها که بر اساس یک پایه ساخته شده اند، به نوبه خود بر اساس ویژگی دیگری به زیر گروه هایی تقسیم می شوند و غیره. (جدول 3.19).

جدول 3.19. گروه بندی آپارتمان های ساخته شده در یک ساختمان مسکونی بر اساس تعداد اتاق و اندازه متوسط

جدول 3.18. توزیع تعداد افراد شاغل در اقتصاد روسیه بر اساس گروه های سنی تا پایان نوامبر 2009، ٪ از کل

موضوع جدول، گروه های آپارتمان های ساخته شده بر اساس تعداد اتاق ها و اندازه متوسط آنها است.

جداول ترکیبی این امکان را فراهم می کند که گروه های معمولی را که با توجه به چندین ویژگی شناسایی شده اند و رابطه بین آنها مشخص شود. توالی تقسیم واحدهای جمعیت به گروه های همگن با توجه به ویژگی ها یا با اهمیت یکی از آنها در ترکیب یا با ترتیب مطالعه آنها تعیین می شود.

در محمول جدول آماری، همانطور که قبلا ذکر شد، شاخص هایی آورده شده است که مشخصه شی مورد مطالعه است.

با توجه به ساختار محمول، جداول آماری ساده و پیچیده متمایز می شوند.

در توسعه محمول ساده ویژگی های ارائه شده در آن با هم تلاقی نمی کنند و مجموع مقادیر به سادگی با جمع کردن مقادیر برای هر ویژگی به طور جداگانه و مستقل از یکدیگر به دست می آیند. جدول 1 می تواند به عنوان مثالی از توسعه ساده یک محمول باشد. 3.20.

در توسعه پیچیده محمول کامل تر می شود و توصیف همراه با جزئیاتهدف - شی. در این مورد، هر دو علامت محمول (بر حسب جنسیت و سن) ارتباط نزدیکی با یکدیگر دارند. ابتدا می توانید ترکیب را تجزیه و تحلیل کنید دومای دولتیتوسط کسری

جدول 3.20.

بر اساس گروه سنی، و سپس هر گروه سنی را بر اساس جنسیت به دو زیر گروه تقسیم کنید. به عبارت دیگر، با توسعه پیچیده محمول، یک پدیده یا شی را می توان با ترکیب متفاوتی از ویژگی هایی که آنها را تشکیل می دهد، مشخص کرد.

در تمام موارد، هنگام ساخت جداول آماری، محقق باید با نسبت بهینه شاخص های محمول هدایت شود.

قوانین اساسی برای ساخت و تجزیه و تحلیل جداول آماری

جداول آماری به عنوان وسیله ای برای ارائه بصری و فشرده اطلاعات دیجیتال باید از نظر آماری صحیح باشند. تکنیک های اساسی زیر وجود دارد که تکنیک تشکیل جداول آماری را تعیین می کند.

1. مطالب دیجیتالی باید به گونه ای ارائه شود که در هنگام تجزیه و تحلیل جدول، با خواندن خطوط از چپ به راست و از بالا به پایین، ماهیت پدیده آشکار شود.
2. عنوان جدول و نام ستون ها و خطوط باید واضح، مختصر باشد، نشان دهنده یک کل کامل باشد که به طور ارگانیک در محتوای متن قرار گیرد. نام جدول باید نشان دهنده شی، علامت، زمان و مکان رویداد باشد.
3. اطلاعات قرار گرفته در ستون ها (ستون ها) جدول با یک خط خلاصه به پایان می رسد.
4. اگر نام تک تک ستون ها در بین خود تکرار می شوند، حاوی اصطلاحات تکرار شونده هستند یا بار معنایی واحدی را حمل می کنند، لازم است یک عنوان متحد کننده به آنها اختصاص دهیم.
5. شماره گذاری ستون ها و خطوط مفید است. ستون های سمت چپ که با نام خطوط پر شده اند، معمولا نشان داده می شوند حروف بزرگالفبای (A)، (B)، و غیره، و تمام ستون های بعدی - اعداد به ترتیب صعودی.
6. داده های مرتبط با هم که یکی از جنبه های پدیده تحلیل شده را مشخص می کند باید در ستون های مجاور یکدیگر قرار گیرند.
7. ستون ها و خطوط باید دارای واحدهای اندازه گیری متناظر با شاخص های تعیین شده در موضوع و محمول باشند. در این مورد، از اختصارات پذیرفته شده واحدهای اندازه گیری (روبل، کیلووات ساعت و غیره) استفاده می شود.
8. اعداد باید تا حد امکان گرد شوند. گرد کردن اعداد در همان ستون یا خط باید با همان درجه دقت انجام شود.
9. در صورت لزوم اطلاعات اضافی(توضیحات جدول) ممکن است یادداشت ها داده شود.

رعایت قوانین فوق برای ساخت و طراحی جداول آماری آنها را به ابزار اصلی ارائه، پردازش و جمع بندی اطلاعات آماری در مورد وضعیت و توسعه پدیده های اجتماعی-اقتصادی تحلیل شده تبدیل می کند.

تجزیه و تحلیل جداول آماری در دو جهت ساختاری و معنادار انجام می شود.

تحلیل ساختاری شامل تجزیه ساختار جدول و مشخص کردن موارد زیر است:

کلیت و واحدهای مشاهده که آن را تشکیل می دهند.
علائم و ترکیبات آنها که موضوع و محمول جدول را تشکیل می دهند.
نوع جدول؛
وظایفی که باید حل شوند

تجزیه و تحلیل گروه های فردی موضوع با توجه به ویژگی های مربوط به محمول.
شناسایی همبستگی ها و تناسبات بین گروه های پدیده ها با علائم؛
تجزیه و تحلیل مقایسه ای و تدوین نتیجه گیری، ایجاد الگوها و تعیین ذخایر برای توسعه شی مورد مطالعه.

تجزیه و تحلیل ویژگی های فردی و گروه ها باید با مطالعه مقادیر مطلق و سپس ارزش های نسبی مرتبط با آنها آغاز شود.

اگر این امر توسط وظایف مطالعه مورد نیاز باشد، تجزیه و تحلیل جداول را می توان با مقادیر نسبی و متوسط محاسبه شده، نمودارها، نمودارها و غیره تکمیل کرد.

تجزیه و تحلیل این جداول برای هر ویژگی به طور جداگانه و سپس در ترکیب منطقی و اقتصادی از ویژگی ها انجام می شود.

انطباق با قوانین و توالی کار با جداول آماری به محقق این امکان را می دهد که تجزیه و تحلیل اقتصادی و آماری جامع علمی از اشیا و فرآیندهای مورد مطالعه را انجام دهد.

توزیع جمعیت به گروه هایی که به یک شکل همگن هستند با اقداماتی مانند سیستم سازی، گونه شناسی، طبقه بندی، گروه بندی همراه است. به طور سنتی، چنین توزیعی طبق طرح زیر انجام می شود: ویژگی های گروه بندی از مجموعه ویژگی هایی که پدیده را توصیف می کنند انتخاب می شوند و سپس مجموعه مطابق با مقادیر این ویژگی ها به گروه ها و زیر گروه ها تقسیم می شود.

هر مطالعه به سه سوال می پردازد:

1) چه چیزی را به عنوان اساس گروه بندی در نظر بگیرید.

2) چند گروه، موقعیت باید اختصاص داده شود.

3) نحوه جداسازی گروه ها

اساس گروه بندی می تواند هر ویژگی اسنادی یا کمی باشد که دارای درجه بندی است.

فاصله تغییرات (منطقه وجود) علامت جامعه آماری

(R=хmax - xmin)

محدوده تغییرات نامیده می شود. مجموعه مقادیر یک علامت از یک جامعه آماری متعلق به یک بازه جداگانه معمولاً یک گروه نامیده می شود.تعداد بهینه تقریبی گروه ها با فرمول توصیه شده توسط آماردان آمریکایی استرجس تعیین می شود:

K=1+3.322LgN

که در آن K تعداد گروه ها (فاصله) است. N حجم جامعه آماری است.

فرمول استرجس به شرطی مناسب است که توزیع واحدهای جمعیت برای یک مشخصه معین به نرمال نزدیک شود و در عین حال فواصل مساوی در گروه ها اعمال شود. برای به دست آوردن گروه های مناسب با واقعیت، لازم است که ماهیت پدیده (فرآیند) مورد مطالعه هدایت شود.

فواصل، چارچوب گروه بندی هستند. در عمل، آنها با رعایت سه اصل رسمی تشکیل می شوند: برابری فواصل، تعدد فواصل، برابری فرکانس ها. تعداد گروه ها و اندازه فاصله با هم مرتبط هستند: هر چه گروه های بیشتری تشکیل شود، فاصله کمتر می شود و بالعکس. تعداد گروه ها به تعداد واحدهای شی مورد بررسی و درجه نوسان ویژگی گروه بندی بستگی دارد.

فواصل می تواند باشد برابرو نابرابر. اگر دامنه تغییرات ویژگی خیلی وسیع باشد و توزیع مقادیر ناهموار باشد، فواصل نابرابر استفاده می شود. آنها بر اساس اصل تعدد تشکیل می شوند، زمانی که عرض هر بازه بعدی k برابر بیشتر (کمتر) از قبلی باشد. در مواردی که تغییرات در مرزهای نسبتاً باریک ظاهر می شود و توزیع عملاً یکنواخت است، توصیه می شود از فواصل مساوی استفاده شود. برای گروه بندی با فواصل مساوی، مقدار بازه

مقایسه گروه بندی های آماری. گروه بندی ثانویه

گاهی اوقات انجام گروه بندی های ثانویه ضروری می شود - تشکیل گروه های جدید بر اساس گروه بندی قبلی انجام شده. چنین نیازی ممکن است در صورتی ایجاد شود که گروه بندی های موجود الزامات تجزیه و تحلیل در حال انجام را برآورده نکنند (به دلیل قابل مقایسه نیستند عدد متفاوتگروه های انتخاب شده یا مرزهای نابرابر فواصل). دریافت گروه‌های جدید بر اساس گروه‌های موجود به دو روش گروه‌بندی مجدد امکان‌پذیر است: با ترکیب فواصل اولیه (با بزرگ‌کردن آنها) و با گروه‌بندی مجدد سهم (بر اساس اختصاص نسبت معینی از واحدهای جمعیتی به هر گروه).

مثال:

جدول 2 - توزیع کارکنان شرکت و سطح درآمد

بیایید داده ها را دوباره گروه بندی کنیم و گروه های جدید را در فواصل زمانی تا 5، 5-10، 10-20، 20-30، بیش از 30 هزار روبل تشکیل دهیم. اولین گروه جدید شامل کل گروه اول کارمندان و بخشی از گروه دوم خواهد بود. برای تشکیل یک گروه تا سقف 5 هزار روبل، لازم است 1.0 هزار روبل از فاصله گروه بگیرید. ارزش فاصله این گروه 6.0 هزار روبل است. بنابراین لازم است 1/6 (1.0:6.0) قسمت از آن گرفته شود. قسمت مشابهی باید از تعداد کارمندان گرفته شود، یعنی. . در گروه اول تعداد کارکنان: 16+3=20 نفر. دومین گروه جدید توسط کارگران گروه دوم منهای کسانی که به گروه اول اختصاص داده شده اند، یعنی 20-3 = 17 نفر تشکیل می شود. گروه سوم تازه تشکیل شده شامل کلیه کارکنان گروه سوم و بخشی از کارکنان گروه چهارم خواهد بود. برای تعیین این قسمت از فاصله 18-30 (عرض فاصله 12 است)، باید 2.0 را به قبلی اضافه کنید (به طوری که حد بالای فاصله برابر با 2.0 هزار روبل است). بنابراین لازم است بخشی از فاصله را برابر با . 74 نفر در این گروه وجود دارند، بنابراین باید 74x (1: 6) = 12 نفر را انتخاب کنیم. گروه سوم جدید شامل 44 + 12 = 56 نفر خواهد بود. گروه چهارم تازه تشکیل شده شامل 74-12 = 62 نفر باقی مانده از گروه چهارم قبلی خواهد بود. پنجمین گروه تازه تشکیل شده متشکل از کارگران گروه های پنجم و ششم قبلی خواهد بود: 37 + 9 = 46 نفر. در نتیجه، گروه های جدید زیر را دریافت می کنیم:

جدول 3 - گروه بندی جدید

4 تحکیم دانش _______

1 فرآیند گروه بندی چیست؟

2 انواع اصلی گروه ها را فهرست و شرح دهید

3 فاصله. انواع و فرمول

4 فرمول استرجس

5 گروه بندی مجدد

5 صدور مشق شب ______

آنچه را که آموخته اید تجدید نظر کنید

جمع بندی درس

طرح درس شماره (7) 4

بر رشته دانشگاهی"آمار"

گروه	تاریخ
E2-1
Zm2-5

موضوع درسانجام خلاصه ای از داده های آماری. گروه بندی و گروه بندی مجدد داده ها

روش گروه بندی

نوع درسدرس ارتقاء دانش

نوع کلاسکار درسی-عملی شماره 1

اهداف آموزشی

آموزشی

آشنایی با مفهوم گروه بندی، انواع، اهداف و مقاصد، روش گروه بندی، توانایی گروه بندی، گروه بندی مجدد داده های آماری

آموزشی

طبقه بندی کردن انواع مختلفگروه بندی، نتیجه گیری را بر اساس نتایج گروه بندی تدوین کنید

مربیان

به شکل گیری فرهنگ حرفه ای کمک کند.

ارتباطات بین رشته ای:

ارائه رشته ها: AFHD

رشته های ارائه شده:ریاضی

شیوه های آموزش:آموزش عملی

پشتیبانی روش شناختی درس:جزوه

ادبیات:

1 N.V. آمار چربی

2 E.M. آمار Efimova

فرآیند مطالعه

زمان سازماندهی

کار با یک مجله، گزارش، بررسی آمادگی گروه برای درس

یادگیری مطالب جدید

1 گروه بندی- این فرآیند تشکیل گروه های همگن بر اساس تقسیم جامعه آماری به بخش ها یا ترکیب واحدهای مورد مطالعه به جمعیت های خصوصی با توجه به ویژگی های اساسی آنها است.

ویژگی هایی که توسط آن واحدهای جمعیت مشاهده شده در گروه ها توزیع می شوند نامیده می شوند گروه بندی صفات

طبقه بندی گروهی:

گروه بندی ساختاریترکیب یک جمعیت همگن را با توجه به ویژگی های خاص مشخص می کند. به عنوان مثال، ترکیب جمعیت منطقه بر اساس محل سکونت، اندازه متوسط درآمد سرانه، گروه بندی مزارع بر اساس حجم خروجی، ساختار سپرده ها بر اساس شرایط جذب آنها.

گروه بندی تیپولوژیک- این توزیع مجموعه های ناهمگن کیفی به طبقات، انواع اجتماعی-اقتصادی، گروه های همگن است. به عنوان مثال گروه بندی بخش های اقتصاد، واحدهای اقتصادی بر اساس نوع مالکیت: ایالتی، فدرال، شهرداری، خصوصی، مختلط است.

گروه بندی های تحلیلیطراحی شده برای شناسایی روابط بین ویژگی ها.

اساس گروه بندی می تواند هر ویژگی اسنادی یا کمی باشد.

مجموعه مقادیر یک علامت از یک جامعه آماری متعلق به یک بازه جداگانه معمولاً یک گروه نامیده می شود. تعداد تقریبی بهینه گروه ها با فرمول توصیه شده توسط آماردان آمریکایی استرجس تعیین می شود:

K=1+3.322LgN (1)

که در آن K تعداد گروه ها (فاصله) است.

N حجم جامعه آماری است.

فواصل، چارچوب گروه بندی هستند. تعداد گروه ها و اندازه فاصله با هم مرتبط هستند: هر چه گروه های بیشتری تشکیل شود، فاصله کمتر می شود و بالعکس. تعداد گروه ها به تعداد واحدهای شی مورد بررسی و درجه نوسان ویژگی گروه بندی بستگی دارد.

فواصل گروه را می توان بسته (زمانی که حد پایین و بالایی مشخص شده است) و باز (زمانی که فقط یک مرز مشخص شده است - بالا یا پایین).

که در آن х min , max مقادیر حداقل و حداکثر صفت هستند

n - تعداد گروه ها

h - مرحله فاصله

وظیفه 1

گروه بندی 30 فروشگاه در یکی از مناطق فدراسیون روسیه در تاریخ 01.01.05 با استفاده از روش گروه بندی.

جدول 1 - داده های اولیه

№	میانگین تعداد کارمندان، شخص	گردش تجاری، میلیون روبل

راه حل:

به عنوان یک ویژگی گروه بندی، گردش مالی را انتخاب می کنیم.

حالا باید 4 گروه را در فواصل مساوی تشکیل دهید. مقدار فاصله با فرمول تعیین می شود:

جایی که h گام بازه ای است

n - تعداد گروه ها

بیایید مرزهای گروه ها را مشخص کنیم:

2100-7350 - گروه اول (2100+5250)

7350-12600 - گروه دوم (7350+5250)

12600-17850 - گروه سوم (17850+5250)

17850-23100 - گروه چهارم (17850+5250)

پس از تعیین تعداد گروه ها و مشخصه گروه بندی، لازم است شاخص هایی که مشخص کننده گروه ها و اندازه آنها هستند تعیین شود. شاخص ها به گروه ها تقسیم می شوند و مجموع ها محاسبه می شوند.

جدول 2 - گروه بندی فروشگاه ها بر اساس گردش مالی

جدول 3 - گروه بندی فروشگاه ها بر اساس گردش مالی (% از کل)

نتیجه: جدول 3 نشان می دهد که گروه با گردش مالی در محدوده 2100-7350 - 60 درصد غالب است.

گروه بندی بانک های تجاری یکی از مناطق فدراسیون روسیه را در تاریخ 1.01.06 انجام دهید.

جدول 4 - داده های اولیه

شماره بانک	سرمایه، پایتخت	دارایی های کاری	سرمایه مجاز
	207,7	2,48	1,14
	200,3	2,40	1,10
	190,2	2,28	1,05
	323,0	3,88	1,88
	247,1	2,96	1,36
	177,7	2,12	0,97
	242,5	2,90	1,33
	182,9	2,18	0,99
	315,6	3,78	1,73
	183,2	2,20	1,01
	320,2	3,84	1,76
	207,3	2,48	1,14
	181,0	2,17	0,99
	172,4	2,06	0,94
	234,3	2,81	1,29
	189,5	2,27	1,04
	187,7	2,24	1,03
	166,9	1,99	0,91
	157,7	1,88	0,86
	168,3	2,02	0,93
	224,4	2,69	1,23
	166,5	1,99	0,91
	198,5	2,38	1,09
	240,4	2,88	1,32
	229,3	2,75	1,26
	175,2	2,10	0,96
	156,8	1,87	0,86
	160,1	1,92	0,88
	178,7	2,14	0,98
	171,6	2,05	0,94

راه حل:

به عنوان یک ویژگی گروه بندی، سرمایه بانک را می گیریم.

چهار گروه بانک با فواصل مختلف تشکیل می دهیم. مقدار فاصله با فرمول تعیین می شود:

جایی که h گام بازه ای است

х max , x min - مقدار حداقل و حداکثر ویژگی گروه بندی

n - تعداد گروه ها

حالا بیایید مرزهای گروه ها را مشخص کنیم:

گروه 1	156,0-197,8
گروه 2	1297,8-239,6
گروه 3	239,6-281,4
گروه 4	281,4-323,2

پس از تعیین ویژگی گروه بندی - سرمایه، مرحله فاصله و گروه ها تشکیل شد، شاخص هایی را تعیین می کنیم که گروه ها و مقادیر آنها را برای هر گروه مشخص می کند.

جدول 5 - گروه بندی بانک های تجاری بر اساس سرمایه

گروه بانک ها بر اساس سرمایه	تعداد بانک ها	سرمایه، پایتخت	دارایی های	دارایی های کاری

156,0-197,8		2699,5	35,48	16,25
197,8-239,6		1501,8	17,99	8,25
239,6-281,4		730,0	8,74	4,01
281,4-323,2		958,8	11,5	5,37
جمع		6157,1	73,71	33,88

گروه بندی ساختاری بانک های تجاری به صورت زیر خواهد بود:

جدول 6 - گروه بندی بانک های تجاری بر اساس ارزش کاری (% از کل)

گروه بانک ها بر اساس سرمایه	تعداد بانک ها، درصد کل	سرمایه، درصد کل	دارایی ها، % از کل	دارایی های کاری، % از کل

156,0-197,8	56,7	48,2	48,1	48,0
197,8-239,6	23,3	24,4	24,4	24,3
239,6-281,4	10,0	11,9	11,9	11,8
281,4-323,2	10,0	15,5	15,6	15,9
جمع

نتیجه:

جدول 6 نشان می دهد که بانک های کوچک غالب هستند - 56.7٪، آنها 48.2٪ از سرمایه را تشکیل می دهند. بانک های بزرگ و متوسط هر کدام 10 درصد را به خود اختصاص داده اند که سهم سرمایه آنها به ترتیب 15.5 و 11.9 درصد بوده است.

تثبیت دانش

1 اهمیت روش گروه بندی در تجزیه و تحلیل داده های آماری چیست؟

2 گروه بندی چیست؟

3 انواع گروه بندی

4 هر نوع گروه بندی را شرح دهید

5 مفهوم فاصله

6 انواع فواصل

7 فرمول فاصله

4 صدور تکلیف

نمونه هایی از ویژگی های کمی و کیفی را در یک دفتر یادداشت بنویسید که می تواند به عنوان مبنایی برای گروه بندی برای یک شرکت استفاده شود (3-5 مثال)

کار عملی انجام دهید

ارسال کار خوب خود در پایگاه دانش ساده است. از فرم زیر استفاده کنید

دانشجویان، دانشجویان تحصیلات تکمیلی، دانشمندان جوانی که از دانش پایه در تحصیل و کار خود استفاده می کنند از شما بسیار سپاسگزار خواهند بود.

نوشته شده در http://www.allbest.ru/

آکادمی مسکو S.Yu. ویت

دانشکده اقتصاد

تست

کار انجام شده:

دانشجوی سال اول،

آموزش از راه دور

Vislyaeva M.N.

شهر مسکو

هنگام انجام یک کار کنترلی، باید یک گروه بندی مجدد ثانویه برای not انجام دهید مثال پیچیده(یک مثال را خودتان انتخاب کنید) و توضیح دهید که چگونه و تحت چه شرایطی چنین محاسبه مجدد معتبر است. هنگام استفاده از برنامه های رایانه ای و مثال پیچیده تر، تأثیر و ویژگی های استفاده از فناوری اطلاعات را نیز نشان دهید.

در پاسخ کتبی خود به تکلیف، باید:

1. رابطه بین فرمول جمع واریانس و نسبت همبستگی را توضیح دهید، معنای آماری آن را توضیح دهید.

2. مقایسه تغییرات برای دو توزیع مختلف با میانگین های مختلف، شرایط مقایسه را در زمانی که میانگین ها متفاوت است توضیح دهید.

3. کامل ترین توضیح را در مورد معنای خطای حاشیه ای ارائه دهید، آن را با مفهوم نماینده بودن نمونه و حجم مورد نیاز آن مرتبط کنید.

4. رابطه بین تخمین پارامترهای مجهول توسط LSM و تأیید اهمیت نتایج بدست آمده توسط معیارهای آزمون فرضیه های آماری را توضیح دهید.

بازآرایی آمارهای گروه بندی شده قبلی را گروه بندی ثانویه می نامند. این روش در مواردی استفاده می شود که در نتیجه گروه بندی اولیه، ماهیت توزیع جمعیت مورد مطالعه به وضوح آشکار نشده است.

در این مورد، فواصل بزرگ یا کاهش می یابد. همچنین از گروه بندی ثانویه برای رساندن گروه ها به شکل قابل مقایسه در فواصل زمانی مختلف به منظور مقایسه آنها استفاده می شود. روش های گروه بندی ثانویه را با مثال در نظر بگیرید.

برای بزرگنمایی فواصل بر اساس داده های جدول 1:

میز 1

	تعداد فروشگاه ها

گروه بندی فوق به اندازه کافی واضح نیست، زیرا الگوی مشخص و دقیقی در تغییر گردش مالی توسط گروه ها نشان نمی دهد.

اجازه دهید سری توزیع را متراکم کنیم و شش گروه را تشکیل دهیم. گروه های جدید با جمع بندی گروه های اصلی تشکیل می شوند (جدول 2).

جدول 2

گروه های فروشگاه ها بر اساس گردش مالی برای سه ماهه چهارم، هزار روبل	تعداد فروشگاه ها	گردش مالی برای سه ماهه چهارم، هزار روبل.	گردش مالی به طور متوسط برای 1 فروشگاه، هزار روبل.

کاملاً واضح است که هر چه فروشگاه ها بزرگتر باشند، سطح گردش مالی بالاتر است.

1. با گروه بندی تحلیلی، می توانید ارتباط را با استفاده از یک رابطه همبستگی تجربی اندازه گیری کنید. این نشانگر مشخص شده است نامه یونانی h (این یکی). بر اساس قانون تجزیه واریانس است که بر اساس آن واریانس کل s2 برابر است با مجموع واریانس های درون گروهی و بین گروهی.

پراکندگی صفت مؤثر در گروه با ثبات نسبی عامل صفت به دلیل عوامل دیگر ایجاد می شود. این پراکندگی باقیمانده نامیده می شود. با فرمول تعیین می شود:

که در آن y ij مقدار مشخصه y برای آن است واحد iدر گروه j ام؛

J مقدار متوسط صفت در گروه j است.

n j - عدد واحدهای j-thگروه;

j = 1، 2، 3، ...، یعنی.

واریانس های درون گروهی محاسبه شده برای گروه های فردی با میانگین واریانس درون گروهی ترکیب می شوند:

واریانس بین گروهی به عامل مورد مطالعه (و عوامل مرتبط با آن) نسبت داده می شود، بنابراین این واریانس فاکتوریل نامیده می شود. با فرمول مشخص می شود

قانون اضافه کردن واریانس را می توان نوشت:

تجربی رابطه همبستگیاندازه گیری می کند که چه مقدار از کل نوسانات صفت حاصل توسط عامل مورد مطالعه ایجاد می شود. بر این اساس، به عنوان نسبت واریانس عامل به محاسبه می شود واریانس کلنشانه موثر:

این شاخص مقادیر را در فاصله زمانی می گیرد: هر چه به 1 نزدیک تر باشد، رابطه نزدیک تر است و بالعکس.

جدول 3. داده های اولیه

جدول 4. کاربرگ

میانگین گردش مالی \u003d؟ X * f / f \u003d 17370/51 \u003d 340.58 هزار روبل.

پراکندگی عبارت است از:

G2 =؟ f*(X-Xav) 2 / ? f = 38682.36/51 = 758.48

میانگین انحراف معیار:

ضریب تغییرات:

V \u003d G / Xav \u003d 27.54 / 758.48 \u003d 0.081; 8.1 درصد

ضریب تغییرات کمتر از 33 درصد است، بنابراین، جمعیت همگن است.

جدول 5. داده های اولیه

1) میانگین زمان صرف شده برای سفر به محل کار برای کارگران = X cf =؟ Xf / ?f = (25*70 + 35*80 + 45*200 + 55*55 + 65*15) / 420 = 41.8 دقیقه.

2) محاسبه واریانس

پراکندگی عبارت است از:

G2 =؟ f انحراف:

3) ضریب * (X-Xav) 2 / ? f = 43160.8 / 420 = 102.8

میانگین تغییرات مربع عبارت است از:

V \u003d G / Xav \u003d 10.14 / 41.8 \u003d 0.24; 24%

ضریب تغییرات کمتر از 33٪ است، بنابراین، مجموعه در نظر گرفته شده همگن است و میانگین برای آن کاملا معمولی است.

مجموعه نمونه‌گیری می‌تواند بر اساس یک علامت کمی از مقادیر آماری و همچنین بر مبنای جایگزین یا اسنادی تشکیل شود. در حالت اول، مشخصه تعمیم دهنده نمونه، مقدار میانگین نمونه است که نشان داده می شود و در حالت دوم، کسر نمونه مقادیر با w نشان داده می شود. AT جمعیتبه ترتیب: میانگین عمومی و سهم عمومی r.

تفاوت -- و W -- p خطای نمونه گیری نامیده می شود که بر خطای ثبت و خطای نمایندگی تقسیم می شود. قسمت اول خطای نمونه گیری به دلیل اطلاعات نادرست یا نادرست به دلیل درک نادرست اصل موضوع، بی احتیاطی مسئول ثبت در هنگام تکمیل پرسشنامه ها، فرم ها و ... رخ می دهد. تشخیص و رفع آن نسبتاً آسان است. بخش دوم خطا از عدم انطباق ثابت یا خود به خودی با اصل انتخاب تصادفی ناشی می شود. تشخیص و حذف آن دشوار است، بسیار بزرگتر از اولی است و بنابراین توجه اصلی به آن معطوف می شود.

نقش بسیار مهمی برای توجیه و کاربرد مشاهده انتخابیقانون اعداد بزرگ را اجرا می کند. استفاده از قوانین اعداد زیاد این است که تحت شرایط معین و با حجم مشاهدات به اندازه کافی زیاد، خصوصیات خلاصه ای که بر اساس مشاهده انتخابی به دست می آید، تفاوت چندانی با ویژگی های متناظر وکالت نامه عمومی نخواهد داشت. بر این اساس می توان با افزایش حجم نمونه، از حدود خطاهای احتمالی بازنمایی کم کرد، آنها را به کوچکترین اندازه رساند. از سوی دیگر، با دانستن حدود خطاهای نمایندگی، می توان حجم نمونه مورد نیاز را تعیین کرد.

یکی از مهمترین و مسئولیت پذیرترین وظایف در سازماندهی و انجام نمونه گیری، تعیین حجم مورد نیاز نمونه است. اندازه آن، که دریافت داده هایی را تضمین می کند که نسبتاً به درستی ویژگی های جمعیت عمومی مورد مطالعه را منعکس می کند.

در این مورد باید موارد زیر را در نظر گرفت: 1) خطای نمونه برداری حاشیه ای با چه درجه ای از دقت باید به دست آید. 2) احتمال اطمینان از صحت مشروط نتایج مشاهده نمونه چقدر باید باشد. 3) درجه نوسان خواص مورد مطالعه در جمعیت عمومی مورد مطالعه.

این بدان معنی است که اندازه نمونه مورد نیاز بسته به اندازه خطای نمونه برداری حاشیه ای، مقدار ضریب اطمینان (t) و اندازه واریانس تنظیم می شود.

روش تخمین پارامتر رگرسیون خطی، به حداقل رساندن مجموع مجذور انحراف مشاهدات متغیر وابسته از مجهول تابع خطی، روش حداقل مربعات نامیده می شود.

ماهیت روش در این واقعیت نهفته است که معیار کیفیت راه حل مورد بررسی، مجموع مربعات خطاها است که به دنبال به حداقل رساندن آن است. برای اعمال این روش، لازم است تا حد امکان انجام شود بیشتراندازه گیری یک متغیر تصادفی ناشناخته (هر چه بیشتر باشد - دقت راه حل بالاتر است) و مجموعه ای از راه حل های پیشنهادی که از بین آنها باید بهترین را انتخاب کرد. اگر مجموعه راه حل ها پارامتری باشد، باید آن را پیدا کنیم مقدار بهینهمولفه های.

LSM در ریاضیات، به ویژه - در نظریه احتمال و آمار ریاضی. این روش بیشترین کاربرد را در مشکلات فیلترینگ دارد، زمانی که لازم است سیگنال مفید را از نویز قرار گرفته بر روی آن جدا کنید. همچنین در آنالیز ریاضی برای نمایش تقریبی یک تابع داده شده توسط توابع ساده تر استفاده می شود. یکی دیگر از زمینه های کاربرد LSM حل سیستم های معادلات با تعداد مجهولات کمتر از تعداد معادلات است.

مراحل آزمون فرضیه های آماری:

بیان فرضیه اصلی H 0 و فرضیه رقیب H 1 . فرضیه ها باید به وضوح در شرایط ریاضی رسمیت داده شوند.

تنظیم احتمال b که سطح اهمیت نامیده می شود و مربوط به خطاهای نوع اول است که در آینده درباره صحت فرضیه نتیجه گیری خواهد شد.

محاسبه آمار معیار به این صورت است که:

مقدار آن به نمونه اولیه بستگی دارد.

با مقدار آن می توان در مورد صحت فرضیه H 0 نتیجه گیری کرد.

خود آمار q باید از قانون توزیع شناخته شده پیروی کند، زیرا q خود بر حسب شانس تصادفی است.

ساخت منطقه بحرانی زیر مجموعه ای از چنین مقادیری از محدوده مقادیر u متمایز می شود که می تواند برای قضاوت در مورد اختلافات قابل توجه با این فرض استفاده شود. اندازه آن به گونه ای انتخاب شده است که برابری برقرار باشد. به این مجموعه منطقه بحرانی می گویند.

نتیجه گیری در مورد صحت فرضیه. مقادیر مشاهده شده نمونه در آمار u جایگزین می شود و با ضربه زدن (یا عدم برخورد) به منطقه بحرانی، تصمیم به رد (یا پذیرش) فرضیه ارائه شده H 0 گرفته می شود.

تنوع همبستگی واریانس

میزبانی شده در Allbest.ru

...

اسناد مشابه

جدول مقادیر نمونه گسسته متغیرهای تصادفیبه صورت منظم جدول سری های آماری بازه ای فرکانس های نسبی. تنظیم یک تابع توزیع تجربی و رسم نمودار آن. چند ضلعی و توزیع یک متغیر تصادفی.

کار عملی، اضافه شده در 2012/07/26

ویژگی های عددیبرای توزیع های آماری ساخت یک سری تغییرات بازه ای، یک چندضلعی فرکانس، یک نمودار از تابع توزیع نمونه و تعیین میانگین نمونه و واریانس نمونه به دو روش.

ارائه، اضافه شده در 11/01/2013

مقدار متوسط شاخص (میانگین حسابی). شاخص های تغییرات - محدوده تغییرات، میانگین انحراف خطی، انحراف استاندارد، واریانس، ضریب تغییرات. حداکثر و حداقل مقدار آمار.

تست، اضافه شده در 11/14/2008

مفهوم جمعیت عمومی، انتظارات ریاضیو پراکندگی حصول اطمینان از تصادفی بودن و نماینده بودن نمونه در برنامه ریزی آماری. سری تغییرات گسسته و بازه ای، تخمین های نقطه ایپارامترهای توزیع صفت

چکیده، اضافه شده در 1390/06/13

ماهیت تحقیق نمونه گیری. روش های انتخاب واحدها در چارچوب نمونه. میانگین و خطای حاشیه ای برای اندیکاتورها سایز متوسطو شاخص ها را به اشتراک بگذارید. تعیین حجم نمونه مورد نیاز برای یک مورد معین خطای حاشیه ایمقدار متوسط

ارائه، اضافه شده در 2014/03/16

فرم ها، انواع و روش ها مشاهده آماری. انواع گروه بندی ها، فاصله زمانی و فراوانی آنها. ساختار یک سری از دینامیک. مطلق و نسبی آمار. ارائه نمونه در قالب یک سری آماری. تخمین نقطه و فاصله

دوره سخنرانی ها، اضافه شده در 2013/11/29

فاصله ساختمان سری تغییراتتوسط شاخص ها محاسبه میانگین حسابی، حالت و میانه، نسبی و شاخص های مطلقتغییرات. تعیین ویژگی های کمی توزیع ها، ساخت یک تابع تجربی.

مقاله ترم، اضافه شده 01/11/2012

نمودار پراکندگی را به عنوان نقاطی روی صفحه ترسیم کنید که مختصات آن با مقادیر متغیرهای تصادفی X و Y، ترتیب ساخت و هدف آن مطابقت دارد. یافتن ضرایب و رسم نمودار تقریب خطی، نمودار تقریب درجه دوم.

مقاله ترم، اضافه شده 05/03/2011

سفارش انتخاب اولیه زمان های عملیاتی تا شکست. معاینه فرضیه آماریدر مورد انطباق با توزیع نمایی و توزیع Weibull. برآورد پارامترهای توزیع و شاخص های قابلیت اطمینان، روش ها و تکنیک های اصلی آن.

مقاله ترم، اضافه شده در 2012/01/22

مفهوم یک سری تغییرات، توزیع آماری. تابع تجربی و ویژگی های اصلی انتظار ریاضی از واریانس نمونه. نقطه و تخمین های فاصله ایتوزیع ها نظریه فرضیه مشابه نظریه فواصل اطمینان است.

گروه بندی ها عبارتند از:

اولیهبر اساس مواد اولیهدر طول مشاهدات جمع آوری شده است.
ثانوی، که بر اساس موارد اولیه تدوین شده است، در دو مورد استفاده می شود:
- زمانی که لازم است گروه‌های رسمی کوچک به گروه‌های بزرگ‌تر تبدیل شوند.
- زمانی که لازم است یک ارزیابی مقایسه ای از مواد جمع آوری شده در آن ارائه شود جاهای مختلفو با روش های مختلف

گروه بندی متشکل از دو یا چند ویژگی − نامیده می شود ترکیبی.
علامتی که با آن انتخاب گروه ها یا انواع پدیده ها رخ می دهد نامیده می شود گروه بندی یا گروه بندی. مبنا می تواند کمی یا اسنادی باشد. اسنادی- این علامتی است که نامی دارد (مثلاً یک حرفه: خیاط، معلم و غیره).

مثال شماره 1. داده های زیر در مورد توزیع شرکت های تجاری بر اساس تعداد کارکنان در دو منطقه موجود است.

با محاسبه مجدد داده های منطقه 1 بر اساس گروه بندی منطقه 2، یک گروه ثانویه از داده های توزیع شرکت ایجاد کنید. کدام منطقه بیشترین میانگین تعداد کارکنان را دارد؟

راه حل:
گروه اول "کمتر از 5" شامل 4/5 از گروه "1-5" خواهد بود. سپس تعداد بنگاه ها خواهد بود: 6*4/5 = 4.8 ≈ 5.
گروه "5-10" به طور کامل شامل گروه "6-10" و بخشی از گروه "1-5" است، یعنی. عدد شرکت 4 + (6-5) = 5 خواهد بود
گروه "11-20" به طور کامل شامل گروه "11-15" و بخشی از گروه "16-20"، یعنی ¼ * 50 \u003d 12.5 ≈ 13 خواهد بود.
گروه "21-30" به طور کامل شامل گروه "16-20" و گروه "21-25" و گروه "بیش از 25" است. دریافت می کنیم: (50-13) + 20 + 15 = 72

میانگین تعداد کارمندان را بیابید:
برای منطقه اول

میانگین وزنی: x sr = 1960/105 = 18.67

برای منطقه دوم

میانگین وزنی: xav = 3502.5/117 = 29.94
بنابراین در منطقه دوم میانگین تعداد شاغلان بیشتر است.

مثال شماره 2.
توزیع کارگران بر اساس مدت خدمت

شماره گروه	گروه های کارگران بر اساس طول خدمت، سال ها	تعداد کارگران، نفر.	تعداد کارگران به عنوان درصدی از کل
من	2-6	6	30,0
II	6-10	6	30,0
III	10-14	5	25,0
IV	14-18	3	15,0
جمع		20	100,0

در سری توزیع، برای وضوح، صفت مورد مطالعه به صورت درصد محاسبه می شود. نتایج گروه‌بندی اولیه نشان داد که 60.0 درصد کارگران تا 10 سال و به طور مساوی از 2 تا 6 سال - 30 درصد و از 6-10 سال - 30 درصد و 40 درصد از کارگران دارای سابقه کار هستند. 10 تا 18 سال.
برای مطالعه رابطه بین تجربه کاری و خروجی، ایجاد یک گروه بندی تحلیلی ضروری است. در پایه آن، ما همان گروه هایی را که در سری توزیع وجود دارد، می گیریم. نتایج گروه بندی در جدول 2 ارائه شده است.

جدول 2 - گروه بندی کارگران بر اساس سابقه خدمت

شماره گروه	گروهی از کارگران با سالها تجربه	تعداد کارگران، نفر.	میانگین سابقه کار، سالها	توسعه محصول، مالش.
شماره گروه	گروهی از کارگران با سالها تجربه	تعداد کارگران، نفر.	میانگین سابقه کار، سالها	جمع	برای یک کارگر
من	2-6	6	3,25	1335,0	222,5
II	6-10	6	7,26	1613,0	268,8
III	10-14	5	11,95	1351,0	270,2
IV	14-18	3	16,5	965,0	321,6
جمع:		20	8,62	5264	236

برای پر کردن جدول 2 باید جدول کار 3 تهیه شود.

جدول 3

شماره p / p	گروه های کارگران بر اساس طول خدمت، سال ها	شماره کارگر	تجربه	تولید در روبل
1	2	3	4	5
1	2-6	1, 2, 3, 4,	2,0; 2,3; 3,0; 5,0; 4,5; 2,7	205, 200, 205, 250, 225, 250
مجموع برای گروه:		6	19,5	1335
2	6-10	5, 6, 8, 13, 17, 19	6,2; 8,0; 6,9; 7,0; 9,0; 6,5	208, 290, 270, 250, 270, 253
مجموع گروه		6	43,6	1613
3	10-14	9, 12, 15, 16, 18	12,5; 13,0; 11,0; 10,5; 12,8	230, 300, 287, 276, 258
مجموع گروه		5	59,8	1351
4	14-18	11, 20, 14	16, 18, 15,5	295, 320, 350
مجموع گروه		3	49,5	965
جمع		20	172.4	5264,0

تقسیم نمودارها (4:3); برگه (5:3). 3 ما داده های مربوطه را برای پر کردن جدول 2 دریافت خواهیم کرد. بنابراین بیشتر برای همه گروه ها. با پر کردن جدول 2. یک جدول تحلیلی بدست می آوریم.
پس از محاسبه جدول کار، نتایج نهایی جدول را با شرایط داده شده مسئله مقایسه می کنیم، آنها باید مطابقت داشته باشند. بنابراین، علاوه بر ایجاد گروه بندی، یافتن مقادیر میانگین، کنترل حسابی را نیز بررسی خواهیم کرد.
با تجزیه و تحلیل جدول تحلیلی 2 می توان نتیجه گرفت که ویژگی های مورد مطالعه (شاخص ها) به یکدیگر بستگی دارند. با رشد تجربه کاری، خروجی هر کارگر به طور مداوم در حال افزایش است. توسعه کارگران گروه چهارم برای 99.1 روبل. بالاتر از اولین یا 44.5٪، نمونه ای از گروه بندی بر اساس یک ویژگی را در نظر گرفتیم. اما در تعدادی از موارد، چنین گروه بندی برای حل وظایف تعیین شده کافی نیست. در چنین مواردی، آنها بر اساس دو یا چند ویژگی، یعنی. به ترکیب. بیایید یک گروه بندی ثانویه از داده ها بر روی میانگین خروجی ایجاد کنیم.
ما هر گروه را با تعداد کارگران، میانگین تجربه کاری، متوسط تولید مشخص می کنیم - در مجموع و به ازای هر کارگر، محاسبات در جدول 4 ارائه شده است.

جدول 4 - گروه بندی کارگران بر اساس طول خدمت و میانگین تولید

شماره p / p	گروه های کارگری		تعداد کارگران، نفر.	میانگین سابقه کار، سالها	متوسط خروجی، مالش.
شماره p / p	بر اساس ارشدیت	با توجه به میانگین خروجی تولید در روبل	تعداد کارگران، نفر.	میانگین سابقه کار، سالها	جمع	برای یک کارگر
1	2-6	200,0-250,0	4	2,5	835,0	208,75
مجموع گروه			6	3,25	1335,0	222,5
2	6-10	200,0-250,0	-	-	-	-
3	10-14	200,0-250,0	1	12,5	230,0	230,0
مجموع گروه			5	11,96	1351,0	270,2
4	14-18	200,0-250,0	-	-	-	-
مجموع گروه			3	16,5	965,0	321,6
مجموع بر اساس گروه ها		200,0-250,0	5	3,0	1065,0	213,0
جمع			20	8,62	5264	263,2

برای ایجاد یک گروه بندی تحلیلی ثانویه بر اساس میانگین خروجی محصولات در گروه های اولیه ایجاد شده، فاصله گروه بندی ثانویه را تعیین می کنیم و سه گروه را برجسته می کنیم. یک کمتر از گروه بندی اصلی.
سپس، i=(350-200)/3 = 50 روبل.
گرفتن گروه های بیشتر منطقی نیست، فاصله بسیار کمی وجود خواهد داشت، کمتر ممکن است. داده های نهایی برای گروه به عنوان مجموع تجربه برای گروه محاسبه می شود، ارسال شده برای 19، 5 سال اول بر تعداد کارگران تقسیم می شود - 6 نفر، ما 3.25 سال دریافت می کنیم.
داده های جدول نشان می دهد که توسعه محصول به طور مستقیم به طول خدمت بستگی دارد.

گاهی اوقات گروه بندی اولیه امکان شناسایی واضح ماهیت توزیع واحدهای جمعیتی را فراهم نمی کند و یا برای رساندن گروه بندی ها به نوع قابل مقایسه به منظور انجام تحلیل مقایسه ای، لازم است گروه بندی موجود تا حدودی تغییر یابد. : گروه‌های نسبتاً کوچک شناسایی شده قبلی را در تعداد کمی از گروه‌های معمولی بزرگ‌تر ترکیب کنید یا مرزهای گروه‌های قبلی را تغییر دهید تا گروه‌بندی با گروه‌های دیگر قابل مقایسه باشد.

هنگام تجزیه و تحلیل و مقایسه چندین گروه، به عنوان مثال، برای چندین کارگاه، شرکت و غیره، ممکن است وضعیتی ایجاد شود که گروه بندی های اولیه به دلیل تعداد متفاوت گروه ها یا مقادیر متفاوت فواصل مورد استفاده غیرقابل مقایسه باشند. به منظور آوردن چنین گروه بندی ها به شکلی قابل مقایسه، یعنی. از روش گروه بندی ثانویه یا برای یک تعداد گروه یا به یک مقدار فاصله استفاده می شود. روش گروه بندی ثانویه - این روشی برای تشکیل گروه های جدید بر اساس گروه بندی های موجود با توجه به نیازهای مشخص شده است.برای انجام گروه بندی ثانویه، از 2 روش استفاده می شود: 1) اتحاد گروه های اصلی، 2) گروه بندی مجدد مشترک.

آوردن چندین گروه بندی متفاوت به شکلی قابل مقایسه در سه مرحله انجام می شود. در مرحله اول، تجزیه و تحلیل گروه بندی های اولیه به منظور شناسایی شرایط برای غیرقابل مقایسه بودن گروه بندی های اولیه انجام می شود. در مرحله دوم، روشی انتخاب می‌شود که گروه‌بندی‌های اصلی را به شکلی قابل مقایسه درآورد. در مرحله سوم، بازآرایی ثانویه گروه بندی های اولیه و تجزیه و تحلیل نتایج به دست آمده انجام می شود. در صورت لزوم، گروه بندی مجدد انجام می شود. روش های بازآرایی ثانویه را در نظر بگیرید.

1 راهمشاهدات آماری در مورد توزیع کارگران شرکت بر اساس طول خدمت در سال 2000 نتایج زیر را نشان داد (جدول 2.7).

جدول 2.7

در سال 2002، یک مشاهدات آماری مکرر انجام شد که نتایج زیر را نشان داد (جدول 2.8). تخمین تغییرات در توزیع کارگران بر اساس طول خدمت برای 2 سال به طور مستقیم از داده های هر دو جدول غیرممکن است. تجزیه و تحلیل هر دو جدول نشان می دهد که آنها به دلیل تعداد متفاوت گروه ها و فواصل مختلف ناسازگار هستند.

جدول 2.8

برای رساندن داده های هر دو جدول به شکل قابل مقایسه، می توان هر دو گروه 1 و 2 و گروه های 3 و 4 را در جدول 2.7 ترکیب کرد. این امکان ارزیابی تغییرات توزیع کارگران بر اساس طول خدمت را که در دو سال در شرکت رخ داده است را ممکن می سازد. نتایج گروه بندی مجدد داده های مشاهدات آماری برای سال 2000 (جدول 2.7) در جدول 2.9 نشان داده شده است.

جدول 2.9

با مقایسه داده های سال 2002 (جدول 2.8) با داده های گروه بندی مجدد برای سال 2000 (جدول 2.9)، می توان نتیجه گرفت که در دو سال تعداد کارگران با تجربه تا 6 سال کاهش یافته است. جوان، و تعداد کارگران با تجربه بیشتر افزایش یافته است.

2 راهاجازه دهید مشاهدات آماری در سال 2002 چنین نتایجی را ارائه دهد (جدول 2.10). با مقایسه داده‌های سال 2000 (جدول 2.9) و داده‌های سال 2002 (جدول 2.7)، می‌توان نتیجه گرفت که به دلیل تعداد گروه‌ها و فواصل متفاوت، متناقض هستند. تجزیه و تحلیل نشان می دهد که استفاده از روش اول برای آوردن داده ها به شکل قابل مقایسه غیرممکن است. بنابراین، ما از روش 2 برای گروه بندی مجدد داده های سال 2000 (جدول 2.7) استفاده می کنیم تا با گروه بندی داده های سال 2002 مطابقت داشته باشند (جدول 2.10).

جدول 2.10

استفاده از روش دوم شامل توزیع یکنواختفرکانس های درون هر گروه این یک شرط ضروری برای استفاده از روش دوم است. برای گروه بندی مجدد داده های سال 2000 (جدول 2.7)، محاسبات زیر را انجام خواهیم داد. بنابراین گروه اول جدید (1-4) (جدول 2.10) شامل تمام داده های گروه اول قدیمی (1-3) (جدول 22.7) و داده های مربوط به تعداد کارگران با 4 سال سابقه از گروه دوم قدیمی است. . تعداد کارگران با 4 سال سابقه 3 نفر (9/3=3، چون در گروه دوم قدیم 9 کارگر وجود داشت و فاصله آن 3 نفر است). بنابراین، گروه اول جدید (1-4) شامل 18 کارگر (18=15+3) خواهد بود. یک گروه جدید(5-8) شامل 6 کارگر با 5.6 سال سابقه (از گروه دوم قدیم 6=9/3 2) و 18 کارگر با 7.8 سال سابقه (از گروه سوم قدیم 18=27/3 2 2) خواهد بود. گروه دوم جدید (5-8) شامل 24 کارگر (24=6+18) خواهد بود. گروه سوم جدید (9-12) شامل کارگران با 9 سال سابقه (9=27/3) و هر 9 کارگر از گروه چهارم قدیم (10-12) خواهد بود. بدین ترتیب در گروه سوم جدید (9-12) 18 کارگر (18=9+9) وجود خواهد داشت. داده های گروه بندی مجدد برای سال 2000 و داده های سال 2002 در یک جدول خلاصه می شود (2.11) که امکان تجزیه و تحلیل مقایسه ای را فراهم می کند.

جدول 2.11

تجزیه و تحلیل توزیع کارگران شرکت بر اساس طول خدمت (جدول 2.11) نشان می دهد که در سال 2002 تعداد کارگران با سابقه بیشتر (از 9 به 12 سال) افزایش یافته است، در حالی که افراد با سابقه کمتر (از 1 تا 8 سال) کاهش یافته است. . بنابراین، گروه‌بندی مجدد داده‌ها این امکان را فراهم می‌آورد که داده‌ها را به شکل قابل مقایسه درآورد، تجزیه و تحلیل انجام داد و نتیجه‌گیری‌های لازم را گرفت.

سوالات و وظایف را کنترل کنید

1. مشاهده آماری چیست؟ چه شرایطی باید هنگام انجام یک مشاهده آماری رعایت شود (به تعریف مراجعه کنید)؟

2. مشاهدات آماری را با چه معیارهایی می توان طبقه بندی کرد؟ نمونه هایی از مشاهدات آماری را ذکر کنید.

3. چه خطاهایی در طول مشاهدات آماری رخ می دهد و از چه روش های کنترلی می توان استفاده کرد؟

4. مشخص کنید کدام مثال دارای خلاصه ساده و کدام یک خلاصه پیچیده است. مثال 1. روز دوشنبه 200 کارگر در مغازه بافندگی کار می کردند. مثال 2. روز دوشنبه 40 کارگر در بافندگی قطعه 1 و 60 کارگر در بخش شماره 2 و در مجموع 100 کارگر مشغول به کار بودند.

5. در پردازش اطلاعات آماری از چه گروه بندی هایی استفاده می شود؟ چه تفاوتی با یکدیگر دارند؟

6. در بخش فناور ارشد 15 نفر و در بخش بازاریابی و فروش 10 نفر هستند. در این صورت، تیم‌های دپارتمان‌ها دانه‌های همگن هستند و در این صورت آن‌ها دانه‌های ناهمگن هستند.

7. فروش روزانه پارچه A در فروشگاه Fabric در ماه اکتبر با داده های زیر (بر حسب متر) مشخص شد: 4، 11، 8، 14، 10، 19، 12، 11، 3، 6، 21، 9، 9 ، 5، 10، 13، 15، 7، 10، 13، 16، 12، 8، 11، 14، 15، 17. داده ها را با استفاده از فواصل مساوی گروه بندی کنید.

8. نتایج گروه بندی داده ها از بند 7 را به گروه های زیر گروه بندی کنید: (3-9)، (9-15)، 15-21).

مبحث شماره 3 سری آماری توزیع، جداول، گرافیک

3.1 سری توزیع آماری - مفهوم، انواع، اشکال ارائه

یکی از اشکال ارائه داده های مشاهده آماری، یک سری توزیع آماری است. سری های آماری توزیع یک آرایش منظم از واحدهای جمعیت به گروه ها بر اساس یک ویژگی گروه بندی است.با کمک سری های توزیع آماری، می توان ساختار و مرزهای تغییر جمعیت را بررسی کرد، همگنی را ارزیابی کرد و الگوهای توسعه واحدهای جامعه را تعیین کرد. بر اساس نوع سری های آماریتوزیع ها به سری های اسنادی، متغیری و زمانی تقسیم می شوند.

سری صفات و تغییرات از دو عنصر تشکیل شده است: انواع و فرکانس ها (فرکانس ها یا چگالی). گونه() - این مقدار خاصی از ویژگی است که در سری توزیع می گیرد. فرکانس () - این هست عدد مطلق، نشان می دهد که چند بار (هر چند وقت یکبار) این یا آن مقدار از یک ویژگی (متغییر) در مجموع رخ می دهد یا چند واحد از جمعیت دارای یک یا مقدار دیگری از ویژگی (متغیر) هستند. فرکانس() - این یک مقدار نسبی است که سهم گزینه های فردی را در حجم کل جمعیت تعیین می کند ().فراوانی را می توان به صورت سهام بیان کرد که در این صورت حجم جمعیت برابر با یک () است یا به صورت درصد، در این حالت حجم جمعیت 100٪ است (). به طور کلی فرکانس به صورت زیر محاسبه می شود

حجم جمعیت کجاست

تراکم() یک مقدار نسبی است که نشان می دهد چند واحد جمعیت (به صورت مطلق یا نسبی) در طول واحد فاصله گروه () است.چگالی می تواند مطلق یا نسبی باشد. چگالی مطلق برابر است با

چگالی نسبیبرابر است با

هنگام محاسبه چگالی نسبی، فرکانس استفاده می شود که در کسری بیان می شود.

سری ویژگیسریالی است که بر اساس ویژگی کیفی جمعیت ساخته شده است.این سری ها با استفاده از گروه بندی تایپولوژیکی ساخته شده اند و می توانند در قالب یک جدول بیان شوند. به عنوان مثال، توزیع کارگران شرکت بر اساس دسته های دستمزد (جدول 3.1).

جدول 3.1

در مثال داده شده (جدول 3.1)، مجموع همه شرکت های فعال است. اندازه جمعیت 250 نفر است. واحد جمعیت یک کارگر است. به عنوان یکی از ویژگی های واحد جمعیت، دسته تعرفه انتخاب می شود. این علامت چندین معنی خاص دارد - یک نوع (دسته اول، دسته دوم، دسته سوم، دسته چهارم، دسته پنجم). در جدول، مقادیر ویژگی در ستون 2، مقادیر فرکانس در ستون 3، مقدار فرکانس در ستون 4 آورده شده است.

سری واریاسیون- این مجموعه ای است که بر اساس یک علامت کمی از جمعیت ساخته شده است.این سری ها عمدتاً با کمک گروه بندی ساختاری ساخته می شوند و می توان آنها را به صورت جدول بیان کرد. سری های متغیر دو نوع هستند: سری های متغیر گسسته و سری های بازه ای. سری تغییرات گسسته مجموعه ای است که در آن مقادیر مشخصه ها (گزینه ها) با مقادیر گسسته نمایش داده می شوند. سری تغییرات فاصله مجموعه ای است که در آن مقادیر مشخصه به صورت فواصل بیان می شود. بر اساس داده های مربوط به گردش مالی روزانه 34 کارآفرین فردی که در صفحه ارائه شده است، یک متغیر ایجاد خواهیم کرد. سری بازه ای(جدول 3.2)

جدول 3.2

ستون 3 فراوانی را نشان می دهد - تعداد کارآفرینانی که گردش مالی یک روزه آنها در یک بازه زمانی معین قرار می گیرد (ستون 2). در ستون 4، درصد فراوانی طبق فرمول 3.1 محاسبه می شود. بنابراین فرکانس برای گروه اول (3.1 - 3.9) برابر خواهد بود

به طور مشابه، فرکانس برای گروه های دیگر محاسبه می شود. ستون 5 فرکانس را بر حسب کسری نشان می دهد. می توان آن را یا با محاسبه به دست آورد

یا با تبدیل درصدها به سهام. هنگام محاسبه، داده ها به صورت اعشاری باید با دقت حداکثر تا 3 رقم اعشار نشان داده شوند. این امر دقت محاسبات و دریافت داده های نهایی مربوطه را بهبود می بخشد. بنابراین مجموع فرکانس ها در درصد باید برابر با 100٪ و در کسری - برابر با 1 باشد.

ستون 6 جدول 3.2 مقادیر چگالی مطلق را نشان می دهد. محاسبه طبق فرمول 3.2 انجام می شود. بنابراین برای گروه اول، چگالی مطلق برابر خواهد بود

اگر فرکانس () از ستون 3 گرفته شود، مقدار بازه () به عنوان تفاوت بین حد بالایی (3.9) و حد پایین (3.1) بازه گروه اول تعریف می شود، یعنی. . به طور مشابه، چگالی مطلق برای گروه های دیگر محاسبه می شود. پس از انجام محاسبات لازم است تفسیر اقتصادی به آنها داده شود. بنابراین، برای مثال، چگالی مطلق گروه اول نشان می دهد که برای هر هزار روبل. گردش مالی در گروه اول 5 کارآفرین بود.

ستون 7 جدول 3.2 مقادیر چگالی نسبی را نشان می دهد. محاسبه طبق فرمول 3.3 انجام می شود. بنابراین برای گروه اول، چگالی نسبی برابر خواهد بود

به طور مشابه، چگالی نسبی برای گروه های دیگر محاسبه می شود. تراکم نسبی گروه اول نشان می دهد که سهم کارآفرینانی که به هر هزار گردش مالی در گروه اول می آیند 0.147 است.

ستون 2 جدول 3.3 گردش مالی را به صورت فواصل و ستون 3 گردش مالی را به صورت مقادیر گسسته نشان می دهد. برای گروه اول مقدار گسسته به صورت زیر محاسبه می شود

به همین ترتیب، گردش مالی در فرم محاسبه می شود کمیت گسستهو برای گروه های دیگر

اغلب، هنگام تجزیه و تحلیل سری های متغیر، نیاز به درک تغییر در حجم جمعیت هنگام تغییر (عمدتا به ترتیب صعودی) مقادیر ویژگی وجود دارد. برای این کار از مفاهیمی مانند فرکانس های تجمعی یا فرکانس های تجمعی استفاده می شود. فرکانس های انباشته شده ( )مجموع فرکانس های ابتدای سری تا مقدار مشخصی از ویژگی، شامل است. فرکانس های انباشته شده مجموع فرکانس ها از ابتدای سری تا مقدار مشخصی از ویژگی، شامل است.یافتن مقادیر این شاخص ها را مطابق جدول در نظر بگیرید. 3.4 در ستون 6 جدول. 3.4 فرکانس های انباشته شده را نشان می دهد. در گروه اول (ستون 1) 4 کارآفرین (ستون 4) گردش مالی 3.1 تا 3.9 هزار روبل داشتند. (گروه 2) یا گردش مالی متوسط 3.5 هزار روبل. (گروه 3). از آنجایی که این اولین گروه است، فرکانس انباشته شده، یعنی. تعداد کارآفرینان برابر با 4 نفر (ستون 6) خواهد بود. در گروه دوم، تعداد کارآفرینان با گردش مالی 3.9 تا 4.7 هزار روبل. یا میانگین گردش مالی 4.3 هزار روبل. برابر با 5 نفر از این رو فرکانس انباشته شده، یعنی. تعداد کارآفرینان با گردش مالی 3.1 تا 4.7 هزار روبل. یا به طور متوسط از و کمتر از 4.3 هزار روبل، برابر با 9=4+5 خواهد بود. برای گروه سوم فراوانی تجمعی 16=4+5+7 و به همین ترتیب خواهد بود. فرکانس تجمعی نیز به همین ترتیب محاسبه می شود.