نحوه ساخت یک سری توزیع بازه ای ساخت یک سری تغییرات بازه ای برای داده های کمی پیوسته

2. مفهوم سری توزیع سری های توزیع گسسته و بازه ای

ردیف های توزیعگروه‌بندی‌هایی از نوع خاصی نامیده می‌شوند که در آن برای هر صفت، گروهی از ویژگی‌ها یا دسته‌ای از ویژگی‌ها، تعداد واحدهای گروه یا سهم این تعداد در کل مشخص می‌شود. آن ها سری توزیع- مجموعه ای مرتب از مقادیر ویژگی که به ترتیب صعودی یا نزولی با وزن های مربوطه مرتب شده اند. سری های توزیع را می توان به صورت کمی یا با ویژگی ساخت.

سری های توزیعی که بر مبنای کمی ساخته می شوند سری های تنوع نامیده می شوند. آن ها هستند گسسته و فاصله ای. یک سری توزیع را می توان بر روی یک ویژگی دائماً متغیر (زمانی که یک ویژگی می تواند هر مقداری را در یک بازه زمانی دریافت کند) و بر روی یک ویژگی کاملاً متغیر (مقادیر صحیح دقیق تعریف شده را می گیرد) ساخته شود.

گسسته سری های متغیرتوزیع به مجموعه‌ای از گزینه‌ها با فرکانس یا ویژگی‌های متناظرشان گفته می‌شود. انواع یک سری گسسته به طور ناپیوسته مقادیر یک علامت را تغییر می دهند، معمولاً این نتیجه یک شمارش است.

گسسته

سری‌های تغییرات معمولاً در صورتی ساخته می‌شوند که مقادیر صفت مورد مطالعه حداقل با مقداری محدود با یکدیگر متفاوت باشند. در سری های گسسته، مقادیر نقطه ای یک ویژگی مشخص می شود. مثال : توزیع کت و شلوار مردانه که توسط فروشگاه ها در ماه فروخته می شود بر اساس سایز.

فاصله

سری تغییرات مجموعه مرتب شده ای از فواصل تغییرات مقادیر است متغیر تصادفیبا فرکانس های مربوطه یا فرکانس های مقادیر بزرگی که به هر یک از آنها برخورد می کنند. سری های بازه ای برای تجزیه و تحلیل توزیع یک ویژگی پیوسته در حال تغییر طراحی شده اند که مقدار آن اغلب با اندازه گیری یا وزن گیری ثبت می شود. انواع چنین ردیف یک گروه بندی است.

مثال : توزیع خرید در خواربارفروشی برحسب مبلغ.

اگر در سری‌های متغیر گسسته، پاسخ فرکانسی مستقیماً به نوع سری اشاره دارد، سپس در بازه‌ها به گروه واریانت‌ها اشاره می‌کند.

سری های توزیع به راحتی با استفاده از آنها تجزیه و تحلیل می شوند تصویر گرافیکی، که قضاوت در مورد شکل توزیع و قاعده مندی ها را ممکن می سازد. یک سری گسسته در نمودار به عنوان یک خط شکسته نمایش داده می شود - منطقه توزیع. برای ساختن آن در یک سیستم مختصات مستطیلی، مقادیر رتبه‌بندی شده (مرتب‌بندی شده) ویژگی متغیر بر روی آبسیسا در همان مقیاس رسم می‌شود و مقیاس بیان فرکانس‌ها در امتداد اردیت رسم می‌شود.

سری فاصله به صورت نمایش داده می شود هیستوگرام های توزیع(یعنی نمودارهای میله ای).

هنگام ساخت یک هیستوگرام، مقادیر فواصل بر روی محور آبسیسا رسم می شوند و فرکانس ها با مستطیل هایی که بر روی فواصل مربوطه ساخته شده اند نشان داده می شوند. ارتفاع ستون ها در صورت فواصل مساوی باید متناسب با فرکانس ها باشد.

هر هیستوگرام را می توان به چند ضلعی از توزیع ها تبدیل کرد، برای این، لازم است که رئوس مستطیل های آن را با بخش های مستقیم متصل کنیم.

2. روش شاخص برای تحلیل تاثیر متوسط ​​خروجی و میانگین تعداد کارمندانبه تغییرات در حجم تولید

روش شاخصبرای تحلیل پویایی و مقایسه شاخص های کلی و همچنین عوامل موثر بر تغییر سطوح این شاخص ها استفاده می شود. با کمک شاخص ها می توان تأثیر میانگین تولید و میانگین سرشماری را بر تغییرات حجم تولید آشکار کرد. این مشکل با ساخت سیستمی از شاخص های تحلیلی حل می شود.

شاخص حجم تولید با شاخص میانگین تعداد کارکنان و شاخص متوسط ​​تولید به همان ترتیبی است که حجم تولید (Q) با بازده مرتبط است ( w)و شماره ( ر) .

می توان نتیجه گرفت که حجم تولید برابر با حاصلضرب میانگین تولید و میانگین تعداد کار خواهد بود:

Q = w r،که در آن Q حجم تولید است،

w - میانگین خروجی،

r میانگین تعداد کارمندان است.

همانطور که می بینید، ما در مورد رابطه پدیده ها در استاتیک صحبت می کنیم: حاصل ضرب دو عامل حجم کل پدیده حاصل را به دست می دهد. همچنین بدیهی است که این ارتباط عملکردی است، بنابراین پویایی این ارتباط با کمک شاخص‌ها بررسی می‌شود. برای مثال ارائه شده، این سیستم زیر است:

J w × J r = J wr .

به عنوان مثال، شاخص حجم تولید Jwr به عنوان شاخصی از یک پدیده حاصل، می تواند به دو عامل شاخص تجزیه شود: شاخص میانگین تولید (Jw) و شاخص میانگین تعداد کار (Jr):

نمایه نمایه نمایه

حجم میانگین

قدرت خروجی تولید

جایی که جی w- شاخص بهره وری نیروی کار با فرمول لاسپیرس محاسبه می شود.

جی آر- شاخص تعداد کارمندان، بر اساس فرمول Paasche محاسبه می شود.

سیستم های شاخص برای تعیین تأثیر عوامل فردی در شکل گیری سطح استفاده می شود شاخص عملکرد، 2 را در نظر بگیرید ارزش های شناخته شدهشاخص ها مقدار مجهول را تعیین می کنند.

بر اساس سیستم شاخص های فوق، می توان افزایش مطلق در حجم تولید را نیز یافت که به تأثیر عوامل تجزیه شده است.

1. افزایش کل در حجم تولید:

∆wr = ∑w 1 r 1 - ∑w 0 r 0 .

2. رشد ناشی از عملکرد شاخص میانگین خروجی:

∆wr/w = ∑w 1 r 1 - ∑w 0 r 1 .

3. رشد ناشی از عملکرد شاخص میانگین تعداد کارمندان:

∆wr/r = ∑w 0 r 1 - ∑w 0 r 0

∆wr = ∆wr/w + ∆wr/r.

مثال.اطلاعات زیر شناخته شده است

ما می توانیم تعیین کنیم که حجم تولید به صورت نسبی و مطلق چگونه تغییر کرده است و عوامل فردی چگونه بر این تغییر تأثیر گذاشته اند.

حجم تولید بالغ بر:

در دوره پایه

w 0 * r 0 \u003d 2000 * 90 \u003d 180000،

و در گزارش

w 1 * r 1 \u003d 2100 * 100 \u003d 210000.

در نتیجه، حجم تولید 30000 یا 1.16 درصد افزایش یافت.

∆wr=∑w 1 r 1 -∑w 0 r 0= (210000-180000)=30000

یا (210000:180000)*100%=1.16%.

این تغییر در حجم تولید به دلیل موارد زیر بود:

1) افزایش میانگین تعداد 10 نفر یا 111.1٪

r 1 / r 0 \u003d 100 / 90 \u003d 1.11 یا 111.1%.

به طور مطلق، با توجه به این عامل، حجم تولید 20000 افزایش یافت:

w 0 r 1 - w 0 r 0 \u003d w 0 (r 1 -r 0) \u003d 2000 (100-90) \u003d 20000.

2) افزایش متوسط ​​تولید 105% یا 10000:

w 1 r 1 / w 0 r 1 \u003d 2100 * 100 / 2000 * 100 \u003d 1.05 یا 105٪.

به صورت مطلق، افزایش عبارت است از:

w 1 r 1 - w 0 r 1 \u003d (w 1 -w 0) r 1 \u003d (2100-2000) * 100 \u003d 10000.

بنابراین، تأثیر ترکیبی عوامل عبارت بود از:

1. به صورت مطلق

10000 + 20000 = 30000

2. به صورت نسبی

1,11 * 1,05 = 1,16 (116%)

بنابراین افزایش 1.16 درصدی است. هر دو نتیجه قبلاً به دست آمده است.

کلمه "index" در ترجمه به معنای نشانگر، نشانگر است. در آمار، شاخص به عنوان یک شاخص نسبی تفسیر می شود که تغییر یک پدیده را در زمان، مکان یا در مقایسه با برنامه مشخص می کند. از آنجایی که شاخص یک مقدار نسبی است، نام شاخص ها با نام مقادیر نسبی همخوان است.

در مواردی که تغییر زمان محصولات مقایسه شده را تجزیه و تحلیل می کنیم، می توانیم این سوال را مطرح کنیم که چگونه اجزای شاخص (قیمت، حجم فیزیکی، ساختار تولید یا فروش انواع مختلف محصولات) تحت شرایط مختلف تغییر می کنند (در مناطق مختلف). در این راستا، شاخص‌های ترکیب ثابت، ترکیب متغیر و تغییرات ساختاری ساخته می‌شوند.

شاخص ترکیب دائمی (ثابت) -شاخصی است که پویایی را مشخص می کند سایز متوسطبا همان ساختار جمعیتی ثابت

اصل ساخت یک شاخص ترکیب ثابت این است که با محاسبه سطح میانگین وزنی شاخص نمایه‌شده با همان وزن‌ها، تأثیر تغییرات در ساختار وزن‌ها بر مقدار نمایه‌شده را از بین ببریم.

شاخص ترکیب ثابت از نظر شکل با شاخص کل یکسان است. شکل کل رایج ترین است.

شاخص ترکیب ثابت با وزن های ثابت در سطح یکی از هر دوره محاسبه می شود و تنها تغییر در مقدار نمایه شده را نشان می دهد. شاخص ترکیب ثابت با محاسبه سطح میانگین وزنی شاخص نمایه شده با همان وزن ها، تأثیر تغییرات ساختار وزن ها را بر مقدار شاخص حذف می کند. در شاخص های ترکیب ثابت، شاخص های محاسبه شده بر اساس ساختار ثابت پدیده ها مقایسه می شوند.

هنگام پردازش مقادیر زیادی از اطلاعات، که به ویژه در هنگام انجام پیشرفت های علمی مدرن اهمیت دارد، محقق با وظیفه خطیر گروه بندی صحیح داده های اولیه روبرو است. اگر داده ها گسسته باشند، همانطور که دیدیم، هیچ مشکلی وجود ندارد - فقط باید فرکانس هر ویژگی را محاسبه کنید. اگر صفت مورد مطالعه داشته باشد مداومشخصیت (که در عمل رایج تر است)، پس انتخاب تعداد بهینه فواصل برای گروه بندی یک ویژگی به هیچ وجه کار بی اهمیتی نیست.

برای گروه بندی متغیرهای تصادفی پیوسته، کل دامنه تغییرات ویژگی به تعداد معینی از فواصل تقسیم می شود. به.

فاصله گروهی (مداوم) سری های متغیربه نام فواصل رتبه بندی شده توسط مقدار ویژگی () که همراه با فرکانس های مربوطه () تعداد مشاهداتی که در بازه r" یا فرکانس های نسبی () قرار می گیرند نشان داده شده است:

فواصل ارزش مشخصه

فرکانس مایل

نمودار میله ایو تجمع (ogiva)قبلاً به تفصیل توسط ما مورد بحث قرار گرفته است، ابزاری عالی برای تجسم داده است که به شما امکان می دهد درک اولیه ای از ساختار داده به دست آورید. چنین نمودارهایی (شکل 1.15) برای داده های پیوسته به همان روشی که برای داده های گسسته ساخته می شوند، تنها با در نظر گرفتن این واقعیت که داده های پیوسته به طور کامل منطقه مقادیر ممکن آن را پر می کنند، با گرفتن هر مقدار، ساخته می شوند.

برنج. 1.15.

از همین رو ستون های هیستوگرام و انباشته باید در تماس باشند، هیچ ناحیه ای ندارند که مقادیر مشخصه در همه موارد ممکن قرار نگیرد.(به عنوان مثال، هیستوگرام و تجمع نباید دارای "سوراخ" در امتداد محور آبسیسا باشد، که در آن مقادیر متغیر مورد مطالعه مانند شکل 1.16 سقوط نمی کند). ارتفاع میله مربوط به فرکانس - تعداد مشاهداتی است که در بازه داده شده قرار می گیرند یا بسامد نسبی - نسبت مشاهدات. فواصل نباید عبور کردو معمولاً هم عرض هستند.

برنج. 1.16.

هیستوگرام و چند ضلعی تقریبی از منحنی چگالی احتمال هستند (تابع دیفرانسیل) f(x)توزیع نظری که در دوره نظریه احتمال در نظر گرفته شده است. بنابراین، ساخت آنها است اهمیتدر ابتدایی پردازش آماریداده های پیوسته کمی - با شکل آنها می توان قانون توزیع فرضی را قضاوت کرد.

تجمع - منحنی فرکانس های انباشته شده (فرکانس ها) بازه سری تغییرات. نمودار تابع توزیع انتگرال با تجمع مقایسه شده است F(x)، در درس نظریه احتمال نیز در نظر گرفته شده است.

اساساً، مفاهیم هیستوگرام و تجمعات دقیقاً با داده های پیوسته و سری تغییرات بازه ای آنها مرتبط هستند، زیرا نمودارهای آنها به ترتیب برآوردهای تجربی تابع چگالی احتمال و تابع توزیع هستند.

ساخت یک سری تغییرات بازه ای با تعیین تعداد بازه ها آغاز می شود ک.و این کار شاید سخت ترین، مهم ترین و بحث برانگیزترین در موضوع مورد بررسی باشد.

تعداد فواصل نباید خیلی کم باشد، زیرا هیستوگرام خیلی صاف خواهد بود ( بیش از حد صاف شده)تمام ویژگی های تغییرپذیری داده های اولیه را از دست می دهد - در شکل. 1.17 می توانید ببینید که چگونه همان داده هایی که نمودارهای شکل 1. 1.15 برای ساختن هیستوگرام با تعداد بازه های کمتر (گراف سمت چپ) استفاده می شود.

در عین حال، تعداد فواصل نباید خیلی زیاد باشد - در غیر این صورت نمی توانیم چگالی توزیع داده های مورد مطالعه را در امتداد محور عددی تخمین بزنیم: هیستوگرام به نظر می رسد که کمتر هموار شده است. (نزدیک)با فواصل پر نشده، ناهموار (نگاه کنید به شکل 1.17، نمودار سمت راست).

برنج. 1.17.

چگونه می توان ترجیح داده شده ترین تعداد فواصل را تعیین کرد؟

در سال 1926، هربرت استرجز فرمولی را برای محاسبه تعداد فواصلی که لازم است مجموعه اولیه مقادیر ویژگی مورد مطالعه را تقسیم کرد، ارائه کرد. این فرمول واقعاً بسیار محبوب شده است - بیشتر کتاب های درسی آماری آن را ارائه می دهند و بسیاری از بسته های آماری به طور پیش فرض از آن استفاده می کنند. این که آیا این موجه است و در همه موارد، یک سوال بسیار جدی است.

بنابراین فرمول استرجز بر چه اساسی است؟

در نظر گرفتن توزیع دو جمله ای }

با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

بارگذاری...