انواع سری های واریاسیون. تجزیه و تحلیل سری های متغیر

سری های آماریتوزیع- این یک توزیع منظم از واحدهای جمعیت به گروه ها با توجه به یک ویژگی متفاوت است.
بسته به ویژگی زیربنایی تشکیل یک سری توزیع، وجود دارد سری های توزیع ویژگی و تنوع.

وجود یک ویژگی مشترک مبنای تشکیل یک جامعه آماری است که نتایج یک توصیف یا اندازه گیری است. ویژگی های مشترکاشیاء تحقیق

موضوع مورد مطالعه در آمار، ویژگی های متغیر (متغیر) یا ویژگی های آماری است.

انواع ویژگی های آماری.

سری های توزیع را سری های ویژگی می نامند.ساخته شده بر اساس کیفیت اسنادی- این علامتی است که نامی دارد (مثلاً یک حرفه: خیاط، معلم و غیره).
مرسوم است که سری های توزیع را به صورت جداول مرتب می کنند. روی میز. 2.8 یک سری ویژگی از توزیع را نشان می دهد.
جدول 2.8 - توزیع انواع کمک های حقوقی ارائه شده توسط وکلا به شهروندان یکی از مناطق فدراسیون روسیه.

سری واریاسیونمقادیر ویژگی (یا محدوده مقادیر) و فرکانس آنها هستند.
سری های تنوع، سری های توزیع هستندبر اساس کمی ساخته شده است. هر سری متغیر از دو عنصر تشکیل شده است: انواع و فرکانس ها.
واریانت ها مقادیر فردی یک ویژگی هستند که در یک سری تغییرات می گیرد.
فرکانس ها تعداد انواع مختلف یا هر گروه هستند سری تغییرات، یعنی اینها اعدادی هستند که نشان می دهند چند وقت یکبار گزینه های خاص در یک سری توزیع رخ می دهند. مجموع همه فرکانس ها اندازه کل جمعیت، حجم آن را تعیین می کند.
فرکانس ها فرکانس نامیده می شوند که در کسری از یک واحد یا به صورت درصدی از کل بیان می شوند. بر این اساس مجموع فرکانس ها برابر با 1 یا 100 درصد است. سری تغییرات به ما امکان می دهد شکل قانون توزیع را بر اساس داده های واقعی ارزیابی کنیم.

بسته به ماهیت تنوع صفت، وجود دارد سری تغییرات گسسته و بازه ای.
نمونه ای از یک سری تغییرات گسسته در جدول آورده شده است. 2.9.
جدول 2.9 - توزیع خانواده ها بر اساس تعداد اتاق های اشغال شده در آپارتمان های فردی در سال 1989 در فدراسیون روسیه.

ستون اول جدول انواع یک سری تغییرات گسسته را نشان می دهد، ستون دوم شامل فرکانس های سری تغییرات و ستون سوم شامل نشانگرهای فرکانس است.

سری واریاسیون

AT جمعیتبرخی از صفات کمی در حال بررسی است. نمونه ای از حجم به صورت تصادفی از آن استخراج می شود n، یعنی تعداد عناصر موجود در نمونه است n. در مرحله اول پردازش آماریتولید کردن محدودهنمونه ها، یعنی سفارش شماره x 1، x 2، …، x nصعودی. هر مقدار مشاهده شده x iتماس گرفت گزینه. فرکانس m iتعداد مشاهدات مقدار است x iدر نمونه فرکانس نسبی (فرکانس) w iنسبت فرکانس است m iبه اندازه نمونه n: .
هنگام مطالعه یک سری متغیر، از مفاهیم فرکانس تجمعی و فرکانس تجمعی نیز استفاده می شود. اجازه دهید ایکستعدادی عدد سپس تعداد گزینه ها , که ارزش های آن کمتر است ایکس، فرکانس انباشته نامیده می شود: برای x i nفرکانس انباشته w i max نامیده می شود.
یک ویژگی در صورتی متغیر گسسته نامیده می‌شود که مقادیر (انواع) فردی آن با مقدار محدودی (معمولاً یک عدد صحیح) با یکدیگر متفاوت باشند. یک سری متغیر از چنین ویژگی، سری تغییرات گسسته نامیده می شود.

جدول 1. نمای کلی از سری تغییرات گسسته فرکانس

مقادیر ویژگیx i x 1 x2 x n
فرکانس هاm i متر 1 متر مربع m n

یک ویژگی به طور پیوسته متغیر نامیده می شود اگر مقادیر آن به مقدار دلخواه کمی با یکدیگر متفاوت باشد، به عنوان مثال. علامت می تواند در یک بازه زمانی مشخص هر مقداری را بگیرد. سری تغییرات پیوسته برای چنین صفتی را سری بازه ای می نامند.

جدول 2. نمای کلی از سری تغییرات بازه ای فرکانس ها

جدول 3. تصاویر گرافیکی سری تغییرات

ردیفچند ضلعی یا هیستوگرامتابع توزیع تجربی
گسسته
فاصله
با نگاهی به نتایج مشاهدات، مشخص می شود که چند مقدار از انواع در هر بازه خاص قرار می گیرد. فرض بر این است که هر بازه به یکی از انتهای آن تعلق دارد: یا در همه موارد سمت چپ (بیشتر) یا در همه موارد سمت راست، و فرکانس ها یا فرکانس ها تعداد گزینه های موجود در مرزهای مشخص شده را نشان می دهند. تفاوت a i – a i +1فواصل جزئی نامیده می شوند. برای ساده کردن محاسبات بعدی، سری تغییرات بازه ای را می توان با یک سری گسسته مشروط جایگزین کرد. در این مورد، مقدار میانگین من-th بازه به عنوان یک گزینه در نظر گرفته شده است x iو فرکانس بازه مربوطه m i- برای فرکانس این بازه.
برای نمایش گرافیکی سری های متغیر اغلب از چند ضلعی، هیستوگرام، منحنی تجمعی و تابع توزیع تجربی استفاده می شود.

روی میز. 2.3 (گروه بندی جمعیت روسیه بر اساس اندازه متوسط ​​درآمد سرانه در آوریل 1994) ارائه شده است. سری تغییرات بازه ای.
تجزیه و تحلیل سری توزیع با استفاده از یک نمایش گرافیکی راحت است، که قضاوت در مورد شکل توزیع را نیز ممکن می سازد. یک نمایش بصری از ماهیت تغییر در فرکانس های سری تغییرات توسط چند ضلعی و هیستوگرام.
چند ضلعی هنگام نمایش سری های متغیر گسسته استفاده می شود.
به عنوان مثال، توزیع موجودی مسکن را بر اساس نوع آپارتمان ها به صورت گرافیکی نشان می دهیم (جدول 2.10).
جدول 2.10 - توزیع موجودی مسکن منطقه شهری بر حسب نوع آپارتمان (ارقام مشروط).


برنج. چند ضلعی توزیع مسکن


در محور y، نه تنها مقادیر فرکانس ها، بلکه فرکانس های سری تغییرات را نیز می توان ترسیم کرد.
هیستوگرام برای نمایش سری تغییرات بازه ای گرفته می شود. هنگام ساخت یک هیستوگرام، مقادیر فواصل بر روی محور آبسیسا رسم می شوند و فرکانس ها با مستطیل هایی که بر روی فواصل مربوطه ساخته شده اند نشان داده می شوند. ارتفاع ستون ها در صورت فواصل مساوی باید متناسب با فرکانس ها باشد. هیستوگرام نموداری است که در آن یک سری به صورت نوارهای مجاور یکدیگر نشان داده می شود.
بیایید به صورت گرافیکی سری توزیع بازه ای ارائه شده در جدول را به تصویر بکشیم. 2.11.
جدول 2.11 - توزیع خانواده ها بر اساس اندازه فضای زندگی برای هر نفر (ارقام مشروط).
N p / p گروه هایی از خانواده ها بر اساس اندازه فضای زندگی برای هر نفر تعداد خانواده ها با اندازه معین فضای زندگی تعداد انباشته خانواده ها
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
جمع 115 ----


برنج. 2.2. هیستوگرام توزیع خانواده ها بر اساس اندازه فضای زندگی برای هر نفر


با استفاده از داده های سری انباشته شده (جدول 2.11)، ما می سازیم توزیع تجمعی


برنج. 2.3. توزیع تجمعی خانواده ها بر اساس اندازه فضای زندگی برای هر نفر


نمایش یک سری متغیر به صورت تجمعی به ویژه برای سری های متغیر که فرکانس های آن به صورت کسری یا درصدی از مجموع فرکانس های سری بیان می شود موثر است.
اگر محورها را در نمایش گرافیکی سری تغییرات به صورت تجمعی تغییر دهیم، به دست می آید. ogivu. روی انجیر 2.4 نشان می دهد که بر اساس داده های جدول ساخته شده است. 2.11.
یک هیستوگرام را می توان با یافتن نقاط میانی اضلاع مستطیل ها و سپس اتصال این نقاط با خطوط مستقیم به یک چندضلعی توزیع تبدیل کرد. چند ضلعی توزیع حاصل در شکل نشان داده شده است. 2.2 خط نقطه.
هنگام ساختن هیستوگرام توزیع یک سری متغیر با فواصل نابرابر، در امتداد محور ارتین، فرکانس اعمال نمی شود، بلکه چگالی توزیع ویژگی در فواصل مربوطه اعمال می شود.
چگالی توزیع فرکانس محاسبه شده در واحد عرض بازه است، یعنی. چند واحد در هر گروه در هر مقدار بازه واحد است. نمونه ای از محاسبه چگالی توزیع در جدول ارائه شده است. 2.12.
جدول 2.12 - توزیع شرکت ها بر اساس تعداد کارکنان (ارقام مشروط هستند)
N p / p گروه های شرکت ها بر اساس تعداد کارمندان، نفر. تعداد شرکت ها اندازه فاصله، pers. چگالی توزیع
ولی 1 2 3=1/2
1 تا 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
جمع 147 ---- ----

برای نمایش گرافیکی سری تغییرات نیز می تواند استفاده شود منحنی تجمعی. با کمک cumulate (منحنی مجموع) یک سری فرکانس انباشته نمایش داده می شود. فرکانس‌های انباشته‌شده با جمع‌کردن متوالی فرکانس‌ها بر اساس گروه‌ها تعیین می‌شوند و نشان می‌دهند که چند واحد از جمعیت دارای ارزش ویژگی‌هایی هستند که از مقدار در نظر گرفته شده بیشتر نباشد.


برنج. 2.4. توزیع Ogiva خانواده ها بر اساس اندازه فضای زندگی برای هر نفر

هنگام ساختن انباشت سری تغییرات بازه ای، انواع سری در امتداد محور آبسیسا و فرکانس های انباشته شده در امتداد محور ارتین رسم می شوند.

تنوع تعیین می کندتفاوت در مقادیر هر ویژگی در واحدهای مختلف یک جمعیت معین در همان دوره (نقطه زمانی). دلیل تنوع، شرایط متفاوت برای وجود واحدهای مختلف جمعیت است. به عنوان مثال، حتی دوقلوها در روند زندگی تفاوت هایی در قد، وزن و همچنین در علائمی مانند سطح تحصیلات، درآمد، تعداد فرزندان و غیره به دست می آورند.

تنوع در نتیجه این واقعیت ایجاد می شود که مقادیر خود ویژگی تحت تأثیر کلی شرایط مختلف شکل می گیرند که در هر مورد به روش های مختلف ترکیب می شوند. بنابراین، ارزش هر گزینه عینی است.

تنوع مشخصهبه همه پدیده های طبیعت و جامعه، بدون استثنا، به جز ارزش های هنجاری ثابت قانونی ویژگی های اجتماعی فردی. مطالعات تنوع در آمار از اهمیت زیادی برخوردار است، آنها به درک ماهیت پدیده مورد مطالعه کمک می کنند. یافتن تنوع، روشن کردن علل آن، شناسایی تأثیر عوامل فردی اطلاعات مهمی را برای اجرای تصمیمات مدیریت مبتنی بر شواهد فراهم می کند.

مقدار متوسط ​​یک ویژگی کلی از ویژگی جمعیت می دهد، اما ساختار آن را آشکار نمی کند. مقدار متوسط ​​نشان نمی‌دهد که چگونه انواع ویژگی‌های متوسط ​​در اطراف آن قرار گرفته‌اند، خواه نزدیک به میانگین توزیع شده باشند یا از آن منحرف شوند. میانگین در دو مجموعه ممکن است یکسان باشد، اما در یک نوع، همه مقادیر فردی کمی با آن متفاوت است، و در دیگری، این تفاوت ها زیاد است، یعنی. در حالت اول، تنوع صفت کم و در حالت دوم زیاد است؛ این برای مشخص کردن اهمیت مقدار متوسط ​​بسیار مهم است.

برای اینکه رئیس سازمان، مدیر، محقق بتواند تغییرات را مطالعه کرده و آن را مدیریت کند، آمار روش های خاصی را برای مطالعه تغییرات (سیستمی از شاخص ها) ایجاد کرده است. با کمک آنها، تنوع پیدا می شود، خواص آن مشخص می شود. شاخص های تنوع هستند : دامنه تغییرات، میانگین انحراف خطی، ضریب تغییرات.

سری تغییرات و اشکال آن

سری واریاسیون- این توزیع مرتب واحدهای جمعیت است که اغلب با افزایش (کمتر کاهش) مقادیر ویژگی و شمارش تعداد واحدها با یک یا مقدار دیگری از ویژگی انجام می شود. وقتی تعداد واحدهای جمعیت زیاد است، سری رتبه بندی شده دست و پا گیر می شود، ساخت آن زمان زیادی می برد. در چنین شرایطی با گروه بندی واحدهای جمعیتی بر اساس مقادیر صفت مورد مطالعه، یک سری متغیر ساخته می شود.

موارد زیر وجود دارد فرم های سری تغییرات :

  1. ردیف رتبه بندی شدهفهرستی از واحدهای فردی جمعیت به ترتیب صعودی (نزولی) صفت مورد مطالعه است.
  2. سری تغییرات گسسته - این یک جدول متشکل از دو ردیف یا یک نمودار است: مقادیر خاص ویژگی متغیر x و تعداد واحدهای جمعیت با مقدار داده شده f - ویژگی فرکانس ها. زمانی ساخته می شود که ویژگی بیشترین تعداد مقادیر را به خود بگیرد.
  3. سری بازه ای.

محدوده تغییرات تعیین می شودبه عنوان قدر مطلق تفاوت بین حداکثر و حداقل مقادیر (گزینه ها) ویژگی:

دامنه تنوع را نشان می دهد فقط انحرافات شدید این صفت را نشان می دهد و انحرافات فردی همه انواع این سری را منعکس نمی کند. محدودیت‌های تغییر یک ویژگی متغیر را مشخص می‌کند و به نوسانات دو گزینه شدید وابسته است و مطلقاً به فرکانس‌های سری تغییرات مربوط نمی‌شود، یعنی به ماهیت توزیع، که به این مقدار یک تصادفی می‌دهد. شخصیت. برای تجزیه و تحلیل تنوع، به شاخصی نیاز دارید که تمام نوسانات یک صفت تنوع را منعکس کند و یک ویژگی کلی ارائه دهد. ساده ترین شاخص از این نوع، میانگین انحراف خطی است.

سری واریاسیون - این یک سری آماری است که توزیع پدیده مورد مطالعه را با توجه به مقدار هر صفت کمی نشان می دهد. به عنوان مثال، بیماران بر اساس سن، مدت زمان درمان، نوزادان بر اساس وزن و غیره.

گزینه - مقادیر فردی مشخصه ای که توسط آن گروه بندی انجام می شود (نشان داده شده است V ) .

فرکانس- عددی که نشان می‌دهد هر چند وقت یک‌بار یک یا آن نوع رخ می‌دهد (نشان داده می‌شود پ ) . مجموع تمام فرکانس ها را نشان می دهد تعداد کل مشاهدات و نشان داده می شود n . تفاوت بین بزرگترین و کوچکترین نوع سری تغییرات نامیده می شود دامنه یا دامنه .

سری های تنوع وجود دارد:

1. ناپیوسته (گسسته) و پیوسته.

اگر ویژگی گروه‌بندی را بتوان در مقادیر کسری بیان کرد (وزن، قد و غیره) این سری پیوسته در نظر گرفته می‌شود، اگر ویژگی گروه‌بندی فقط به صورت یک عدد صحیح بیان شود (روزهای ناتوانی، تعداد ضربان قلب و غیره) ناپیوسته است.

2. ساده و وزن دار.

یک سری متغیر ساده سری‌ای است که در آن مقدار کمی یک ویژگی متغیر یک بار اتفاق می‌افتد. در یک سری تغییرات وزنی، مقادیر کمی یک صفت متغیر با فرکانس معینی تکرار می شود.

3. گروه بندی شده (فاصله) و گروه بندی نشده.

یک سری گروه‌بندی‌شده دارای گزینه‌هایی است که در گروه‌هایی ترکیب شده‌اند که اندازه آن‌ها را در یک بازه زمانی مشخص یکی می‌کند. در یک سری گروه‌بندی‌نشده، هر گونه جداگانه با فرکانس خاصی مطابقت دارد.

4. زوج و فرد.

در سری های متغیر زوج، مجموع فرکانس ها یا تعداد کل مشاهدات به صورت یک عدد زوج و در سری های متغیر فرد به صورت یک عدد فرد بیان می شود.

5. متقارن و نامتقارن.

در یک سری تغییرات متقارن، همه انواع میانگین ها منطبق یا بسیار نزدیک هستند (حالت، میانه، میانگین حسابی).

بسته به ماهیت پدیده های مورد مطالعه، وظایف و اهداف خاص مطالعه آماری، و همچنین محتوای منبع، در آمار بهداشتی از انواع میانگین های زیر استفاده می شود:

میانگین های ساختاری (حالت، میانه)؛

میانگین حسابی؛

هارمونیک متوسط؛

میانگین هندسی؛

متوسط ​​مترقی

مد (M در باره ) - مقدار صفت متغیر که در جامعه مورد مطالعه بیشتر دیده می شود، یعنی. گزینه مربوط به بالاترین فرکانس مستقیماً توسط ساختار سری تغییرات، بدون توسل به هیچ محاسباتی یافت می شود. معمولاً مقداری بسیار نزدیک به میانگین حسابی است و در عمل بسیار راحت است.

میانه (M ه ) - تقسیم سری تغییرات (رتبه بندی شده، یعنی مقادیر گزینه به ترتیب صعودی یا نزولی مرتب شده اند) به دو نیمه مساوی. میانه با استفاده از سری به اصطلاح فرد محاسبه می شود که از جمع متوالی فرکانس ها به دست می آید. اگر مجموع فرکانس ها با یک عدد زوج مطابقت داشته باشد، میانه به طور معمول به عنوان میانگین حسابی دو مقدار متوسط ​​در نظر گرفته می شود.

حالت و میانه در مورد جمعیت باز اعمال می شود، یعنی. زمانی که بزرگترین یا کوچکترین گزینه ها دارای مشخصه کمی دقیق نیستند (مثلاً زیر 15 سال، 50 سال به بالا و غیره). در این حالت میانگین حسابی (مشخصات پارامتریک) قابل محاسبه نیست.

میانگین من حسابی - رایج ترین مقدار میانگین حسابی معمولا با نشان داده می شود م.

بین میانگین حسابی ساده و میانگین وزنی تمایز قائل شوید.

میانگین حسابی ساده محاسبه شد:

- در مواردی که کل با یک لیست ساده از دانش یک ویژگی برای هر واحد نشان داده می شود.

- اگر تعداد تکرارهای هر گونه قابل تعیین نباشد.

- اگر تعداد تکرارهای هر نوع به هم نزدیک باشد.

میانگین حسابی ساده با فرمول محاسبه می شود:

جایی که V - مقادیر فردی ویژگی؛ n تعداد مقادیر فردی است.
- علامت جمع.

بنابراین، میانگین ساده، نسبت مجموع متغیر به تعداد مشاهدات است.

مثال: میانگین مدت اقامت در رختخواب برای 10 بیمار مبتلا به ذات الریه را تعیین کنید:

16 روز - 1 بیمار. 17–1; 18-1; 19–1; 20–1; 21–1; 22–1; 23–1; 26–1; 31-1.

روز خواب

میانگین وزنی حسابی در مواردی که مقادیر فردی مشخصه تکرار می شود محاسبه می شود. به دو صورت قابل محاسبه است:

1. به طور مستقیم (میانگین حسابی یا روش مستقیم) طبق فرمول:

,

که در آن P فراوانی (تعداد موارد) مشاهدات هر گزینه است.

بنابراین، میانگین حسابی وزنی، نسبت مجموع حاصلضرب های متغیر با بسامد به تعداد مشاهدات است.

2. با محاسبه انحرافات از میانگین شرطی (طبق روش ممان).

مبنای محاسبه میانگین حسابی موزون عبارت است از:

- گروه بندی مواد بر اساس انواع یک صفت کمی؛

- همه گزینه ها باید به ترتیب صعودی یا نزولی مقدار مشخصه (سری های رتبه بندی شده) مرتب شوند.

برای محاسبه با روش ممان، لازمه یکسان بودن اندازه تمام فواصل است.

با توجه به روش لحظه ها، میانگین حسابی با فرمول محاسبه می شود:

,

که در آن M o میانگین شرطی است که اغلب به عنوان مقدار مشخصه مربوط به بالاترین فرکانس در نظر گرفته می شود. که بیشتر تکرار می شود (Mode).

i - مقدار فاصله.

الف - انحراف شرطی از شرایط میانگین، که یک سری متوالی از اعداد (1، 2، و غیره) با علامت + برای گزینه میانگین شرطی بزرگ و با - (-1، -2، و غیره) است. برای یک گزینه، که کمتر از میانگین هستند، علامت بزنید. انحراف شرطی از متغیری که به عنوان میانگین شرطی در نظر گرفته شده است 0 است.

P - فرکانس ها.

- تعداد کل مشاهدات یا n.

مثال: میانگین قد پسران 8 ساله را مستقیماً تعیین کنید (جدول 1).

میز 1

ارتفاع بر حسب سانتی متر

پسران پ

مرکزی

گزینه V

نوع مرکزی، وسط بازه، به عنوان نیمه مجموع مقادیر اولیه دو گروه همسایه تعریف می شود:

;
و غیره.

حاصل ضرب VP با ضرب انواع مرکزی در فرکانس ها به دست می آید
;
و غیره. سپس محصولات به دست آمده اضافه می شوند و می گیرند
، که بر تعداد مشاهدات (100) تقسیم می شود و میانگین حسابی وزنی بدست می آید.

سانتی متر.

همین مشکل را با استفاده از روش لحظه ها حل می کنیم که جدول 2 زیر برای آن تهیه شده است:

جدول 2

ارتفاع بر حسب سانتی متر (V)

پسران پ

n=100

ما 122 را به عنوان M o می گیریم، زیرا از 100 مشاهده، 33 نفر قد 122 سانتی متر داشتند. انحرافات شرطی (الف) از میانگین شرطی را مطابق با موارد بالا پیدا می کنیم. سپس حاصل ضرب انحرافات شرطی فرکانس ها (aP) را به دست می آوریم و مقادیر به دست آمده را خلاصه می کنیم (
). نتیجه 17 خواهد بود. در نهایت، داده ها را با فرمول جایگزین می کنیم:

هنگام مطالعه یک صفت متغیر، نباید تنها به محاسبه مقادیر میانگین محدود شود. همچنین لازم است شاخص هایی که درجه تنوع ویژگی های مورد مطالعه را مشخص می کنند محاسبه شود. مقدار یک یا آن ویژگی کمی برای همه واحدهای جامعه آماری یکسان نیست.

مشخصه سری تغییرات انحراف معیار است ( ) که پراکندگی (پراکندگی) ویژگی های مورد مطالعه را نسبت به میانگین حسابی نشان می دهد، یعنی. نوسان سری تغییرات را مشخص می کند. می توان آن را مستقیماً با فرمول تعیین کرد:

انحراف استاندارد برابر است با جذر مجذور انحرافات مجذور هر گزینه از میانگین حسابی (V–M) 2 بر فرکانس های آن تقسیم بر مجموع فرکانس ها (
).

مثال محاسبه: میانگین تعداد مرخصی های صادر شده در کلینیک در روز را تعیین کنید (جدول 3).

جدول 3

تعداد روزهای بیماری

برگه های صادر شده

پزشک در روز (V)

تعداد پزشکان (P)

;

در مخرج زمانی که تعداد مشاهدات کمتر از 30 باشد، لازم است از
یک واحد را بردار

اگر سری ها در فواصل مساوی گروه بندی شوند، انحراف معیار را می توان با روش گشتاور تعیین کرد:

,

جایی که i مقدار بازه است.

- انحراف مشروط از میانگین مشروط؛

P - نوع فرکانس فواصل مربوطه؛

تعداد کل مشاهدات است.

مثال محاسبه : تعیین میانگین مدت اقامت بیماران در تخت درمانی (بر اساس روش لحظه ها) (جدول 4):

جدول 4

تعداد روزها

اقامت در تخت (V)

بیمار (P)

;

آماردان بلژیکی A. Quetelet کشف کرد که تغییرات پدیده های جرمی از قانون توزیع خطا پیروی می کنند که تقریباً به طور همزمان توسط K. Gauss و P. Laplace کشف شده است. منحنی نشان دهنده این توزیع به شکل زنگ است. طبق قانون توزیع نرمال، تغییرپذیری مقادیر فردی صفت در داخل است
که 99.73 درصد از کل واحدهای جمعیت را پوشش می دهد.

محاسبه می شود که اگر 2 را به میانگین حسابی اضافه و کم کنید ، 95.45% از تمام اعضای سری تغییرات در مقادیر بدست آمده قرار دارند و در نهایت اگر 1 را به میانگین حسابی اضافه و کم کنیم. ، سپس 68.27 درصد از کل اعضای این سری تغییرات در مقادیر به دست آمده خواهند بود. در پزشکی با بزرگی
1با مفهوم هنجار مرتبط است. انحراف از میانگین حسابی بیشتر از 1 است ، اما کمتر از 2 غیر طبیعی است و انحراف بیشتر از 2 است غیر طبیعی (بالاتر یا کمتر از حد نرمال).

در آمار بهداشتی، از قانون سه سیگما در مطالعه رشد فیزیکی، ارزیابی فعالیت‌های موسسات بهداشتی و ارزیابی سلامت عمومی استفاده می‌شود. در اقتصاد ملی هنگام تعیین استانداردها از همین قاعده استفاده می شود.

بنابراین، انحراف استاندارد در خدمت موارد زیر است:

- اندازه گیری پراکندگی یک سری تغییرات؛

- ویژگی های درجه تنوع ویژگی ها که توسط ضریب تغییرات تعیین می شود:

اگر ضریب تغییرات بیش از 20٪ باشد - تنوع قوی، از 20 تا 10٪ - متوسط، کمتر از 10٪ - تنوع ضعیف شخصیت ها. ضریب تغییرات تا حدی معیاری برای پایایی میانگین حسابی است.

سری واریاسیونمجموعه ای از مقادیر عددی یک ویژگی است.

ویژگی های اصلی سری تغییرات: v - نوع، p - فراوانی وقوع آن.

انواع سری های واریاسیون:

    با توجه به فراوانی وقوع انواع: ساده - نوع یک بار رخ می دهد، وزن دار - نوع دو یا چند بار رخ می دهد.

    گزینه ها بر اساس مکان: رتبه بندی شده - گزینه ها به ترتیب نزولی و صعودی مرتب شده اند، بدون رتبه - گزینه ها بدون ترتیب خاصی نوشته می شوند.

    با گروه بندی گزینه در گروه ها: گروه بندی شده - گزینه ها در گروه ها ترکیب می شوند، گروه بندی نشده - گزینه ها گروه بندی نمی شوند.

    با گزینه های مقدار: پیوسته - گزینه ها به صورت یک عدد صحیح و یک عدد کسری، گسسته - گزینه ها به صورت عدد صحیح بیان می شوند، مختلط - گزینه ها با یک مقدار نسبی یا متوسط ​​نشان داده می شوند.

یک سری متغیر برای محاسبه مقادیر میانگین جمع آوری و ترسیم می شود.

فرم نشانه گذاری سری تغییرات:

8. مقادیر متوسط، انواع، روش محاسبه، کاربرد در مراقبت های بهداشتی

مقادیر متوسط- ویژگی کلی تعمیم دهنده ویژگی های کمی. کاربرد میانگین ها:

1. تشریح سازماندهی کار موسسات پزشکی و ارزیابی فعالیت های آنها:

الف) در پلی کلینیک: شاخص های حجم کار پزشکان، میانگین تعداد ویزیت ها، میانگین تعداد ساکنان در منطقه؛

ب) در بیمارستان: میانگین تعداد روزهای تخت در سال. میانگین مدت اقامت در بیمارستان؛

ج) در مرکز بهداشت، اپیدمیولوژی و بهداشت عمومی: میانگین مساحت (یا ظرفیت مکعب) برای هر نفر، میانگین استانداردهای تغذیه ای (پروتئین ها، چربی ها، کربوهیدرات ها، ویتامین ها، نمک های معدنی، کالری)، هنجارها و استانداردهای بهداشتی و غیره. ;

2. برای توصیف رشد فیزیکی (ویژگی های اصلی آنتروپومتریک مورفولوژیکی و عملکردی).

3. تعیین پارامترهای پزشکی و فیزیولوژیکی بدن در شرایط طبیعی و پاتولوژیک در مطالعات بالینی و تجربی.

4. در تحقیقات علمی خاص.

تفاوت بین مقادیر متوسط ​​و شاخص ها:

1. ضرایب یک ویژگی جایگزین را مشخص می کند که فقط در بخشی از تیم آماری رخ می دهد، که ممکن است اتفاق بیفتد یا نباشد.

مقادیر متوسط ​​علائم ذاتی در همه اعضای تیم را پوشش می دهد، اما به درجات مختلف (وزن، قد، روزهای درمان در بیمارستان).

2. برای اندازه گیری ویژگی های کیفی از ضرایب استفاده می شود. مقادیر متوسط ​​برای صفات کمی متفاوت است.

انواع میانگین ها:

    میانگین حسابی، ویژگی های آن - انحراف معیار و خطای متوسط

    حالت و میانه مد (Mo)- مربوط به ارزش صفتی است که اغلب در این جمعیت یافت می شود. میانه (من)- مقدار صفت که مقدار متوسط ​​را در این جمعیت اشغال می کند. این سری را با توجه به تعداد مشاهدات به 2 قسمت مساوی تقسیم می کند. مقدار میانگین حسابی (M)- بر خلاف حالت و میانه، بر تمام مشاهدات انجام شده متکی است، بنابراین یک مشخصه مهم برای کل توزیع است.

    انواع دیگر میانگین ها که در مطالعات خاص مورد استفاده قرار می گیرند: ریشه میانگین مربع، مکعب، هارمونیک، هندسی، پیش رونده.

میانگین حسابیمیانگین سطح جامعه آماری را مشخص می کند.

برای یک سریال ساده که در آن

∑v – گزینه جمع،

n تعداد مشاهدات است.

برای یک سریال وزن دار، که در آن

∑vr مجموع حاصل از هر گزینه و فراوانی وقوع آن است

n تعداد مشاهدات است.

انحراف معیارمیانگین حسابی یا سیگما (σ) تنوع ویژگی را مشخص می کند

- برای یک ردیف ساده

Σd 2 - مجموع مجذورات تفاوت بین میانگین حسابی و هر گزینه (d = │M-V│)

n تعداد مشاهدات است

- برای سریال های وزن دار

∑d 2 p مجموع حاصل ضرب مجذور اختلاف میانگین حسابی و هر گزینه و فراوانی وقوع آن است.

n تعداد مشاهدات است.

درجه تنوع را می توان با مقدار ضریب تغییرات قضاوت کرد
. بیش از 20٪ - تنوع قوی، 10-20٪ - تنوع متوسط، کمتر از 10٪ - تنوع ضعیف.

اگر یک سیگما (M ± 1σ) به میانگین حسابی اضافه و از آن کم شود، در آن صورت با توزیع نرمال، حداقل 68.3 درصد از همه واریانت ها (مشاهدات) در این محدوده قرار خواهند گرفت که هنجار پدیده مورد مطالعه در نظر گرفته می شود. . اگر k 2 ± 2σ باشد، 95.5٪ از تمام مشاهدات در این حدود خواهد بود، و اگر k M ± 3σ، آنگاه 99.7٪ از تمام مشاهدات در این محدوده خواهد بود. بنابراین، انحراف معیار، انحراف معیار است که امکان پیش‌بینی احتمال وقوع چنین مقداری از صفت مورد مطالعه را که در محدوده‌های مشخص شده است، می‌دهد.

میانگین خطای میانگین حسابییا خطای نمایندگی برای سریال های ساده و وزن دار و بر اساس قانون لحظه ها:

.

برای محاسبه مقادیر متوسط، لازم است: همگن بودن مواد، تعداد کافی مشاهدات. اگر تعداد مشاهدات کمتر از 30 باشد، در فرمول های محاسبه σ و m از n-1 استفاده می شود.

هنگام ارزیابی نتیجه به دست آمده با اندازه خطای متوسط، از ضریب اطمینان استفاده می شود که امکان تعیین احتمال پاسخ صحیح را ممکن می کند، یعنی نشان می دهد که خطای نمونه حاصل از خطای واقعی بیشتر نخواهد بود. در نتیجه مشاهده مداوم ساخته شده است. در نتیجه، با افزایش احتمال اطمینان، عرض فاصله اطمینان افزایش می‌یابد که به نوبه خود، اطمینان قضاوت، حمایت از نتیجه به‌دست‌آمده را افزایش می‌دهد.

متغیرسری توزیع نامیده می شود که بر مبنای کمی ساخته شده است. مقادیر ویژگی های کمی در واحدهای فردی جمعیت ثابت نیست، کم و بیش با یکدیگر متفاوت است.

تغییر- نوسان، تغییرپذیری مقدار ویژگی در واحدهای جمعیت. مقادیر عددی مجزای صفت موجود در جمعیت مورد مطالعه نامیده می شود گزینه هاارزش های. ناکافی بودن مقدار متوسط ​​برای توصیف کامل جمعیت، تکمیل مقادیر متوسط ​​با شاخص هایی را ضروری می کند که ارزیابی معمولی بودن این میانگین ها را با اندازه گیری نوسان (تغییر) صفت مورد مطالعه امکان پذیر می کند.

وجود تنوع به دلیل تأثیر تعداد زیادی از عوامل در تشکیل سطح صفت است. این عوامل با نیروی نابرابر و در جهات مختلف عمل می کنند. شاخص های تنوع برای توصیف اندازه گیری تنوع صفت استفاده می شود.

وظایف مطالعه آماری تغییرات:

  • 1) مطالعه ماهیت و درجه تنوع علائم در واحدهای فردی جمعیت.
  • 2) تعیین نقش عوامل فردی یا گروه های آنها در تنوع ویژگی های خاص جمعیت.

در آمار، روش های خاصی برای مطالعه تغییرات، بر اساس استفاده از یک سیستم شاخص، استفاده می شود. باکه با آن تغییرات اندازه گیری می شود.

مطالعه تنوع ضروری است. اندازه گیری تغییرات هنگام انجام مشاهده نمونه، تحلیل همبستگی و واریانس و غیره ضروری است. Ermolaev O.Yu. آمار ریاضی برای روانشناسان: کتاب درسی [متن] / O.Yu. ارمولایف. - M.: انتشارات فلینت موسسه روانشناسی و اجتماعی مسکو، 2012. - 335 ص.

با توجه به درجه تنوع، می توان همگنی جمعیت، ثبات ارزش های فردی ویژگی ها و معمولی بودن میانگین را قضاوت کرد. بر اساس آنها، شاخص های نزدیکی رابطه بین علائم، شاخص هایی برای ارزیابی دقت مشاهده انتخابی ایجاد می شود.

تنوع در فضا و تنوع در زمان وجود دارد.

تنوع در فضا به عنوان نوسان مقادیر یک ویژگی در واحدهای جمعیت که قلمروهای جداگانه را نشان می دهد درک می شود. منظور از تغییر در زمان، تغییر در مقادیر ویژگی در دوره های زمانی مختلف است.

برای مطالعه تغییرات در سری توزیع، همه انواع مقادیر ویژگی ها به ترتیب صعودی یا نزولی مرتب می شوند. به این فرآیند رتبه بندی سری می گویند.

ساده ترین نشانه های تنوع هستند حداقل و حداکثر- کوچکترین و بزرگترین مقدار صفت در مجموع. تعداد تکرارهای انواع مختلف مقادیر ویژگی را فرکانس تکرار (fi) می گویند. جایگزینی فرکانس ها با فرکانس ها راحت است - wi. فرکانس - یک شاخص نسبی فرکانس، که می تواند در کسری از یک واحد یا درصد بیان شود و به شما امکان می دهد سری های تغییرات را با تعداد متفاوتی از مشاهدات مقایسه کنید. با فرمول بیان می شود:

که در آن Xmax، Xmin - مقادیر حداکثر و حداقل ویژگی در مجموع؛ n تعداد گروه هاست.

برای اندازه گیری تنوع یک صفت، از شاخص های مطلق و نسبی مختلفی استفاده می شود. شاخص های مطلق تغییرات شامل دامنه تغییرات، میانگین انحراف خطی، واریانس، انحراف استاندارد است. شاخص های نسبی نوسان شامل ضریب نوسان، انحراف خطی نسبی، ضریب تغییرات است.

نمونه ای از یافتن یک سری تغییرات

ورزش.برای این نمونه:

  • الف) یک سری تغییرات را پیدا کنید.
  • ب) تابع توزیع را بسازید.

شماره = 42. موارد نمونه:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

راه حل.

  • الف) ساخت یک سری تغییرات رتبه بندی شده:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • ب) ساخت یک سری تغییرات گسسته.

بیایید تعداد گروه های سری تغییرات را با استفاده از فرمول استرجس محاسبه کنیم:

بیایید تعداد گروه ها را برابر با 7 در نظر بگیریم.

با دانستن تعداد گروه ها، مقدار فاصله را محاسبه می کنیم:

برای راحتی ساخت جدول، تعداد گروه ها را برابر با 8 می گیریم، فاصله زمانی 1 خواهد بود.

برنج. یکی حجم فروش کالا توسط فروشگاه برای مدت زمان معین

با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

بارگذاری...