چگونه یک سری تغییرات را پیدا کنیم. سری تغییرات و ویژگی های آن

تنوع تعیین می کندتفاوت در مقادیر هر ویژگی در واحدهای مختلف یک جمعیت معین در همان دوره (نقطه زمانی). دلیل تنوع، شرایط متفاوت برای وجود واحدهای مختلف جمعیت است. به عنوان مثال، حتی دوقلوها در روند زندگی تفاوت هایی در قد، وزن و همچنین در علائمی مانند سطح تحصیلات، درآمد، تعداد فرزندان و غیره به دست می آورند.

تنوع در نتیجه این واقعیت به وجود می آید که خود مقادیر ویژگی تحت تأثیر کلی شرایط مختلف شکل می گیرند که به روش های مختلفدر هر مورد جداگانه ترکیب شده است. بنابراین، ارزش هر گزینه عینی است.

تنوع مشخصهبه همه پدیده های طبیعت و جامعه، بدون استثنا، به جز ارزش های هنجاری ثابت قانونی ویژگی های اجتماعی فردی. مطالعات تنوع در آمار از اهمیت زیادی برخوردار است، آنها به درک ماهیت پدیده مورد مطالعه کمک می کنند. یافتن تنوع، روشن ساختن علل آن، شناسایی تأثیر عوامل فردی می دهد اطلاعات مهمبرای اجرای تصمیمات مدیریتی مبتنی بر علمی.

مقدار متوسط ​​یک ویژگی کلی از ویژگی جمعیت می دهد، اما ساختار آن را آشکار نمی کند. مقدار متوسط ​​نشان نمی‌دهد که چگونه انواع ویژگی‌های متوسط ​​در اطراف آن قرار گرفته‌اند، خواه نزدیک به میانگین توزیع شده باشند یا از آن منحرف شوند. میانگین در دو مجموعه ممکن است یکسان باشد، اما در یک نوع، همه مقادیر فردی کمی با آن متفاوت است، و در دیگری، این تفاوت ها زیاد است، یعنی. در حالت اول، تنوع صفت کم است و در حالت دوم بزرگ است، این یک مقدار بسیار دارد اهمیتبرای مشخص کردن اهمیت مقدار متوسط.

برای اینکه رئیس سازمان، مدیر، محقق بتواند تغییرات را مطالعه کرده و آن را مدیریت کند، آمار روش های خاصی را برای مطالعه تغییرات (سیستمی از شاخص ها) ایجاد کرده است. با کمک آنها، تنوع پیدا می شود، خواص آن مشخص می شود. شاخص های تنوع هستند : دامنه تغییرات، میانگین انحراف خطی، ضریب تغییرات.

سری تغییرات و اشکال آن

سری واریاسیون- این توزیع مرتب واحدهای جمعیت است که اغلب با افزایش (کمتر کاهش) مقادیر ویژگی و شمارش تعداد واحدها با یک یا مقدار دیگری از ویژگی انجام می شود. وقتی تعداد واحدهای جمعیت زیاد است، سری رتبه‌بندی شده دست و پا گیر می‌شود، ساخت آن طول می‌کشد مدت زمان طولانی. در چنین شرایطی با گروه بندی واحدهای جمعیتی بر اساس مقادیر صفت مورد مطالعه، یک سری متغیر ساخته می شود.

موارد زیر وجود دارد تشکیل می دهد سری تغییرات :

  1. ردیف رتبه بندی شدهفهرستی از واحدهای فردی جمعیت به ترتیب صعودی (نزولی) صفت مورد مطالعه است.
  2. سری تغییرات گسسته - این یک جدول متشکل از دو ردیف یا یک نمودار است: مقادیر خاص ویژگی متغیر x و تعداد واحدهای جمعیت با مقدار داده شده f - ویژگی فرکانس ها. زمانی ساخته می شود که صفت گرفته شود بیشترین تعدادارزش های.
  3. سری بازه ای.

محدوده تغییرات تعیین می شودبه عنوان قدر مطلق تفاوت بین حداکثر و حداقل مقادیر (گزینه ها) ویژگی:

دامنه تنوع را نشان می دهد فقط انحرافات شدید این صفت را نشان می دهد و انحرافات فردی همه انواع این سری را منعکس نمی کند. محدودیت‌های تغییر یک ویژگی متغیر را مشخص می‌کند و به نوسانات دو گزینه شدید وابسته است و مطلقاً به فرکانس‌های سری تغییرات مربوط نمی‌شود، یعنی به ماهیت توزیع، که به این مقدار یک تصادفی می‌دهد. شخصیت. برای تجزیه و تحلیل تغییرات، به یک شاخص نیاز دارید که تمام نوسانات را منعکس کند. صفت تنوعو می دهد ویژگی های عمومی. ساده ترین شاخص از این نوع، میانگین انحراف خطی است.

سری تغییرات: تعریف، انواع، ویژگی های اصلی. روش محاسبه
مد، میانه، میانگین حسابی در مطالعات پزشکی و آماری
(در یک مثال شرطی نشان دهید).

سری متغیر مجموعه ای از مقادیر عددی صفت مورد مطالعه است که از نظر بزرگی با یکدیگر متفاوت بوده و در یک ترتیب معین (به ترتیب صعودی یا نزولی) مرتب شده اند. هر مقدار عددی سری یک نوع (V) نامیده می‌شود و اعداد نشان می‌دهند که هر چند وقت یکبار این یا آن متغیر در ترکیب رخ می‌دهد. این ردیف، فرکانس (p) نامیده می شود.

تعداد کل موارد مشاهدات، که سری تغییرات شامل آن است، با حرف n نشان داده می شود. تفاوت در معنای ویژگی های مورد مطالعه را تنوع می گویند. اگر علامت متغیر معیار کمی نداشته باشد، تنوع را کیفی و سری توزیع را اسنادی می نامند (مثلاً توزیع بر اساس نتیجه بیماری، وضعیت سلامت و غیره).

اگر علامت متغیر یک عبارت کمی داشته باشد، چنین تغییری کمی و سری توزیع متغیر نامیده می شود.

سری های متغیر به ناپیوسته و پیوسته - با توجه به ماهیت صفت کمی، ساده و وزن دار - با توجه به فراوانی وقوع متغیر تقسیم می شوند.

در یک سری تغییرات ساده، هر متغیر فقط یک بار رخ می دهد (p=1)، در یک سری وزنی، همان واریانت چندین بار رخ می دهد (p>1). نمونه هایی از این سری ها در ادامه متن مورد بحث قرار خواهند گرفت. اگر صفت کمی پیوسته باشد، یعنی. بین مقادیر صحیح مقادیر کسری میانی وجود دارد، سری تغییرات پیوسته نامیده می شود.

به عنوان مثال: 10.0 - 11.9

14.0 - 15.9 و غیره

اگر علامت کمی ناپیوسته باشد، یعنی. مقادیر جداگانه (گزینه ها) آن با یک عدد صحیح با یکدیگر متفاوت است و مقادیر کسری میانی ندارند، سری تغییرات را ناپیوسته یا گسسته می نامند.

با استفاده از داده های مثال قبلی در مورد ضربان قلب

برای 21 دانش آموز، یک سری تغییرات خواهیم ساخت (جدول 1).

میز 1

توزیع دانشجویان پزشکی بر اساس ضربان نبض (bpm)

بنابراین، ساخت یک سری متغیر به معنای سیستم‌سازی، ساده‌سازی مقادیر عددی موجود (گزینه‌ها) است. به ترتیب خاصی (به ترتیب صعودی یا نزولی) با فرکانس های متناظر آنها ترتیب دهید. در مثال مورد بررسی، گزینه ها به ترتیب صعودی مرتب شده اند و به صورت اعداد صحیح ناپیوسته (گسسته) بیان می شوند، هر گزینه چندین بار اتفاق می افتد، یعنی. ما با یک سری تغییرات وزنی، ناپیوسته یا گسسته سروکار داریم.

به عنوان یک قاعده، اگر تعداد مشاهدات در جامعه آماری مورد مطالعه ما از 30 تجاوز نکند، کافی است مانند جدول، تمام مقادیر صفت مورد مطالعه را در یک سری متغیر به ترتیب افزایشی مرتب کنیم. 1 یا به ترتیب نزولی

با تعداد زیادی مشاهدات (n>30)، تعداد انواع رخ‌داده می‌تواند بسیار زیاد باشد، در این مورد یک سری تغییرات بازه‌ای یا گروهی جمع‌آوری می‌شود، که در آن، برای ساده‌سازی پردازش بعدی و شفاف‌سازی ماهیت توزیع، انواع در گروه ها ترکیب می شوند.

معمولاً تعداد گزینه های گروه بین 8 تا 15 متغیر است.

باید حداقل 5 مورد از آنها وجود داشته باشد، زیرا. در غیر این صورت بیش از حد درشت، بزرگ شدن بیش از حد خواهد بود که مخدوش می شود تصویر بزرگتغییر می کند و به شدت بر دقت مقادیر متوسط ​​تأثیر می گذارد. هنگامی که تعداد گزینه های گروه بیش از 20-25 باشد، دقت محاسبه مقادیر متوسط ​​افزایش می یابد، اما ویژگی های تنوع ویژگی به طور قابل توجهی تحریف شده و پردازش ریاضی پیچیده تر می شود.

هنگام تدوین یک سری گروه بندی، باید در نظر گرفته شود

- گروه های متغیر باید در یک ترتیب خاص (صعودی یا نزولی) قرار گیرند.

- فواصل در گروه های مختلف باید یکسان باشد.

- مقادیر مرزهای فواصل نباید منطبق باشند، زیرا مشخص نخواهد بود که در کدام گروه ها گزینه های فردی نسبت داده شود.

- هنگام تعیین محدودیت های فواصل، باید ویژگی های کیفی مواد جمع آوری شده را در نظر گرفت (به عنوان مثال، هنگام مطالعه وزن بزرگسالان، فاصله 3-4 کیلوگرم قابل قبول است و برای کودکان در ماه های اول). در طول زندگی نباید از 100 گرم تجاوز کند.)

بیایید یک سری گروهی (فاصله) بسازیم که داده های مربوط به ضربان نبض (تعداد ضربان در دقیقه) را برای 55 دانشجوی پزشکی قبل از امتحان مشخص می کند: 64، 66، 60، 62،

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

برای ساخت یک سری گروه بندی شده، شما نیاز دارید:

1. مقدار فاصله را تعیین کنید.

2. وسط، ابتدا و انتهای گروه های واریانت سری تغییرات را تعیین کنید.

● مقدار فاصله (i) با تعداد گروه های مورد انتظار (r) تعیین می شود که تعداد آنها بسته به تعداد مشاهدات (n) طبق جدول خاصی تعیین می شود.

تعداد گروه ها بسته به تعداد مشاهدات:

در مورد ما، برای 55 دانش آموز، امکان تشکیل 8 تا 10 گروه وجود دارد.

مقدار بازه (i) با فرمول زیر تعیین می شود -

i = Vmax-Vmin/r

در مثال ما، مقدار بازه 82-58/8= 3 است.

اگر مقدار بازه یک عدد کسری باشد، نتیجه باید به یک عدد صحیح گرد شود.

چندین نوع میانگین وجود دارد:

میانگین حسابی,

میانگین هندسی,

● میانگین هارمونیک،

ریشه میانگین مربع,

● متوسط ​​مترقی،

● میانه

AT آمار پزشکیبیشترین استفاده از میانگین های حسابی است.

میانگین حسابی (M) یک مقدار تعمیم‌دهنده است که مقدار معمولی را مشخص می‌کند که مشخصه کل جمعیت است. روشهای اصلی محاسبه M عبارتند از: روش میانگین حسابی و روش گشتاورها (انحرافات شرطی).

از روش میانگین حسابی برای محاسبه میانگین حسابی ساده و میانگین حسابی وزن دار استفاده می شود. انتخاب روش برای محاسبه مقدار میانگین حسابی به نوع سری تغییرات بستگی دارد. در مورد یک سری تغییرات ساده، که در آن هر گونه فقط یک بار رخ می دهد، میانگین حسابی ساده با فرمول تعیین می شود:

جایی که: М – مقدار میانگین حسابی؛

V مقدار ویژگی متغیر (گزینه ها) است.

Σ - عمل - جمع را نشان می دهد.

n- تعداد کلمشاهدات

یک مثال از محاسبه میانگین حسابی ساده است. تعداد تنفس (تعداد تنفس در دقیقه) در 9 مرد 35 ساله: 20، 22، 19، 15، 16، 21، 17، 23، 18.

برای تعیین میانگین میزان تنفس در مردان 35 ساله، لازم است:

1. یک سری متغیر بسازید، همه گزینه ها را به ترتیب صعودی یا نزولی قرار دهید. ما یک سری متغیر ساده دریافت کردیم، زیرا مقادیر متغیر فقط یک بار رخ می دهد.

M = ∑V/n = 171/9 = 19 نفس در دقیقه

نتیجه. میزان تنفس در مردان 35 ساله به طور متوسط ​​19 تنفس در دقیقه است.

اگر مقادیر مجزای یک متغیر تکرار شود، نیازی به نوشتن هر گونه در یک خط نیست، کافی است اندازه‌های متغیری را که رخ می‌دهد (V) فهرست کنید و در ادامه تعداد تکرارهای آنها را مشخص کنید (p. ). چنین سری تغییراتی که در آن گزینه‌ها، همانطور که گفته شد، با توجه به تعداد فرکانس‌های مربوط به آنها وزن می‌شوند، سری تغییرات وزنی نامیده می‌شوند و مقدار متوسط– میانگین موزون حسابی

میانگین وزنی حسابی با فرمول تعیین می شود: M= ∑Vp/n

که در آن n تعداد مشاهدات است، برابر با مجموعفرکانس ها - Σr.

مثالی از محاسبه میانگین موزون حسابی.

مدت ناتوانی (بر حسب روز) در 35 بیمار مبتلا به بیماری های حاد تنفسی (ARI) تحت درمان توسط پزشک محلی در سه ماهه اول سال جاری: 6، 7، 5، 3، 9، 8، 7، 5، 6 بوده است. ، 4، 9، 8، 7، 6، 6، 9، 6، 5، 10، 8، 7، 11، 13، 5، 6، 7، 12، 4، 3، 5، 2، 5، 6، 6 ، 7 روز

روش تعیین میانگین مدت ناتوانی در بیماران مبتلا به عفونت های حاد تنفسی به شرح زیر است:

1. بیایید یک سری متغیر وزنی بسازیم، زیرا مقادیر متغیرهای فردی چندین بار تکرار می شوند. برای این کار می توانید تمام گزینه ها را به ترتیب صعودی یا نزولی با فرکانس های مربوطه مرتب کنید.

در مورد ما، گزینه ها به ترتیب صعودی هستند.

2. میانگین موزون حسابی را با استفاده از فرمول محاسبه کنید: M = ∑Vp/n = 233/35 = 6.7 روز

توزیع بیماران مبتلا به عفونت های حاد تنفسی بر اساس مدت زمان ناتوانی:

مدت ناتوانی در کار (V) تعداد بیماران (p) vp
∑p = n = 35 ∑Vp = 233

نتیجه. طول مدت ناتوانی در بیماران مبتلا به بیماری های حاد تنفسی به طور متوسط ​​6.7 روز بود.

حالت (Mo) رایج ترین نوع در سری تغییرات است. برای توزیع ارائه شده در جدول، حالت مربوط به نوع برابر با 10 است، بیشتر از دیگران رخ می دهد - 6 بار.

توزیع بیماران بر اساس مدت اقامت در تخت بیمارستان (بر حسب روز)

V
پ

گاهی اوقات تعیین مقدار دقیق حالت دشوار است، زیرا ممکن است چندین مشاهدات در داده های مورد مطالعه وجود داشته باشد که "اغلب" رخ می دهد.

میانه (Me) یک نشانگر ناپارامتریک است که سری تغییرات را به دو نیمه مساوی تقسیم می کند: تعداد یکسانی از گزینه ها در هر دو طرف میانه قرار دارد.

به عنوان مثال، برای توزیع نشان داده شده در جدول، میانه 10 است زیرا در هر دو طرف این مقدار در گزینه 14 قرار دارد، i.e. عدد 10 در این سریال جایگاه مرکزی را به خود اختصاص داده و میانه آن است.

با توجه به اینکه تعداد مشاهدات در این مثال زوج است (n=34)، میانه را می توان به صورت زیر تعیین کرد:

من = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

این بدان معنی است که وسط سری روی گزینه هفدهم قرار می گیرد که مربوط به میانه 10 است. برای توزیع ارائه شده در جدول، میانگین حسابی برابر است با:

M = ∑Vp/n = 334/34 = 10.1

بنابراین، برای 34 مشاهده از جدول. 8، بدست آوردیم: Mo=10، Me=10، میانگین حسابی (M) 10.1 است. در مثال ما، هر سه شاخص برابر یا نزدیک به یکدیگر بودند، اگرچه کاملاً متفاوت هستند.

میانگین حسابی مجموع حاصل از همه تأثیرات است؛ همه گزینه‌ها، بدون استثنا، در شکل‌گیری آن شرکت می‌کنند، از جمله موارد شدید، اغلب غیر معمول برای این پدیدهیا سنگدانه ها

حالت و میانه، بر خلاف میانگین حسابی، به مقدار تمام مقادیر فردی ویژگی متغیر (مقادیر انواع شدید و درجه پراکندگی سری) بستگی ندارد. میانگین حسابی کل انبوه مشاهدات را مشخص می کند، مد و میانه حجم مشاهدات را مشخص می کند.

سری توزیع آماری- این یک توزیع منظم از واحدهای جمعیت به گروه ها با توجه به یک ویژگی متفاوت است.
بسته به ویژگی زیربنایی تشکیل یک سری توزیع، وجود دارد سری های توزیع ویژگی و تنوع.

وجود یک ویژگی مشترک مبنای تشکیل یک جامعه آماری است که نتایج یک توصیف یا اندازه گیری است. ویژگی های مشترکاشیاء تحقیق

موضوع مورد مطالعه در آمار، ویژگی های متغیر (متغیر) یا ویژگی های آماری است.

انواع ویژگی های آماری.

سری های توزیع را سری های ویژگی می نامند.ساخته شده بر اساس کیفیت اسنادی- این علامتی است که نامی دارد (مثلاً یک حرفه: خیاط، معلم و غیره).
مرسوم است که سری های توزیع را به صورت جداول مرتب می کنند. روی میز. 2.8 یک سری ویژگی از توزیع را نشان می دهد.
جدول 2.8 - توزیع انواع کمک های حقوقی ارائه شده توسط وکلا به شهروندان یکی از مناطق فدراسیون روسیه.

سری واریاسیونمقادیر ویژگی (یا محدوده مقادیر) و فرکانس آنها هستند.
سری های تنوع، سری های توزیع هستندبر اساس کمی ساخته شده است. هر سری متغیر از دو عنصر تشکیل شده است: انواع و فرکانس ها.
واریانت ها مقادیر فردی یک ویژگی هستند که در یک سری تغییرات می گیرد.
فرکانس ها تعداد انواع مختلف یا هر گروه از سری تغییرات هستند، یعنی. اینها اعدادی هستند که نشان می دهند چند وقت یکبار گزینه های خاص در یک سری توزیع رخ می دهند. مجموع همه فرکانس ها اندازه کل جمعیت، حجم آن را تعیین می کند.
فرکانس ها فرکانس نامیده می شوند که در کسری از یک واحد یا به صورت درصدی از کل بیان می شوند. بر این اساس مجموع فرکانس ها برابر با 1 یا 100 درصد است. سری تغییرات به ما امکان می دهد شکل قانون توزیع را بر اساس داده های واقعی ارزیابی کنیم.

بسته به ماهیت تنوع صفت، وجود دارد سری تغییرات گسسته و بازه ای.
نمونه ای از یک سری تغییرات گسسته در جدول آورده شده است. 2.9.
جدول 2.9 - توزیع خانواده ها بر اساس تعداد اتاق های اشغال شده در آپارتمان های فردی در سال 1989 در فدراسیون روسیه.

ستون اول جدول انواع یک سری تغییرات گسسته را نشان می دهد، ستون دوم شامل فرکانس های سری تغییرات و ستون سوم شامل نشانگرهای فرکانس است.

سری واریاسیون

AT جمعیتبرخی از صفات کمی در حال بررسی است. نمونه ای از حجم به صورت تصادفی از آن استخراج می شود n، یعنی تعداد عناصر موجود در نمونه است n. در مرحله اول پردازش آماریتولید کردن محدودهنمونه ها، یعنی سفارش شماره x 1، x 2، …، x nصعودی. هر مقدار مشاهده شده x iتماس گرفت گزینه. فرکانس m iتعداد مشاهدات مقدار است x iدر نمونه فرکانس نسبی (فرکانس) w iنسبت فرکانس است m iبه اندازه نمونه n: .
هنگام مطالعه یک سری متغیر، از مفاهیم فرکانس تجمعی و فرکانس تجمعی نیز استفاده می شود. اجازه دهید ایکستعدادی عدد سپس تعداد گزینه ها , که ارزش های آن کمتر است ایکس، فرکانس انباشته نامیده می شود: برای x i nفرکانس انباشته w i max نامیده می شود.
یک ویژگی در صورتی متغیر گسسته نامیده می‌شود که مقادیر (انواع) فردی آن با مقدار محدودی (معمولاً یک عدد صحیح) با یکدیگر متفاوت باشند. یک سری متغیر از چنین ویژگی، سری تغییرات گسسته نامیده می شود.

جدول 1. نمای کلی از سری تغییرات گسسته فرکانس

مقادیر ویژگیx i x 1 x2 x n
فرکانس هاm i متر 1 متر مربع m n

یک ویژگی به طور پیوسته متغیر نامیده می شود اگر مقادیر آن به مقدار دلخواه کمی با یکدیگر متفاوت باشد، به عنوان مثال. علامت می تواند در یک بازه زمانی مشخص هر مقداری را بگیرد. سری تغییرات پیوسته برای چنین صفتی را سری بازه ای می نامند.

جدول 2. نمای کلی از سری تغییرات بازه ای فرکانس ها

جدول 3. تصاویر گرافیکی سری تغییرات

ردیفچند ضلعی یا هیستوگرامتابع توزیع تجربی
گسسته
فاصله
با نگاهی به نتایج مشاهدات، مشخص می شود که چند مقدار از انواع در هر بازه خاص قرار می گیرد. فرض بر این است که هر بازه به یکی از انتهای آن تعلق دارد: یا در همه موارد سمت چپ (بیشتر) یا در همه موارد سمت راست، و فرکانس ها یا فرکانس ها تعداد گزینه های موجود در مرزهای مشخص شده را نشان می دهند. تفاوت a i – a i +1فواصل جزئی نامیده می شوند. برای ساده کردن محاسبات بعدی، سری تغییرات بازه ای را می توان با یک سری گسسته مشروط جایگزین کرد. در این مورد، مقدار میانگین من-th بازه به عنوان یک گزینه در نظر گرفته شده است x iو فرکانس بازه مربوطه m i- برای فرکانس این بازه.
برای نمایش گرافیکی سری های متغیر اغلب از چند ضلعی، هیستوگرام، منحنی تجمعی و تابع توزیع تجربی استفاده می شود.

روی میز. 2.3 (گروه بندی جمعیت روسیه بر اساس اندازه متوسط ​​درآمد سرانه در آوریل 1994) ارائه شده است. سری تغییرات بازه ای.
تجزیه و تحلیل سری توزیع با استفاده از یک نمایش گرافیکی راحت است، که قضاوت در مورد شکل توزیع را نیز ممکن می سازد. یک نمایش بصری از ماهیت تغییر در فرکانس های سری تغییرات توسط چند ضلعی و هیستوگرام.
چند ضلعی هنگام نمایش سری های متغیر گسسته استفاده می شود.
به عنوان مثال، توزیع موجودی مسکن را بر اساس نوع آپارتمان ها به صورت گرافیکی نشان می دهیم (جدول 2.10).
جدول 2.10 - توزیع موجودی مسکن منطقه شهری بر حسب نوع آپارتمان (ارقام مشروط).


برنج. چند ضلعی توزیع مسکن


در محور y، نه تنها مقادیر فرکانس ها، بلکه فرکانس های سری تغییرات را نیز می توان ترسیم کرد.
هیستوگرام برای نمایش سری تغییرات بازه ای گرفته می شود. هنگام ساخت یک هیستوگرام، مقادیر فواصل بر روی محور آبسیسا رسم می شوند و فرکانس ها با مستطیل هایی که بر روی فواصل مربوطه ساخته شده اند نشان داده می شوند. ارتفاع ستون ها در صورت فواصل مساوی باید متناسب با فرکانس ها باشد. هیستوگرام نموداری است که در آن یک سری به صورت نوارهای مجاور یکدیگر نشان داده می شود.
بیایید به صورت گرافیکی سری بازه ایتوزیع، در جدول آورده شده است. 2.11.
جدول 2.11 - توزیع خانواده ها بر اساس اندازه فضای زندگی برای هر نفر (ارقام مشروط).
N p / p گروه هایی از خانواده ها بر اساس اندازه فضای زندگی برای هر نفر تعداد خانواده ها با اندازه معین فضای زندگی تعداد انباشته خانواده ها
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
جمع 115 ----


برنج. 2.2. هیستوگرام توزیع خانواده ها بر اساس اندازه فضای زندگی برای هر نفر


با استفاده از داده های سری انباشته شده (جدول 2.11)، ما می سازیم توزیع تجمعی


برنج. 2.3. توزیع تجمعی خانواده ها بر اساس اندازه فضای زندگی برای هر نفر


نمایش یک سری متغیر به صورت تجمعی به ویژه برای سری های متغیر که فرکانس های آن به صورت کسری یا درصدی از مجموع فرکانس های سری بیان می شود موثر است.
اگر محورها را در نمایش گرافیکی سری تغییرات به صورت تجمعی تغییر دهیم، به دست می آید. ogivu. روی انجیر 2.4 نشان می دهد که بر اساس داده های جدول ساخته شده است. 2.11.
یک هیستوگرام را می توان با یافتن نقاط میانی اضلاع مستطیل ها و سپس اتصال این نقاط با خطوط مستقیم به یک چندضلعی توزیع تبدیل کرد. چند ضلعی توزیع حاصل در شکل نشان داده شده است. 2.2 خط نقطه.
هنگام ساختن هیستوگرام توزیع یک سری متغیر با فواصل نابرابر، در امتداد محور ارتین، فرکانس اعمال نمی شود، بلکه چگالی توزیع ویژگی در فواصل مربوطه اعمال می شود.
چگالی توزیع فرکانس محاسبه شده در واحد عرض بازه است، یعنی. چند واحد در هر گروه در هر مقدار بازه واحد است. نمونه ای از محاسبه چگالی توزیع در جدول ارائه شده است. 2.12.
جدول 2.12 - توزیع شرکت ها بر اساس تعداد کارکنان (ارقام مشروط هستند)
N p / p گروه های شرکت ها بر اساس تعداد کارمندان، نفر. تعداد شرکت ها اندازه فاصله، pers. چگالی توزیع
ولی 1 2 3=1/2
1 تا 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
جمع 147 ---- ----

برای نمایش گرافیکی سری تغییرات نیز می تواند استفاده شود منحنی تجمعی. با کمک cumulate (منحنی مجموع) یک سری فرکانس انباشته نمایش داده می شود. فرکانس‌های انباشته‌شده با جمع‌کردن متوالی فرکانس‌ها بر اساس گروه‌ها تعیین می‌شوند و نشان می‌دهند که چند واحد از جمعیت دارای ارزش ویژگی‌هایی هستند که از مقدار در نظر گرفته شده بیشتر نباشد.


برنج. 2.4. توزیع Ogiva خانواده ها بر اساس اندازه فضای زندگی برای هر نفر

هنگام ساختن انباشت سری تغییرات بازه ای، انواع سری در امتداد محور آبسیسا و فرکانس های انباشته شده در امتداد محور ارتین رسم می شوند.

نمونه ای از حل تست در آمار ریاضی

وظیفه 1

اطلاعات اولیه : دانش آموزان یک گروه خاص متشکل از 30 نفر در امتحان درس "انفورماتیک" قبول شدند. نمرات دریافت شده توسط دانش آموزان مجموعه ای از اعداد زیر است:

I. یک سری متغیر بنویسید

متر ایکس

w ایکس

متر ایکس nak

w ایکس nak

جمع:

II. نمایش گرافیکی اطلاعات آماری.

III. مشخصات عددی نمونه

1. میانگین حسابی

2. میانگین هندسی

3. مد

4. میانه

222222333333333 | 3 34444444445555

5. واریانس نمونه

7. ضریب تغییرات

8. عدم تقارن

9. ضریب عدم تقارن

10. کورتوزیس

11. ضریب کورتوزیس

وظیفه 2

اطلاعات اولیه : دانش آموزان یک گروه خاص امتحان نهایی را نوشتند. گروه متشکل از 30 نفر است. نمرات کسب شده توسط دانش آموزان سری اعداد زیر را تشکیل می دهد

راه حل

I. از آنجایی که علامت مقادیر مختلفی می گیرد، ما یک سری تغییرات بازه ای برای آن می سازیم. برای این کار ابتدا مقدار فاصله را تعیین می کنیم ساعت. بیایید از فرمول استورگر استفاده کنیم

بیایید یک مقیاس از فواصل ایجاد کنیم. در این حالت، برای مرز بالایی اولین بازه، مقدار تعیین شده توسط فرمول را می گیریم:

کران بالای بازه های بعدی با فرمول بازگشتی زیر تعیین می شود:

، سپس

ما ساخت مقیاس فواصل را تمام می کنیم، زیرا حد بالای بازه بعدی بزرگتر یا مساوی با حداکثر مقدار نمونه شده است.
.

II. نمایش گرافیکی سری تغییرات فاصله

III. مشخصات عددی نمونه

برای تعیین مشخصات عددی نمونه، جدول کمکی را تهیه می کنیم

مجموع:

1. میانگین حسابی

2. میانگین هندسی

3. مد

4. میانه

10 11 12 12 13 13 13 13 14 14 14 14 15 15 15 |15 15 15 16 16 16 16 16 17 17 18 19 19 20 20

5. واریانس نمونه

6. نمونه انحراف معیار

7. ضریب تغییرات

8. عدم تقارن

9. ضریب عدم تقارن

10. کورتوزیس

11. ضریب کورتوزیس

وظیفه 3

وضعیت : مقدار تقسیم مقیاس آمپرمتر 0.1 A است. قرائت ها به نزدیکترین تقسیم کل گرد می شوند. احتمال خطای بیشتر از 0.02 A را در حین خواندن پیدا کنید.

راه حل.

خطای گرد کردن را می توان به عنوان یک متغیر تصادفی در نظر گرفت ایکس، که به طور مساوی در فاصله بین دو تقسیم عدد صحیح مجاور توزیع می شود. چگالی توزیع یکنواخت

,

جایی که
- طول بازه ای که حاوی مقادیر ممکن است ایکس; خارج از این فاصله
در این مشکل، طول بازه حاوی مقادیر ممکن است ایکس، برابر با 0.1 است، بنابراین

اگر در بازه (0.02؛ 0.08) محصور شود، خطای خواندن از 0.02 تجاوز خواهد کرد. سپس

پاسخ: آر=0,6

وظیفه 4

اطلاعات اولیه: انتظارات ریاضی و انحراف معیار یک ویژگی به طور معمول توزیع شده است ایکسبه ترتیب 10 و 2 می باشد.احتمالی را که در نتیجه آزمون بدست می آید ایکسمقدار موجود در بازه (12، 14) را می گیرد.

راه حل.

بیایید از فرمول استفاده کنیم

و فرکانس های نظری

راه حل

برای X، انتظار ریاضی آن M(X) و واریانس D(X). راه حل. تابع توزیع F(x) یک متغیر تصادفی را پیدا کنید... خطای نمونه گیری). بسازیم متغیر ردیفعرض فاصله خواهد بود: برای هر مقدار ردیفبیایید حساب کنیم چند ...

  • راه حل: معادله قابل تفکیک

    راه حل

    در فرم برای پیدا کردن یک خصوصی راه حل هامعادله ناهمگن ساختنسیستم بیایید سیستم حاصل را حل کنیم... ; +47; +61; +10; -هشت فاصله ساخت متغیر ردیف. برآوردهای آماری از میانگین ...

  • راه حل: بیایید نرخ رشد مطلق زنجیره ای و پایه، نرخ رشد، نرخ رشد را محاسبه کنیم. مقادیر به دست آمده در جدول 1 خلاصه شده است

    راه حل

    حجم تولید. راه حل: میانگین حسابی فاصله متغیر ردیفبه صورت زیر محاسبه می شود: به ازای ... خطای نمونه گیری حاشیه ای با احتمال 954/0 (t=2) خواهد بود: Δ w = t*μ = 2*0.0146 = 0.02927 بیایید مرزها را تعریف کنیم...

  • راه حل. امضاء کردن

    راه حل

    در مورد تجربه کاری و تخمین زده می شود بهنمونه. میانگین مدت خدمت نمونه ... روز کاری این کارکنان و تخمین زده می شود بهنمونه. میانگین مدت برای نمونه ... 1.16، سطح معنی داری α = 0.05. راه حل. متغیر ردیفاین نمونه به شکل 0.71 ...

  • برنامه درسی کار در زیست شناسی برای پایه های 10-11 گردآوری شده توسط Polikarpova S. V

    برنامه درسی کار

    ساده ترین طرح های تلاقی» 5 L.r. " راه حلمشکلات ژنتیکی ابتدایی» 6 L.r. " راه حلمشکلات ژنتیکی ابتدایی» 7 L.r. «...، 110، 115، 112، 110. آرایش متغیر ردیف، قرعه کشی متغیرمنحنی، مقدار متوسط ​​ویژگی را پیدا کنید ...

  • سری تغییرات - سری‌هایی که در آنها (به ترتیب صعودی یا نزولی) مقایسه می‌شوند. گزینه هاو مربوط به آنها فرکانس ها

    واریانت ها عبارت های کمی مجزا از یک ویژگی هستند. با حروف لاتین مشخص شده است V . درک کلاسیک اصطلاح «واریانت» فرض می‌کند که هر مقدار منحصربه‌فرد یک ویژگی، بدون توجه به تعداد تکرارها، یک نوع نامیده می‌شود.

    به عنوان مثال، در یک سری متغیر از شاخص های فشار خون سیستولیک که در ده بیمار اندازه گیری شد:

    110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

    فقط 6 مقدار گزینه هستند:

    110, 120, 130, 140, 160, 170.

    فرکانس عددی است که نشان می دهد یک گزینه چند بار تکرار شده است. با یک حرف لاتین مشخص می شود پ . مجموع همه فرکانس ها (که البته برابر است با تعداد تمام فرکانس های مطالعه شده) به صورت n.

      در مثال ما، فرکانس ها مقادیر زیر را خواهند داشت:
    • برای نوع 110 فرکانس P = 1 (مقدار 110 در یک بیمار رخ می دهد)،
    • برای واریانت 120 فرکانس P = 2 (مقدار 120 در دو بیمار رخ می دهد)،
    • برای واریانت 130 فرکانس P = 3 (مقدار 130 در سه بیمار رخ می دهد)،
    • برای واریانت 140 فرکانس P = 2 (مقدار 140 در دو بیمار رخ می دهد)،
    • برای واریانت 160 فرکانس P = 1 (مقدار 160 در یک بیمار رخ می دهد)،
    • برای نوع 170 فرکانس P = 1 (مقدار 170 در یک بیمار رخ می دهد)،

    انواع سری های واریاسیون:

    1. ساده- این یک سری است که در آن هر گزینه فقط یک بار رخ می دهد (همه فرکانس ها برابر با 1 هستند).
    2. معلق- مجموعه ای که در آن یک یا چند گزینه به طور مکرر رخ می دهد.

    سری تغییرات برای توصیف آرایه های بزرگی از اعداد استفاده می شود؛ در این شکل است که داده های جمع آوری شده اکثر مطالعات پزشکی در ابتدا ارائه می شود. به منظور مشخص کردن سری تغییرات، شاخص های خاصی از جمله مقادیر متوسط، شاخص های تغییرپذیری (به اصطلاح پراکندگی)، شاخص های نمایندگی داده های نمونه محاسبه می شود.

    شاخص های سری تغییرات

    1) میانگین حسابی یک شاخص تعمیم دهنده است که اندازه صفت مورد مطالعه را مشخص می کند. میانگین حسابی به صورت نشان داده می شود م ، رایج ترین نوع میانگین است. میانگین حسابی به عنوان نسبت مجموع مقادیر شاخص های همه واحدهای مشاهده به تعداد همه مورد بررسی محاسبه می شود. روش محاسبه میانگین حسابی برای یک سری تغییرات ساده و وزنی متفاوت است.

    فرمول محاسبه میانگین حسابی ساده:

    فرمول محاسبه میانگین وزنی حسابی:

    M = Σ(V * P)/ n

    ​2) حالت - یک مقدار متوسط ​​دیگر از سری تغییرات، مربوط به بیشترین نوع تکرار شده است. یا به عبارت دیگر، این گزینه ای است که با بالاترین فرکانس مطابقت دارد. تعیین شده به عنوان مو . حالت فقط برای سری های وزنی محاسبه می شود، زیرا در سری های ساده هیچ یک از گزینه ها تکرار نمی شود و همه فرکانس ها برابر با یک هستند.

    به عنوان مثال، در سری تغییرات مقادیر ضربان قلب:

    80, 84, 84, 86, 86, 86, 90, 94;

    مقدار حالت 86 است، زیرا این نوع 3 بار رخ می دهد، بنابراین فرکانس آن بالاترین است.

    3) میانه - مقدار گزینه، تقسیم سری تغییرات به نصف: در هر دو طرف آن تعداد مساوی گزینه وجود دارد. میانه، و همچنین میانگین حسابی و حالت، به مقادیر میانگین اشاره دارد. تعیین شده به عنوان من

    4) انحراف معیار (مترادف: انحراف معیار، انحراف سیگما، سیگما) - اندازه گیری تغییرپذیری سری تغییرات. این یک شاخص جدایی ناپذیر است که همه موارد انحراف یک نوع از میانگین را ترکیب می کند. در واقع به این سوال پاسخ می دهد: گزینه ها چقدر و چند وقت یکبار از میانگین حسابی پراکنده می شوند. با یک حرف یونانی نشان داده شده است σ ("سیگما").

    هنگامی که اندازه جمعیت بیش از 30 واحد باشد، انحراف معیار با استفاده از فرمول زیر محاسبه می شود:

    برای جمعیت های کوچک - 30 واحد مشاهده یا کمتر - انحراف استاندارد با استفاده از یک فرمول متفاوت محاسبه می شود:

    با دوستان به اشتراک بگذارید یا برای خود ذخیره کنید:

    بارگذاری...