Видове вариационни серии. Анализ на вариационни редове

Статистически серииразпространение- това е подредено разпределение на единиците от съвкупността в групи според определен вариращ признак.
В зависимост от признака, който е в основата на формирането на серия на разпространение, има серия на разпределение на атрибути и вариации.

Наличието на общ признак е в основата на формирането на статистическа съвкупност, която е резултат от описание или измерване Общи чертиобекти на изследване.

Предмет на изследване в статистиката са променящите се (вариращи) признаци или статистически признаци.

Видове статистически признаци.

Сериите на разпределение се наричат ​​серии на атрибути.изграден на качествени основания. Атрибутивен- това е знак, който има име (например професия: шивачка, учител и др.).
Прието е сериите за разпределение да се подреждат под формата на таблици. В табл. 2.8 показва серия от атрибути на разпределение.
Таблица 2.8 - Разпределение на видовете правна помощ, предоставяна от адвокати на граждани на един от регионите на Руската федерация.

Вариационни серииса стойности на характеристики (или диапазони от стойности) и техните честоти.
Вариационните серии са серии на разпределениеизградена на количествена основа. Всяка вариационна серия се състои от два елемента: варианти и честоти.
Вариантите са индивидуални стойности на характеристика, които тя приема в серия от варианти.
Честотите са номерата на отделните варианти или всяка група вариационна серия, т.е. това са числа, показващи колко често се появяват определени опции в серия за разпространение. Сумата от всички честоти определя размера на цялата популация, нейния обем.
Честотите се наричат ​​честоти, изразени в части от единица или като процент от общата сума. Съответно сумата от честотите е равна на 1 или 100%. Вариационните серии ни позволяват да оценим формата на закона за разпределение въз основа на действителни данни.

В зависимост от характера на изменението на признака има дискретни и интервални вариационни серии.
Пример за дискретна вариационна серия е даден в табл. 2.9.
Таблица 2.9 - Разпределение на семействата по броя на стаите, заети в отделни апартаменти през 1989 г. в Руската федерация.

Първата колона на таблицата представя варианти на дискретна вариационна серия, втората колона съдържа честотите на вариационната серия, а третата колона съдържа честотните индикатори.

Вариационни серии

AT населениеизследва се някаква количествена характеристика. Проба от обема се извлича произволно от него н, тоест броят на елементите в извадката е н. На първия етап статистическа обработкапроизвеждат вариращипроби, т.е. подреждане на номера x 1, x 2, …, x nВъзходящ. Всяка наблюдавана стойност x iНаречен опция. Честота m iе броят на наблюденията на стойността x iв пробата. Относителна честота (честота) w iе честотното съотношение m iдо размера на извадката н: .
При изучаване на вариационна серия се използват и понятията кумулативна честота и кумулативна честота. Позволявам хнякакво число. След това броят на опциите , чиито стойности са по-малки х, се нарича акумулирана честота: за x i нсе нарича акумулирана честота w i max .
Един атрибут се нарича дискретно променлив, ако отделните му стойности (варианти) се различават една от друга с някаква крайна сума (обикновено цяло число). Вариационна серия от такава характеристика се нарича дискретна вариационна серия.

Таблица 1. Общ изглед на дискретните вариационни серии от честоти

Стойности на характеристикитеx i х 1 x2 x n
Честотиm i m 1 м2 m n

Един атрибут се нарича непрекъснато променящ се, ако неговите стойности се различават една от друга с произволно малка сума, т.е. знакът може да приема произволна стойност в определен интервал. Серия от непрекъснати вариации за такъв признак се нарича интервална серия.

Таблица 2. Общ изглед на интервалните вариационни серии от честоти

Таблица 3. Графични изображения на вариационната серия

РедетеМногоъгълник или хистограмаЕмпирична функция на разпределение
Отделен
интервал
Разглеждайки резултатите от наблюденията, се определя колко стойности на вариантите попадат във всеки конкретен интервал. Предполага се, че всеки интервал принадлежи към един от неговите краища: или във всички случаи вляво (по-често), или във всички случаи вдясно, а честотите или честотите показват броя на опциите, съдържащи се в посочените граници. Разлики a i – a i +1се наричат ​​частични интервали. За да се опростят последващите изчисления, интервалните вариационни серии могат да бъдат заменени с условно дискретни. В този случай средната стойност аз-ти интервал се приема като опция x iи съответната интервална честота m i- за честотата на този интервал.
За графично представяне на вариационни серии най-често се използват полигон, хистограма, кумулативна крива и емпирична функция на разпределение.

В табл. 2.3 (Представено е групиране на населението на Русия според размера на средния доход на глава от населението през април 1994 г.) интервални вариационни серии.
Удобно е да се анализира серията на разпределение с помощта на графично представяне, което също позволява да се прецени формата на разпределението. Визуално представяне на характера на промяната в честотите на вариационните серии е дадено от многоъгълник и хистограма.
Полигонът се използва при показване на дискретни вариационни серии.
Нека изобразим например графично разпределението на жилищния фонд по тип апартаменти (Таблица 2.10).
Таблица 2.10 - Разпределение на жилищния фонд на градската зона по тип апартаменти (условни числа).


Ориз. Жилищно разпределителен полигон


На оста y могат да се начертаят не само стойностите на честотите, но и честотите на вариационните серии.
Хистограмата се взема за показване на серията от интервални вариации. При конструирането на хистограма стойностите на интервалите се нанасят върху абсцисната ос, а честотите се изобразяват с правоъгълници, изградени върху съответните интервали. Височината на колоните в случай на равни интервали трябва да бъде пропорционална на честотите. Хистограмата е графика, в която серия е показана като ленти, съседни една на друга.
Нека изобразим графично серията интервално разпределение, дадена в табл. 2.11.
Таблица 2.11 - Разпределение на семействата по размер на жилищната площ на човек (условни цифри).
N p / p Групи семейства според размера на жилищната площ на човек Брой семейства с определена жилищна площ Натрупан брой семейства
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
ОБЩА СУМА 115 ----


Ориз. 2.2. Хистограма на разпределението на семействата по размер на жилищната площ на човек


Използвайки данните от натрупаната серия (Таблица 2.11), ние конструираме разпределение кумулативно.


Ориз. 2.3. Кумулативното разпределение на семействата според размера на жилищната площ на човек


Представянето на вариационна серия под формата на кумулация е особено ефективно за вариационни серии, чиито честоти се изразяват като дроби или проценти от сумата на честотите на серията.
Ако променим осите в графичното представяне на вариационната серия под формата на кумулация, тогава получаваме огиву. На фиг. 2.4 е показан огив, изграден въз основа на данните от табл. 2.11.
Хистограмата може да бъде преобразувана в многоъгълник на разпределение чрез намиране на средните точки на страните на правоъгълниците и след това свързване на тези точки с прави линии. Полученият разпределителен полигон е показан на фиг. 2.2 пунктирана линия.
При конструиране на хистограма на разпределението на вариационна серия с неравни интервали, по ординатната ос се прилагат не честоти, а плътността на разпределение на признака в съответните интервали.
Плътността на разпределение е честотата, изчислена за единица ширина на интервала, т.е. колко единици във всяка група са на стойност на единичен интервал. Пример за изчисляване на плътността на разпределение е представен в табл. 2.12.
Таблица 2.12 - Разпределение на предприятията по брой на заетите (цифрите са условни)
N p / p Групи предприятия по брой на заетите, нач. Брой предприятия Размер на интервала, перс. Плътност на разпространение
НО 1 2 3=1/2
1 до 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
ОБЩА СУМА 147 ---- ----

Може да се използва и за графично представяне на вариационни серии кумулативна крива. С помощта на кумулата (кривата на сумите) се показва серия от натрупани честоти. Натрупаните честоти се определят чрез последователно сумиране на честотите по групи и показват колко единици от съвкупността имат стойности на характеристики не по-големи от разглежданата стойност.


Ориз. 2.4. Огива разпределение на семействата според размера на жилищната площ на човек

При конструиране на кумулата на интервална вариационна серия, вариантите на серията се нанасят по абсцисната ос, а натрупаните честоти по ординатната ос.

Вариацията определяразлики в стойностите на който и да е атрибут в различни единици от дадена популация в един и същи период (точка във времето). Причината за варирането са различните условия за съществуване на различните единици от съвкупността. Например, дори близнаците в процеса на живот придобиват разлики във височината, теглото, както и в такива признаци като ниво на образование, доходи, брой деца и др.

Вариацията възниква в резултат на факта, че самите стойности на атрибута се формират под общото влияние на различни условия, които се комбинират по различни начини във всеки отделен случай. Следователно стойността на всяка опция е обективна.

Вариацията е характерназа всички явления на природата и обществото, без изключение, с изключение на законодателно фиксираните нормативни стойности на индивидуалните социални характеристики. Изследванията на вариациите в статистиката са от голямо значение, те помагат да се разбере същността на изследваното явление. Откриването на вариация, изясняването на причините за нея, идентифицирането на влиянието на отделните фактори осигуряват важна информация за прилагането на основани на доказателства управленски решения.

Средната стойност дава обобщена характеристика на признака на популацията, но не разкрива нейната структура. Средната стойност не показва как вариантите на средния признак са разположени около него, дали са разпределени близо до средното или се отклоняват от него. Средната стойност в два комплекта може да е една и съща, но в единия вариант всички отделни стойности се различават леко от него, а в другия тези разлики са големи, т.е. в първия случай вариацията на признака е малка, а във втория случай е голяма, което е много важно за характеризиране на значимостта на средната стойност.

За да може ръководителят на организацията, мениджърът, изследователят да изучава вариацията и да я управлява, статистиката е разработила специални методи за изучаване на вариацията (система от показатели). С тяхна помощ се открива вариацията, характеризират се нейните свойства. Индикаторите за вариация са : диапазон на вариация, средно линейно отклонение, коефициент на вариация.

Вариационна серия и нейните форми

Вариационни серии- това е подредено разпределение на единици от популацията по-често чрез увеличаване (по-рядко намаляване) на стойностите на атрибута и преброяване на броя на единиците с една или друга стойност на атрибута. Когато броят на единиците на съвкупността е голям, класираният ред става тромав, изграждането му отнема много време. В такава ситуация се изгражда вариационна серия чрез групиране на популационни единици според стойностите на изследваната черта.

Има следните форми на вариационна серия :

  1. класиран реде списък на отделните единици от съвкупността във възходящ (низходящ) ред на изследвания признак.
  2. Дискретни вариационни серии - това е таблица, състояща се от два реда или графика: специфични стойности на променливата характеристика x и броя на единиците в съвкупността с дадена стойност f - характеристиката на честотите. Той се изгражда, когато атрибутът приеме най-голям брой стойности.
  3. интервални серии.

Определя се диапазонът на вариациякато абсолютната стойност на разликата между максималните и минималните стойности (опции) на атрибута:

Диапазонът на вариация показва само екстремни отклонения на признака и не отразява индивидуалните отклонения на всички варианти в серията. Той характеризира границите на промяна на променлив атрибут и зависи от колебанията на двете екстремни опции и абсолютно не е свързан с честотите в вариационните серии, тоест с естеството на разпределението, което дава тази стойност случайна характер. За да анализирате вариацията, ви е необходим индикатор, който отразява всички колебания на вариационната характеристика и дава обща характеристика. Най-простият индикатор от този вид е средното линейно отклонение.

Вариационни серии - това е статистическа серия, показваща разпределението на изследваното явление според стойността на всеки количествен признак. Например пациенти по възраст, продължителност на лечението, новородени по тегло и др.

опция - индивидуални стойности на характеристиката, по която се извършва групирането (обозначено V ) .

Честота- число, показващо колко често се среща един или друг вариант (обозначено П ) . Показва се сумата от всички честоти общ брой наблюдения и се обозначава н . Разликата между най-големия и най-малкия вариант на вариационната серия се нарича обхват или амплитуда .

Има вариационни серии:

1. Прекъснати (дискретни) и непрекъснати.

Серията се счита за непрекъсната, ако групиращият атрибут може да бъде изразен в дробни стойности (тегло, височина и т.н.), прекъснат, ако групиращият атрибут е изразен само като цяло число (дни на увреждане, брой удари на сърцето и т.н.).

2. Просто и претеглено.

Простата вариационна серия е серия, в която количествената стойност на променлив атрибут се среща веднъж. В претеглена вариационна серия количествените стойности на вариращ признак се повтарят с определена честота.

3. Групирани (интервални) и негрупирани.

Групирана серия има опции, комбинирани в групи, които ги обединяват по размер в рамките на определен интервал. В негрупирани серии всеки отделен вариант отговаря на определена честота.

4. Четни и нечетни.

В четните вариационни серии сумата от честотите или общият брой наблюдения се изразява като четно число, в нечетните вариационни серии като нечетно число.

5. Симетрични и асиметрични.

В симетрични вариационни серии всички видове средни стойности съвпадат или са много близки (мода, медиана, средно аритметично).

В зависимост от характера на изучаваните явления, от конкретните задачи и цели на статистическото изследване, както и от съдържанието на изходния материал, в санитарната статистика се използват следните видове средни стойности:

структурни средни (мода, медиана);

средноаритметично;

среден хармоник;

средно геометрично;

средно прогресивен.

Мода (М относно ) - стойността на променливия признак, който се среща по-често в изследваната популация, т.е. опция, съответстваща на най-високата честота. Намира се директно от структурата на вариационния ред, без да се прибягва до изчисления. Обикновено това е стойност, много близка до средноаритметичната и е много удобна на практика.

Медиана (М д ) - разделяне на вариационната серия (класирана, т.е. стойностите на опцията са подредени във възходящ или низходящ ред) на две равни половини. Медианата се изчислява с помощта на така наречената нечетна серия, която се получава чрез последователно сумиране на честотите. Ако сумата от честотите съответства на четно число, тогава медианата условно се приема като средноаритметично от двете средни стойности.

Режимът и медианата се прилагат в случай на отворена популация, т.е. когато най-големите или най-малките опции нямат точна количествена характеристика (например под 15 години, 50 и повече години и др.). В този случай не може да се изчисли средноаритметичната стойност (параметричните характеристики).

Средно аритметично аз аритметика - най-често срещаната стойност. Средната аритметична стойност обикновено се означава с М.

Правете разлика между проста средна аритметична и среднопретеглена стойност.

просто аритметично средно изчислено:

— в случаите, когато съвкупността е представена чрез прост списък от знания за атрибут за всяка единица;

— ако броят на повторенията на всеки вариант не може да бъде определен;

— ако броят на повторенията на всеки вариант е близък един до друг.

Простата средна аритметична стойност се изчислява по формулата:

където V - индивидуални стойности на атрибута; n е броят на отделните стойности;
- знак за сумиране.

По този начин простата средна стойност е съотношението на сбора на варианта към броя на наблюденията.

Пример: определяне на средната продължителност на престоя на легло за 10 пациенти с пневмония:

16 дни - 1 пациент; 17–1; 18–1; 19–1; 20–1; 21–1; 22–1; 23–1; 26–1; 31–1.

легло-ден.

Средно аритметично претеглено се изчислява в случаите, когато отделните стойности на характеристиката се повтарят. Може да се изчисли по два начина:

1. Директно (средно аритметично или директен метод) по формулата:

,

където P е честотата (броят случаи) на наблюдения на всяка опция.

По този начин среднопретеглената аритметична стойност е съотношението на сумата от продуктите на варианта по честота към броя на наблюденията.

2. Чрез изчисляване на отклонения от условната средна (по метода на моментите).

Основата за изчисляване на среднопретеглената аритметична стойност е:

— групиран материал по варианти на количествен признак;

— всички опции трябва да бъдат подредени във възходящ или низходящ ред на стойността на атрибута (класирана серия).

За да се изчисли по метода на моментите, необходимото условие е еднакъв размер на всички интервали.

Според метода на моментите средноаритметичната стойност се изчислява по формулата:

,

където M o е условната средна стойност, която често се приема като стойност на характеристиката, съответстваща на най-високата честота, т.е. който се повтаря по-често (Режим).

i - стойност на интервала.

a - условно отклонение от условията на средната стойност, което е последователна серия от числа (1, 2 и т.н.) със знак + за голяма условна средна опция и с - (-1, -2 и т.н.) знак за опция, които са под средните. Условното отклонение от варианта, взет за условно средно, е 0.

P - честоти.

- общ брой наблюдения или n.

Пример: определете директно средната височина на 8-годишните момчета (таблица 1).

маса 1

Височина в см

Момчета П

Централна

вариант V

Централният вариант, средата на интервала, се определя като полусума от началните стойности на две съседни групи:

;
и т.н.

Продуктът VP се получава чрез умножаване на централните варианти по честотите
;
и т.н. След това получените продукти се добавят и се получават
, което се разделя на броя наблюдения (100) и се получава среднопретеглената аритметична стойност.

см.

Ще решим същата задача с помощта на метода на моментите, за което е съставена следната таблица 2:

Таблица 2

Височина в cm (V)

Момчета П

n=100

Приемаме 122 като M o, защото от 100 наблюдения 33 души са с ръст 122 см. Намираме условните отклонения (а) от условната средна в съответствие с горното. След това получаваме произведението на условните отклонения по честоти (aP) и обобщаваме получените стойности (
). Резултатът ще бъде 17. Накрая заместваме данните във формулата:

Когато изучавате променлива черта, не трябва да се ограничавате само до изчисляването на средните стойности. Необходимо е също така да се изчислят показатели, характеризиращи степента на разнообразие на изследваните характеристики. Стойността на един или друг количествен признак не е еднаква за всички единици от статистическата съвкупност.

Характеристиката на вариационната серия е стандартното отклонение ( ), който показва разсейването (разсейването) на изследваните признаци спрямо средноаритметичното, т.е. характеризира флуктуацията на вариационния ред. Може да се определи директно по формулата:

Стандартното отклонение е равно на корен квадратен от сумата от произведенията на квадратните отклонения на всяка опция от средната аритметична стойност (V–M) 2 по нейните честоти, разделена на сумата от честотите (
).

Пример за изчисление: определяне на средния брой болнични листове, издадени в клиниката на ден (таблица 3).

Таблица 3

Брой дни по болест

издадени листове

лекар на ден (V)

Брой лекари (P)

;

В знаменателя, когато броят на наблюденията е по-малък от 30, е необходимо от
отнема единица.

Ако серията е групирана на равни интервали, тогава стандартното отклонение може да се определи по метода на моментите:

,

където i е стойността на интервала;

- условно отклонение от условната средна;

P - честотен вариант на съответните интервали;

е общият брой наблюдения.

Пример за изчисление : Определете средната продължителност на престоя на пациентите в терапевтично легло (по метода на моментите) (таблица 4):

Таблица 4

Номер на дните

нощувка (V)

болен (P)

;

Белгийският статистик А. Кетле открива, че вариациите на масовите явления се подчиняват на закона за разпределение на грешките, открит почти едновременно от К. Гаус и П. Лаплас. Кривата, представяща това разпределение, има формата на камбана. Според нормалния закон за разпределение променливостта на отделните стойности на признака е в рамките
, което обхваща 99,73% от всички единици в съвкупността.

Изчислено е, че ако добавите и извадите 2 към средното аритметично , тогава 95,45% от всички членове на вариационната серия са в рамките на получените стойности и накрая, ако добавим и извадим 1 към средното аритметично , то 68,27% от всички членове на този вариационен ред ще бъдат в рамките на получените стойности. В медицината с величина
1свързани с понятието норма. Отклонението от средноаритметичното е по-голямо от 1 , но по-малко от 2 е под нормалното и отклонението е по-голямо от 2 ненормален (над или под нормата).

В санитарната статистика правилото на трите сигми се използва при изследване на физическото развитие, оценка на дейността на здравните институции и оценка на общественото здраве. Същото правило се използва широко в националната икономика при определяне на стандарти.

По този начин стандартното отклонение служи за:

— измервания на дисперсията на вариационна серия;

— характеристики на степента на разнообразие на атрибутите, които се определят от коефициента на вариация:

Ако коефициентът на вариация е повече от 20% - силно разнообразие, от 20 до 10% - средно, по-малко от 10% - слабо разнообразие от характери. Коефициентът на вариация до известна степен е критерий за достоверността на средноаритметичното.

Вариационни сериие поредица от числови стойности на характеристика.

Основните характеристики на вариационната серия: v - вариант, p - честотата на неговото появяване.

Видове вариационни серии:

    според честотата на срещане на вариантите: прости - вариантът се среща веднъж, претеглени - вариантът се среща два или повече пъти;

    опции по местоположение: класирани - опциите са подредени в низходящ и възходящ ред, некласирани - опциите са записани без определен ред;

    чрез групиране на опцията в групи: групирани - опциите се комбинират в групи, негрупирани - опциите не се групират;

    опции по стойност: непрекъснати - опциите се изразяват като цяло число и дробно число, дискретни - опциите се изразяват като цяло число, сложни - опциите се представят чрез относителна или средна стойност.

За изчисляване на средните стойности се съставя и изготвя вариационна серия.

Форма за нотация на вариационна серия:

8. Средни стойности, видове, начин на изчисляване, приложение в здравеопазването

Средни стойности- общата обобщаваща характеристика на количествените характеристики. Прилагане на средни стойности:

1. Да се ​​характеризира организацията на работата на лечебните заведения и да се оцени тяхната дейност:

а) в поликлиниката: показатели за натовареността на лекарите, среден брой посещения, среден брой жители в района;

б) в болница: среден брой леглодни за година; средна продължителност на болничния престой;

в) в центъра по хигиена, епидемиология и обществено здраве: средната площ (или кубичен капацитет) на 1 човек, средните хранителни норми (протеини, мазнини, въглехидрати, витамини, минерални соли, калории), санитарни норми и стандарти и др. ;

2. Да характеризира физическото развитие (основните антропометрични характеристики на морфологични и функционални);

3. Да се ​​определят медико-физиологичните параметри на организма в нормални и патологични състояния при клинични и експериментални изследвания.

4. В специални научни изследвания.

Разликата между средните стойности и индикаторите:

1. Коефициентите характеризират алтернативна характеристика, която се среща само в част от статистическия екип, която може или не може да се осъществи.

Средните стойности обхващат признаците, присъщи на всички членове на екипа, но в различна степен (тегло, ръст, дни на лечение в болница).

2. Коефициентите се използват за измерване на качествени характеристики. Средните стойности са за различни количествени признаци.

Видове средни стойности:

    средно аритметично, неговите характеристики - стандартно отклонение и средна грешка

    режим и медиана. Мода (Mo)- съответства на стойността на признака, който най-често се среща в тази популация. Медиана (аз)- стойността на атрибута, който заема средната стойност в тази популация. Той разделя серията на 2 равни части според броя на наблюденията. Средна аритметична стойност (M)- за разлика от модата и медианата, той се основава на всички направени наблюдения, следователно е важна характеристика за цялото разпределение.

    други видове средни стойности, които се използват в специални изследвания: средноквадратична, кубична, хармонична, геометрична, прогресивна.

Средноаритметичнохарактеризира средното ниво на статистическата съвкупност.

За проста серия, където

∑v – опция за сума,

n е броят на наблюденията.

за претеглена серия, където

∑vr е сумата от продуктите на всяка опция и честотата на нейното появяване

n е броят на наблюденията.

Стандартно отклонениесредно аритметично или сигма (σ) характеризира разнообразието на характеристиката

- за обикновен ред

Σd 2 - сумата от квадратите на разликата между средната аритметична стойност и всяка опция (d = │M-V│)

n е броят на наблюденията

- за претеглени серии

∑d 2 p е сумата от произведенията на квадратите на разликата между средната аритметична стойност и всяка опция и честотата на нейното появяване,

n е броят на наблюденията.

Степента на разнообразие може да се съди по стойността на коефициента на вариация
. Повече от 20% - силно разнообразие, 10-20% - средно разнообразие, по-малко от 10% - слабо разнообразие.

Ако една сигма (M ± 1σ) се добави и извади от средното аритметично, тогава при нормално разпределение най-малко 68,3% от всички варианти (наблюдения) ще бъдат в тези граници, което се счита за норма за изследваното явление . Ако k 2 ± 2σ, тогава 95,5% от всички наблюдения ще бъдат в тези граници, а ако k M ± 3σ, тогава 99,7% от всички наблюдения ще бъдат в тези граници. По този начин стандартното отклонение е стандартното отклонение, което позволява да се предвиди вероятността за поява на такава стойност на изследваната черта, която е в рамките на определените граници.

Средна грешка на средноаритметичната стойностили грешка в представителността. За прости, претеглени серии и по правилото на моментите:

.

За да се изчислят средните стойности, е необходимо: хомогенността на материала, достатъчен брой наблюдения. Ако броят на наблюденията е по-малък от 30, във формулите за изчисляване на σ и m се използва n-1.

При оценката на получения резултат от размера на средната грешка се използва коефициент на доверие, който дава възможност да се определи вероятността за правилен отговор, т.е. показва, че получената грешка в извадката няма да бъде по-голяма от действителната грешка направени в резултат на непрекъснато наблюдение. Следователно, с увеличаване на вероятността за доверие, ширината на интервала на доверие се увеличава, което от своя страна увеличава увереността на преценката, подкрепата на получения резултат.

вариационеннаречена серия на разпределение, изградена на количествена основа. Стойностите на количествените характеристики в отделните единици на популацията не са постоянни, повече или по-малко се различават една от друга.

Вариация- колебание, променливост на стойността на признака в единици от съвкупността. Наричат ​​се отделни числени стойности на признака, срещащи се в изследваната популация настроикистойности. Недостатъчността на средната стойност за пълно характеризиране на популацията налага допълването на средните стойности с показатели, които позволяват да се оцени типичността на тези средни стойности чрез измерване на флуктуацията (вариацията) на изследваната черта.

Наличието на вариация се дължи на влиянието на голям брой фактори върху формирането на нивото на признака. Тези фактори действат с различна сила и в различни посоки. Индикаторите за вариация се използват за описание на мярката за вариабилност на признака.

Задачи на статистическото изследване на вариацията:

  • 1) изследване на естеството и степента на вариация на признаците в отделни единици от популацията;
  • 2) определяне на ролята на отделни фактори или техните групи в изменението на определени характеристики на населението.

В статистиката се използват специални методи за изследване на вариациите, базирани на използването на система от показатели, спо който се измерва вариацията.

Изследването на вариациите е от съществено значение. Измерването на вариациите е необходимо при провеждане на извадково наблюдение, корелационен и дисперсионен анализ и др. Ермолаев О.Ю. Математическа статистика за психолози: Учебник [Текст] / O.Yu. Ермолаев. - М.: Издателство "Флинт" на Московския психологически и социален институт, 2012. - 335с.

Според степента на вариация може да се прецени хомогенността на популацията, стабилността на индивидуалните стойности на характеристиките и типичността на средната стойност. На тяхна основа се разработват показатели за близостта на връзката между знаците, показатели за оценка на точността на селективното наблюдение.

Има вариация в пространството и вариация във времето.

Променливостта в пространството се разбира като колебание на стойностите на характеристика в единици от населението, представляващи отделни територии. Под изменение във времето се има предвид промяната в стойностите на атрибута в различни периоди от време.

За да се проучи вариацията в серията на разпределение, всички варианти на стойностите на атрибута са подредени във възходящ или низходящ ред. Този процес се нарича класиране на серията.

Най-простите признаци на вариация са минимум и максимум- най-малката и най-голямата стойност на атрибута в съвкупността. Броят на повторенията на отделните варианти на стойностите на характеристиките се нарича честота на повторение (fi). Удобно е да замените честотите с честоти - wi. Честота - относителен показател за честота, който може да бъде изразен в части от единица или процент и ви позволява да сравнявате вариационни серии с различен брой наблюдения. Изразява се с формулата:

където Xmax, Xmin - максималните и минималните стойности на атрибута в съвкупността; n е броят на групите.

За измерване на вариацията на даден признак се използват различни абсолютни и относителни показатели. Абсолютните показатели за вариация включват диапазон на вариация, средно линейно отклонение, дисперсия, стандартно отклонение. Относителните показатели на флуктуация включват коефициент на трептене, относително линейно отклонение, коефициент на вариация.

Пример за намиране на вариационна серия

Упражнение.За тази проба:

  • а) Намерете вариационна серия;
  • б) Конструирайте функцията на разпределение;

№=42. Примерни елементи:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Решение.

  • а) изграждане на класирана вариационна серия:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • б) изграждане на дискретна вариационна редица.

Нека изчислим броя на групите във вариационната серия, използвайки формулата на Стърджис:

Нека вземем броя на групите равен на 7.

Знаейки броя на групите, изчисляваме стойността на интервала:

За удобство при конструирането на таблицата ще вземем броя на групите, равен на 8, интервалът ще бъде 1.

Ориз. един Обемът на продажбите на стоки от магазина за определен период от време

Споделете с приятели или запазете за себе си:

Зареждане...