На каква основа е изградена вариационната серия? Серии за разпределение и групиране

Вариационни сериие поредица от числови стойности на характеристика.

Основните характеристики на вариационната серия: v - вариант, p - честотата на неговото появяване.

Видове вариационни серии:

    според честотата на срещане на вариантите: прости - вариантът се среща веднъж, претеглени - вариантът се среща два или повече пъти;

    опции по местоположение: класирани - опциите са подредени в низходящ и възходящ ред, некласирани - опциите са записани без определен ред;

    чрез групиране на опцията в групи: групирани - опциите се комбинират в групи, негрупирани - опциите не се групират;

    опции по стойност: непрекъснати - опциите се изразяват като цяло число и дробно число, дискретни - опциите се изразяват като цяло число, сложни - опциите се представят чрез относителна или средна стойност.

За изчисляване на средните стойности се съставя и изготвя вариационна серия.

Форма за нотация на вариационна серия:

8. Средни стойности, видове, начин на изчисляване, приложение в здравеопазването

Средни стойности- общата обобщаваща характеристика на количествените характеристики. Прилагане на средни стойности:

1. Да се ​​характеризира организацията на работата на лечебните заведения и да се оцени тяхната дейност:

а) в поликлиниката: показатели за натовареността на лекарите, среден брой посещения, среден брой жители в района;

б) в болница: среден брой леглодни за година; средна продължителност на болничния престой;

в) в центъра по хигиена, епидемиология и обществено здраве: средната площ (или кубичен капацитет) на 1 човек, средните хранителни норми (протеини, мазнини, въглехидрати, витамини, минерални соли, калории), санитарни норми и стандарти и др. ;

2. Да характеризира физическото развитие (основните антропометрични характеристики на морфологични и функционални);

3. Да се ​​определят медико-физиологичните параметри на организма в нормални и патологични състояния при клинични и експериментални изследвания.

4. В специални научни изследвания.

Разликата между средните стойности и индикаторите:

1. Коефициентите характеризират алтернативна характеристика, която се среща само в част от статистическия екип, която може или не може да се осъществи.

Средните стойности обхващат признаците, присъщи на всички членове на екипа, но в различна степен (тегло, ръст, дни на лечение в болница).

2. Коефициентите се използват за измерване на качествени характеристики. Средните стойности са за различни количествени признаци.

Видове средни стойности:

    средно аритметично, неговите характеристики - стандартно отклонение и средна грешка

    режим и медиана. Мода (Mo)- съответства на стойността на признака, който най-често се среща в тази популация. Медиана (аз)- стойността на атрибута, който заема средната стойност в тази популация. Той разделя серията на 2 равни части според броя на наблюденията. Средна аритметична стойност (M)- за разлика от модата и медианата, той се основава на всички направени наблюдения, следователно е важна характеристика за цялото разпределение.

    други видове средни стойности, които се използват в специални изследвания: средноквадратична, кубична, хармонична, геометрична, прогресивна.

Средноаритметичнохарактеризира средното ниво на статистическата съвкупност.

За проста серия, където

∑v – опция за сума,

n е броят на наблюденията.

за претеглена серия, където

∑vr е сумата от продуктите на всяка опция и честотата на нейното появяване

n е броят на наблюденията.

Стандартно отклонениесредно аритметично или сигма (σ) характеризира разнообразието на характеристиката

- за обикновен ред

Σd 2 - сумата от квадратите на разликата между средната аритметична стойност и всяка опция (d = │M-V│)

n е броят на наблюденията

- за претеглени серии

∑d 2 p е сумата от произведенията на квадратите на разликата между средната аритметична стойност и всяка опция и честотата на нейното появяване,

n е броят на наблюденията.

Степента на разнообразие може да се съди по стойността на коефициента на вариация
. Повече от 20% - силно разнообразие, 10-20% - средно разнообразие, по-малко от 10% - слабо разнообразие.

Ако една сигма (M ± 1σ) се добави и извади от средното аритметично, тогава при нормално разпределение най-малко 68,3% от всички варианти (наблюдения) ще бъдат в тези граници, което се счита за норма за изследваното явление . Ако k 2 ± 2σ, тогава 95,5% от всички наблюдения ще бъдат в тези граници, а ако k M ± 3σ, тогава 99,7% от всички наблюдения ще бъдат в тези граници. По този начин стандартното отклонение е стандартното отклонение, което позволява да се предвиди вероятността за поява на такава стойност на изследваната черта, която е в рамките на определените граници.

Средна грешка на средноаритметичната стойностили грешка в представителността. За прости, претеглени серии и по правилото на моментите:

.

За да се изчислят средните стойности, е необходимо: хомогенността на материала, достатъчен брой наблюдения. Ако броят на наблюденията е по-малък от 30, във формулите за изчисляване на σ и m се използва n-1.

При оценката на получения резултат от размера на средната грешка се използва коефициент на доверие, който дава възможност да се определи вероятността за правилен отговор, т.е. показва, че получената грешка в извадката няма да бъде по-голяма от действителната грешка направени в резултат на непрекъснато наблюдение. Следователно, с увеличаване на вероятността за доверие, ширината на интервала на доверие се увеличава, което от своя страна увеличава увереността на преценката, подкрепата на получения резултат.

В резултат на усвояването на тази глава студентът трябва: зная

  • показатели за вариация и тяхната връзка;
  • основни закони на разпределение на характеристиките;
  • същността на критериите за съгласие; да бъде в състояние да
  • изчисляване на степени на вариация и добро съответствие;
  • определят характеристиките на разпределенията;
  • оценете основното числови характеристики статистически серииразпространение;

собствен

Вариационни индикатори

При статистическо изследванена признаци на различни статистически съвкупности от голям интерес е изследването на вариацията на знака на отделните статистически единици от съвкупността, както и естеството на разпределението на единиците според този знак. вариация -това са разликите в индивидуалните стойности на признака сред единиците на изследваната съвкупност. Изследването на вариациите е от голямо практическо значение. По степента на вариация можете да прецените границите на вариацията на признака, хомогенността на популацията за този признак, типичността на средната стойност, връзката на факторите, които определят вариацията. Индикаторите за вариация се използват за характеризиране и подреждане на статистически съвкупности.

Резултати от обобщаване и групиране на материали статистическо наблюдение, проектирани под формата на статистически серии на разпределение, представляват подредено разпределение на единици от изследваната съвкупност в групи според групиращ (променлив) признак. Ако за основа на групирането се вземе качествен признак, тогава се нарича такава серия на разпределение атрибутивни(разпределение по професия, пол, цвят и др.). Ако серията за разпределение е изградена на количествена основа, тогава се нарича такава серия вариационен(разпределение по ръст, тегло, размер заплатии т.н.). Да се ​​конструира вариационна серия означава да се подреди количественото разпределение на единиците на съвкупността според стойностите на атрибута, да се преброи броя на единиците на популацията с тези стойности (честота), да се подредят резултатите в таблица.

Вместо честота на даден вариант е възможно да се използва съотношението му към общия обем на наблюденията, което се нарича честота (относителна честота).

Има два вида вариационни серии: дискретни и интервални. Дискретна серия- това е такава вариационна серия, чиято конструкция се основава на знаци с прекъсната промяна (дискретни знаци). Последните включват броя на служителите в предприятието, категорията на заплатите, броя на децата в семейството и др. Дискретна вариационна серия е таблица, която се състои от две колони. В първата колона се посочва конкретната стойност на признака, а във втората - броят единици на съвкупността с конкретна стойност на признака. Ако даден знак има непрекъсната промяна (размерът на дохода, трудовия стаж, цената на дълготрайните активи на предприятието и т.н., които в определени граници могат да приемат всякакви стойности), тогава за този знак е възможно да се конструира интервални вариационни серии.Таблицата при конструиране на серия от интервални вариации също има две колони. Първият показва стойността на характеристиката в интервала "от - до" (опции), вторият - броя на единиците, включени в интервала (честота). Честота (честота на повторение) - броят на повторенията на определен вариант на стойностите на атрибута. Интервалите могат да бъдат затворени и отворени. Затворените интервали са ограничени от двете страни, т.е. имат долна граница („от“) и горна („до“). Отворените интервали имат една граница: горна или долна. Ако опциите са подредени във възходящ или низходящ ред, тогава се извикват редовете класиран.

За вариационни серии има два типа опции за честотна характеристика: кумулативна честота и кумулативна честота. Кумулативната честота показва колко наблюдения е взела стойността на характеристиката на стойности, по-малки от определената стойност. Кумулативната честота се определя чрез сумиране на стойностите на характеристичната честота за дадена група с всички честоти на предходните групи. Натрупаната честота характеризира съотношението на единиците на наблюдение, в които стойностите на признака не надвишават горната граница на дневната група. Така натрупаната честота показва специфичното тегло на варианта в съвкупността, които имат стойност не по-голяма от дадената. Честота, честота, абсолютна и относителна плътност, кумулативна честота и честота са характеристики на величината на варианта.

Вариациите в знака на статистическите единици на съвкупността, както и естеството на разпределението, се изследват с помощта на показатели и характеристики на вариационните серии, които включват средното ниво на серията, средното линейно отклонение, стандартното отклонение, дисперсията , коефициенти на трептене, вариация, асиметрия, ексцес и др.

Средните стойности се използват за характеризиране на разпределителния център. Средната стойност е обобщаваща статистическа характеристика, в която се определя количествено типичното ниво на признак, притежаван от членовете на изследваната популация. Въпреки това са възможни случаи на съвпадение на средните аритметични стойности различен характерразпределение, следователно като статистически характеристики на вариационните редове се изчисляват т. нар. структурни средни - мода, медиана, както и квантили, които разделят реда на разпределение на равни части (квартили, децили, процентили и др.).

мода -това е стойността на характеристиката, която се среща по-често в серията на разпределение, отколкото другите й стойности. За дискретни серии това е вариантът с най-висока честота. При интервалните вариационни серии, за да се определи модата, е необходимо преди всичко да се определи интервалът, в който се намира, т. нар. модален интервал. При вариационна серия с равни интервали модалният интервал се определя от най-високата честота, при серия с неравни интервали - но най-висока плътностразпространение. След това, за да определите режима в редове с равни интервали, приложете формулата

където Mo е стойността на модата; x Mo - долната граница на модалния интервал; ч-широчина на модалния интервал; / Mo - модална интервална честота; / Mo j - честота на предмодалния интервал; / Mo+1 е честотата на постмодалния интервал и за серия с неравни интервали в тази формула за изчисление, вместо честотите / Mo, / Mo, / Mo, трябва да се използват плътности на разпределение Ум 0 _| , Ум 0> UMO+"

Ако има единичен режим, тогава вероятностното разпределение на случайната променлива се нарича унимодално; ако има повече от един режим, той се нарича многомодален (многомодален, мултимодален), при два режима - бимодален. По правило мултимодалността показва, че изследваното разпределение не се подчинява на закона нормална дистрибуция. Хомогенните популации като правило се характеризират с унимодално разпределение. Multivertex също показва хетерогенността на изследваната популация. Появата на два или повече върха налага прегрупирането на данните, за да се изолират по-хомогенни групи.

В серия от интервални вариации режимът може да се определи графично с помощта на хистограма. За да направите това, две пресичащи се линии се изчертават от горните точки на най-високата колона на хистограмата до горните точки на две съседни колони. След това от точката на тяхното пресичане се спуска перпендикуляр към абсцисната ос. Стойността на характеристиката върху абсцисата, съответстваща на перпендикуляра, е режимът. В много случаи при характеризиране на съвкупността като обобщен показател се дава предпочитание на модата, а не на средноаритметичното.

Медиана -това е централната стойност на характеристиката; тя се притежава от централния член на класираната серия на разпространение. В дискретни серии, за да се намери стойността на медианата, първо се определя нейният пореден номер. За да направите това, с нечетен брой единици, една се добавя към сумата от всички честоти, числото се дели на две. Ако има четен брой 1s, ще има 2 медианни 1s в серията, така че в този случай медианата се определя като средната стойност на стойностите на 2-те медианни 1s. По този начин медианата в серия от дискретни вариации е стойността, която разделя серията на две части, съдържащи еднакъв брой опции.

В интервалната серия, след определяне на поредния номер на медианата, средният интервал се намира от натрупаните честоти (честоти) и след това, като се използва формулата за изчисляване на медианата, се определя стойността на самата медиана:

където Me е стойността на медианата; x Аз -долната граница на средния интервал; ч-средна ширина на интервала; - сумата от честотите на серията на разпределение; /D - натрупаната честота на предмедианния интервал; / Me - честотата на средния интервал.

Медианата може да се намери графично, като се използва кумулацията. За да направите това, по скалата на натрупаните честоти (честоти) на кумулата, от точката, съответстваща на поредния номер на медианата, се начертава права линия, успоредна на абсцисната ос, докато се пресече с кумулата. Освен това от точката на пресичане на посочената права линия с кумулата се спуска перпендикуляр към оста на абсцисата. Стойността на характеристиката по оста x, съответстваща на начертаната ордината (перпендикуляр), е медианата.

Медианата се характеризира със следните свойства.

  • 1. Не зависи от онези стойности на атрибута, които се намират от двете му страни.
  • 2. Има свойството минималност, което означава, че сумата абсолютни отклонениястойностите на характеристиките от медианата е минималната стойност в сравнение с отклонението на стойностите на характеристиките от всяка друга стойност.
  • 3. При комбиниране на две разпределения с известни медиани е невъзможно предварително да се предскаже средната стойност на новото разпределение.

Тези средни свойства се използват широко при проектирането на местоположението на елементите. опашка- училища, поликлиники, бензиностанции, водни помпи и др. Например, ако се планира да се построи поликлиника в определен квартал на града, тогава е по-целесъобразно да се разположи в точка от квартала, която разделя не дължината на квартала, а броя на жителите.

Съотношението на режима, медианата и средната аритметична стойност показва естеството на разпределението на чертата в съвкупността, позволява да се оцени симетрията на разпределението. Ако x Me тогава има дясна асиметрия на серията. С нормално разпределение Х -Аз - Мо.

К. Пиърсън, въз основа на подравняването на различни видове криви, установи, че за умерено асиметрични разпределения са валидни следните приблизителни връзки между средноаритметичната стойност, медианата и модата:

където Me е стойността на медианата; Mo - модна стойност; x arithm - стойността на средноаритметичното.

Ако има нужда да се проучи по-подробно структурата на вариационната серия, тогава се изчисляват характерните стойности, подобно на медианата. Такива стойности на характеристиките разделят всички разпределителни единици на равни числа, те се наричат ​​квантили или градиенти. Квантилите се подразделят на квартили, децили, процентили и т.н.

Квартилите разделят населението на четири равни части. Първият квартил се изчислява подобно на медианата, като се използва формулата за изчисляване на първия квартил, като предварително се определи първият тримесечен интервал:

където Qi е стойността на първия квартил; xQ^-долната граница на първия квартилен интервал; ч- ширина на първия тримесечен интервал; /, - честоти на интервалните серии;

Натрупана честота в интервала, предхождащ първия квартилен интервал; Jq ( - честота на първия квартилен интервал.

Първият квартил показва, че 25% от единиците на генералната съвкупност са по-малки от неговата стойност, а 75% са повече. Вторият квартил е равен на медианата, т.е. Q2 =аз

По аналогия се изчислява третият квартил, като предварително се намери третият тримесечен интервал:

където е долната граница на третия квартилен интервал; ч- ширина на третия квартилен интервал; /, - честоти на интервалните серии; /Х"-натрупана честота в предходния интервал

Ж

трети квартилен интервал; Jq - честота на третия квартилен интервал.

Третият квартил показва, че 75% от единиците на съвкупността са по-малки от неговата стойност, а 25% са повече.

Разликата между третия и първия квартил е интерквартилният интервал:

където Aq е стойността на интерквартилния интервал; Q 3 -стойността на третия квартил; Q, - стойността на първия квартил.

Децилите разделят населението на 10 равни части. Децил е стойност на характеристика в серия на разпределение, която съответства на десети от съвкупността. По аналогия с квартилите, първият децил показва, че 10% от единиците на съвкупността са по-малки от неговата стойност, а 90% са повече, а деветият децил разкрива, че 90% от единиците на съвкупността са по-малки от неговата стойност, а 10% са Повече ▼. Съотношението на деветия и първия децил, т.е. децилен коефициент, широко използван в изследването на диференциацията на доходите за измерване на съотношението на нивата на доходите на 10% от най-заможното и 10% от най-малко заможното население. Процентилите разделят класираната популация на 100 равни части. Изчисляването, значението и използването на процентилите са подобни на децилите.

Квартили, децили и други структурни характеристики могат да се определят графично по аналогия с медианата, използвайки кумулата.

За измерване на размера на вариацията се използват следните показатели: диапазон на вариация, средно линейно отклонение, стандартно отклонение и дисперсия. Големината на диапазона на вариация зависи изцяло от случайността на разпределението на екстремните членове на серията. Този индикатор представлява интерес в случаите, когато е важно да се знае каква е амплитудата на колебанията в стойностите на атрибута:

където Р-стойността на диапазона на вариация; x max - максималната стойност на атрибута; x tt -минималната стойност на характеристиката.

При изчисляване на диапазона на вариация стойността на по-голямата част от членовете на серията не се взема предвид, докато вариацията се свързва с всяка стойност на члена на серията. Този недостатък е свободен от показатели, които са средни стойности, получени от отклоненията на отделните стойности на даден признак от тяхната средна стойност: средното линейно отклонение и стандартното отклонение. Съществува пряка връзка между индивидуалните отклонения от средната стойност и колебанията на определен признак. Колкото по-силна е волатилността, толкова по-голям е абсолютният размер на отклоненията от средната стойност.

Средното линейно отклонение е средната аритметична стойност на абсолютните стойности на отклоненията на отделните опции от тяхната средна стойност.

Средно линейно отклонение за негрупирани данни

където / pr - стойността на средното линейно отклонение; x, - - стойността на характеристиката; Х - П -брой единици от съвкупността.

Средно линейно отклонение на групирани серии

където / vz - стойността на средното линейно отклонение; x, - стойността на характеристиката; Х -средната стойност на признака за изследваната популация; / - броят на единиците съвкупност в отделна група.

Знаците за отклонение в този случай се игнорират, в противен случай сумата от всички отклонения ще бъде равна на нула. Средното линейно отклонение в зависимост от групирането на анализираните данни се изчислява по различни формули: за групирани и негрупирани данни. Средното линейно отклонение, поради своята условност, отделно от другите показатели за вариация, се използва сравнително рядко на практика (по-специално за характеризиране на изпълнението на договорните задължения по отношение на равномерността на доставките; при анализа на оборота външната търговия, съставът на служителите, ритъмът на производство, качеството на продукта, като се вземат предвид технологичните особености на производството и др.).

Стандартното отклонение характеризира колко индивидуалните стойности на изследвания признак се отклоняват средно от средната стойност за съвкупността и се изразява в единици на изследвания признак. Стандартното отклонение, като една от основните мерки за вариация, се използва широко при оценка на границите на вариация на признак в хомогенна популация, при определяне на стойностите на ординатите на кривата на нормалното разпределение, както и при изчисления, свързани с организацията селективно наблюдениеи установяване на точността на характеристиките на извадката. Стандартното отклонение за негрупирани данни се изчислява по следния алгоритъм: всяко отклонение от средната стойност се повдига на квадрат, всички квадрати се сумират, след което сумата от квадратите се разделя на броя на членовете в серията и се взема квадратен корен от частното:

където Iip е средната стойност стандартно отклонение; Xj-стойност на характеристиката; х- средната стойност на признака за изследваната съвкупност; П -брой единици от съвкупността.

За групирани анализирани данни стандартното отклонение на данните се изчислява с помощта на претеглената формула

където - стойността на стандартното отклонение; Xj-стойност на характеристиката; Х -средната стойност на признака за изследваната популация; FX-броя на единиците от населението в определена група.

Изразът под корена и в двата случая се нарича дисперсия. По този начин дисперсията се изчислява като средния квадрат на отклоненията на стойностите на чертата от средната им стойност. За непретеглени (прости) стойности на характеристики, дисперсията се определя, както следва:

За претеглени характерни стойности

Има и специален опростен начин за изчисляване на дисперсията: в общи линии

за непретеглени (прости) стойности на характеристики за претеглени характеристични стойности
използвайки метода на броене от условна нула

където a 2 - стойността на дисперсията; x, - - стойността на характеристиката; Х -средната стойност на характеристиката, ч-стойност на групов интервал, t 1 -тегло (A =

Дисперсията има независим израз в статистиката и е един от най-важните показатели за вариация. Измерва се в единици, съответстващи на квадрата на мерните единици на изследвания признак.

Дисперсията има следните свойства.

  • 1. Дисперсията на постоянна стойност е нула.
  • 2. Намаляването на всички стойности на характеристиката с една и съща стойност на A не променя стойността на дисперсията. Това означава, че средният квадрат на отклоненията може да се изчисли не от дадените стойности на атрибута, а от техните отклонения от някакво постоянно число.
  • 3. Намаляване на всички стойности на функцията в кпъти намалява дисперсията в к 2 пъти, а стандартното отклонение - в кпъти, т.е. всички стойности на атрибута могат да бъдат разделени на някакво постоянно число (да речем, по стойността на интервала на серията), може да се изчисли стандартното отклонение и след това да се умножи по постоянно число.
  • 4. Ако изчислим средния квадрат на отклоненията от всяка стойност И присе различава до известна степен от средноаритметичната стойност, тогава тя винаги ще бъде по-голяма от средния квадрат на отклоненията, изчислени от средната аритметична стойност. В този случай средният квадрат на отклоненията ще бъде по-голям с точно определена стойност - с квадрата на разликата между средната и тази условно взета стойност.

Вариантът на алтернативен признак е наличието или отсъствието на изследваното свойство в единиците на съвкупността. Количествено, вариацията на алтернативен признак се изразява с две стойности: наличието на изследваното свойство в единица се означава с единица (1), а липсата му се означава с нула (0). Делът на единиците, които притежават изследваното свойство, се означава с P, а делът на единиците, които нямат това свойство, се означава с Ж.По този начин дисперсията на алтернативен атрибут е равна на произведението на съотношението на единиците, които имат дадено свойство (P) с пропорцията на единиците, които нямат това свойство (G).Най-голяма вариация на популацията се постига в случаите, когато част от популацията, която е 50% от общия обем на популацията, има признак, а другата част от популацията, също равна на 50%, няма тази характеристика, докато дисперсията достига максимална стойност от 0,25, m .e. P = 0,5, G= 1 - P \u003d 1 - 0,5 \u003d 0,5 и o 2 = 0,5 0,5 \u003d 0,25. Долната граница на този показател е равна на нула, което съответства на ситуация, при която няма промяна в съвкупността. Практическа употребавариация на алтернативен признак се състои в конструиране доверителни интервалипо време на вземане на проби.

Колкото по-малка е стойността на дисперсията и стандартното отклонение, толкова по-хомогенна е популацията и толкова по-типична ще бъде тя. средна стойност. В практиката на статистиката често се налага да се сравняват вариации на различни характеристики. Например, интересно е да се сравнят вариациите във възрастта на работниците и тяхната квалификация, трудовия стаж и заплатите, разходите и печалбата, трудовия стаж и производителността на труда и др. За такива сравнения показателите за абсолютна променливост на характеристиките са неподходящи: невъзможно е да се сравни променливостта на трудовия опит, изразена в години, с промяната на заплатите, изразена в рубли. За извършване на такива сравнения, както и сравнения на флуктуацията на един и същи признак в няколко популации с различни аритметични средни стойности, се използват показатели за вариация - коефициентът на колебание, линеен коефициентвариация и коефициент на вариация, които показват мярката на колебание на екстремни стойности около средната стойност.

Коефициент на трептене:

където V R -стойността на коефициента на трептене; Р- стойността на диапазона на вариация; Х -

Линеен коефициент на вариация".

където vj-стойността на линейния коефициент на вариация; аз-стойността на средното линейно отклонение; Х -средната стойност на признака за изследваната популация.

Коефициентът на вариация:

където ва-стойността на коефициента на вариация; a - стойността на стандартното отклонение; Х -средната стойност на признака за изследваната популация.

Коефициентът на колебание е процентът на диапазона на вариация спрямо средната стойност на изследвания признак, а линейният коефициент на вариация е отношението на средното линейно отклонение към средната стойност на изследвания признак, изразено в проценти. Коефициентът на вариация е процентът на стандартното отклонение спрямо средната стойност на изследваната характеристика. Като относителна стойност, изразена в проценти, коефициентът на вариация се използва за сравняване на степента на вариация на различни признаци. С помощта на коефициента на вариация се оценява хомогенността на статистическата съвкупност. Ако коефициентът на вариация е по-малък от 33%, тогава изследваната популация е хомогенна и вариацията е слаба. Ако коефициентът на вариация е по-голям от 33%, тогава изследваната популация е хетерогенна, вариацията е силна, а средната стойност е нетипична и не може да се използва като обобщаващ показател за тази популация. В допълнение, коефициентите на вариация се използват за сравняване на колебанията на един признак в различни популации. Например, за да се оцени разликата в трудовия стаж на работниците в две предприятия. Колкото по-голяма е стойността на коефициента, толкова по-значима е вариацията на характеристиката.

Въз основа на изчислените квартили също е възможно да се изчисли относителен показателтримесечна вариация по формулата

където Q 2 и

Интерквартилният диапазон се определя по формулата

Квартилното отклонение се използва вместо диапазона на вариация, за да се избегнат недостатъците, свързани с използването на екстремни стойности:

За вариационни серии с неравни интервали се изчислява и плътността на разпределението. Дефинира се като частното на съответната честота или честота, разделено на стойността на интервала. При сериите с неравни интервали се използват абсолютни и относителни плътности на разпределение. Абсолютната плътност на разпределение е честотата на единица дължина на интервала. Относителна плътност на разпределение - честотата на единица дължина на интервала.

Всичко по-горе е вярно за сериите на разпределение, чийто закон за разпределение е добре описан нормален законразпространение или близо до него.

Нека извикаме различни примерни стойности настроикипоредица от стойности и обозначават: х 1 , х 2, …. Първо, нека направим вариращиопции, т.е. подредете ги във възходящ или низходящ ред. За всяка опция е посочено собственото й тегло, т.е. число, което характеризира приноса на тази опция към общото население. Честотите или честотите действат като тежести.

Честота n i опция x iнаричано число, показващо колко пъти се появява тази опцияв рамка за вземане на проби.

Честота или относителна честота w i опция x iсе нарича число, равно на съотношението на честотата на даден вариант към сумата от честотите на всички варианти. Честотата показва каква част от единиците на извадката има даден вариант.

Поредицата от опции със съответните им тегла (честоти или честоти), записани във възходящ (или низходящ) ред, се нарича вариационни серии.

Вариационните редове са дискретни и интервални.

За дискретна вариационна серия са посочени точковите стойности на атрибута, за интервалната серия стойностите на атрибута са посочени под формата на интервали. Вариационните серии могат да показват разпределението на честотите или относителните честоти (честоти), в зависимост от това каква стойност е посочена за всяка опция - честота или честота.

Дискретни вариационни серии на честотното разпределениеизглежда като:

Честотите се намират по формулата , i = 1, 2, …, м.

w 1 +w 2 + … + w m = 1.

Пример 4.1. За даден набор от числа

4, 6, 6, 3, 4, 9, 6, 4, 6, 6

изграждане на дискретни вариационна серияразпределения на честотите и честотите.

Решение . Обемът на населението е н= 10. Серията с дискретно разпределение на честотата има формата

Интервалните серии имат подобна форма на запис.

Интервални вариационни серии на честотното разпределениесе записва като:

Сумата от всички честоти е общ бройнаблюдения, т.е. общ обем: н = н 1 +н 2 + … + нм .

Интервални вариационни серии на разпределението на относителните честоти (честоти)изглежда като:

Честотата се намира по формулата , i = 1, 2, …, м.

Сумата от всички честоти е равна на единица: w 1 +w 2 + … + w m = 1.

Най-често в практиката се използват интервални серии. Ако има много статистически извадкови данни и техните стойности се различават една от друга с произволно малка сума, тогава дискретната серия за тези данни ще бъде доста тромава и неудобна за по-нататъшно изследване. В този случай се използва групиране на данни, т.е. интервалът, съдържащ всички стойности на атрибута, се разделя на няколко частични интервала и след изчисляване на честотата за всеки интервал се получава интервална серия. Нека запишем по-подробно схемата за изграждане на интервална серия, като приемем, че дължините на частичните интервали ще бъдат еднакви.

2.2 Изграждане на интервална серия

За да изградите интервална серия, трябва:

Определете броя на интервалите;

Определете дължината на интервалите;

Определете местоположението на интервалите върху оста.

За определяне брой интервали к Съществува формула на Стърджис, според която

,

където н- обемът на съвкупността.

Например, ако има 100 характерни стойности (вариант), тогава се препоръчва да се вземе броят на интервалите, равен на интервалите, за да се изгради интервална серия.

Въпреки това много често на практика броят на интервалите се избира от самия изследовател, като се има предвид, че този брой не трябва да бъде много голям, така че серията да не е тромава, но и не много малка, за да не се загубят някои свойства на разпространение.

Дължина на интервала ч се определя по следната формула:

,

където хмакс и х min е най-големият и най-много малка стойностнастроики.

стойността Наречен в голям мащабред.

За да се конструират самите интервали, те действат по различни начини. Един от най прости начиние както следва. Стойността се приема като начало на първия интервал
. Тогава останалите граници на интервалите се намират по формулата . Очевидно краят на последния интервал а m+1 трябва да отговаря на условието

След като бъдат намерени всички граници на интервалите, се определят честотите (или честотите) на тези интервали. За да решат този проблем, те разглеждат всички опции и определят броя на опциите, които попадат в определен интервал. Ще разгледаме пълното изграждане на интервална серия, използвайки пример.

Пример 4.2. За следните статистики, записани във възходящ ред, изградете интервална серия с брой интервали, равен на 5:

11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

Решение. Обща сума н=50 вариантни стойности.

Броят на интервалите е посочен в условието на проблема, т.е. к=5.

Дължината на интервалите е
.

Нека да определим границите на интервалите:

а 1 = 11 − 8,5 = 2,5; а 2 = 2,5 + 17 = 19,5; а 3 = 19,5 + 17 = 36,5;

а 4 = 36,5 + 17 = 53,5; а 5 = 53,5 + 17 = 70,5; а 6 = 70,5 + 17 = 87,5;

а 7 = 87,5 +17 = 104,5.

За да определим честотата на интервалите, ние преброяваме броя на опциите, които попадат в този интервал. Например в първия интервал от 2,5 до 19,5 попадат опциите 11, 12, 12, 14, 14, 15. Техният брой е 6, следователно честотата на първия интервал е н 1=6. Честотата на първия интервал е . Във втория интервал от 19.5 до 36.5 попадат варианти 21, 21, 22, 23, 25, чийто брой е 5. Следователно честотата на втория интервал е н 2 =5 и честотата . След като намерихме по подобен начин честотите и честотите за всички интервали, получаваме следната интервална серия.

Интервалният ред на честотното разпределение има формата:

Сумата от честотите е 6+5+9+11+8+11=50.

Интервалният ред на честотното разпределение има формата:

Сумата от честотите е 0,12+0,1+0,18+0,22+0,16+0,22=1. ■

При построяването на интервални редове в зависимост от конкретните условия на разглежданата задача могат да се прилагат и други правила, а именно

1. Интервалните вариационни серии могат да се състоят от частични интервали с различна дължина. Неравномерните дължини на интервалите позволяват да се отделят свойствата на статистическа съвкупност с неравномерно разпределение на признак. Например, ако границите на интервалите определят броя на жителите в градовете, тогава е препоръчително в този проблем да се използват интервали, които са различни по дължина. Очевидно за малките градове е важна и малката разлика в броя на жителите, а за големите градове разлика от десетки и стотици жители не е съществена. интервални сериис неравномерни дължини на частични интервали се изучават главно в общата теория на статистиката и тяхното разглеждане е извън обхвата на това ръководство.

2. В математическа статистикапонякога се разглеждат интервални серии, за които лявата граница на първия интервал се приема за равна на –∞, а дясната граница на последния интервал е +∞. Това се прави с цел привеждане статистическо разпределениекъм теоретичното.

3. При конструиране на интервални серии може да се окаже, че стойността на някой вариант съвпада точно с границата на интервала. Най-доброто нещо, което можете да направите в този случай е следното. Ако има само едно такова съвпадение, считайте, че разглежданият вариант с неговата честота е попаднал в интервала, разположен по-близо до средата на интервалната поредица, ако има няколко такива варианта, тогава или всички те са приписани на интервалите към отдясно на тези варианти или всички отляво.

4. След определяне на броя на интервалите и тяхната дължина, разположението на интервалите може да се извърши по друг начин. Намерете средната аритметична стойност на всички разгледани стойности на опциите хвж. и изградете първия интервал по такъв начин, че тази примерна средна стойност да бъде вътре в някакъв интервал. Така получаваме интервала от хвж. – 0,5 чпреди хср. + 0,5 ч. След това наляво и надясно, добавяйки дължината на интервала, изграждаме останалите интервали, докато хмин. и х max няма да попада съответно в първия и последния интервал.

5. Интервални серии за големи числаУдобно е да пишете интервали вертикално, т.е. записвайте интервали не в първия ред, а в първата колона и честоти (или честоти) във втората колона.

Примерните данни могат да се разглеждат като стойности на някаква случайна променлива х. Случайната променлива има свой собствен закон на разпределение. От теорията на вероятностите е известно, че законът за разпределение на дискретна случайна променлива може да бъде определен като серия на разпределение, а за непрекъсната - с помощта на функцията на плътността на разпределението. Съществува обаче универсален закон за разпределение, който важи както за дискретно, така и за непрекъснато случайни променливи. Този закон на разпределение е даден като функция на разпределение Е(х) = П(х<х). За примерни данни можете да посочите аналог на функцията на разпределение - емпиричната функция на разпределение.


Подобна информация.


Концепцията за вариационна серия.Първата стъпка в систематизирането на материалите на статистическото наблюдение е преброяването на броя на единиците, които имат една или друга характеристика. След като подредим единиците във възходящ или низходящ ред на техния количествен признак и преброим броя на единиците с определена стойност на признака, получаваме вариационна серия. Вариационният ред характеризира разпределението на единиците от определена статистическа съвкупност по някакъв количествен признак.

Вариантната поредица се състои от две колони, лявата колона съдържа стойностите на променливия атрибут, наречени варианти и обозначени с (x), а дясната колона съдържа абсолютни числа, показващи колко пъти се среща всеки вариант. Стойностите в тази колона се наричат ​​честоти и се означават с (f).

Схематично серията от вариации може да бъде представена под формата на таблица 5.1:

Таблица 5.1

Тип вариационна серия

Опции (x)

Честоти (f)

В дясната колона могат да се използват и относителни показатели, характеризиращи дела на честотата на отделните варианти в общото количество честоти. Тези относителни показатели се наричат ​​честоти и условно се означават с , т.е. . Сумата от всички честоти е равна на единица. Честотите могат да бъдат изразени и като процент и тогава тяхната сума ще бъде равна на 100%.

Променливите знаци могат да бъдат от различен характер. Вариантите на някои знаци се изразяват в цели числа, например броят на стаите в апартамента, броят на издадените книги и др. Тези признаци се наричат ​​прекъснати или дискретни. Вариантите на други знаци могат да приемат всякакви стойности в определени граници, като например изпълнение на планираните цели, заплати и т.н. Тези знаци се наричат ​​непрекъснати.

Дискретни вариационни серии.Ако вариантите на вариационната серия са изразени като дискретни стойности, тогава такава вариационна серия се нарича дискретна, нейният вид е представен в табл. 5.2:

Таблица 5.2

Разпределение на студентите по оценки, получени на изпита

Оценки (x)

Брой студенти (f)

В % от общо ()

Характерът на разпределението в дискретни серии се изобразява графично като полигон на разпределение, фиг.5.1.

Ориз. 5.1. Разпределение на студентите по оценки, получени на изпита.

Интервални вариационни серии.За непрекъснатите характеристики вариационните серии се изграждат като интервални серии, т.е. стойностите на характеристиките в тях се изразяват като интервали "от и до". В този случай минималната стойност на характеристика в такъв интервал се нарича долна граница на интервала, а максималната стойност се нарича горна граница на интервала.

Интервалните вариационни серии се изграждат както за прекъснати признаци (дискретни), така и за такива, вариращи в голям диапазон. Интервалните редове могат да бъдат с равни и неравни интервали. В икономическата практика в по-голямата си част се използват неравни интервали, прогресивно нарастващи или намаляващи. Такава необходимост възниква особено в случаите, когато колебанията на знака се извършват неравномерно и в големи граници.

Помислете за типа интервални серии с равни интервали, табл. 5.3:

Таблица 5.3

Разпределение на работниците по продукция

Изход, тр. (Х)

Брой работници (f)

Кумулативна честота (f´)

Серията на интервалното разпределение е изобразена графично като хистограма, фиг.5.2.

Фиг.5.2. Разпределение на работниците по продукция

Натрупана (кумулативна) честота.На практика има нужда от преобразуване на серията за разпространение в кумулативни редове,изграден върху натрупаните честоти. Те могат да се използват за дефиниране на структурни средни стойности, които улесняват анализа на данните от сериите на разпределението.

Кумулативните честоти се определят чрез последователно добавяне към честотите (или честотите) на първата група от тези показатели на следващите групи от серията на разпределение. Кумулатите и огивите се използват за илюстриране на серията на разпространение. За да ги изградите, стойностите на дискретна характеристика (или краищата на интервалите) се отбелязват на абсцисната ос, а нарастващите суми на честотите (кумулативни) се отбелязват на ординатната ос, фиг.5.3.

Ориз. 5.3. Кумулативното разпределение на работниците по развитие

Ако скалите на честотите и вариантите са разменени, т.е. отразяват натрупаните честоти по абсцисната ос и стойностите на опциите по ординатната ос, тогава кривата, характеризираща промяната на честотите от група на група, ще се нарича огива на разпределението, Фиг. 5.4.

Ориз. 5.4. Огива разпределение на работници за производство

Вариационните редове с равни интервали осигуряват едно от най-важните изисквания за статистическите редове на разпределение, осигурявайки тяхната съпоставимост във времето и пространството.

Плътност на разпространение.Въпреки това, честотите на отделните неравни интервали в тези серии не са пряко сравними. В такива случаи, за да се осигури необходимата съпоставимост, се изчислява плътността на разпределение, т.е. определете колко единици във всяка група са на единица стойност на интервала.

При конструиране на графика на разпределение на вариационна серия с неравни интервали височината на правоъгълниците се определя пропорционално не на честотите, а на показателите за плътност на разпределението на стойностите на изследваната черта в съответните интервали.

Съставянето на вариационна серия и нейното графично представяне е първата стъпка в обработката на изходните данни и първата стъпка в анализа на изследваната съвкупност. Следващата стъпка в анализа на вариационните редове е определянето на основните обобщаващи показатели, наречени характеристики на реда. Тези характеристики трябва да дадат представа за средната стойност на атрибута в единиците на съвкупността.

средна стойност. Средната стойност е обобщена характеристика на изследвания признак в изследваната популация, отразяваща характерното му ниво за единица популация в конкретни условия на място и време.

Средната стойност винаги се назовава, има същата размерност като атрибута на отделните единици от съвкупността.

Преди да се изчислят средните стойности, е необходимо да се групират единиците от изследваната съвкупност, като се откроят качествено хомогенни групи.

Средната стойност, изчислена за съвкупността като цяло, се нарича обща средна, а за всяка група - групови средни.

Има два вида средни стойности: мощност (средно аритметично, средно хармонично, средно геометрично, средноквадратично); структурни (мода, медиана, квартили, децили).

Изборът на средната стойност за изчислението зависи от целта.

Видове средни мощности и методи за тяхното изчисляване.В практиката на статистическата обработка на събрания материал възникват различни проблеми, за чието решаване са необходими различни средни стойности.

Математическата статистика извлича различни средства от формулите за средна мощност:

къде е средната стойност; x - индивидуални опции (стойности на характеристиките); z - показател (при z = 1 - средно аритметично, z = 0 средно геометрично, z = - 1 - средно хармонично, z = 2 - средно квадратично).

Въпреки това, въпросът какъв тип средна стойност трябва да се прилага във всеки отделен случай се решава чрез специфичен анализ на изследваната популация.

Най-често срещаният тип средна стойност в статистиката е средноаритметично. Изчислява се в случаите, когато обемът на осреднения признак се формира като сума от неговите стойности за отделни единици от изследваната статистическа съвкупност.

В зависимост от характера на изходните данни средноаритметичната стойност се определя по различни начини:

Ако данните са негрупирани, изчислението се извършва по формулата на проста средна стойност

Изчисляване на средно аритметично в дискретна сериястава по формулата 3.4.

Изчисляване на средноаритметичната стойност в интервалния ред.В серия от интервални вариации, където средата на интервала условно се приема като стойност на характеристика във всяка група, средноаритметичната стойност може да се различава от средната стойност, изчислена от негрупирани данни. Освен това, колкото по-голям е интервалът в групите, толкова по-големи са възможните отклонения на средната стойност, изчислена от групираните данни, от средната стойност, изчислена от негрупираните данни.

Когато се изчислява средната стойност за серия от интервални вариации, за да се извършат необходимите изчисления, се преминава от интервалите към техните средни точки. След това изчислете средната стойност по формулата на среднопретеглената аритметична стойност.

Свойства на средната аритметична.Средната аритметична има някои свойства, които ни позволяват да опростим изчисленията, нека ги разгледаме.

1. Средно аритметичното на постоянните числа е равно на това постоянно число.

Ако x = a. Тогава .

2. Ако теглата на всички опции се променят пропорционално, т.е. увеличи или намали със същия брой пъти, тогава средноаритметичната стойност на новата серия няма да се промени от това.

Ако всички тегла f се намалят с k пъти, тогава .

3. Сумата от положителните и отрицателните отклонения на отделните варианти от средната стойност, умножена по теглата, е равна на нула, т.е.

Ако, тогава. Оттук.

Ако всички опции се намалят или увеличат с някакво число, тогава средноаритметичната стойност на новата серия ще намалее или се увеличи със същото количество.

Намалете всички опции хна а, т.е. х´ = ха.

Тогава

Средната аритметична стойност на първоначалната серия може да бъде получена чрез добавяне към намалената средна стойност на числото, извадено преди това от вариантите а, т.е. .

5. Ако всички опции са намалени или увеличени в кпъти, тогава средноаритметичното на новата серия ще намалее или се увеличи със същото количество, т.е. в кведнъж.

Нека тогава .

Следователно, т.е. за да се получи средната стойност на оригиналната серия, средноаритметичната стойност на новата серия (с намалени опции) трябва да се увеличи с кведнъж.

Средно хармонично.Средната хармонична е реципрочната на средната аритметична. Използва се, когато статистическата информация не съдържа честоти за отделни опции за популация, а е представена като техен продукт (M = xf). Средната хармонична стойност ще бъде изчислена по формула 3.5

Практическото приложение на средната хармонична стойност е да се изчислят някои индекси, по-специално индексът на цените.

Средна геометрична.При прилагане на средното геометрично отделните стойности на атрибута като правило са относителни стойности на динамиката, изградени под формата на верижни стойности, като съотношение към предишното ниво на всяко ниво в динамичната серия . Така средната стойност характеризира средния темп на растеж.

Средната геометрична стойност се използва и за определяне на равноотдалечената стойност от максималните и минималните стойности на атрибута. Например застрахователна компания сключва договори за предоставяне на услуги за автомобилно застраховане. В зависимост от конкретното застрахователно събитие, застрахователното плащане може да варира от 10 000 до 100 000 долара годишно. Средното застрахователно изплащане е щатски долари.

Средната геометрична стойност е стойността, използвана като средна на съотношенията или в серията на разпределение, представена като геометрична прогресия, когато z = 0. Тази средна стойност е удобна за използване, когато се обръща внимание не на абсолютните разлики, а на съотношенията на две числа.

Формулите за изчисление са както следва

където са варианти на осреднения признак; - продуктът на опциите; f– честота на опциите.

При изчисляването на средните годишни темпове на растеж се използва средната геометрична стойност.

Среден квадрат.Формулата на средния квадрат се използва за измерване на степента на колебание на отделните стойности на даден признак около средноаритметичната стойност в серията на разпределение. Така че, когато се изчисляват показателите за вариация, средната стойност се изчислява от квадратите на отклоненията на отделните стойности на признака от средната аритметична стойност.

Средната квадратична стойност се изчислява по формулата

В икономическите изследвания модифицираната форма на средния квадрат се използва широко при изчисляването на показатели за вариацията на даден признак, като дисперсия, стандартно отклонение.

Правилото на мнозинството.Съществува следната връзка между степенните средни стойности - колкото по-голям е показателят, толкова по-голяма е стойността на средната, Таблица 5.4:

Таблица 5.4

Връзка между средните стойности

z стойност

Съотношението между средните

Тази връзка се нарича правило на мажорността.

Структурни средни.За характеризиране на структурата на населението се използват специални показатели, които могат да бъдат наречени структурни средни. Тези мерки включват режим, медиана, квартили и децили.

Мода.Режим (Mo) е най-често срещаната стойност на характеристика в съвкупност. Mode е стойността на атрибута, която съответства на максималната точка на теоретичната крива на разпределение.

Модата се използва широко в търговската практика при изследване на потребителското търсене (при определяне на размерите на дрехи и обувки, които са в голямо търсене), регистрация на цените. Може да има общо няколко мода.

Изчисляване на режима в дискретна серия.В дискретна серия режимът е вариантът с най-висока честота. Помислете за намиране на режим в дискретна серия.

Изчисляване на модата в интервална серия.В интервалната вариационна серия централният вариант на модалния интервал се счита приблизително за мода, т.е. интервалът, който има най-висока честота (честота). В рамките на интервала е необходимо да се намери стойността на атрибута, който е режимът. За интервална серия режимът ще се определя по формулата

където е долната граница на модалния интервал; е стойността на модалния интервал; е честотата, съответстваща на модалния интервал; е честотата, предхождаща модалния интервал; е честотата на интервала след модала.

Медиана.Медианата () е стойността на характеристиката в средната единица на класираната серия. Класирана серия е серия, в която характерните стойности са записани във възходящ или низходящ ред. Или медианата е стойност, която разделя броя на подредена вариационна серия на две равни части: едната част има стойност на променлива характеристика, която е по-малка от средния вариант, а другата е голяма.

За да се намери медианата, първо се определя нейният пореден номер. За целта при нечетен брой единици се добавя една към сумата от всички честоти и всичко се дели на две. При четен брой единици медианата се намира като стойността на атрибута на единицата, чийто пореден номер се определя от общата сума на честотите, разделена на две. Познавайки поредния номер на медианата, е лесно да се намери нейната стойност от натрупаните честоти.

Изчисляване на медианата в дискретна серия.Според извадковото изследване са получени данни за разпределението на семействата по брой деца, табл. 5.5. За да определите медианата, първо определете нейния пореден номер

В тези семейства броят на децата е 2, следователно = 2. Така в 50% от семействата броят на децата не надвишава 2.

–натрупана честота, предхождаща медианния интервал;

От една страна, това е много положително свойство. в този случай се взема предвид ефектът от всички причини, засягащи всички единици от изследваната популация. От друга страна, дори едно наблюдение, което случайно е включено в първоначалните данни, може значително да изкриви идеята за нивото на развитие на изследваната черта в разглежданата популация (особено в кратки серии).

Квартили и децили.По аналогия с намирането на медианата във вариационни серии, може да се намери стойността на характеристика във всяка класирана серийна единица по ред. Така че, по-специално, може да се намери стойността на признак за единици, разделящи серията на 4 равни части, на 10 и т.н.

Квартили.Вариантите, които разделят класираната серия на четири равни части, се наричат ​​квартили.

В същото време се разграничават: долният (или първи) квартил (Q1) - стойността на признака в единицата на класираната серия, разделяща съвкупността в съотношение ¼ към ¾ и горната (или третата ) квартил (Q3) - стойността на характеристиката в единицата на класираната серия, разделяща съвкупността в съотношение ¾ към ¼.

– честоти на квартилните интервали (долни и горни)

Интервалите, съдържащи Q1 и Q3, се определят от натрупаните честоти (или честоти).

Децили.В допълнение към квартилите се изчисляват децили - опции, които разделят класираната серия на 10 равни части.

Те се означават с D, като първият децил D1 разделя серията в съотношение 1/10 и 9/10, вторият D2 - 2/10 и 8/10 и т.н. Те се изчисляват по същия начин като медианата и квартилите.

И медианата, и квартилите, и децилите принадлежат към така наречената ординална статистика, която се разбира като вариант, който заема определено ординално място в класирана серия.

Наборът от стойности на изследвания параметър в даден експеримент или наблюдение, класирани по величина (увеличаване или намаляване), се нарича вариационна серия.

Да приемем, че сме измерили кръвното налягане на десет пациенти, за да получим горен праг на BP: систолично налягане, т.е. само едно число.

Представете си, че поредица от наблюдения (статистическа съвкупност) на артериалното систолно налягане в 10 наблюдения има следната форма (Таблица 1):

маса 1

Компонентите на една вариационна серия се наричат ​​варианти. Вариантите представляват числената стойност на изследваната черта.

Изграждането на вариационна серия от статистически набор от наблюдения е само първата стъпка към разбиране на характеристиките на целия набор. След това е необходимо да се определи средното ниво на изследваната количествена характеристика (средното ниво на кръвния протеин, средното тегло на пациентите, средното време на начало на анестезията и др.)

Средното ниво се измерва с помощта на критерии, които се наричат ​​средни стойности. Средната стойност е обобщаваща числена характеристика на качествено хомогенни стойности, характеризираща с едно число цялата статистическа съвкупност по един признак. Средната стойност изразява общото, което е характерно за черта в даден набор от наблюдения.

Има три типа средни стойности, които се използват често: режим (), медиана () и средно аритметично ().

За да се определи всяка средна стойност, е необходимо да се използват резултатите от индивидуалните наблюдения, като се запишат под формата на вариационна серия (Таблица 2).

Мода- стойността, която се среща най-често в серия от наблюдения. В нашия пример режим = 120. Ако няма повтарящи се стойности в серията вариации, тогава те казват, че няма режим. Ако няколко стойности се повтарят еднакъв брой пъти, тогава най-малката от тях се приема като режим.

Медиана- стойността, разделяща разпределението на две равни части, централната или средната стойност на поредица от наблюдения, подредени във възходящ или низходящ ред. Така че, ако има 5 стойности във вариационната серия, тогава нейната медиана е равна на третия член на вариационната серия, ако има четен брой членове в серията, тогава медианата е средното аритметично от нейните две централни наблюдения, т.е. ако има 10 наблюдения в серията, тогава медианата е равна на средната аритметична от 5 и 6 наблюдения. В нашия пример.

Обърнете внимание на важна характеристика на режима и медианата: техните стойности не се влияят от числените стойности на екстремните варианти.

Средноаритметичноизчислено по формулата:

където е наблюдаваната стойност в -тото наблюдение и е броят на наблюденията. За нашия случай.

Средната аритметична има три свойства:

Средният заема средна позиция във вариационната серия. В строго симетричен ред.

Средната стойност е обобщаваща стойност и случайни колебания, разликите в отделните данни не се виждат зад средната стойност. Той отразява типичното, което е характерно за цялото население.

Сумата от отклоненията на всички варианти от средната е равна на нула: . Посочено е отклонението на варианта от средната стойност.

Серията вариации се състои от варианти и съответните им честоти. От десетте получени стойности числото 120 се среща 6 пъти, 115 - 3 пъти, 125 - 1 път. Честота () - абсолютният брой на индивидуалните опции в популацията, показващ колко пъти тази опция се среща в серията вариации.

Вариационните серии могат да бъдат прости (честоти = 1) или групирани съкратени, по 3-5 варианта всяка. Използва се проста серия с малък брой наблюдения (), групирани - с голям брой наблюдения ().

Споделете с приятели или запазете за себе си:

Зареждане...