При изчисляване на дисперсията се изчислява средната стойност на признака. Как да изчислим дисперсията на случайна променлива

Само тази характеристика обаче не е достатъчна за изследване случайна величина. Представете си двама стрелци, които стрелят по мишена. Единият стреля точно и улучва близо до центъра, а другият ... просто се забавлява и дори не се прицелва. Но смешното е, че средно аритметичнорезултатът ще бъде абсолютно същият като при първия стрелец! Тази ситуация условно се илюстрира със следните случайни променливи:

"Снайперското" математическо очакване е равно на , но за "интересния човек": - също е нула!

Следователно е необходимо да се определи количествено докъде разпръснатикуршуми (произволни стойности) спрямо центъра на целта ( математическо очакване). добре и разсейванепреведено от латински само като дисперсия .

Нека да видим как се дефинира това. числена характеристикана един от примерите от 1-ва част на урока:

Там открихме разочароващо математическо очакване на тази игра и сега трябва да изчислим нейната дисперсия, която означенопрез .

Нека да разберем колко далеч са "разпръснати" печалбите/загубите спрямо средната стойност. Очевидно за това трябва да изчислим различиямежду стойности на случайна променливаи тя математическо очакване:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Сега изглежда е необходимо да се обобщят резултатите, но този начин не е добър - поради причината, че трептенията вляво ще се компенсират взаимно с трептенията вдясно. Така например "аматьорският" стрелец (пример по-горе)разликите ще са , и когато се добавят, те ще дадат нула, така че няма да получим никаква оценка за разсейването на неговата стрелба.

За да избегнете това раздразнение, помислете модулиразлики, но по технически причини подходът се е утвърдил, когато те са повдигнати на квадрат. По-удобно е решението да се подреди в таблица:

И тук е необходимо да се изчисли среднопретеглена стойностстойността на квадратните отклонения. Какво е? Тяхно е очаквана стойност, което е мярката за разсейване:

определениедисперсия. Веднага става ясно от определението, че дисперсията не може да бъде отрицателна- вземете бележка за практика!

Нека си припомним как да намерим очакването. Умножете разликите на квадрат по съответните вероятности (Продължение на таблицата):
- образно казано, това е "теглителна сила",
и обобщете резултатите:

Не мислите ли, че на фона на печалбите резултатът се оказа твърде голям? Точно така – повдигахме на квадрат и за да се върнем към размерността на нашата игра, трябва да извадим корен квадратен. Тази стойност се нарича стандартно отклонение и означено гръцка буква"сигма":

Понякога това значение се нарича стандартно отклонение .

Какво е значението му? Ако се отклоним от математическото очакване наляво и надясно със средната стойност стандартно отклонение:

– тогава най-вероятните стойности на случайната променлива ще бъдат „концентрирани“ в този интервал. Какво всъщност виждаме:

Но така се случи, че при анализа на разсейването почти винаги се работи с концепцията за дисперсия. Нека да видим какво означава това във връзка с игрите. Ако при стрелците говорим за "точността" на попаденията спрямо центъра на мишената, то тук дисперсията характеризира две неща:

Първо, очевидно е, че с увеличаването на ставките дисперсията също се увеличава. Така например, ако увеличим 10 пъти, тогава математическото очакване ще се увеличи 10 пъти, а дисперсията ще се увеличи 100 пъти (щом е квадратична стойност). Но имайте предвид, че правилата на играта не са се променили! Само ставките се промениха, грубо казано, преди залагахме 10 рубли, сега 100.

Вторият, по-интересен момент е, че дисперсията характеризира стила на игра. Мислено фиксирайте ставките на играта на някакво определено нивои вижте какво има тук:

Игра с ниска вариация е предпазлива игра. Играчът е склонен да избира най-надеждните схеми, при които не губи/печели твърде много наведнъж. Например системата червено/черно в рулетката (вижте Пример 4 от статията случайни променливи) .

Игра с висока вариация. Тя често се нарича дисперсияигра. Това е приключенски или агресивен стил на игра, при който играчът избира "адреналинови" схеми. Да си спомним поне "Мартингейл", в която заложените суми са с порядъци по-големи от „тихата“ игра от предходния параграф.

Ситуацията в покера е показателна: има т.нар стегнатииграчи, които са склонни да бъдат предпазливи и да "разклащат" средствата си за игра (банкрол). Не е изненадващо, че банкролът им не се колебае много (ниска вариация). Обратно, ако даден играч има висока вариация, тогава той е агресорът. Той често поема рискове, прави големи залози и може както да разбие огромна банка, така и да се разпадне.

Същото се случва във Форекс и т.н. - има много примери.

Освен това във всички случаи няма значение дали играта е за стотинка или за хиляди долари. Всяко ниво има играчи с ниска и висока вариация. Е, за средната победа, както си спомняме, "отговорен" очаквана стойност.

Вероятно сте забелязали, че намирането на дисперсията е дълъг и труден процес. Но математиката е щедра:

Формула за намиране на дисперсията

Тази формула се извлича директно от определението за дисперсия и ние веднага я пускаме в обращение. Ще копирам табелата с нашата игра отгоре:

и намереното очакване .

Изчисляваме дисперсията по втория начин. Първо, нека намерим математическото очакване - квадратът на случайната променлива. от дефиниция на математическото очакване:

В такъв случай:

Така, според формулата:

Както се казва, усетете разликата. И на практика, разбира се, е по-добре да се прилага формулата (освен ако условието не изисква друго).

Ние владеем техниката на решаване и проектиране:

Пример 6

Намерете неговото математическо очакване, дисперсия и стандартно отклонение.

Тази задача се среща навсякъде и като правило остава без смислен смисъл.
Можете да си представите няколко крушки с цифри, които светят в лудница с определени вероятности :)

Решение: Удобно е основните изчисления да се обобщят в таблица. Първо записваме първоначалните данни в горните два реда. След това изчисляваме продуктите, след това и накрая сумите в дясната колона:

Всъщност почти всичко е готово. В третия ред беше начертано готово математическо очакване: .

Дисперсията се изчислява по формулата:

И накрая, стандартното отклонение:
- лично аз обикновено закръглявам до 2 знака след десетичната запетая.

Всички изчисления могат да се извършват на калкулатор, а още по-добре - в Excel:

Тук е трудно да сбъркаш :)

Отговор:

Тези, които желаят, могат да опростят живота си още повече и да се възползват от моите калкулатор (демонстрация), който не само моментално решава този проблем, но и изгражда тематична графика (Ела скоро). Програмата може изтеглете в библиотеката– ако сте изтеглили поне един учебен материалили да получите друг начин. Благодаря за подкрепата на проекта!

Няколко задачи за самостоятелно решение:

Пример 7

Изчислете дисперсията на случайната променлива от предишния пример по дефиниция.

И подобен пример:

Пример 8

Дискретна случайна променлива се дава от собствен закон за разпределение:

Да, стойностите на случайната променлива могат да бъдат доста големи (пример от реална работа), а тук по възможност използвайте Excel. Както, между другото, в пример 7 - той е по-бърз, по-надежден и по-приятен.

Решения и отговори в долната част на страницата.

В заключение на втората част на урока ще анализираме още една типична задача, дори може да се каже малък ребус:

Пример 9

Дискретна случайна променлива може да приема само две стойности: и , и . Известни са вероятността, математическото очакване и дисперсията.

Решение: Да започнем с неизвестна вероятност. Тъй като една случайна променлива може да приеме само две стойности, тогава сумата от вероятностите на съответните събития:

и тъй като , тогава .

Остава да намерим ..., лесно да се каже :) Но добре, започна се. По дефиниция на математическото очакване:
- заменете известните стойности:

- и нищо повече не може да се изтръгне от това уравнение, освен че можете да го пренапишете в обичайната посока:

или:

За по-нататъшните действия, мисля, че можете да се досетите. Нека създадем и решим системата:

Десетични знаци- това, разбира се, е пълно безобразие; умножете двете уравнения по 10:

и разделете на 2:

Така е много по-добре. От първото уравнение изразяваме:
(това е по-лесният начин)- заместител във второто уравнение:


Ние строим на квадрати направете опростявания:

Умножаваме по:

Като резултат, квадратно уравнение, намерете неговия дискриминант:
- перфектно!

и получаваме две решения:

1) ако , тогава ;

2) ако , тогава .

Първата двойка стойности удовлетворява условието. С голяма вероятност всичко е правилно, но въпреки това записваме закона за разпределение:

и извършете проверка, а именно намерете очакването:

.

Обратно, ако е неотрицателна а.е. функция, такава че , тогава има абсолютно непрекъсната вероятностна мярка за такава, която е нейната плътност.

    Промяна на мярката в интеграла на Лебег:

,

където е всяка функция на Борел, интегрируема по отношение на вероятностната мярка.

Дисперсия, видове и свойства на дисперсията Понятието дисперсия

Дисперсия в статистикатасе намира като стандартно отклонение на индивидуалните стойности на признака на квадрат от средното аритметично. В зависимост от първоначалните данни, тя се определя по формулите за проста и претеглена дисперсия:

1. проста вариация(за негрупирани данни) се изчислява по формулата:

2. Претеглена дисперсия (за серия от варианти):

където n - честота (фактор на повторяемост X)

Пример за намиране на дисперсията

Тази страница описва стандартен пример за намиране на дисперсията, можете също да разгледате други задачи за намирането й

Пример 1. Определяне на групова, средна за група, междугрупова и обща дисперсия

Пример 2. Намиране на дисперсията и коефициента на вариация в групираща таблица

Пример 3. Намиране на дисперсията в дискретна серия

Пример 4. Имаме следните данни за група от 20 задочни студенти. Необходимо е да се изгради интервална серия на разпределението на признака, да се изчисли средната стойност на признака и да се изследва неговата дисперсия

Нека изградим интервално групиране. Нека определим диапазона на интервала по формулата:

където X max е максималната стойност на групиращия признак; X min е минималната стойност на групиращия признак; n е броят на интервалите:

Приемаме n=5. Стъпката е: h \u003d (192 - 159) / 5 \u003d 6,6

Нека направим интервално групиране

За по-нататъшни изчисления ще изградим спомагателна таблица:

X "i - средата на интервала. (например средата на интервала 159 - 165,6 \u003d 162,3)

Средният растеж на учениците се определя по формулата на среднопретеглената аритметична стойност:

Определяме дисперсията по формулата:

Формулата може да се преобразува по следния начин:

От тази формула следва, че дисперсията е разликата между средната стойност на квадратите на опциите и квадрата и средната стойност.

Дисперсия в вариационна серия с равни интервали по метода на моментите може да се изчисли по следния начин, като се използва второто свойство на дисперсия (разделяне на всички опции на стойността на интервала). Дефиниция на дисперсия, изчислено по метода на моментите, по следната формула отнема по-малко време:

където i е стойността на интервала; A - условна нула, която е удобна за използване в средата на интервала с най-висока честота; m1 е квадратът на момента от първи ред; m2 - момент от втори ред

Дисперсия на характеристиките (ако в статистическата популация атрибутът се променя по такъв начин, че има само две взаимно изключващи се опции, тогава такава променливост се нарича алтернативна) може да се изчисли по формулата:

Замествайки в тази дисперсионна формула q = 1- p, получаваме:

Видове дисперсия

Обща дисперсияизмерва вариацията на даден признак в цялата популация като цяло под влиянието на всички фактори, които причиняват тази вариация. Тя е равна на средния квадрат на отклоненията на отделните стойности на атрибута x от общата средна стойност x и може да се определи като проста дисперсия или претеглена дисперсия.

Вътрешногрупова дисперсия характеризира случайна вариация, т.е. част от вариацията, която се дължи на влиянието на неотчетени фактори и не зависи от знака-фактор, лежащ в основата на групирането. Тази дисперсия е равна на средния квадрат на отклоненията на отделните стойности на атрибута в групата X от средната аритметична на групата и може да се изчисли като проста дисперсия или като претеглена дисперсия.

По този начин, мерки за дисперсия в рамките на групатавариация на признак в група и се определя по формулата:

където xi - средна група; ni е броят на единиците в групата.

Например, вътрешногруповите отклонения, които трябва да бъдат определени в задачата за изследване на ефекта от квалификацията на работниците върху нивото на производителността на труда в цеха, показват вариации в производството във всяка група, причинени от всички възможни фактори (техническо състояние на оборудването, наличие на инструменти и материали, възраст на работниците, интензивност на труда и др.), с изключение на разликите в квалификационната категория (в рамките на групата всички работници имат една и съща квалификация).

Средната стойност на вариациите в рамките на групата отразява случайната вариация, т.е. онази част от вариацията, която е настъпила под влиянието на всички други фактори, с изключение на фактора за групиране. Изчислява се по формулата:

Междугрупова дисперсияхарактеризира систематичната вариация на резултантния признак, която се дължи на влиянието на фактора на признака, лежащ в основата на групирането. Тя е равна на средния квадрат на отклоненията на груповите средни стойности от общата средна стойност. Междугрупова дисперсияизчислено по формулата:

За групирани данни остатъчна дисперсия - средна стойност на вътрешногруповите дисперсии:

Където σ 2 j е вътрешногруповата дисперсия на j -тата група.

За негрупирани данни остатъчна дисперсияе мярка за точността на приближението, т.е. приближаване на регресионната линия към оригиналните данни:
където y(t) е прогнозата според уравнението на тенденцията; y t – начална серия от динамика; n е броят на точките; p е броят на коефициентите на регресионното уравнение (броят на обяснителните променливи).
В този пример се нарича безпристрастна оценка на дисперсията.

Пример #1. Разпределението на работниците от три предприятия от една асоциация по тарифни категории се характеризира със следните данни:

Категория на заплатата на работникаБроят на работниците в предприятието
предприятие 1предприятие 2предприятие 3
1 50 20 40
2 100 80 60
3 150 150 200
4 350 300 400
5 200 150 250
6 150 100 150

Определете:
1. дисперсия за всяко предприятие (вътрешногрупова дисперсия);
2. средна стойност на вътрешногруповите дисперсии;
3. междугрупова дисперсия;
4. обща дисперсия.

Решение.
Преди да се пристъпи към решаване на проблема, е необходимо да се установи коя характеристика е ефективна и коя факторна. В разглеждания пример действащият признак е "Тарифна категория", а факторният признак е "Номер (име) на предприятието".
След това имаме три групи (предприятия), за които е необходимо да се изчисли средната групова и вътрешногруповата дисперсия:


Търговско дружествосредна група,дисперсия в рамките на групата,
1 4 1,8

Средната стойност на вътрешногруповите дисперсии ( остатъчна дисперсия), изчислено по формулата:


където можете да изчислите:
или:


тогава:
Общата дисперсия ще бъде равна на: s 2 \u003d 1,6 + 0 \u003d 1,6.
Общата дисперсия може също да се изчисли с помощта на една от следните две формули:

При решаване практически задачичесто човек трябва да работи с функция, която приема само две алтернативни стойности. В този случай те не говорят за тежестта на определена стойност на характеристика, а за нейния дял в съвкупността. Ако съотношението единици на популацията, които притежават изследваната характеристика, се означи с " Р", а не притежаване - чрез" р”, тогава дисперсията може да се изчисли по формулата:
s 2 = p×q

Пример #2. Според данните за развитието на шестима работници от бригадата, определете междугруповата вариация и оценете влиянието на работната смяна върху тяхната производителност на труда, ако общата вариация е 12,2.

No на работната бригадаРаботна мощност, бр.
в първа смянана 2-ра смяна
1 18 13
2 19 14
3 22 15
4 20 17
5 24 16
6 23 15

Решение. Изходни данни

хf1f2е 3f4f5f6Обща сума
1 18 19 22 20 24 23 126
2 13 14 15 17 16 15 90
Обща сума 31 33 37 37 40 38

След това имаме 6 групи, за които е необходимо да се изчисли груповата средна и вътрешногруповата дисперсия.
1. Намерете средните стойности на всяка група.







2. Намерете средния квадрат на всяка група.







Обобщаваме резултатите от изчислението в таблица:
Номер на групатаГрупово средноВътрешногрупова дисперсия
1 1.42 0.24
2 1.42 0.24
3 1.41 0.24
4 1.46 0.25
5 1.4 0.24
6 1.39 0.24

3. Вътрешногрупова дисперсияхарактеризира промяната (вариацията) на изследваната (резултатна) черта в рамките на групата под влияние на всички фактори, с изключение на фактора, който е в основата на групирането:
Изчисляваме средната стойност на вътрешногруповите дисперсии по формулата:


4. Междугрупова дисперсияхарактеризира промяната (вариацията) на изследваната (резултатна) черта под влиянието на фактор (факторна черта), лежащ в основата на групирането.
Междугруповата дисперсия се определя като:

където


Тогава

Обща дисперсияхарактеризира промяната (вариацията) на изследваната (резултатна) черта под въздействието на всички фактори (факторни черти) без изключение. По условието на задачата то е равно на 12,2.
емпиричен корелационна връзка измерва каква част от общата флуктуация на резултантния атрибут е причинена от изследвания фактор. Това е съотношението на факторната дисперсия към общата дисперсия:

Определяме емпиричната корелационна връзка:

Връзките между характеристиките могат да бъдат слаби или силни (близки). Техните критерии се оценяват по скалата на Chaddock:
0,1 0,3 0,5 0,7 0,9 В нашия пример връзката между функция Y фактор X е слаба
Коефициент на определяне.

Нека да определим коефициента на детерминация:

По този начин 0,67% от вариацията се дължи на разлики между признаците, а 99,37% се дължи на други фактори.
Заключение: в този случай продукцията на работниците не зависи от работата в определена смяна, т.е. влиянието на работната смяна върху тяхната производителност на труда не е значително и се дължи на други фактори.

Пример #3. Въз основа на средната стойност заплатии квадратни отклонения от неговата стойност за две групи работници, намерете общата дисперсия, като приложите правилото за добавяне на дисперсии:

Решение:
Средна стойност на дисперсиите в рамките на групата

Междугруповата дисперсия се определя като:


Общата дисперсия ще бъде: 480 + 13824 = 14304

Нека изчислим вГОСПОЖИЦАEXCELдисперсия и стандартно отклонениепроби. Ние също изчисляваме дисперсията на случайна променлива, ако е известно нейното разпределение.

Първо помислете дисперсия, тогава стандартно отклонение.

Дисперсия на извадката

Дисперсия на извадката (дисперсия на извадката,пробадисперсия) характеризира разпространението на стойностите в масива спрямо .

И трите формули са математически еквивалентни.

От първата формула се вижда, че дисперсия на извадкатае сумата от квадратите на отклоненията на всяка стойност в масива от средноразделено на размера на извадката минус 1.

дисперсия пробиизползва се функцията DISP(), бълг. името на VAR, т.е. ВАРИАНЦИЯ. От MS EXCEL 2010 се препоръчва използването на неговия аналог DISP.V() , англ. името ВАРС, т.е. Дисперсия на пробата. Освен това, започвайки от версията на MS EXCEL 2010, има функция DISP.G (), англ. VARP име, т.е. Популация VARIance, която изчислява дисперсияза население . Цялата разлика се свежда до знаменателя: вместо n-1 като DISP.V(), DISP.G() има само n в знаменателя. Преди MS EXCEL 2010 функцията VARP() се използваше за изчисляване на дисперсията на популацията.

Дисперсия на извадката
=КВАДРАТ(Проба)/(БРОЙ(Проба)-1)
=(SUMSQ(Извадка)-БРОЙ(Извадка)*СРЕДНО(Извадка)^2)/ (БРОЙ(Извадка)-1)- обичайната формула
=SUM((Пример -СРЕДНО(Пример))^2)/ (БРОЙ(Пример)-1) –

Дисперсия на извадкатае равно на 0 само ако всички стойности са равни една на друга и съответно са равни средна стойност. Обикновено от повече стойност дисперсия, толкова по-голямо е разпространението на стойностите в масива.

Дисперсия на извадкатае точкова оценка дисперсияразпределение на случайната променлива, от която проба. Относно строителството доверителни интервали при оценяване дисперсияможе да се прочете в статията.

Дисперсия на случайна променлива

Да изчисля дисперсияслучайна променлива, трябва да я знаете.

За дисперсияслучайната променлива X често използва нотацията Var(X). дисперсияе равно на квадрата на отклонението от средната E(X): Var(X)=E[(X-E(X)) 2 ]

дисперсияизчислено по формулата:

където x i е стойността, която може да приеме случайната променлива, а μ е средната стойност (), p(x) е вероятността случайната променлива да приеме стойността x.

Ако случайната променлива има , тогава дисперсияизчислено по формулата:

Измерение дисперсиясъответства на квадрата на мерната единица на първоначалните стойности. Например, ако стойностите в извадката са измервания на теглото на частта (в kg), тогава размерът на дисперсията ще бъде kg 2 . Това може да бъде трудно за тълкуване, следователно, за да се характеризира разпространението на ценностите, стойност, равна на корен квадратенот дисперсиястандартно отклонение.

Някои имоти дисперсия:

Var(X+a)=Var(X), където X е случайна променлива, а a е константа.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2=E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Това свойство на дисперсия се използва в статия за линейна регресия.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), където X и Y са случайни променливи, Cov(X;Y) е ковариацията на тези случайни променливи.

Ако случайните променливи са независими, тогава техните ковариацияе 0 и следователно Var(X+Y)=Var(X)+Var(Y). Това свойство на дисперсията се използва в изхода.

Нека покажем, че за независими величини Var(X-Y)=Var(X+Y). Наистина Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Това свойство на дисперсията се използва за начертаване.

Примерно стандартно отклонение

Примерно стандартно отклонениее мярка за това колко широко са разпръснати стойностите в извадката спрямо техните .

По дефиниция, стандартно отклонениее равно на корен квадратен от дисперсия:

Стандартно отклонениене взема предвид големината на стойностите в вземане на проби, а само степента на разпръскване на ценностите около тях средата. Нека вземем пример, за да илюстрираме това.

Нека изчислим стандартното отклонение за 2 проби: (1; 5; 9) и (1001; 1005; 1009). И в двата случая s=4. Очевидно е, че съотношението на стандартното отклонение към стойностите на масива е значително различно за пробите. За такива случаи използвайте Коефициентът на вариация(Coefficient of Variation, CV) - отношение стандартно отклонениедо средното аритметика, изразено като процент.

В MS EXCEL 2007 и по-стари версии за изчисление Примерно стандартно отклонениеизползва се функцията =STDEV(), бълг. името STDEV, т.е. стандартно отклонение. От MS EXCEL 2010 се препоръчва използването на неговия аналог = STDEV.B () , англ. име STDEV.S, т.е. Примерно стандартно отклонение.

Освен това, започвайки от версията на MS EXCEL 2010, има функция STDEV.G () , англ. име STDEV.P, т.е. Популация Стандартно отклонение, което изчислява стандартно отклонениеза население. Цялата разлика се свежда до знаменателя: вместо n-1 като STDEV.V(), STDEV.G() има само n в знаменателя.

Стандартно отклонениеможе също да се изчисли директно от формулите по-долу (вижте примерния файл)
=SQRT(SQUADROTIV(Проба)/(БРОЙ(Проба)-1))
=SQRT((SUMSQ(Проба)-БРОЙ(Проба)*СРЕДНО(Проба)^2)/(БРОЙ(Проба)-1))

Други мерки за дисперсия

Функцията SQUADRIVE() изчислява с umm на квадратни отклонения на стойностите от техните средата. Тази функция ще върне същия резултат като формулата =VAR.G( проба)*ПРОВЕРКА( проба) , където проба- препратка към диапазон, съдържащ масив от примерни стойности (). Изчисленията във функцията QUADROTIV() се правят по формулата:

Функцията SROOT() също е мярка за разсейването на набор от данни. Функцията SIROTL() изчислява средната стойност на абсолютните стойности на отклоненията на стойностите от средата. Тази функция ще върне същия резултат като формулата =SUMPRODUCT(ABS(Пример-СРЕДЕН(Пример)))/БРОЙ(Пример), където проба- препратка към диапазон, съдържащ масив от примерни стойности.

Изчисленията във функцията SROOTKL () се правят по формулата:

Дисперсията в статистиката се определя като стандартното отклонение на индивидуалните стойности на характеристика на квадрат от средното аритметично. Често срещан начин за изчисляване на квадратните отклонения на опциите от средната стойност и след това осредняването им.

В икономическия и статистически анализ е обичайно да се оценява вариацията на характеристика, като се използва най-често стандартното отклонение, което е корен квадратен от дисперсията.

(3)

Той характеризира абсолютната флуктуация на стойностите на атрибута на променливата и се изразява в същите единици като вариантите. В статистиката често става необходимо да се сравняват вариациите на различни характеристики. За такива сравнения се използва относителен показател за вариация, коефициентът на вариация.

Дисперсионни свойства:

1) ако извадите произволно число от всички опции, тогава дисперсията няма да се промени;

2) ако всички стойности на варианта се разделят на някакво число b, тогава дисперсията ще намалее с b^2 пъти, т.е.

3) ако изчислите средния квадрат на отклоненията от произволно число с неравно аритметично средно, тогава той ще бъде по-голям от дисперсията. В този случай, чрез точно определена стойност на квадрат от разликата между средната стойност на поз.

Дисперсията може да се определи като разликата между средната стойност на квадрат и средната стойност на квадрат.

17. Групови и междугрупови вариации. Правило за добавяне на дисперсии

Ако статистическата популация е разделена на групи или части според изследваната характеристика, тогава за такава популация могат да се изчислят следните видове дисперсии: групова (частна), средна за групата (частна) и междугрупова.

Обща дисперсия- отразява вариацията на даден признак поради всички условия и причини, действащи в дадена статистическа съвкупност.

Групова дисперсия- е равна на средния квадрат на отклоненията на отделните стойности на атрибута в рамките на групата от средната аритметична стойност на тази група, наречена групова средна стойност. В този случай средното за групата не съвпада с общото средно за цялата популация.

Груповата вариация отразява вариацията на черта само поради условията и причините, действащи в групата.

Средни групови дисперсии- се определя като средноаритметично претеглено на груповите дисперсии, като теглата са обемите на групите.

Междугрупова дисперсия- е равно на средния квадрат на отклоненията на груповите средни от общата средна стойност.

Междугруповата вариация характеризира вариацията на резултатния атрибут, дължаща се на групиращия атрибут.

Между разглежданите типове дисперсии съществува определена връзка: общата дисперсия е равна на сумата от средната групова и междугрупова дисперсия.

Тази връзка се нарича правило за добавяне на дисперсии.

18. Динамичен ред и съставните му елементи. Видове динамични редове.

Серии в статистиката- това са цифрови данни, показващи дали дадено явление се променя във времето или пространството и дават възможност за статистическо съпоставяне на явленията както в процеса на тяхното развитие във времето, така и в различни формии видове процеси. Благодарение на това е възможно да се открие взаимната зависимост на явленията.

Процесът на развитие на движението на обществените явления във времето в статистиката обикновено се нарича динамика. За показване на динамиката се изграждат серии от динамики (хронологични, времеви), които са серии от променящи се във времето стойности на статистически показател (например брой осъдени над 10 години), разположени в хронологичен ред. Техните съставни елементи са числените стойности на даден показател и периодите или моментите от времето, за които се отнасят.

Най-важната характеристика на времевия ред- техният размер (обем, стойност) на това или онова явление, постигнато в определен период или в определен момент. Съответно, величината на членовете на серията от динамика е нейното ниво. Разграничетеначално, средно и крайно ниво на динамичния ред. Първо нивопоказва стойността на първия, крайният - стойността на последния член на серията. Средно нивопредставлява средния хронологичен вариационен диапазон и се изчислява в зависимост от това дали времевият ред е интервален или мигновен.

Друга важна характеристика на динамичните серии- времето, изминало от първоначалното до последното наблюдение, или броя на тези наблюдения.

Има различни видове времеви редове, те могат да бъдат класифицирани според следните критерии.

1) В зависимост от начина на изразяване на нивата, сериите от динамика се разделят на серии от абсолютни и производни показатели (относителни и средни стойности).

2) В зависимост от това как нивата на реда изразяват състоянието на явлението в определени моменти от време (в началото на месеца, тримесечието, годината и т.н.) или неговата стойност за определени интервали от време (например за ден, месец, година и т.н.) и т.н.), разграничават съответно момент и интервални сериидинамика. Моментните серии в аналитичната работа на правоприлагащите органи се използват сравнително рядко.

В теорията на статистиката динамиката се разграничава и по редица други класификационни признаци: в зависимост от разстоянието между нивата - с равноотдалечени нива и неравномерни във времето нива; в зависимост от наличието на основната тенденция на изследвания процес – стационарни и нестационарни. При анализиране времеви редовеизхождайте от следните нива на серията, представени като компоненти:

Y t \u003d TP + E (t)

където TR е детерминистичен компонент, който определя общата тенденция на промяна във времето или тенденция.

E (t) е случаен компонент, причиняващ колебания на нивото.

Споделете с приятели или запазете за себе си:

Зареждане...