Концепцията за вариационни серии. класиран ред

Ранжиране- процедурата за подреждане на всякакви обекти във възходящ или низходящ ред на някои от техните свойства, при условие че притежават това свойство.

Можете да класирате:

Състояние по стандарт на живот, раждаемост, безработица;

Професии по престиж;

Стоки според предпочитанията на потребителя;

Респонденти по политическа дейност, финансова ситуация;

Обектите за класиране са тези обекти, които са директно подредени. Базово класиране(ranking attribute) - свойството, по което се подреждат обектите. В резултат на класирането получаваме класирана серия, в която на всеки обект е присвоен свой индивид ранг- място на обекта в класирания ред. Броят на местата и съответно броят на ранговете в класираната серия е равен на броя на обектите.

Видове класирани серии:

1) всеки обект има стойност на характеристика, която е различна от стойностите на характеристиката на други обекти, тогава на всеки обект от класираната серия се присвоява собствен ранг, различен от друг обект;

2) няколко обекта имат една и съща стойност на атрибута, тогава на тези обекти в класираната серия се присвояват еднакви рангове, изчислени по определена формула. В този случай класираната серия се нарича класирана серия със свързани рангове. При решаване на задачи ще се дава първи ранг най-висока стойностзнак. Свързаният ранг се изчислява като средната стойност на местата, заети от обекти, които имат същата стойност на характеристиката. Установяването на статистическа връзка за 2 или повече класирани серии се извършва с помощта на коефициенти за рангвръзки- такива коефициенти, които ви позволяват да изчислите степента на последователност в класирането на едни и същи обекти по две различни основания (характеристики). Най-често срещаният коефициент на рангова връзка ( рангова корелация) е ρ-коефициентът на Спирман.

Да кажем, че n обекта са подредени според атрибута x и според атрибута y. Позволявам

Мярката за несъответствие на ранговете на i-тия обект: d i = R x i - R y i

Имоти:

Промени в диапазона от -1 до 1;

Po = 1, ако има пълна последователност на класираната серия; ранговете на един и същи обект са еднакви по две основания.

Po = -1, ако има пълно несъответствие на класираната серия; тази ситуация възниква, ако ранкинг серията има противоположна посока: R x i – 1 2 3 4 5; R y i – 5 4 3 2 1.

Забележка: може да се изчисли за два вида равни (ако всеки обект има свой собствен ранг и ако има свързани рангове).

Проверка на хипотезата за статистическа значимостρ-коефициент на Спирман.

H 0: ρ gs = 0

H 1: ρ gs ≠ 0

Нулевата хипотеза винаги гласи, че ρ е равно на 0. Алтернативната хипотеза е, че стойността на ρ е различна от 0.

Ниво на значимост като в таблиците за непредвидени обстоятелства.

състояние НО б AT Ж д д И У И
Качеството на живот 6,8 7,0 6,5 5,9 4,6 5,7 4,5 5,8 4,0
Безработица 20,3 18,0 19,8 23,4 21,6 20,8
ранг x
ранг y
|d i |
d 2 i
Σ d 2 i

τ - Кендъле разликата между вероятностите за правилен и неправилен ред за две наблюдения, извлечени на случаен принцип от популацията, при условие че няма свързани рангове. Имоти:

Промени от -1 до 1;

Ако характеристиките x и y са статистически независими, тогава коефициентът τ става 0; ако τ е равно на 0, това не означава, че характеристиките са статистически независими;

Ако τ е равно на 1, това означава, че има пълна пряка статистическа връзка между характеристиките или класираните серии са напълно последователни; ако τ е -1, това означава, че има пълна статистическа обратна връзка или класираните серии са непоследователни.

S е общият брой двойки обекти с постоянен правилен ред и за двата обекта. D е общият брой двойки обекти с непоследователен грешен ред и за двата обекта.

Тестване на хипотезата за статистическата значимост на коефициента τ:

H 0: τ gs = 0

H 1: τ gs ≠ 0

Коефициентът τ е статистически значим, ако стойността му за HS е различна от 0.

|Z H | > Z cr => H 1

Ако изградим класирана серия за малък брой обекти, тогава потвърждението на нулевата хипотеза ни казва, че трябва да изследваме голямо количествообекти.

Ако са изследвани достатъчен брой обекти, тогава потвърждаването на нулевата хипотеза показва, че няма връзка между характеристиките.

Множествен коефициентрангова връзка

Използва се в случаите, когато е необходимо да се измери връзката между повече от 2 класирани серии (например, когато искаме да оценим съответствието на експертните мнения (повече от 2) при оценка 1 и едни и същи обекти).

S е сумата от квадратните отклонения на стойностите на ранга за реда от средния ранг за цялата популация. k 2 – брой променливи (брой експерти). n е броят на класираните обекти.

Първата стъпка в статистическото изследване на вариацията е изграждането на вариационна серия - подредено разпределение на популационните единици според нарастващи (по-често) или намаляващи (по-рядко) стойности на признак и преброяване на броя на единиците с една или друга стойност на чертата.

Има три форми на вариационни серии: диапазонни, дискретни, интервални. Вариационната серия често се нарича серия на разпределение. Този термин се използва при изучаване на вариациите както на количествени, така и на неколичествени признаци. Серията на разпространение е структурна група (глава 6).

Класирана серия е списък на отделни единици от популацията във възходящ (низходящ) ред на изследваната характеристика.

Следва информация за големи банкиПетербург, класиран по собствен капитал към 01.10.1999 г

Име на банката Собствен капитал, милиони рубли Балтонексим банка 169

Банка Санкт Петербург 237

Петровски 268

Балтийско 290

Промстройбанк 1007

Ако броят на съвкупните единици е достатъчно голям, класираният ред става тромав и изграждането му, дори с помощта на компютър, отнема дълго време. В такива случаи вариационната серия се конструира чрез групиране на единиците от популацията според стойностите на изследваната черта.


Определяне на броя на групите

Броят на групите в серия от дискретни вариации се определя от броя на действително съществуващите стойности на променливия атрибут. Ако признакът приема дискретни стойности, но техният брой е много голям (например броят на добитъка на 1 януари на годината в различни селскостопански предприятия може да варира от нула до десетки хиляди глави), тогава се изгражда интервална вариационна серия . Също така е конструирана поредица от интервални вариации, за да се изследват характеристики, които могат да приемат всякакви, както цели, така и дробни стойности в

области на неговото съществуване. Това са например рентабилността на продадената продукция, себестойността на единица продукция, доходът на жител на града, делът на хората с висше образованиесред населението на различни територии и като цяло всички вторични характеристики, чиито стойности се изчисляват чрез разделяне на стойността на една основна характеристика на стойността на друга (виж Глава 3).

Серията от интервални вариации е таблица, състояща се от две колони (или редове) - интервалите на признака, чиято вариация се изследва, и броя на единиците от популацията, попадащи в този интервал (честоти), или съотношението на този брой от общата популация (честоти).

Най-често се използват два вида интервални вариационни серии: с еднакъв интервал и с еднаква честота. Серията с равен интервал се използва, ако вариацията на признака не е много силна, т.е. за еднородна съвкупност, чието разпределение по даден признак е близко до нормален закон. (Такава серия е представена в таблица 5.6.) Серия с еднаква честота се използва, ако вариацията на характеристиката е много силна, но разпределението не е нормално, а например хиперболично (таблица 5.5).

Когато е построен, той е интервални серииброят на групите е избран така, че разнообразието от стойности на атрибута в съвкупността да е достатъчно отразено и в същото време редовността на разпределението, неговата форма не е изкривена от случайни честотни колебания. Ако има твърде малко групи, няма да има модел на вариация; ако има твърде много групи, произволните честотни скокове ще изкривят формата на разпределението.



Границите на интервалите могат да бъдат зададени по различни начини: горната граница на предишния интервал повтаря долната граница на следващия, както е показано в табл. 5.5, или не се повтаря.

В последния случай вторият интервал ще бъде обозначен като 15.1-20, третият - като 20.1-25 и т.н., т.е. предполага се, че всички стойности на добива са задължително закръглени до една десета. Освен това възниква нежелано усложнение със средата на интервала 15.1-20, който, строго погледнато, вече ще бъде равен не на 17.5, а на 17.55; съответно при замяна на закръгления интервал 40-60 с 40.1-60, вместо закръглената стойност на средата му 50, получаваме 50.5. Следователно е за предпочитане да се оставят интервали с повтаряща се закръглена граница и да се съгласите, че единиците на популацията, които имат стойност на характеристика, равна на границата на интервала, са включени в интервала, където това точна стойностпосочен за първи път. По този начин ферма с добив от 15 центнера на хектар е включена в първата група, стойността е 20 центнера на хектар

Във втория и т.н.

Необходима е вариационна серия с еднаква честота при много силна вариация на признак, тъй като при разпределение с еднакъв интервал повечето от единиците на популацията се оказват


Таблица 5.5

Разпределение на 100 руски банки според балансовата оценка на активите към 01.01.2000 г.


Границите на интервалите за равномерно разпределение са действителните стойности на активите на първа, десета, единадесета, двадесета и т.н. банки.

Графично представяне на вариационната серия

Значителна помощ при анализа на вариационния ред и неговите свойства оказва графичното представяне. Интервалната поредица е представена от лентова графика, в която основите на лентите, разположени по абсцисната ос, са интервалите на стойностите на променливия атрибут, а височината на лентите са честотите, съответстващи на скалата по протежение на у-ос. Графично представяне на разпределението на стопанствата в региона по отношение на добивите от зърнени култури е показано на фиг.

5.1. Диаграма от този вид често се нарича хистограма (гр. histos - тъкан).

Таблица данни. 5.6 и фиг. 5.1 показват формата на разпределение, характерна за много черти: стойностите на средните интервали на чертата са по-чести, по-рядко екстремните, малки и големи стойности на чертата. Формата на това разпределение е близка до разглежданата в курса математическа статистиказакон нормална дистрибуция. Великият руски математик А. М. Ляпунов (1857-1918) доказва, че нормалното

Таблица 5.6 Разпределение на стопанствата в региона по добив на зърнени култури


образува се малко разпределение, ако вариращата променлива е засегната от голямо числофактори, нито един от които не е доминиращ. Случайна комбинация от много приблизително еднакви фактори, влияещи върху промените в добива на зърнени култури, както природни, така и агротехнически, икономически, създава разпределение на фермите в региона по добив, близък до нормалния закон за разпределение.


Ориз. 5.2. Кумулативно и основно разпределение на фермите по

производителност

Такава серия се нарича кумулативна. Можете да изградите кумулативно разпределение "не по-малко от", или можете

"повече от". В първия случай графиката на кумулативното разпределение се нарича кумулативно, във втория - огив (фиг. 5.2).

Плътност на разпространение

Ако трябва да се справите с вариационни сериис неравни интервали, тогава за съпоставимост е необходимо честотата или честотата да се приведе към единицата на интервала. Полученото съотношение се нарича плътност на разпределение:


Плътността на разпределение се използва както за изчисляване на обобщаващи показатели, така и за графично изображениевариационни серии с неравни интервали.

Страница 2

Нека построим интервална вариационна серия на разпределението на областите по

съотношението на средната месечна пенсия, начислена на пенсионерите, регистрирани в органите за социално осигуряване, и средната месечна номинална заплата на заетите в икономиката.

Броят на групите, необходими за изграждане на групиране, се изчислява с помощта на формулата на Стърджис.

N=1+3,32*log n (1,1)

където, N - Брой групи;

n - Брой елементи в популацията

N=1+3.32*ln 24= 1+3.32*1.38=5.5816=6

Разделяме целия набор от области на 6 групи и намираме стойността на интервала по формулата:

H= (Xmax - Xmin) /n (1,2)

където Xmax=65,9 е максималната стойност на признака в изследваната ранжирана серия (окръг № 24);

Xmin=28.1 - минимална стойност (окръг №1).

Интервалът ще бъде:

H=(65.9-28.1) /6=6.3

Нека изградим серия на разпределение от области, с тази стойност на интервала, стойността Xmin=28.1, тогава горната граница на първата група ще бъде:

28,1+6,3=34,4 и т.н.

Нека разпределим организациите според установените групи и изчислим броя им във всяка група (Таблица 1.2).

Таблица 1.2

Интервални серии на разпределение на областите.

номер на групата

Групи области според стойността на съотношението вж. таксуваната сума на месец. пенсии до ср. номинално начислена заплата, rub.

Брой области

За по-голяма яснота изобразяваме интервалната серия под формата на хистограма (фиг. 1.2).


Други материали:

Циклични концепции за социално развитие
Социалната промяна е преходът на обществото от друго състояние в друго. Промяна, при която настъпва необратимо усложнение обществена структурасе нарича социално развитие. Правете разлика между еволюционен и революционен път на развитие...

Социални функции и социален статус
Определение социални функцииличността е достатъчно пълно разкрита в теорията социални роли. Всеки човек, живеещ в обществото, е включен в много различни социални групи(семейство, учебна група, приятелска компанияи т.н.). Например...

Методология и методи на социологическото изследване
Същност на социологическото изследване. Публичен животпостоянно поставя много въпроси пред човек, на които може да се отговори само с помощта на научно изследване, по-специално социологически. Не всички изследвания обаче...

Изпратете добрата си работа в базата знания е лесно. Използвайте формата по-долу

Добра работакъм сайта">

Студенти, докторанти, млади учени, които използват базата от знания в обучението и работата си, ще ви бъдат много благодарни.

публикувано на http:// www. всичко най-добро. en/

Задача номер 1

Въз основа на данни статистическо наблюдение, дадени в таблицата, изградете ранжиран, интервален и кумулативен ред на разпределение на земеделските предприятия по факторен признак, изобразете ги графично.

Провеждане на обобщения на данни. Използвайки метода на групиране, определете зависимостта на ефективния атрибут в селскостопанските предприятия от фактора. Изграждане на таблици и графики на зависимости. Заключение.

групиране серия разпределение факториел

Качество на почвата, точки (x)

(y)

Решение:

Сградакласиранредразпределението предполага подреждане на всички варианти на серията във възходящ ред на изследвания признак (качество на почвата). Сортирането беше извършено в програмата TP Excel с помощта на функцията "Сортиране".

Качество на почвата

Добивът на зеленчуци на открито

Графично представяне на класирана серия на разпределение

Линията на фигура 1 се нарича огива на Галтън. Този огив има тенденция да расте плавно с малки скокове в някои точки. За да преобразувате класирана серия в интервална серия, по-добре е да извършите ръчно групиране.

Сградаинтервалредразпределението на предприятията според изследвания критерий включва определяне на броя на групите (интервали).

За да изчислим броя на групите, използваме формулата:

n=2 , където N-общ бройединици от изследваната популация.

n=2 Ig30 = 2.95424251?3.

Стойността на равен интервал се изчислява по формулата:

i === 16.33333

Кумулативенред- това е серията, в която се изчисляват натрупаните честоти. Той показва колко единици от съвкупността имат стойност на характеристика, не по-голяма от дадена стойност, и се изчислява чрез последователно добавяне на честотите на следващите интервали към честотата на първия интервал.

Интервални и кумулативни серии

честота- брой предприятия в групата;

Специфични теглото предприятия в група- намира се по формулата:

(номерпредприятиявгрупа*100%)/м, където m е броят на експерименталните данни;

Натрупана честота- намира се по формулата: номерпредприятиявпредишенгрупа+честотададеногрупи.

Честотна хистограма

Разпределението на качеството на почвата се натрупва

Обобщаващи показатели

номер на групата

Брой предприятия в групата

Добив на зеленчуци на открито (общо по групи)

Качество на почвата (общо по групи)

II 61.33333-77.33333

III 77.33333-94.1

Средни характеристики на групите

Група №

Добивът на зеленчуци на открито

Качество на почвата

II 61.33333-77.33333

III 77.33333-94.1

Обща средна стойност

където колоната "добив на зеленчуци" се намира по формулата: ПриПриаз(въвгрупа) / номерпредприятиявгрупа;

колоната "Качество на почвата" се намира по формулата: Прихаз(въвгрупа)/номерпредприятиявгрупа.

Зависимостта на добива от зеленчуци на открито от качеството на почвата.

В разглеждания пример можем да заключим, че с повишаване на качеството на почвата добивът на зеленчуци в открита земя се увеличава, следователно можем да приемем, че има пряка връзка между разглежданите параметри.

Хоствано на Allbest.ru

Подобни документи

    Аналитично групиране по факторен признак. Изграждане на вариационна честота и кумулативни серииразпределение на базата на структурно групиране на равни интервали на продуктивен атрибут - дивиденти, натрупани въз основа на резултатите от изпълнението.

    контролна работа, добавена на 07.05.2009 г

    Основните показатели за населението и разпределението му по Калужка област. Построяване на ранжирани и интервални серии на разпределение по един групиращ факторен признак. Анализ на типичните групи по показатели средно за населението.

    курсова работа, добавена на 11.10.2010 г

    Конструкция по формулата на Стърджис. Построяване на редове на разпределение с произволни интервали. Изграждане на серии на разпределение с помощта на средната стойност стандартно отклонение. Класификация на сериите за разпространение. Изчисляване на основните характеристики на вариацията.

    курсова работа, добавена на 22.11.2013 г

    Анализ, изчисляване и конструиране на начални динамични редове от признак-функция и признак-фактор. Изчисляване на показатели за вариация на динамични редове. Количествено измерване на плътността на връзката между знак-функция и признаци-фактори по метода на двойната корелация.

    курсова работа, добавена на 24.09.2014 г

    Оценка на популацията за нейната хомогенност. Построяване на ранжирани и интервални редове на разпределение. Анализ на времеви редове чрез методите на уголемяване на интервали и пълзяща средна, аналитично подравняване по уравнение на права линия и парабола.

    курсова работа, добавена на 09/10/2014

    Изчисляване на средната оценка според резултатите от сесията, определяне на показателя за вариации в нивото на знанията и структурата на броя на студентите по отношение на академичното представяне. Построяване на интервална серия от разпределение на предприятията. Оценка на коефициентите на корелация.

    контролна работа, добавена на 21.08.2009 г

    Понятие и видове статистическо групиране, произведени с цел установяване на статистически зависимости и закономерности, за идентифициране на структурата на изследваната популация. Построяване на интервална серия за разпределение на предприятията на базата на „търговска площ”.

    дисертация, добавена на 14.02.2016 г

    Основни категории статистика. Групирането е в основата на научната обработка на статистически данни. Обобщено съдържание и население. Построяване на вариационни, ранжирани и дискретни редове на разпределение. Групиране на предприятията според броя на работниците.

    тест, добавен на 17.03.2015 г

    Извършване на изчисляване на абсолютни, относителни, средни стойности, коефициенти на регресия и еластичност, вариационни показатели, дисперсия, конструиране и анализ на редове на разпределение. Характеристика аналитично подравняваневерига и основни серии от динамика.

    курсова работа, добавена на 20.05.2010 г

    Провеждане на експериментално статистическо изследване на социално-икономическите явления и процеси Смоленска областвъз основа на зададените показатели. Построяване на статистически графики, редове на разпределение, вариационни редове, тяхното обобщаване и оценка.

Понятие за обобщение, групиране, класификация

Резюме- систематизиране и обобщаване: метеорологична справка, сводка от полетата. Резюмето не позволява подробен анализ на информацията. Всяко обобщение трябва да се основава на групиране на данни, т.е. първо групиране, след това обобщаване на данните.

групиране- разделяне на популациите на редица групи според най-съществените признаци.

Правете разлика между качествено и количествено групиране. качество- атрибутивни количествен- вариация. От своя страна вариацията се дели на структурна и аналитична . Структурнигрупирането включва изчисляване на дела на всяка група. Пример: в едно предприятие 80% са работници, 20% са служители, от които 5% са ръководители, 3% са служители, 12% са специалисти. Цел аналитиченгрупиране - за идентифициране на връзката между знаците: трудов стаж и средна печалба, опит и продукция и др.

Когато групирате, трябва:

Извършване на цялостен анализ на същността на изследваното явление;

Идентифициране на групиращ признак (един или повече);

Задайте границите на групите по такъв начин, че групите да се различават значително една от друга и във всяка група да се комбинират хомогенни елементи.

Според степента на сложност групировките могат да бъдат прости и комбинирани (по признаци).

Според изворовата информация първична и вторично групиране, първиченизвършено въз основа на данните от първоначалното наблюдение, вториизползва данни за първично групиране.

Определя се броят на групите по формулата на Стърджис:

където н- броя на групите, н- общо население.

Ако се използват равни интервали, тогава интервална стойносте равно на .

Интервалимогат или не могат да бъдат равни. Последните от своя страна се разделят на такива, които се променят според закона на аритметиката или геометрична прогресия. Първият и последният интервал могат да бъдат отворени или затворени. Затворените интервали включват или не включват граници на интервали.

Ако интервалите са затворени и нищо не се казва за включването на горни граници, тогава приемаме, че горните граници са включени.

Ако интервалите са отворени, тогава се ръководим от последния интервал.

Знак в тези интервали може да бъде измерен дискретно и непрекъснато (т.е. разделен). При непрекъснат знак границите са затворени 1-10, 10-20, 20-30; ако атрибутът се променя дискретно, тогава може да се използва следният запис: 1 - 10, 11 - 20, 21 - 30.

Ако интервалите са отворени, тогава стойността на последния интервал е равна на предходния, а стойността на първия - на втория.

Класификациягрупиране по качество. Той е относително стабилен, стандартизиран и одобрен от органите на държавната статистика.


3.2. Ранове на разпределение: видове и основни характеристики

Под близко разпространениесе отнася до поредица от данни, които характеризират всяко социално-икономическо явление на една основа. то най-простата формагрупи по два признака.

Сериите на разпределение са разделени на качествени и количествени, класирани и некласирани, групирани и негрупирани, с дискретни и непрекъснато разпространениезнак.

Пример за негрупирана, некласирана серия от заплати е извлечение заплати. В същото време списъкът на служителите може да бъде подреден по азбучен ред или по номера на персонала. Пример за класирана серия е списък с отбори, класация на тенисисти.

класиран редразпределения - поредица от данни, подредени в низходящ или възходящ ред на характеристика.

За групирани класирани серии се разграничават следните характеристики: вариант, честота или честота, кумулация и плътност на разпространение.

Вариант()е средната интервална стойност на характеристиката. защото при създаване на групировка трябва да се спазва принципът равномерно разпределениефункция във всеки интервал, тогава вариантът може да се изчисли като полусума от границите на интервалите.

Честота() показва колко пъти се среща дадената стойност на функцията. Изразът на относителната честота е честота(.) , т.е. дял, специфично тегло от сумата на честотите.

Кумулирайте() – кумулативна честота или честота, кумулативно изчисление. Обемът, разходите, приходите се изчисляват кумулативно, т.е. резултати от дейността.

маса 1

Групиране на действащи кредитни институции
от размера на регистрирания уставен капитал

през 2008 г. в Русия

Споделете с приятели или запазете за себе си:

Зареждане...