вторични групи. Съпоставимост на статистически групировки

Изпратете добрата си работа в базата знания е лесно. Използвайте формата по-долу

Добра работакъм сайта">

Студенти, докторанти, млади учени, които използват базата от знания в обучението и работата си, ще ви бъдат много благодарни.

публикувано на http://www.allbest.ru/

Московска академия. С.Ю. Witte

Стопански факултет

Тест

Завършена работа:

студент 1-ва година,

дистанционно обучение

Висляева М.Н.

град Москва

Когато изпълнявате контролна задача, трябва да направите вторично прегрупиране за не сложен пример(сами изберете пример) и обяснете как и при какви условия е валидно такова преизчисляване. Когато използвате компютърни програми и по-сложен пример, също посочете ефекта и характеристиките на използването на ИТ.

Във вашия писмен отговор на задачата трябва да:

1. Обяснете връзката между формулата за добавяне на дисперсии и коефициента на корелация, обяснете нейното статистическо значение.

2. Сравнение на вариацията за две различни разпределения с различни средни стойности, обяснете условията за сравнимост, когато средните стойности се различават.

3. Дайте най-пълно обяснение на значението на пределната грешка, свържете го с концепцията за представителност на извадката и необходимия й обем.

4. Обяснете връзката между оценката на неизвестни параметри чрез LSM и проверката на значимостта на резултатите, получени чрез критериите за проверка на статистически хипотези.

Пренареждането на предварително групирани статистики се нарича вторично групиране. Този метод се използва в случаите, когато в резултат на първоначалното групиране естеството на разпределението на изследваната популация не е ясно проявено.

В този случай интервалите се увеличават или намаляват. Също така вторичното групиране се използва за привеждане на групировките в сравнима форма на различни интервали, за да бъдат сравнени. Разгледайте методите на вторично групиране с пример.

За да увеличите интервалите въз основа на данните в таблица 1:

маса 1

Брой магазини

Горното групиране не е достатъчно ясно, тъй като не показва ясна и строга закономерност в изменението на оборота по групи.

Нека съкратим серията на разпределение, образувайки шест групи. Нови групи се формират чрез сумиране на първоначалните групи (Таблица 2).

таблица 2

Групи магазини по оборот за 4-то тримесечие, хиляди рубли

Брой магазини

Оборот за IV тримесечие, хиляди рубли.

Оборот средно за 1 магазин, хиляди рубли.

Съвсем ясно се вижда, че колкото по-големи са магазините, толкова по-висок е оборотът.

1. Чрез аналитично групиране можете да измерите връзката с помощта на емпирична корелационна връзка. Този индикатор е маркиран гръцка буква h (този). Базира се на правилото за разлагане на дисперсията, според което общата дисперсия s2 е равна на сумата от вътрешногруповите и междугруповите дисперсии.

Дисперсията на ефективния признак в рамките на групата с относителната константност на фактора на чертата възниква поради други фактори. Тази дисперсия се нарича остатъчна. Определя се по формулата:

където y ij е стойността на характеристиката y за i-та единицав j-та група;

J е средната стойност на признака в j-та група;

n j - число единици j-тигрупа;

j = 1, 2, 3, ..., т.е.

Вътрешногруповите дисперсии, изчислени за отделните групи, се комбинират в средната вътрешногрупова дисперсия:

Дисперсията между групите се приписва на изследвания фактор (и факторите, свързани с него), така че тази дисперсия се нарича факторна. Определя се по формулата

Правилото за добавяне на отклонения може да бъде написано:

емпиричен корелационна връзкаизмерва каква част от общата флуктуация на резултантния атрибут е причинена от изследвания фактор. Съответно се изчислява като съотношение на факторната вариация към обща дисперсияефективен знак:

Този индикатор приема стойности в интервала: колкото по-близо до 1, толкова по-близка е връзката и обратно.

Таблица 3. Изходни данни

Таблица 4. Работен лист

Среден оборот \u003d? X * f / f \u003d 17370/51 \u003d 340,58 хиляди рубли.

Дисперсията е:

G2=? f*(X-Xav) 2 /? f = 38682,36/51 = 758,48

Средно аритметично стандартно отклонение:

Коефициентът на вариация е:

V \u003d G / Xav \u003d 27,54 / 758,48 \u003d 0,081; 8,1%.

Коефициентът на вариация е по-малък от 33%, следователно популацията е хомогенна.

Таблица 5. Изходни данни

1) средното време, прекарано в пътуване до мястото на работа на работниците = X cf =? Xf / ?f = (25*70 + 35*80 + 45*200 + 55*55 + 65*15) / 420 = 41,8 минути.

2) изчисляване на дисперсията

Дисперсията е:

G2=? f отклонение:

3) Коефициент * (X-Xav) 2 / ? f = 43160,8 / 420 = 102,8

Средната квадратична вариация е:

V \u003d G / Xav \u003d 10,14 / 41,8 \u003d 0,24; 24%

Коефициентът на вариация е по-малък от 33%, следователно разглежданият набор е хомогенен и средната стойност за него е доста типична.

Извадковият набор може да се формира на базата на количествен признак на статистически стойности, както и на алтернативна или атрибутивна основа. В първия случай обобщаващата характеристика на извадката е извадковата средна стойност, означена, а във втория случай извадковата част от стойностите, означена с w. AT населениесъответно: обща авария и общ дял на r.

Разликите -- и W -- p се наричат ​​извадкова грешка, която се разделя на грешката при регистрацията и грешката на представителността. Първата част от грешката на извадката възниква от невярна или неточна информация поради неразбиране на същността на въпроса, невнимание на регистратора при попълване на въпросници, формуляри и др. Сравнително лесно се открива и коригира. Втората част от грешката произтича от постоянното или спонтанно неспазване на принципа на случайния подбор. Трудно се открива и елиминира, много по-голям е от първия и затова на него се обръща основно внимание.

Изключително важна роля за обосновката и приложението селективно наблюдениеизпълнява закона на големите числа. Използването на законите на големите числа е, че при определени условия и с достатъчно голям обем от наблюдения обобщените характеристики, получени въз основа на селективно наблюдение, ще се различават малко от съответните характеристики на общото пълномощно. Въз основа на това е възможно чрез увеличаване на обема на извадката да се намалят границите на възможните грешки на представителност, да се сведат до най-малкия размер. От друга страна, познавайки границите на грешките на представителност, е възможно да се определи необходимия размер на извадката.

Една от най-важните и отговорни задачи при организирането и провеждането на извадковото наблюдение е определянето на необходимия размер на извадката, т.е. неговия размер, което би осигурило получаването на данни, които доста коректно отразяват свойствата на генералната съвкупност, която се изследва.

В този случай трябва да се вземе предвид следното: 1) с каква степен на точност трябва да се получи пределната извадкова грешка; 2) каква трябва да бъде вероятността да се осигури условната точност на резултатите от наблюдението на извадката; 3) степента на флуктуация на изследваните свойства в изследваната генерална съвкупност.

Това означава, че необходимият размер на извадката се определя в зависимост от размера на пределната извадкова грешка, от стойността на коефициента на доверие (t) и от размера на дисперсията.

Метод за оценка на параметрите линейна регресия, минимизиране на сумата от квадратните отклонения на наблюденията на зависимата променлива от неизвестното линейна функция, се нарича метод на най-малките квадрати.

Същността на метода се състои в това, че критерият за качество на разглежданото решение е сумата от квадратите на грешките, която се стреми да бъде минимизирана. За да приложите този метод, е необходимо да извършите възможно най-много Повече ▼измервания на неизвестна случайна променлива (колкото повече - толкова по-висока е точността на решението) и някакъв набор от предложени решения, от които се изисква да се избере най-доброто. Ако наборът от решения е параметризиран, тогава трябва да намерим оптимална стойностпараметри.

LSM се използва в математиката, по-специално - в теорията на вероятностите и математическа статистика. Този метод има най-голямо приложение при проблеми с филтрирането, когато е необходимо да се отдели полезният сигнал от насложения върху него шум. Използва се и в математическия анализ за приблизително представяне на дадена функция чрез по-прости функции. Друга област на приложение на LSM е решаването на системи от уравнения с брой неизвестни, по-малък от броя на уравненията.

Етапи на проверка на статистически хипотези:

Изложение на основната хипотеза H 0 и конкурентната хипотеза H 1 . Хипотезите трябва да бъдат ясно формализирани в математически термини.

Задаване на вероятността b, наречено ниво на значимост и съответстващо на грешки от първи вид, на което в бъдеще ще бъде направено заключение за истинността на хипотезата.

Изчисляването на статистиката на критерия е такова, че:

стойността му зависи от първоначалната проба;

по стойността му е възможно да се направят изводи за истинността на хипотезата H 0 ;

самата статистика q трябва да се подчинява на известен закон за разпределение, тъй като самото q е случайно по силата на случайността.

Изграждане на критичния регион. Подгрупа от такива стойности се разграничава от диапазона от стойности на u, които могат да се използват за преценка на значителни несъответствия с предположението. Размерът му е избран по такъв начин, че да се спазва равенството. Този набор се нарича критична област.

Заключение за истинността на хипотезата. Наблюдаваните стойности на извадката се заместват в статистиката u и чрез удряне (или неудряне) на критичната област се взема решение за отхвърляне (или приемане) на предложената хипотеза H 0 .

дисперсия корелация вариация

Хоствано на Allbest.ru

...

Подобни документи

    Таблица с примерни стойности на дискретни случайни променливипо подреден начин. Таблица на интервални статистически серии от относителни честоти. Задаване на емпирична функция на разпределение и начертаване на нейната графика. Многоъгълник и разпределение на случайна променлива.

    практическа работа, добавена на 26.07.2012 г

    Числени характеристики за статистически разпределения. Изграждане на интервал вариационна серия, честотния полигон, графиката на функцията на разпределение на извадката и определянето на средната стойност на извадката и дисперсията на извадката по два начина.

    презентация, добавена на 01.11.2013 г

    Средната стойност на показателя (средноаритметична). Вариационни показатели - диапазон на вариация, средно линейно отклонение, стандартно отклонение, дисперсия, коефициент на вариация. Максималната и минималната стойност на статистиката.

    тест, добавен на 14.11.2008 г

    Концепцията за общата съвкупност, математическо очакванеи дисперсия. Осигуряване на случайност и представителност на извадката при статистическото планиране. Дискретни и интервални вариационни серии, точкови оценкипараметри на разпределение на чертите.

    резюме, добавено на 13.06.2011 г

    Същността на извадковото изследване. Методи за избор на единици в рамка за вземане на проби. Средна и пределна грешка за индикатори среден размери индикатори за споделяне. Определяне на необходимия размер на извадката за дадена пределна грешкасредна стойност.

    презентация, добавена на 16.03.2014 г

    Форми, видове и методи статистическо наблюдение. Видове групировки, техният интервал и честота. Структурата на серия от динамика. Абсолютно и относително статистика. Представяне на извадката под формата на статистическа серия. Точкова и интервална оценка.

    курс от лекции, добавен на 29.11.2013 г

    Построяване на интервални вариационни редове по показатели. Изчисляване на средно аритметично, мода и медиана, относителна и абсолютни показателивариации. Определяне на количествени характеристики на разпределения, изграждане на емпирична функция.

    курсова работа, добавена на 11.01.2012 г

    Точкова диаграма като точки на равнина, чиито координати съответстват на стойностите на случайните променливи X и Y, реда на нейното изграждане и целта. Намиране на коефициентите и построяване на графика на линейна апроксимация, графика на квадратична апроксимация.

    курсова работа, добавена на 03.05.2011 г

    Поръчване на първоначалния избор на работни времена до отказ. Преглед статистическа хипотезавърху съответствието с експоненциалното разпределение и разпределението на Weibull. Оценка на параметрите на разпределението и показателите за надеждност, неговите основни методи и техники.

    курсова работа, добавена на 22.01.2012 г

    Концепцията за вариационна серия, статистическо разпределение. Емпирична функция и основни характеристики на математическото очакване на дисперсията на извадката. Точка и интервални оценкиразпределения. Теорията на хипотезите е аналог на теорията на доверителните интервали.

Групировките, изградени за един и същи период от време, но за различни обекти или, обратно, за един и същ обект, но за два различни периода от време, може да не са сравними поради различния брой избрани групи или неравните граници на интервалите .

Вторично групиране или прегрупиране на групирани данни се използва за по-добро характеризиране на изследваното явление (в случай че първоначалното групиране не разкрива ясно естеството на разпределението на единиците на съвкупността) или за привеждане на групировките към сравним тип в ред да провеждам сравнителен анализ.

Вторично групиране- Това е операция за формиране на нови групи въз основа на предварително въведено групиране.

Има два начина за формиране на нови групи. Първият, най-простият и най-разпространеният начин е промяна (често уголемяване) на началните интервали. Вторият метод се нарича пренареждане на дялове. Състои се във формирането на нови групи въз основа на приписването на всяка група на определена част от единиците на съвкупността. Нека илюстрираме техниката на вторично групиране с пример (Таблица 3.14).

Таблица 3.14. Корпоративно разпространение на дребноедин от градовете на Московска област според средногодишния брой на служителите през 2011 г. *

* Данните са условни.

Ще прегрупираме данните, като формираме нови групи на интервали от до 5, 5-10, 10-20, 20-30, 30 или повече души.

Първата нова група ще включва цялата първа група търговци на дребно и част от втората група. За формиране на група до пет човека е необходимо да вземете един човек от интервала на втората група. Размерът на интервала на тази група е шест души. Затова е необходимо да се вземе 1/6 от него. Подобна част в новообразуваната първа група трябва да се вземе и от броя на предприятията, т.е. 20 -= 3 предприятия. 6

Тогава в първата група търговци на дребно ще има 16 + 3 = 19 бр.

Втората нова група се формира от предприятията за търговия на дребно от втората група минус причислените към първата, т.е. 20 - 3 = 17 предприятия. В новосформираната трета група ще бъдат включени всички предприятия от трета група и част от предприятията от четвърта. За да определите тази част от интервала 18 30 (ширината на интервала е 12), трябва да добавите 2,0 към предишния (така че горната граница на интервала да е равна на 20 души). Следователно е необходимо да се вземе частта от интервала, равна на 2/12 = 1/6. В тази група има 74 предприятия, така че трябва да вземем 74 (1/6) = 12 предприятия. Новата трета група ще включва 44 + 12 = 56 предприятия.

В новосформираната четвърта група ще бъдат включени 74 - 12 = = 62 предприятия, останали от предишната четвърта група. Петата новосформирана група ще бъде съставена от предприятията за търговия на дребно от пета и шеста предишни групи: 37 + 9 = 46 предприятия.

В резултат на това получаваме нови групи (Таблица 3.15).

Таблица 3.15. Разпределение на предприятията за търговия на дребно в един от градовете на Московска област според средногодишния брой на служителите през 2011 г. след прегрупиране на данните*

* Данните са условни.

Статистическа таблица: същност, елементи и класификация

Статистическа таблица - най-рационалната, визуална и компактна форма за представяне на статистическия материал, включително резултатите от статистическото групиране. Не всяка таблица обаче е статистическа. Таблицата за умножение, въпросникът на социологическото проучване може да бъде в таблична форма, но все още не е статистическа таблица.

Статистическа таблицае таблица, която съдържа резюме числена характеристикана изследваната съвкупност по един или повече съществени признаци, свързани помежду си от логиката на икономическия анализ.

Основните елементи на статистическата таблица, съставляващи нейния гръбнак (основа), са показани на схема 3.1.

Табличентази форма на подреждане на цифрова информация се нарича, при която числото е разположено в пресечната точка на ясно артикулирано заглавие по протежение на вертикална колона, наречена графика, и имена според съответната хоризонтална лента - линия. По този начин, външно, таблицата е пресечната точка на графики и редове, които образуват скелета на таблицата.

Статистическата таблица съдържа три вида заглавия: общи, горни и странични. Обща заглавка отразява съдържанието на цялата таблица (на кое място и време принадлежи), намира се над оформлението на таблицата в центъра и е външно заглавие. Горни заглавки характеризират съдържанието на графиката (заглавията на предиката) и страничен (предметни рубрики) - низове. Те служат като вътрешни заглавки.

Скелет на таблица, пълен със заглавки, формира оформлението на таблицата; ако в пресечната точка на графиката и линиите запишем числата, тогава получаваме пълна статистическа таблица. Заглавие на таблицата (общо заглавие)

Схема 3.1. Скелет (основа) на статистическата таблица

Цифровият материал може да бъде представен като абсолютен (уставен капитал, обем на иновативни стоки и др.), относителен (БВП на глава от населението, брой персонални компютрина 100 работници и др.) и средни (средна цена на акции, среден млеконадой на крава и др.) стойности.

Таблиците могат да бъдат придружени от бележка, използвана за обяснение, ако е необходимо, на заглавия, методи за изчисляване на някои показатели, източници на информация и др.

Според логическото съдържание таблицата е "статистическо изречение", чиито основни елементи са подлогът и сказуемото.

ПредметОбект, който се характеризира с числа, се нарича. Това може да бъде една или повече съвкупности, отделни единици на съвкупността по реда на техния списък или групирани по някакъв критерий, териториални единици и др. Обикновено темата на таблицата е дадена от лявата страна, в имената на редовете.

Предикатформира система от показатели, които характеризират обекта на изследване, т.е. предмет на масата. Предикатът формира горните заглавия и изгражда съдържанието на графиката с логично последователно подреждане на индикатори отляво надясно.

Местоположението на субекта и предиката в някои случаи може да се размени за по-пълно и по-добър начинразчитане и анализиране на първоначалната информация за изследваната популация.

Според структурата на предмета,в зависимост от групирането на единиците в нея има прости и сложни статистически таблици.

просто се извиква статистическа таблица, в предмета на която е даден списък на обекти или териториални единици. Простите статистически таблици са разделени на монографични и списъчни.

Монографични таблици характеризират не целия набор от единици на обекта, който се изследва, а само една от всяка единица или група, разпределена според определен признак (Таблица 3 .16).

Таблица 3.16. Въвеждане в експлоатация на социални и културни обекти в съставните образувания на Руската федерация през 2009 г

Списъци с таблици се наричат ​​таблици, чийто предмет съдържа списък на обекти или единици на обекта, който се изследва (Таблица 3.17).

Комплексни статистически таблици за разлика от простите, те позволяват да се идентифицират социално-икономическите типове на изследваните явления, тяхната структура, както и взаимовръзките и взаимозависимостите между характеристиките, които ги характеризират. Тези задачи могат да бъдат по-пълно решени с помощта на групови и особено комбинирани таблици.

група се наричат ​​статистически таблици, чийто предмет съдържа групиране на единици от съвкупността според един количествен или атрибутивен признак.

Най-простият вид групови таблици са редовете за разпределение. Груповата таблица може да бъде по-сложна, ако предикатът допълнително съдържа редица показатели, характеризиращи предметните групи. Такива таблици често се използват за сравняване на обобщени показатели между групи (Таблица 3.18).

Таблица 3.17. Притокът на чуждестранни инвестиции в икономиката на Руската федерация, но в основните страни инвеститори през 2009 г

Група на населението по възраст, години

Обща сума

Включително

мъже

Жени

По този начин груповите таблици позволяват да се идентифицират и характеризират социално-икономическите видове явления, тяхната структура в зависимост само от един атрибут.

комбиниран те се наричат ​​статистически таблици, чийто предмет съдържа групиране на единици от съвкупността едновременно по два или повече признака: всяка от групите, изградена на една основа, се разделя на свой ред на подгрупи по друг признак и т.н. (Таблица 3.19).

Таблица 3.19. Групиране на построените апартаменти в жилищна сграда по брой стаи и среден размер

Таблица 3.18. Разпределение на броя на заетите в руската икономика по възрастови групи към края на ноември 2009 г., % от общия брой

Предмет на таблицата са групите построени апартаменти по брой стаи и средната им площ.

Комбинационните таблици позволяват да се характеризират типичните групи, идентифицирани според няколко характеристики, и връзката между тях. Последователността на разделяне на единици от съвкупността на хомогенни групи според характеристиките се определя или от важността на една от тях в комбинация, или от реда, в който са изследвани.

В предиката на статистическата таблица, както вече беше споменато, се дават показатели, които са характеристика на изследвания обект.

Според структурата на предиката се разграничават прости и сложни статистически таблици.

При просто предикатно развитие характеристиките, представени в него, не се пресичат и общите стойности се получават чрез просто сумиране на стойностите за всяка характеристика поотделно, независимо една от друга. Таблица 1 може да служи като пример за просто развитие на предикат. 3.20.

При сложно развитие на сказуемото става по-пълна и Подробно описаниеобект. В този случай и двата признака на предиката (по пол и по възраст) са тясно свързани помежду си. Първо можете да анализирате състава Държавна думапо дроби

Таблица 3.20.

по възрастова група и след това разделете всяка възрастова група на две подгрупи по пол. С други думи, при сложно развитие на предиката, едно явление или обект може да се характеризира с различна комбинация от признаци, които ги формират.

Във всички случаи при конструирането на статистически таблици изследователят трябва да се ръководи от оптималното съотношение на предикатните показатели.

Основни правила за конструиране и анализ на статистически таблици

Статистическите таблици като средство за визуално и компактно представяне на цифрова информация трябва да бъдат статистически коректни. Съществуват следните основни техники, които определят техниката за формиране на статистически таблици.

  • 1. Цифровият материал трябва да бъде представен по такъв начин, че при анализ на таблицата да се разкрие същността на явлението чрез четене на редовете отляво надясно и отгоре надолу.
  • 2. Заглавието на таблицата и имената на колоните и редовете трябва да са ясни, кратки, да представляват завършено цяло, което органично да се вписва в съдържанието на текста. Името на масата трябва да отразява обекта, знака, времето и мястото на събитието.
  • 3. Информацията, разположена в колоните (колоните) на таблицата, завършва с обобщаващ ред.
  • 4. Ако имената на отделните колони се повтарят помежду си, съдържат повтарящи се термини или носят едно семантично натоварване, тогава е необходимо да им присвоите обединяващо заглавие.
  • 5. Полезно е да номерирате колони и редове. Колоните отляво, попълнени с имената на линиите, обикновено се обозначават главни буквиазбука (A), (B) и т.н., а всички следващи колони - числа във възходящ ред.
  • 6. Взаимосвързани данни, характеризиращи един от аспектите на анализираното явление, трябва да бъдат поставени в колони една до друга.
  • 7. Колоните и редовете трябва да съдържат мерни единици, съответстващи на показателите, заложени в подлога и сказуемото. В този случай се използват общоприети съкращения на мерните единици (рубли, kWh и др.).
  • 8. Числата трябва да се закръглят, когато е възможно. Закръгляването на числата в една и съща колона или ред трябва да се извършва с еднаква степен на точност.
  • 9. При необходимост Допълнителна информация(пояснения към таблицата) могат да се дават бележки.

Спазването на горните правила за построяване и оформяне на статистическите таблици ги превръща в основно средство за представяне, обработка и обобщаване на статистическа информация за състоянието и развитието на анализираните социално-икономически явления.

Анализът на статистическите таблици се извършва в две насоки: структурна и съдържателна.

Структурен анализ включва анализ на структурата на таблицата и характеризиране на:

  • съвкупността и формиращите я единици на наблюдение;
  • знаци и техните комбинации, които образуват субекта и предиката на таблицата;
  • тип маса;
  • задачи за решаване.
  • анализ на отделни групи от субекта според съответните признаци на сказуемото;
  • идентифициране на съотношения и пропорции между групи явления по признаци;
  • сравнителен анализ и формулиране на изводи, установяване на закономерности и определяне на резерви за развитие на обекта на изследване.

Анализът на отделните характеристики и групи трябва да започне с изследване на абсолютните стойности, след това - относителните стойности, свързани с тях.

Ако това се изисква от задачите на изследването, тогава анализът на таблиците може да бъде допълнен с изчислени относителни и средни стойности, графики, диаграми и др.

Анализът на тези таблици се извършва за всеки признак поотделно, а след това в логическа и икономическа комбинация от признаци.

Спазването на правилата и последователността на работа със статистически таблици ще позволи на изследователя да извърши цялостен научно обоснован икономически и статистически анализ на обектите и процесите, които се изследват.


Групировките, изградени за един и същи период от време, но за различни обекти или, обратно, за един и същ обект, но за два различни периода от време, може да не са сравними поради различния брой избрани групи или разликата в границите на интервалите.
Вторично групиране или прегрупиране на групирани данни се използва за по-добро характеризиране на изследваното явление (в случай, че първоначалното групиране не разкрива ясно естеството на разпределението на единиците от съвкупността) или за привеждане на групировките до сравним тип в за извършване на сравнителен анализ.
Вторично групиране - операция за формиране на нови групи въз основа на предварително извършено групиране.
Има два начина за формиране на нови групи. Първият, най-простият и най-разпространеният начин е да промените (по-често да увеличите) началните интервали. Вторият метод се нарича споделено прегрупиране и се състои във формирането на нови групи въз основа на приписването на всяка група на определена част от единиците на съвкупността. Нека илюстрираме техниката на вторично групиране със следния пример.
Пример:
Разпределение на служителите на предприятието по ниво на доходите

Ще прегрупираме данните, образувайки нови групи на интервали до 5, 5-10, 10-20, 20-30, над 30 хиляди рубли.
Първата нова група ще включва цялата първа група служители и част от втората група. За да формирате група до 5 хиляди рубли, е необходимо да вземете 1,0 хиляди рубли от интервала на втората група. Стойността на интервала от тази група е 6,0 хиляди рубли. Следователно е необходимо да се вземе 1/6 (1,0:6,0) част от него. Подобна част в новообразуваната първа група трябва да се вземе и от броя на служителите, т.е
20 x1 = 3 души Тогава в първата група ще има работници: 16 + 3 = 19 души.
6
Втората нова група се формира от работниците от втората група минус тези, назначени в първата, тоест 20-3 = 17 души. В новосформираната трета група ще бъдат включени всички служители от трета група и част от служителите от четвърта. За да определите тази част от интервала 18-30 (ширината на интервала е 12), трябва да добавите 2,0 към предишния (така че горната граница на интервала да е равна на 2,0 хиляди рубли). Следователно е необходимо да се вземе частта от интервала, равна на . В тази група има 74 души, така че трябва да вземем 74x (1: 6) = 12 души. Новата трета група ще включва 44 + 12 = 56 души. Новосформираната четвърта група ще включва 74-12 = 62 души, останали от предишната четвърта група. Петата новосформирана група ще бъде съставена от работници от пета и шеста предишни групи: 37 + 9 = 46 души.
В резултат на това получаваме следните нови групи:

Още по темата Съпоставимост на статистически групировки. Вторично групиране:

  1. 1.3. Статистическо наблюдение и обобщение. Групиране на материали от статистическо наблюдение.
  2. 10.2. СТАТИСТИЧЕСКО НАБЛЮДЕНИЕ И СЧЕТОВОДСТВО В ОРГАНИЗАЦИИ ОТ РАЗЛИЧНИ ОТРАСЛИ. ИНФОРМАЦИОННО-АНАЛИТИЧНИ ВЪЗМОЖНОСТИ ЗА СТАТИСТИЧЕСКА ОТЧЕТНОСТ

При анализиране и сравняване на няколко групировки, например за няколко цеха, предприятия и т.н., може да възникне ситуация, когато първоначалните групировки са несравними поради различен брой групи или различни стойности на използваните интервали. За да се приведат такива групи в сравнима форма, т.е. или към един брой групи, или към една стойност на интервал, се използва вторичният метод на групиране. Метод на вторично групиране - това е метод за формиране на нови групи на базата на съществуващите групировки според зададените изисквания.За извършване на вторичното групиране се използват 2 метода: 1) обединението на първоначалните групи, 2) споделеното прегрупиране.

Привеждането на няколко различни групи в сравнима форма се извършва на три етапа. На първия етап се извършва анализ на първоначалните групировки, за да се идентифицират условията за несравнимостта на първоначалните групировки. На втория етап се избира метод за привеждане на оригиналните групи в сравнима форма. На третия етап се извършва вторично пренареждане на първоначалните групировки и анализ на получените резултати. При необходимост се извършва прегрупиране. Помислете за методите на вторично пренареждане.

1 начинСтатистическото наблюдение върху разпределението на работниците в предприятието по трудов стаж през 2000 г. дава следните резултати (Таблица 2.7).

Таблица 2.7

През 2002 г. е проведено повторно статистическо наблюдение, което дава следните резултати (Таблица 2.8). Невъзможно е да се оценят промените в разпределението на работниците по трудов стаж за 2 години директно от данните от двете таблици. Анализът на двете таблици показва, че те са непоследователни поради различен номергрупи и различни интервали.

Таблица 2.8

За да се приведат данните от двете таблици в сравнима форма, е възможно да се комбинират както групи 1 и 2, така и групи 3 и 4 в таблица 2.7. Това ще даде възможност да се оценят промените в разпределението на работниците по трудов стаж, настъпили в предприятието за две години. Резултатите от прегрупирането на данните от статистическите наблюдения за 2000 г. (Таблица 2.7) са показани в Таблица 2.9.

Таблица 2.9

Сравнявайки данните за 2002 г. (Таблица 2.8) с прегрупираните данни за 2000 г. (Таблица 2.9), можем да заключим, че за две години броят на работниците със стаж до 6 години е намалял, т.е. млади, а броят на работниците с повече опит се е увеличил.

2 начинаНека статистическото наблюдение през 2002 г. даде такива резултати (Таблица 2.10). Сравнявайки данните за 2000 г. (Таблица 2.9) и данните за 2002 г. (Таблица 2.7), можем да заключим, че те са непоследователни поради различния брой групи и различни интервали. Анализът показва, че е невъзможно да се приложи първият метод за привеждане на данните в сравнима форма. Затова използваме метод 2, за да прегрупираме данните за 2000 г. (Таблица 2.7), така че да съответстват на групирането на данните за 2002 г. (Таблица 2.10)

Таблица 2.10

Използването на втория метод включва равномерно разпределениечестоти във всяка група. Това е задължително условие за използването на втория метод. За да прегрупираме данните за 2000 г. (Таблица 2.7), ще направим следните изчисления. Така новата първа група (1-4) (Таблица 2.10) ще включва всички данни от старата първа група (1-3) (Таблица 22.7) и данните за броя на работниците с 4 години стаж от старата втора група . Броят на работниците с 4 години стаж е 3 (9/3=3, тъй като в старата втора група бяха 9 работници, а интервалът е 3). Така новата първа група (1-4) ще включва 18 работници (18=15+3) нова група(5-8) ще включва 6 работници с 5,6 години стаж (от старата втора група 6=9/3 2) и 18 работници със 7,8 години стаж (от старата трета група 18=27/3 2 2) Така , новата втора група (5-8) ще включва 24 работници (24=6+18). Новата трета група (9-12) ще включва работници с 9 години стаж (9=27/3) и всичките 9 работници от старата четвърта група (10-12). Така в новата трета група (9-12) ще има 18 работници (18=9+9). Прегрупираните данни за 2000 г. и данните за 2002 г. ще бъдат обобщени в една таблица (2.11), което ще позволи извършването на сравнителен анализ.

Таблица 2.11

Анализът на разпределението на работниците във фирмата по трудов стаж (Таблица 2.11) показва, че през 2002 г. нараства броят на работниците с по-дълъг стаж (от 9 до 12 години), докато тези с по-малък стаж (от 1 до 8 години) намаляват. . По този начин прегрупирането на данните позволи да се приведат данните в сравнима форма, да се извърши анализ и да се направят необходимите заключения.

Контролни въпроси и задачи

1. Какво е статистическо наблюдение? Какви условия трябва да бъдат изпълнени при провеждане на статистическо наблюдение (виж дефиницията)?

2. По какви критерии могат да се класифицират статистическите наблюдения? Дайте примери за статистическо наблюдение.

3. Какви грешки възникват при статистическите наблюдения и какви методи за контрол могат да се използват?

4. Определете кой пример има просто резюме и кой има сложно резюме. Пример 1. В понеделник в тъкачния цех работеха 200 работници. Пример 2. В понеделник в тъкачен цех на участък № 1 работеха 40 работници, в участък № 2 - 60 работници, а общо 100 работници.

5. Какви групи се използват при обработката на статистическа информация? Как се различават един от друг?

6. В отдела на главния технолог има 15 души, а в отдел Маркетинг и продажби - 10 души. В кой случай екипите от отдели са хомогенни съвкупности, а в кой случай те са разнородни съвкупности.

7. Ежедневната продажба на артикул плат А в магазин Fabric през октомври се характеризира със следните данни (в метри): 4, 11, 8, 14, 10, 19, 12, 11, 3, 6, 21, 9, 9 , 5, 10 , 13, 15, 7, 10, 13, 16, 12, 8, 11, 14, 15, 17. Групирайте данните, като използвате равни интервали.

8. Прегрупирайте резултатите от групирането на данни от параграф 7 в следните групи: (3-9), (9-15), 15-21).

Тема № 3 СТАТИСТИЧЕСКА ПОРЕДИЦА НА РАЗПРЕДЕЛЕНИЕ, ТАБЛИЦИ, ГРАФИКИ

3.1 Статистически редове на разпределение - понятие, видове, форми на представяне

Една от формите за представяне на данните от статистическото наблюдение е статистическа серия на разпределение. Статистически серии разпределението е подредено подреждане на единици от съвкупността в групи според атрибут на групиране.С помощта на статистически серии за разпределение е възможно да се изследват структурата и границите на промените в популацията, да се оцени хомогенността и да се определят моделите на развитие на единиците в популацията. По вид статистически серииразпределенията се подразделят на атрибутивни, вариационни и времеви редове.

Сериите от атрибути и вариации се състоят от два елемента: варианти и честоти (честоти или плътности). Вариант() - това е специфичната стойност на характеристиката, която тя приема в серията за разпространение. Честота () - това е абсолютно число, показващ колко пъти (колко често) тази или онази стойност на признак (вариант) се среща в съвкупността или колко единици от съвкупността имат една или друга стойност на признака (вариант). честота() - това е относителна стойност, която определя дела на отделните опции в общия обем на популацията ().Честотата може да бъде изразена или в дялове, в който случай обемът на популацията е равен на единица (), или като процент, в този случай обемът на популацията е 100% (). Най-общо честотата се изчислява по следния начин

къде е обемът на населението.

Плътност() е относителна стойност, показваща колко единици съвкупност (в абсолютна или относителна форма) са на единица дължина на груповия интервал ().Плътността може да бъде абсолютна или относителна. Абсолютна плътност е равно на

Относителна плътносте равно на

При изчисляване на относителната плътност се използва честота, изразена в дроби.

Серия от атрибутие серия, изградена на базата на качествен признак на населението.Тези серии са изградени с помощта на типологично групиране и могат да бъдат изразени под формата на таблица. Например разпределението на работниците в предприятието по категории заплати (Таблица 3.1).

Таблица 3.1

В дадения пример (Таблица 3.1) съвкупността е всички работещи предприятия. Населението е 250 души. Единицата на населението е един работник. Като характеристика на единицата за населението се избира тарифната категория. Знакът има няколко конкретни значения - опция (1-ва категория, 2-ра категория, 3-та категория, 4-та категория, 5-та категория). В таблицата стойностите на атрибутите са дадени в колона 2, стойностите на честотата в колона 3, стойността на честотата в колона 4.

Вариационни серии- това е серия, изградена на базата на количествен признак на населението.Тези серии се изграждат главно с помощта на структурно групиране и могат да бъдат изразени под формата на таблица. Вариационните редове са два вида: дискретни вариационни редове и интервални редове. Дискретни вариационни серии е серия, в която стойностите на атрибутите (опциите) са представени от дискретни стойности. Интервални вариационни серии е серия, в която характерните стойности са изразени като интервали. Въз основа на данните за дневния оборот на 34 индивидуални предприемачи, дадени на стр., ще изградим вариация интервални серии(Таблица 3.2)

Таблица 3.2

Колона 3 показва честотата - броят на предприемачите, чийто еднодневен оборот попада в определен интервал (колона 2). В колона 4 процентната честота се изчислява по формула 3.1. Така че честотата за първата група (3,1 - 3,9) ще бъде равна на

По същия начин честотата се изчислява и за други групи. Колона 5 показва честотата в дроби. Може да се получи или чрез изчисление

или чрез конвертиране на проценти в акции. При изчисляване данните в десетична форма трябва да се показват с точност до 3 знака след десетичната запетая. Това подобрява точността на изчисленията и получаването на съответните крайни данни. Така сумата от честотите в проценти трябва да бъде равна на 100%, а в дроби - равна на 1.

Колона 6 на таблица 3.2 показва абсолютните стойности на плътността. Изчислението се извършва по формулата 3.2. Така че за първата група абсолютната плътност ще бъде равна на

Ако честотата () е взета от колона 3, тогава стойността на интервала () се определя като разликата между горната граница (3.9) и долната граница (3.1) на интервала от първата група, т.е. . По същия начин се изчислява абсолютната плътност за други групи. След извършване на изчисленията е необходимо да им се даде икономическа интерпретация. Така например абсолютната плътност на първата група предполага, че за всяка хиляда рубли. оборот в първата група представляват 5 предприемачи.

Колона 7 на Таблица 3.2 показва стойностите на относителната плътност. Изчислението се извършва по формулата 3.3. Така че за първата група относителната плътност ще бъде равна на

По същия начин се изчислява относителната плътност за други групи. Относителната плътност на първата група показва, че делът на предприемачите, които идват на всяка хиляда оборот в първата група е 0,147.

Колона 2 на Таблица 3.3 показва оборота под формата на интервали, а колона 3 показва оборота под формата на дискретни стойности. За първата група дискретната стойност се изчислява, както следва

По подобен начин се изчислява оборотът във формуляра дискретно количествои за други групи.

Често, когато се анализират вариационни серии, има нужда да се разбере промяната в обема на популацията при промяна (главно във възходящ ред) на стойностите на атрибута. За това се използват понятия като кумулативни честоти или кумулативни честоти. Натрупани честоти ( )е сумата от честотите в началото на серията до определена стойност на признака включително. Натрупани честоти е сумата от честотите от началото на серията до определена стойност на признака включително.Помислете за намиране на стойностите на тези показатели според табл. 3.4 В колона 6 на табл. 3.4 показва натрупаните честоти. В първата група (колона 1) 4 предприемачи (колона 4) са имали оборот от 3,1 до 3,9 хиляди рубли. (група 2) или среден оборот от 3,5 хиляди рубли. (група 3). Тъй като това е първата група, натрупаната честота, т.е. броят на предприемачите ще бъде равен на 4 (колона 6). Във втората група броят на предприемачите с оборот от 3,9 до 4,7 хиляди рубли. или среден оборот от 4,3 хиляди рубли. се равнява на 5 души. Оттук и натрупаната честота, т.е. броят на предприемачите с оборот от 3,1 до 4,7 хиляди рубли. или средно от и по-малко от 4,3 хиляди рубли, ще бъде равно на 9=4+5. За третата група кумулативната честота ще бъде 16=4+5+7 и т.н. Кумулативната честота се изчислява по същия начин.

Вторично групиране

На практика понякога се налага да се използват вече съществуващи групи, които може да не са сравними поради неравномерни граници на интервалите или различен брой разграничени групи. За да се приведат такива групи в сравнима форма, се използва методът на вторичното групиране.

Вторично групиранесе състои в образуването на нови групи на базата на предварително създадено групиране.

При вторичното групиране се използват два метода за формиране на нови групи:

  • § Първият начин е да се укрепят оригиналните интервали. Това е най-простият и често срещан начин за вторично групиране.
  • § Вторият метод се нарича метод на споделено прегрупиране и се състои в това, че определена част от единиците на съвкупността се приписват на всяка група.

Ранове на разпределение

Групирането може да бъде изградено на базата на разпределителна серия. В същото време редовете могат да бъдат изградени на базата на групиране. Цялостното изследване на статистическо явление е най-плодотворно, ако се основава на система от групировки. Системата за групиране е поредица от взаимосвързани статистически групипо най-съществените признаци, отразяващи изчерпателно най-важните страни на явлението.

Близо до разпределениенаречено подредено разпределение на единиците от населението в групи според някакъв признак.

Видове разпределителни редове:

  • - атрибутивни;
  • - вариационни - дискретни и интервални.

С други думи, серията на разпределение е резултат от групиране.

Атрибутивна серия се разбира като серия от разпределение според атрибут, който няма количествена мярка. Например, серия от атрибути може да бъде съставена на базата на "Социален статус", "Професия", "Пол" и др.

Всеки ред, представен в таблична форма, се състои от две колони. Първата колона показва стойностите на изследваната черта (атрибутивна или количествена). Втората колона записва броя на единиците за наблюдение, които имат дадена стойност. По този начин изграждането на вариационна серия се свежда до определяне на стойността на признак във всяка класификационна група и определяне на броя на елементите, които попадат в тази група.

Всяка отделна стойност на характеристика в серия на разпространение се нарича вариант.

Броят на елементите във всяка класификационна група или броят на елементите в комбинация с даден вариант се нарича честота, или, с други думи, броят на единиците за наблюдение, съдържащи се във всяка отделна група, обикновено се нарича честота на серията на разпределение. .

Делът на тази група в съвкупността се нарича честота. Честота или структура показва съотношението на населението на дадена класификационна група.

Честота - съотношението на честотата към общия брой изследвани елементи, т.е. обема на популацията.

Нека означим честотата с n или f, честотата - с p или j.

Пример за дискретна серия.

Напредък в група студенти по икономика от 15 души по един от предметите.

Споделете с приятели или запазете за себе си:

Зареждане...