Ранове на разпределение. Изграждане на ранжирани, интервални и кумулативни серии

Вариационна серия е подреждане на стойностите на атрибут на всяка статистическа единица в определен ред. В този случай отделните стойности на характеристика обикновено се наричат ​​​​вариант (вариант). . Всеки член на вариационната серия (вариант) се нарича ординална статистика, а броят на вариантите се нарича ранг (ред) на статистиката.

Най-важните характеристики на вариационния ред са неговите екстремни варианти (X 1 = Xmin; X n = Xmax) и диапазонът на вариация (Rx = Xn - X 1).

Вариационните серии се използват широко при първичната обработка на статистическа информация, получена в резултат на статистическо наблюдение. Те служат като основа за изграждане на емпирична функция на разпределение на статистическите единици в статистическата съвкупност. Следователно вариационният ред се нарича редове на разпределение.

В статистиката той разграничава следните видове вариационни редове: рангирани, дискретни, интервални.

Рангирани (от латински rang - ранг) серии- това е поредица от разпределение на единици от статистическата съвкупност, в която вариантите на признака са във възходящ или низходящ ред. Всяка класирана серия се състои от класирани числа (от 1 до n) и съответния им вариант. Броят на опциите в класирана серия, формирана според съществен признак, обикновено е равен на броя на единиците в статистическата съвкупност.

За да формирате ранжирана серия на дадена основа (например по броя на животновъдните работници в 100 земеделски предприятия), можете да използвате оформлението на табл. 5.1.

Т а б л и ц а 5.1. Редът за формиране на класирана серия

Край на работата -

Тази тема принадлежи на:

Статистика

И храна на Република Беларус .. Министерство на образованието, науката и персонала ..

Ако се нуждаеш допълнителен материалпо тази тема или не сте намерили това, което търсите, препоръчваме да използвате търсенето в нашата база данни с произведения:

Какво ще правим с получения материал:

Ако този материал се оказа полезен за вас, можете да го запазите на страницата си в социалните мрежи:

Всички теми в този раздел:

Шундалов Б.М.
Обща теория на статистиката. Урокза икономическите специалности на висшите селскостопански учебни заведения. учебно помагало с

Предметът на статистиката
Думата "статистика" произлиза от латинското "status" (статус), което означава състояние, състояние на нещата. Това дава възможност да се акцентира върху теоретико-познавателната същност

Същността на статистическото наблюдение
Всяко статистическо изследване, както беше отбелязано по-горе (тема 1), винаги започва със събиране на първична (първоначална) информация за всяка единица от статистическата съвкупност. Въпреки това, не всички

Програма за статистическо наблюдение
В първата глава беше обърнато внимание на факта, че всяка статистическа единица, като обект като цяло, има много различни свойства, качества, специфични характеристики, които обикновено се наричат

Списъкът от характеристики, записани по време на процеса на наблюдение, обикновено се нарича програма за статистическо наблюдение.
Разработването на програма е един от най-важните теоретични и практически въпроси на статистическото наблюдение. Качеството на програмата до голяма степен определя качеството събран материал, неговата надеждност и

Форми на статистическо наблюдение
Цялото разнообразие от статистически наблюдения се свежда до две форми: статистическа отчетност и специално организирани статистически наблюдения. Статистическа отчетност

Статистически форми
Статистическата форма е банка, съдържаща въпросите от програмата за статистическо изследване и място за отговаряне на тях. формулярът е носител на статистическа информация, получена в резултат

Видове статистическо наблюдение
Статистическите наблюдения се класифицират по видове, които могат да се различават по различни принципи. Така че, в зависимост от степента на покритие на изследвания обект, статистическите наблюдения могат да се подразделят

Методи за провеждане на статистически наблюдения
Статистическите наблюдения могат да се извършват по различни начини, сред които често се срещат следните: отчетност, експедиция, самоизчисление, саморегистрация, въпросник, кореспондент.

Място, дати и период на статистическите наблюдения
В плана на всяко статистическо наблюдение мястото на това наблюдение трябва да бъде ясно определено, т.е. мястото, където се регистрира събраната информация, попълнено статистически

Грешки на статистическото наблюдение и мерки за борба с тях
Едно от най-важните изисквания към резултатите от статистическото наблюдение е тяхната точност, която се разбира като мярка за съответствие на статистическите знания,

Първично статистическо резюме
Резултатите от статистическото наблюдение съдържат разнообразна информация за всяка единица от съвкупността или обекта и обикновено са неподредени. Този изходен материал е необходим преди

Същност и значение на относителните статистически показатели
Относителните резултати са статистика, изразяваща мярката на количественото съотношение на абсолютните стойности на атрибута и показваща относителните размери на явления и процеси. О

Видове относителни показатели. Относителни показатели за динамика
В зависимост от задачите, решавани с помощта на относителни величини, се разграничават следните видове относителни показатели: динамика, структура, координация, интензивност, сравнение, изпълнение на поръчката,

Относителни показатели на структурата
Една от най-важните характеристики на всички явления е тяхната сложност. Дори една молекула дестилирана вода е изградена от водородни и кислородни атоми. Много явления от природата, обществото, човека

Относителни показатели за координация
Относителните показатели за координация са съотношението на абсолютните размери един към друг съставни частив някакво абсолютно цяло. За да се изчислят тези показатели, един от компонентите

Показатели за относителна интензивност
Относителните показатели за интензивност (степен) са съотношението на абсолютните размери на две качествено различни, но взаимосвързани характеристики в статистическата лъжичка.

Индикатори за относително сравнение
Относителни показатели за сравнение (сравнение) се получават от едноименното съотношение абсолютни показателиотнасящи се до различни статистически единици, cos

Относителни нива на изпълнение на поръчките
Относителните показатели за изпълнение на поръчка (задача, план) са съотношението на абсолютните, действително постигнати показатели за определен период или към

Относителни показатели за нивото на икономическо развитие
Относителни показатели на нивото икономическо развитиенарича съотношението на абсолютните размери на две качествено различни (противоположни), но взаимосвързани характеристики. По същото време

Същност и значение на графичния метод
Абсолютни статистически показатели, получени в резултат на статистически наблюдения, и различни изчислени на тази база относителна производителностможе да бъде по-добър, по-дълбок, по-достъпен

Основни изисквания при построяването на координатни диаграми
Най-често срещаният и удобен начин графично изображениеабсолютни и относителни показатели за динамика, показатели за сравнение и др., разглежда се координатна диаграма.

Начини за графично представяне на показатели за динамика и структура
В много случаи е необходимо да се отрази на една и съща координатна диаграма не една, а няколко линии, характеризиращи динамиката на различни абсолютни или относителни показатели, или

Методи за графично представяне на сравнителни показатели
В широк смисъл сравнението на показателите се извършва както във времето, така и в пространството, т.е. методите за сравнение могат да обхващат динамика, структура и териториални обекти. Следователно пр

Същност и значение на картограмите и картограмите
В много случаи има нужда от графично изобразяване на най-важните характеристики, характерни за обширни териториални обекти. В системата на агропромишления комплекс това могат да бъдат селища, селскостопански

Контролни въпроси към тема 4
1. Какво представлява графичният метод и на какво се основава? 2. За какви основни цели се използва графичният метод. 3. Как се класифицират

същност на вариацията. Видове вариационни знаци
Вариация (от лат. variatio - изменение) е изменение на признак (вариант) в статистическа съвкупност, т.е. признава се приемането от единици от населението или техните групи на различни знания

По брой на животновъдните работници
Номер на ранг (#) на опцията, съответстващ на номер на ранг (#) Символ Брой животновъдни работници

Дискретно разпределение
Дискретна (разделителна) серия е вариационна серия, в която нейните групи са формирани по признак, който се променя прекъснато, т.е. през определен бройедин

Животновъдни работници
№ варианти Вариант (стойност на знака), Х Знаци за честота Локални честоти, fl Кумулативни честоти, fn

Серия на интервално разпределение
В много случаи този статистически набор включва голям или още повече безкраен брой опции, което най-често се случва с непрекъсната вариация, практически е невъзможно и неподходящо.

Същността на средните стойности
Вариационните серии отразяват голямо разнообразие от явления и процеси, които съставляват същността на нашата реалност. За по-пълно, задълбочено изучаване на явленията и процесите от заобикалящия ни свят

Средноаритметично
Ако заместим стойността K = 1 във формула 6.2, тогава получаваме средноаритметичната стойност, т.е. .

В класираното разпределение
Ранг №№ Варианти (стойности на знаци) Символи Посевна площ, ха

Разпределение на редовете
№ п.п. Варианти Локални честоти Среднопретеглени Варианти Символи Добив

Основни свойства на средното аритметично
Средната аритметична стойност има много математически свойства, които са важни математически при нейното изчисляване. Познаването на тези свойства помага да се контролира правилното и точното

Средна хронологична стойност
Една от разновидностите на средната аритметична е средната хронологична. Средната стойност, изчислена въз основа на съвкупността от стойностите на атрибута в различни моменти или за различни периоди в

RMS
При условие на задаване на стойността на K=2 във формулата 6.2. получаваме средната квадратична стойност. В класирана серия средната квадратна стойност се изчислява от непретеглената (пр

Средна геометрична
Ако заместим стойността K = 0 във формула 6.2, тогава в резултат получаваме средното геометрично, което има проста (непретеглена) и претеглена форма. Средната геометрична е проста

Средна хармонична стойност
При условие на заместване в общата формула 6.2, стойността на K \u003d -1, можете да получите средната хармонична стойност, която има проста и претеглена форма. Средно име на акордеон

Структурна средна. Същност и значение на модата
В някои случаи, за да се получи обобщаваща характеристика на статистическата съвкупност по който и да е признак, се налага използването на т.нар. структурни средни. Те включват

Същност и значение на медианата
Медиана - опциите, които са в средата на вариационната серия. Медианата в класираните серии е следната. Първо изчислете броя на медианата на опциите:

Концепцията за най-простите индикатори за вариация
Същността на вариацията беше разгледана в глава 5 на учебника, където беше отбелязано, че вариацията е волатилност, промяна в стойността на признак в статистическа съвкупност, т.е. приемане по единици

Стандартно отклонение
Стандартното отклонение се изчислява въз основа на средната стойност квадратична стойност. Появява се в непретеглени (прости) и претеглени форми. За класирани п

Коефициентът на вариация
Коефициентът на вариация е относителен показател, който може да се изчисли по следната формула:

Контролни въпроси към тема 6
1. Каква е средната стойност и какво изразява? 2. Какво е определящо свойство на съвкупността и защо се използва в статистиката? 3. Кои са основните видове носители

Същността на генералната и извадковата съвкупност
В статистиката непрекъснат вид наблюдение е сравнително рядък, като например общо преброяване на населението. Все пак най-често се налага използването на прекъснати наблюдения, които

Концепцията за стохастична популация
В реални условия случаите на статистическа работа с общата съвкупност са сравнително редки и следователно далеч не винаги е възможно да се получат основните статистически характеристики

Същност на селективния метоп
Статистическата работа в повечето случаи по някакъв начин е свързана с данните, получени в резултат на прилагането на извадковия метод. Много изследвания биха били невъзможни без използването на

Предимства и недостатъци на пробовземния метод
Пробният метод има редица предимства пред непрекъснатото наблюдение. Първо, селективното наблюдение може значително да спести труд, пари и време за неговото прилагане. Бухал

Методи за подбор, техните предимства и недостатъци
Изборът на статистически единици от генералната съвкупност може да се извърши по различни начини и зависи от много условия. Извадковият метод включва следните методи за избор на статистически единици

Същността на грешките на представителността и процедурата за тяхното изчисляване
Един от централните въпроси за метод на вземане на пробисе счита за теоретично изчисление на основните статистически характеристики и преди всичко на средната стойност на знак в общата статистическа лъжичка

Концепцията за малка извадка. Точкова оценка на основните статистически характеристики
Използването на извадков метод може да се основава на избора на теоретично произволен брой статистически единици от генералната съвкупност. Математически е доказано, че извадковите популации могат да бъдат

Пределна извадкова грешка. Интервална оценка на основните статистически характеристики
пределна грешкаизвадка е несъответствието между статистическите характеристики, получени в извадката и генералната съвкупност. Както е показано по-горе (формулата

Методи за изчисляване на размера на извадката при различните методи на подбор
Подготвителна работа за селективно наблюдениепряко свързано с определянето на необходимия размер на извадката, който зависи от метода на подбор и броя на единиците в общата

Концепцията за вторична (комплексна) статистическа сводка
Резултатите от едно просто резюме, чието съдържание е разгледано в тема 2, не винаги могат да задоволят изследователя, тъй като те дават само обща представа за обекта на изследване, т.е. от статистиката t

Типологични групировки
Типологичното групиране е разделяне на статистическата съвкупност на по същество еднакви по качество типологични групи. Типологично групиране

Структурни групировки
Структурното групиране се състои в разделяне на хомогенна и качествено съвкупност от статистически единици на групи, които характеризират състава на сложен обект. Чрез структурни

Същността и процедурата за провеждане на просто и аналитично групиране
Аналитично групиране, при което статистическата съвкупност е разделена на хомогенни групи според една от факторните характеристики, се нарича проста.

Аналитично групиране
№ п.п. Групи фермипо дози торове, t/ha. Знаци за честота в групи (брой единици от съвкупността в група)

Показатели за ефективност в отглеждането на картофи
№ п.п. Показатели Групи стопанства по дозата на торовете, t/ha Общо (средно) 10-20

Същност и значение на статистическите таблици
Резултатите от обработката на данни от наблюдение с помощта на различни статистически методи (обобщения, относителни, средни стойности, формации, вариационни серии, вариационни индикатори, аналитични

Елементарна композиция на статистически таблици
Интегриран статистическа обработкарезултатите от наблюдението обикновено се свързват с използването на множество таблици. Следователно на всяка таблица се присвоява индивидуален номер.

Видове и форми на статистически таблици
В зависимост от структурата на табличния предмет се разграничават следните видове статистически таблици: прости, групови и комбинирани. Проста статистическа таблица - хара

Помощни и резултатни статистически таблици
Статистическите таблици могат да изпълняват различни функционални роли. Някои от тях служат например за обобщаване на резултатите от статистическото наблюдение и допринасят за изпълнението на функцията на първичния

Производствени резултати, 2003г
(комбинирана таблица) No п.п. Групи ферми по натоварване на земеделска земя на 1 трактор, ha Подгрупи ферми по натоварване

Предприятия за преработка на лен в агропромишления комплекс през 2003 г
(работен лист) No п.п. Доверителен годишен обем на обработка, t Брой служители, лица Поносим капацитет a

Регистрация на статистически таблици
Постигането на поставените цели с помощта на табличния метод е възможно в случаите, когато са изпълнени необходимите изисквания за проектиране на статистически таблици. Като цяло всички маси трябва да имат

Концепцията за дисперсионния метод
Името на метода се дължи на широката употреба различни видоведисперсии, чиято същност и методи за изчисляване са разгледани в шеста тема на учебника. Струва си да се отбележи, че разликата в сумата

резултат-знак
№ p/n Индивидуални опции Линейни отклонения индивидуални. вариант от средните квадрати на линейните отклонения

Селски стопанства
№ Добив, q/ha Линейни отклонения на индивидуалните добиви от средните, q/ha Квадрати на линейните отклонения на добива

Късна болест, върху добива на картофи
№ Групи стопанства по дял на отглежданите култури, % Брой стопанства в групата Среден дял на третирани култури,

резултат-знак
Група № Интервали по факторен индикатор Локална честота Средна стойност на резултантния вариант на индикатора

Видове дисперсии. Правило за добавяне на дисперсии
Принципът на изчисляване на дисперсията (средни квадратни отклонения) в общ изгледразгледани в тема 6. По отношение на дисперсионния метод това означава, че всеки тип вариация съответства на определен

Добив от картофи (първа група)
№ п.п. Добив, c/ha Линейно отклонение от средния групов добив Квадрати на линейните отклонения

Концепцията за критерия на Р. Фишер
Методът на дисперсията се състои в оценяване на съотношението на коригираната дисперсия, която характеризира систематичните колебания на груповите средни стойности на изследваната ефективна характеристика, към коригираната дисперсия

Двуфакторен дисперсионен комплекс
Решението на този комплекс е насочено към изследване на качественото влияние на два факторни признака на влиянието на два факторни знака върху един или повече ефективни признаци. Двуфакторен комплекс

Зърнени култури
Подгрупа № Брой стопанства в подгрупата Среден добив от ц/ха Линейни отклонения на добива в подгрупата от

Характеристики на многофакторния дисперсионен комплекс
Изследването на качеството на комуникацията, т.е. значимост на влиянието на няколко (три, четири или повече) факторни характеристики върху показатели за ефективност, по същество е продължителността на комбинирания прием

Добиви от зърнени култури
№ п.п. Елементи на вариация Символи Обща вариация Систематична вариация Остатъчна вариация

Същност и видове корелации
В предишната глава беше показано, че качеството (важността) на връзката между характеристиките на фактора и резултата в статистическата популация се определя и оценява с помощта на дисперсията

Основните форми на корелация между характеристиките
Идентифицирането на формата на връзка между знаците се предшества от определянето на причинно-следствената връзка между тях. Това е най-важният и решаващ момент за правилното използване на корелационния метод. от

Индикатори за плътност на корелациите. корелационна връзка
Един от централните въпроси, решавани с помощта на корелационния метод, е определянето и оценката на количествена мярка за близостта на връзката между факторните и резултантните характеристики. При

Корелационни коефициенти на права двойка
Ако връзката между характеристиките на изследваната двойка характеристики е изразена във форма, близка до права линия, тогава степента на близост на връзката между тези характеристики може да се изчисли с помощта на коефициента pr

Ранг коефициент на корелация
Основните статистически характеристики в случаите, когато общо население, от която е взета пробата, се оказва извън параметрите на нормалния или близък до него закон на разпределение

Множествен коефициент на корелация
При изследване на близостта на връзката между няколко факторни и ефективни характеристики се изчислява кумулативният коефициент множествена корелация. Така че, при определяне на общия m

Индикатори за решителност
При изследване на количественото влияние на признаците - фактори върху резултатите е важно да се определи каква част от флуктуацията на резултантния признак се дължи пряко на влиянието на вариацията.

Същност, видове и значение на регресионните уравнения
Регресията се разбира като функция, предназначена да опише зависимостта на промяната в ефективните признаци под влиянието на колебанията на признаците - фактори. Концепцията за регресия е въведена в статистиката

Регресионно уравнение на права линия
Корелацията във форма, близка до права линия, може да бъде представена като уравнение на права линия:

Уравнение на хиперболична регресия
Ако формата на връзката между характеристиката-фактор и характеристиката-резултат, идентифицирана с помощта на координатната диаграма (корелационно поле), се доближава до хиперболична, тогава е необходимо да се състави и реши уравнението

Регресии
№ п.п. Функция-фактор Характеристика-резултат Обратна стойност на характеристиката-фактор Квадрат на обратната стойност

Хиперболична регресия
№ п.п. Добив на грах, dt/ha X Цена на грах, хил. рубли/dt Y Прогнозни стойности

Уравнение на параболична регресия
В някои случаи емпиричните данни на статистическата съвкупност, визуализирани с помощта на координатна диаграма, показват, че нарастването на фактора е придружено от изпреварващо нарастване на res.

параболична регресия
№ п.п. X Y XY X2 X2Y X4

параболична регресия
№ п.п. Специфично тегло на реколтата от картофи, Х Добив на картофи, хил. c. Изчисления на стойността

Уравнение на множествена регресия
Използването на корелационния метод при изследване на зависимостта на признак - резултатът от няколко факторни признака се формира по схема, подобна на проста (двойка) корелация. Един от

Коефициенти на еластичност
За смислено и достъпно описание (интерпретация) на резултатите, отразяващи корелационно-регресионната зависимост между признаците чрез различни регресионни уравнения, обикновено се използва

Същността на динамичните редове
Всички явления на околния свят претърпяват непрекъснати промени във времето; с течение на времето, т.е. техният обем, ниво, състав, структура и др. се променят в динамика. уместно е да се отбележи, че

Селскостопански предприятия
(в началото на годината; хил. физически единици) Показатели 2000 г. 2001 г. 2002 г. 2003 г.

Основните показатели на динамичната серия
Цялостният анализ на динамичните серии ще позволи да се разкрият и характеризират закономерностите, които се проявяват на различни етапи от развитието на явленията, да се идентифицират тенденциите и характеристиките в развитието на тези явления. В про

Абсолютни печалби на ниво
Един от най-простите показатели за развитието на динамиката е абсолютното увеличение на нивото. Абсолютният растеж е разликата между две нива на динамичния диапазон

Темп на растеж на ниво
За да се характеризира относителната скорост на изменение, индикаторът за темп на растеж. Скорост на растеж- това е съотношението на едно ниво на динамичната серия към друго, взето като база за сравнение. темпът на растеж може да бъде

Темп на растеж на ниво
Ако абсолютната скорост на нарастване на нивата на динамичния ред се характеризира с големината на абсолютните увеличения, тогава относителна скоростнива на растеж - темпове на растеж. Темпо при

Абсолютната стойност от един процент увеличение
При анализиране на времеви редове често се поставя задачата: да се установи какви абсолютни стойности изразяват 1% увеличение (намаляване) на нивата, тъй като в редица случаи с намаляване (забавяне) на

За 1999-2003г
Години Продуктивност, c/ha Абсолютно увеличение на добива, c/ha Темп на растеж, % Темп на растеж, %

Техники за подравняване на динамични серии
За идентифициране на времеви модели изисква, като правило, достатъчно голямо числонива, динамични серии. Ако динамичната серия се състои от ограничен брой нива, тогава нейното подравняване

Методи за аналитично подравняване на времеви редове
Идентифицирането на общата тенденция в развитието на нивата на динамичния ред може да се извърши с помощта на различни методи за аналитично подравняване, което най-често се извършва

Аналитично подравняване към експоненциална крива
В някои случаи, например, в процес на въвеждане в експлоатация и разработване на нови производствен капацитет, динамичната серия може да се характеризира с бързо нарастваща промяна в нивата, т.е. верижни

Аналитично параболично подравняване от втори ред
Ако изследваната динамична серия се характеризира с положителни абсолютни нараствания, с ускорение в развитието на нивата, тогава подравняването на серията може да се извърши според парабола от втори ред.

Аналитично подравняване според уравнението на хиперболата
Ако динамичният ред се характеризира със затихнали абсолютни намаления на нивата (например динамиката на трудоемкостта на продуктите, предлагането на труд в производството в селското стопанство и т.н.), тогава

Концепцията за интерполация и екстраполация на нивата на динамичния ред
В някои случаи е необходимо да се намерят стойностите на липсващите междинни нива на времевия ред въз основа на известните му стойности. В такива случаи може да се използва интерполация

производство на картофи класирани статистически

Въз основа на показателите в таблица 2 съставяме ранжирани редове за производство на картофи на 100 хектара обработваема земя; върху добива на картофи; на цена. Връзката между тези показатели е изобразена графично.

Първата стъпка в статистическото изследване на вариацията е изграждането на вариационна серия - подредено разпределение на популационните единици според нарастващи (по-често) или намаляващи (по-рядко) стойности на черта.

Има три форми на вариационна серия: диапазонна серия, дискретна серия, интервална серия. Вариационната серия често се нарича серия на разпределение.

Класирана серия е списък на отделни единици от популацията във възходящ (низходящ) ред на изследваната характеристика

Класирането е процедура за подреждане на обектите на изследване, която се извършва на базата на предпочитание. Диапазонът на вариация показва колко голяма е разликата между единиците на съвкупността.

Рангът е поредният номер на стойностите на атрибута, подредени във възходящ или низходящ ред на техните стойности. Ако стойността на атрибута има същата количествено определяне, тогава рангът на всички тези стойности се приема равен на средноаритметичното на съответния брой места, които определят. Тези редици се наричат ​​свързани.

Графиките в статистиката са начин за визуализиране на статистически показатели под формата на геометрични фигури и знаци, чертежи или схематични карти. Визуалното изображение улеснява възприемането на информация, позволява ви да покриете набор от показатели във взаимовръзка, да идентифицирате тенденциите на развитие и типичните съотношения на показателите.

За показване на индикатори за динамика е препоръчително да използвате линейни графикиили лентови диаграми. Графиката трябва да е визуална, разбираема, лесна за четене и по възможност артистично оформена, която да привлича вниманието към нея.

При конструирането на точкови диаграми набор от точки се използва като графични проби; при конструиране на линейни - линии. Графиката винаги е творчески процес. Тук е необходимо известно търсене. Само след компилиране и сравняване на няколко чернови версии е възможно да се определи правилният състав на графиката, да се зададе мащабът и местоположението на знаците в полето на графиката.

От класирания ред за производство на картофи на 100 ха обработваема земя може да се направи следният извод, че най-ниско производство се наблюдава в Балаганския район, а Ангарският район има най-висока производителност на картофи от 100 ха обработваема земя.

Най-нисък е добивът в Качугски район - 10 ц / ха, а най-висок в Усолски - 195,5 ц / ха.

В област Чунски, с високо производство на картофи на 100 хектара обработваема земя, най-ниската цена от 1 c. Максималната цена се наблюдава в района на Нижне-Илимск. Диапазонът на вариация в цената на центнер картофи е много голям и е равен на 1161,01 рубли.

Други публикации

Анализ на стопанската дейност на предприятието
Преходът към пазарна икономика изисква предприятието да повиши ефективността на производството, конкурентоспособността на продуктите и услугите чрез въвеждане на ефективни форми на икономическо управление и управление на производството, постиженията на научния и технологичния прогрес и активирането на ...

Анализ на финансово-икономическата дейност на АД ТрансКонтейнер
Финансовият анализ е процес, базиран на изследване на данни за финансовото състояние на предприятието и резултатите от дейността му в миналото с цел оценка на бъдещите условия и резултати. Така основната задача финансов анализявл...

Най-важният етап в изследването на социално-икономическите явления и процеси е систематизирането на първичните данни и на тази основа получаването на обобщена характеристика на целия обект с помощта на обобщаващи показатели, което се постига чрез обобщаване и групиране на първичен статистически материал.

Статистическо резюме - това е комплекс от последователни операции за обобщаване на конкретни единични факти, които образуват набор, за идентифициране на типични характеристики и модели, присъщи на изследваното явление като цяло. Провеждането на статистическо обобщение включва следните стъпки :

  • избор на функция за групиране;
  • определяне на реда за формиране на групите;
  • разработване на система от статистически показатели за характеризиране на групите и обекта като цяло;
  • разработване на оформления на статистически таблици за представяне на обобщени резултати.

Статистическо групиране нарича разделяне на единици от изследваната съвкупност на хомогенни групи според определени характеристики, които са от съществено значение за тях. Групирането е най-важният статистически метод за обобщаване на статистически данни, основа за правилното изчисляване на статистическите показатели.

Различават се следните видове групировки: типологични, структурни, аналитични. Всички тези групи се обединяват от факта, че единиците на обекта са разделени на групи по някакъв признак.

знак за групиране се нарича признакът, по който единиците от съвкупността се разделят на отделни групи. от правилен изборчерта на групиране зависи от заключенията статистически изследвания. Като основа за групиране е необходимо да се използват значими, теоретично обосновани признаци (количествени или качествени).

Количествени признаци на групиране имат цифров израз (обем на търговия, възраст на лицето, семеен доход и др.) и качествени характеристики на групировката отразяват състоянието на съвкупността (пол, семейно положение, отраслова принадлежност на предприятието, неговата форма на собственост и др.).

След като се определи основата на групирането, трябва да се реши въпросът за броя на групите, на които трябва да бъде разделена изследваната популация. Броят на групите зависи от целите на изследването и вида на показателя, залегнал в групирането, обема на популацията, степента на изменчивост на признака.

Например, групирането на предприятията според формите на собственост отчита общинската, федералната и собствеността на субектите на федерацията. Ако групирането се извършва по количествен признак, тогава е необходимо да се обърне специално внимание на броя на единиците на обекта, който се изследва, и степента на колебание на груповия признак.

Когато се определи броят на групите, трябва да се определят и интервалите на групиране. Интервал - това са стойностите на променлива характеристика, които са в определени граници. Всеки интервал има своя собствена стойност, горна и долна граница или поне една от тях.

Долната граница на интервала се нарича най-малката стойност на атрибута в интервала и Горна граница - най-голямата стойност на атрибута в интервала. Стойността на интервала е разликата между горната и долната граница.

Интервалите на групиране в зависимост от големината им биват: равни и неравни. Ако вариацията на признака се проявява в относително тесни граници и разпределението е равномерно, тогава се изгражда групиране с равни интервали. Стойността на равен интервал се определя по следната формула :

където Xmax, Xmin - максималните и минималните стойности на атрибута в съвкупността; n е броят на групите.

Най-простото групиране, при което всяка избрана група се характеризира с един показател, е серия на разпределение.

Статистически редове на разпределение - това е подредено разпределение на единиците на съвкупността в групи по определен признак. В зависимост от признака, който е в основата на формирането на серия на разпределение, се разграничават атрибутивни и вариационни серии на разпределение.

атрибутивни те наричат ​​серията за разпределение, изградена според качествени характеристики, т.е. признаци, които нямат цифров израз (разпределение по вид труд, по пол, по професия и др.). Признаковите редове на разпределение характеризират състава на съвкупността по един или друг съществен признак. Взети за няколко периода, тези данни ни позволяват да изследваме промяната в структурата.

Вариационни редове наречена серия на разпределение, изградена на количествена основа. Всяка вариационна серия се състои от два елемента: варианти и честоти. Настроики отделните стойности на атрибута, които приема в серията вариации, се наричат, т.е. специфичната стойност на променливия атрибут.

Честоти наречен номер на индивидуален вариант или всяка група от вариационната серия, т.е. това са числа, които показват колко често се срещат определени варианти в разпределителната серия. Сумата от всички честоти определя размера на цялата популация, нейния обем. Честоти се наричат ​​честоти, изразени в части от единица или като процент от общата сума. Съответно сумата от честотите е равна на 1 или 100%.

В зависимост от характера на изменението на признака се разграничават три форми на вариационни серии: класирана серия, дискретна серия и интервална серия.

Класирани вариационни серии - това е разпределението на отделните единици от съвкупността във възходящ или низходящ ред на изследвания признак. Класирането улеснява разделянето на количествените данни в групи, незабавното откриване на най-малките и най-големите стойности на характеристика, подчертаване на стойностите, които най-често се повтарят.

Дискретни вариационни серии характеризира разпределението на единиците на съвкупността според дискретен атрибут, който приема само цели числа. Например тарифната категория, броят на децата в семейството, броят на служителите в предприятието и др.

Ако знак има непрекъсната промяна, която в определени граници може да приема всякакви стойности ("от - до"), тогава за този знак трябва да изградите интервални вариационни серии . Например размерът на доходите, трудовият стаж, цената на дълготрайните активи на предприятието и др.

Примери за решаване на задачи по темата "Статистическо обобщение и групиране"

Задача 1 . Има информация за броя на получените книги от студентите чрез абонамент за изминалата учебна година.

Изграждане на диапазонна и дискретна вариационна серия на разпределение, обозначаваща елементите на серията.

Решение

Този комплект е набор от опции за броя на книгите, които учениците получават. Нека преброим броя на такива варианти и да ги подредим под формата на вариационна класирана и вариационна дискретна серия на разпределение.

Задача 2 . Има данни за стойността на дълготрайните активи за 50 предприятия, хиляди рубли.

Изградете серия за разпределение, като подчертаете 5 групи предприятия (на равни интервали).

Решение

За решението избираме най-големите и най-малките стойности на цената на дълготрайните активи на предприятията. Това са 30,0 и 10,2 хиляди рубли.

Намерете размера на интервала: h \u003d (30,0-10,2): 5 \u003d 3,96 хиляди рубли.

Тогава първата група ще включва предприятия, чийто размер на дълготрайните активи е от 10,2 хиляди рубли. до 10,2 + 3,96 = 14,16 хиляди рубли. Такива предприятия ще бъдат 9. Втората група ще включва предприятия, чийто размер на дълготрайните активи ще бъде от 14,16 хиляди рубли. до 14,16 + 3,96 = 18,12 хиляди рубли. Такива предприятия ще бъдат 16. По същия начин намираме броя на предприятията, включени в трета, четвърта и пета група.

Получената серия на разпределение се поставя в таблицата.

Задача 3 . За редица предприятия лека промишленостполучи следните данни:

Направете групиране на предприятията според броя на работниците, като оформите 6 групи на равни интервали. Брой за всяка група:

1. брой предприятия
2. брой работници
3. обем на произведената продукция за година
4. средна действителна продукция на работник
5. размер на ДМА
6. среден размер на дълготрайните активи на едно предприятие
7. средна стойност на произведената продукция от едно предприятие

Запишете резултатите от изчислението в таблици. Направете си изводите.

Решение

За решението избираме най-големите и най-малките стойности на средния брой работници в предприятието. Това са 43 и 256.

Намерете размера на интервала: h = (256-43): 6 = 35,5

Тогава първата група ще включва предприятия със среден брой на работниците от 43 до 43 + 35,5 = 78,5 души. Такива предприятия ще бъдат 5. Втората група ще включва предприятия, средният брой на работниците в които ще бъде от 78,5 до 78,5 + 35,5 = 114 души. Такива предприятия ще бъдат 12. По същия начин намираме броя на предприятията, включени в трета, четвърта, пета и шеста група.

Поставяме получената серия на разпределение в таблица и изчисляваме необходимите показатели за всяка група:

Изход : Както се вижда от таблицата, най-многобройна е втората група предприятия. Включва 12 предприятия. Най-малки са пета и шеста група (по две предприятия). Това са най-големите предприятия (по отношение на броя на работниците).

Тъй като втората група е най-многобройна, обемът на продукцията годишно от предприятията от тази група и обемът на дълготрайните активи са много по-високи от останалите. В същото време средната фактическа продукция на един работник в предприятията от тази група не е най-висока. Тук водещи са предприятията от четвърта група. Тази група също така представлява доста голямо количество дълготрайни активи.

В заключение отбелязваме, че средният размер на дълготрайните активи и средната стойност на продукцията на едно предприятие са пряко пропорционални на размера на предприятието (по отношение на броя на работниците).

Първата стъпка в статистическото изследване на вариацията е изграждането на вариационна серия - подредено разпределение на единиците на съвкупността според нарастващи (по-често) или намаляващи (по-рядко) стойности на признак и преброяване на броя на единиците с една или друга стойност на характеристиката.

Има три форми на вариационни серии: диапазонни, дискретни, интервални. Вариационната серия често се нарича серия на разпределение. Този термин се използва при изучаване на вариациите както на количествени, така и на неколичествени признаци. Серията на разпространение е структурна група (глава 6).

Класирана серия е списък на отделни единици от популацията във възходящ (низходящ) ред на изследваната характеристика.

По-долу е дадена информация за големите банки в Санкт Петербург, класирани по собствен капитал към 01.10.1999 г.

Име на банката Собствен капитал, милиони рубли Балтонексим банка 169

Банка Санкт Петербург 237

Петровски 268

Балтийско 290

Промстройбанк 1007

Ако броят на съвкупните единици е достатъчно голям, класираният ред става тромав и изграждането му, дори с помощта на компютър, отнема дълго време. В такива случаи вариационната серия се конструира чрез групиране на единиците от популацията според стойностите на изследваната черта.


Определяне на броя на групите

Броят на групите в серия от дискретни вариации се определя от броя на действително съществуващите стойности на променливия атрибут. Ако признакът приема дискретни стойности, но техният брой е много голям (например броят на добитъка на 1 януари на годината в различни селскостопански предприятия може да варира от нула до десетки хиляди глави), тогава се изгражда интервална вариационна серия . Също така е конструирана поредица от интервални вариации, за да се изследват характеристики, които могат да приемат всякакви, както цели, така и дробни стойности в

области на неговото съществуване. Това са например рентабилността на продадената продукция, себестойността на единица продукция, доходът на жител на града, делът на хората с висше образованиесред населението на различни територии и като цяло всички вторични характеристики, чиито стойности се изчисляват чрез разделяне на стойността на една основна характеристика на стойността на друга (виж Глава 3).

Серията от интервални вариации е таблица, състояща се от две колони (или редове) - интервалите на признака, чиято вариация се изследва, и броя на единиците от съвкупността, попадащи в този интервал (честоти), или съотношението на това число от общата популация (честоти).

Най-често се използват два вида интервални вариационни серии: с еднакъв интервал и с еднаква честота. Серията с равен интервал се използва, ако вариацията на признака не е много силна, т.е. за хомогенна съвкупност, чието разпределение по даден признак е близко до нормалния закон. (Такава серия е представена в таблица 5.6.) Серия с еднаква честота се използва, ако вариацията на характеристиката е много силна, но разпределението не е нормално, а например хиперболично (таблица 5.5).

При конструирането на серия с равен интервал, броят на групите се избира така, че разнообразието от стойности на характеристиките в съвкупността да се отразява достатъчно добре и в същото време редовността на разпределението, неговата форма не се изкривява от случайни честотни колебания. Ако има твърде малко групи, няма да има модел на вариация; ако има твърде много групи, произволните честотни скокове ще изкривят формата на разпределението.



Границите на интервалите могат да бъдат определени по различни начини: горната граница на предишния интервал повтаря долната граница на следващия, както е показано в табл. 5.5, или не се повтаря.

В последния случай вторият интервал ще бъде обозначен като 15.1-20, третият - като 20.1-25 и т.н., т.е. предполага се, че всички стойности на добива са задължително закръглени до една десета. Освен това възниква нежелано усложнение със средата на интервала 15.1-20, който, строго погледнато, вече ще бъде равен не на 17.5, а на 17.55; съответно при замяна на закръгления интервал 40-60 с 40.1-60, вместо закръглената стойност на средата му 50, получаваме 50.5. Поради това е за предпочитане да се оставят интервали с повтаряща се закръглена граница и да се приеме, че единиците от съвкупността, които имат характерна стойност, равна на границата на интервала, са включени в интервала, където тази точна стойност е докладвана за първи път. По този начин ферма с добив от 15 центнера на хектар е включена в първата група, стойността е 20 центнера на хектар

Във втория и т.н.

Необходима е вариационна серия с еднаква честота при много силна вариация на признак, тъй като при разпределение с еднакъв интервал повечето от единиците на популацията се оказват


Таблица 5.5

Разпределение на 100 руски банки според балансовата оценка на активите към 01.01.2000 г.


Границите на интервалите за равномерно разпределение са действителните стойности на активите на първа, десета, единадесета, двадесета и т.н. банки.

Графично представяне на вариационната серия

Значителна помощ при анализа на вариационния ред и неговите свойства оказва графичното представяне. Интервалната поредица е представена от лентова графика, в която основите на лентите, разположени по абсцисната ос, са интервалите на стойностите на променливия атрибут, а височината на лентите са честотите, съответстващи на скалата по протежение на у-ос. Графично представяне на разпределението на стопанствата в региона по отношение на добивите от зърнени култури е показано на фиг.

5.1. Диаграма от този вид често се нарича хистограма (гр. histos - тъкан).

Таблица данни. 5.6 и фиг. 5.1 показват формата на разпределение, характерна за много черти: стойностите на средните интервали на чертата са по-чести, по-рядко екстремните, малки и големи стойности на чертата. Формата на това разпределение е близка до разглежданата в курса математическа статистиказаконът за нормалното разпределение. Великият руски математик А. М. Ляпунов (1857-1918) доказва, че нормалното

Таблица 5.6 Разпределение на стопанствата в региона по добив на зърнени култури


Малко разпределение се формира, когато една променлива е повлияна от голям брой фактори, нито един от които няма преобладаващо влияние. Случайна комбинация от много приблизително равни фактори, влияещи върху промените в добива на зърнени култури, както естествени, така и агротехнически, икономически, създава разпределение на фермите в региона по отношение на добива, близък до нормалния закон за разпределение.


Ориз. 5.2. Кумулативно и основно разпределение на фермите по

производителност

Такава серия се нарича кумулативна. Можете да изградите кумулативно разпределение "не по-малко от", или можете

"повече от". В първия случай графиката на кумулативното разпределение се нарича кумулативно, във втория - огив (фиг. 5.2).

Плътност на разпространение

Ако трябва да се справите с вариационна серия с неравни интервали, тогава за съпоставимост трябва да приведете честотата или честотата към единицата на интервала. Полученото съотношение се нарича плътност на разпределение:


Плътността на разпределение се използва както за изчисляване на обобщаващи показатели, така и за графично представяне на вариационни серии с неравни интервали.

Първата стъпка в статистическото изследване на вариацията е конструирането вариационна серия - подредено разпределение на единици от популацията според нарастващи (по-често) или намаляващи (по-рядко) стойности на атрибута и преброяване на броя на единиците с една или друга стойност на атрибута.

Има три форми на вариационна серия: диапазонна серия, дискретна серия, интервална серия. Вариационната серия често се нарича близко разпространение.Този термин се използва при изследване на вариациите както в количествените, така и в неколичествените признаци. Серията за разпространение е структурно групиране(виж гл. 6).

Класиран ред -това е списък на отделните единици от съвкупността във възходящ (низходящ) ред на изследваната характеристика.

Таблица 1 може да служи като пример за класирана серия. 5.5.

Таблица 5.5

Големи банки в Санкт Петербург, класирани по размерсобствен капитал към 01.07.96г

Ако броят на съвкупните единици е достатъчно голям, класираният ред става тромав и изграждането му, дори с помощта на компютър, отнема много време. В такива случаи вариационната серия се конструира чрез групиране на единиците от популацията според стойностите на изследваната черта.

Ако атрибутът приема малък брой стойности, се изгражда дискретна вариационна серия. Пример за такава серия е разпределението на футболните срещи по брой отбелязани голове (Таблица 5.1). Серия с дискретни вариации -това е таблица, състояща се от два реда или графика: специфични стойности на променлив атрибут хази броя на единиците съвкупност с дадената стойност на признака фичестоти (f е началната буква на английската дума frequency).

Определяне на броя на групите

Броят на групите в серия от дискретни вариации се определя от броя на действително съществуващите стойности на променливия атрибут. Ако признакът може да приема дискретни стойности, но техният брой е много голям (например броят на добитъка на 1 януари на годината в различни селскостопански предприятия може да варира от нула до десетки хиляди глави), тогава серия от интервални вариации е изградена. Интервална вариационна серия също е конструирана за изследване на характеристики, които могат да приемат всякакви, както цели, така и дробни стойности в областта на тяхното съществуване. Такива са например рентабилността на продадените продукти, себестойността на единица продукция, доходът на 1 жител на града, делът на хората с висше образование сред населението на различни територии и като цяло всички второстепенни характеристики, стойностите на които се изчисляват чрез разделяне на стойността на една основна характеристика на стойността на друга (виж глава 3).

Интервални вариационни сериие таблица (състояща се от две колони (или редове) - интервали на признака, чиято вариация се изследва, и броя на единиците от популацията, попадащи в този интервал (честоти), или съотношението на това число от общо население (честоти).

При конструирането на серия от интервални вариации е необходимо да изберете оптималния брой групи (интервали на знаци) и да зададете дължината на интервала. Тъй като при анализ на вариационна серия честотите се сравняват в различни интервали, е необходимо стойността на интервала да бъде постоянна. Оптималният брой групи се избира по такъв начин, че разнообразието от стойности на чертите в съвкупността да се отразява в достатъчна степен и в същото време редовността на разпределението, неговата форма не се изкривява от случайни честотни колебания. Ако има твърде малко групи, няма да има модел на вариация; ако има твърде много групи, произволните честотни скокове ще изкривят формата на разпределението.

Най-често броят на групите във вариационния ред се определя, като се придържаме към формулата, препоръчана от американския статистик Стърджис (Стърджис):

където к- брой групи; н- размерът на населението.

Тази формула показва, че броят на групите е функция на количеството данни.

Да предположим, че е необходимо да се изгради вариационна серия от разпределение на предприятията в региона според добива на зърнени култури за определена година. Броят на земеделските предприятия със зърнени култури е 143; най-ниската стойност на добива е 10,7 c/ha, най-високата е 53,1 c/ha. Ние имаме:

Тъй като броят на групите е цяло число, следователно се препоръчва да се изградят 8 или 9 групи.

Определяне на размера на интервала

Знаейки броя на групите, изчислете стойността на интервала:

В нашия пример стойността на интервала е:

а) с 8 групи

б) с 9 групи

За да изградите серия и да анализирате вариацията, е много по-добре да имате закръглени стойности на размера на интервала и неговите граници, ако е възможно. Следователно най-доброто решение би било да се изгради вариационна серия от 9 групи с интервал, равен на 5 q/ha. Тази вариационна серия е дадена в табл. 5.6, а графичното му представяне е дадено на фиг. 5.1.

Границите на интервалите могат да бъдат определени по различни начини: горната граница на предишния интервал повтаря долната граница на следващия, както е показано в табл. 5.6, или не се повтаря.

В последния случай вторият интервал ще бъде обозначен като 15.1-20, третият като 20.1-25 и т.н., т.е. предполага се, че всички стойности на добива са задължително закръглени до една десета. Освен това възниква нежелано усложнение със средата на интервала 15.1-20, който, строго погледнато, вече ще бъде равен не на 17.5, а на 17.55; съответно, когато заменим закръгления интервал 40-60 с 40,1-6,0, вместо закръглената стойност на средата му 50, получаваме 50,5.Затова е за предпочитане да оставим интервалите с повтаряща се закръглена граница и да се съгласим, че единиците на съвкупността, които имат стойност на характеристиката, равна на границата на интервала, са включени в интервала, където тази точна стойност е докладвана за първи път. Така ферма с добив от 15 центнера от хектар е включена в първата група, стойност от 20 центнера от хектар е включена във втората и т.н.

Ориз. 5.1. Разпределение на стопанствата по добив

Таблица 5.6

Разпределение на стопанствата в района според добива на зърнени култури

Групи ферми по добив,

ц/ха хй

Брой ферми

Средата на интервала

ц/ха хй"

Натрупана честота f'j

Графично представяне на вариационната серия

Значителна помощ при анализа на вариационния ред и неговите свойства оказва графичното представяне. Интервалната поредица е представена от лентова графика, в която основите на лентите, разположени на абсцисната ос, са интервалите на стойностите на променливия атрибут, а височините на лентите са честотите, съответстващи на скалата по оста y. Графично представяне на разпределението на стопанствата в региона по отношение на добивите от зърнени култури е показано на фиг. 5.1. Този вид диаграма често се нарича хистограма(от гръцката дума "histos" - тъкан, структура).

Таблица данни. 5.5 и фиг. 5.1 показва формата на разпределение, характерна за много знаци: стойностите на средните интервали на знака са по-чести, по-рядко - екстремни; малки и големи стойности на характеристиката. Формата на това разпределение е близка до закона за нормалното разпределение, разглеждан в хода на математическата статистика. Великият руски математик А. М. Ляпунов (1857 - 1918) доказва, че нормалното разпределение се формира, ако променливата променлива е повлияна от голям брой фактори, нито един от които няма преобладаващо влияние. Случайна комбинация от много приблизително равни фактори, които влияят върху изменението на добива на зърнени култури, както природни, така и агротехнически, икономически, създава разпределение на фермите в региона по добив, близък до нормалния закон за разпределение.

Ако има дискретна вариационна серия или се използват средните точки на интервалите, тогава графичното представяне на такава вариационна серия се нарича многоъгълник(от гръцките думи - многоъгълник). Всеки от вас може лесно да построи тази графика, като свърже точките с координати с прави линии Х,и /.

Съотношението на височината на многоъгълник или диаграма към основата му се препоръчва в съотношение приблизително 5:8.

Концепцията за честота

Ако в таблицата 5.6 Изразете броя на фермите с едно или друго ниво на производителност като процент от общия брой, като целият брой ферми (143) се приема за 100%, тогава средният добив може да се изчисли, както следва:

където w- честота на 7-ма категория от вариационната серия;

Кумулативно разпределение

Трансформираната форма на вариационната серия е редица натрупани честоти,дадени в табл. 5.6, колона 5. Това е поредица от стойности за броя на единиците в съвкупността с по-малко и равно на долната граница на съответните интервални стойности на атрибута. Такава поредица се нарича кумулативен.Можете да изградите кумулативно разпределение „не по-малко от“ или можете „по-голямо от“. В първия случай се извиква диаграмата на кумулативното разпределение натрупвам,във втория - огив(фиг. 5.2).

Плътност, разпределения

Ако трябва да се справите с вариационна серия с неравни интервали, тогава за съпоставимост трябва да приведете честотата или честотата към единицата на интервала. Полученото съотношение се нарича плътност на разпространение:

Плътността на разпределение се използва както за изчисляване на обобщаващи показатели, така и за графично представяне на вариационни серии с неравни интервали.

Ориз. 5.2. Ogiva и разпределение на кумулативния добив

5.7. Структурни характеристики на вариационния ред

Медиана на разпределение

При изучаване на вариацията се използват такива характеристики на вариационната серия, които описват количествено нейната структура, структура. Такава е напр. Медиана-стойността на променливата характеристика, разделяща съвкупността на две равни части ~ със стойности на характеристиките по-малки от медианата И със стойности на характеристиките по-големи от медианата (третата банка от пет в таблица 5.5, т.е. 196 милиарда рубли).

На примера на табл. 5.5 видяно фундаментална разликамежду медианата и средната стойност. Медианата не зависи от стойностите на характеристиките в краищата на класираната серия. Дори ако капиталът на най-голямата банка в Санкт Петербург беше десет пъти по-голям, средната стойност няма да се промени. Следователно медианата често се използва като по-надежден индикатор за типичната стойност на дадена характеристика от средната аритметична стойност, ако серията от стойности е разнородна, включва резки отклонения от средната стойност. В тази серия средната стойност на собствения капитал, равна на 269 милиарда рубли, се формира под силното влияние на най-голямата опция. 80% от банките имат капитал под средния и само 20% имат повече. Малко вероятно е такава средна стойност да се счита за типична стойност. При четен брой единици на съвкупността, медианата се приема като средна аритметична стойност на двете централни опции, например с десет стойности на атрибута, средната стойност на петата и шестата стойност в класираната серия.

В интервална вариационна серия формулата (5.14) се използва за намиране на медианата.

където Me е медианата;

x 0 -долната граница на интервала, в който се намира медианата;

f M e-1 - натрупаната честота в интервала, предхождащ медианата;

е аз- честота в медианния интервал;

аз- интервална стойност;

к - брой групи.

В табл. 5.6 медианата е средната от 143 стойности, т.е. седемдесет и втора от началото на серията стойност на производителността. Както се вижда от броя на натрупаните честоти, той е в четвъртия интервал. Тогава

При нечетен брой единици от съвкупността, средното число, както виждаме, е равно на не , както във формула (5.14), a , но това разграничение не е съществено и обикновено се пренебрегва на практика.

В дискретна вариационна серия медианата трябва да се счита за стойността на признака в групата, в която е натрупаната честота;

повече от половината от населението. Например за данните в табл. 5.1 Средният брой отбелязани голове на мач ще бъде 2.

Квартили на разпределение

Подобно на медианата, стойностите на атрибута се изчисляват, разделяйки съвкупността на четири части, равни по брой единици. Тези количества се наричат квартилии се означават с главна латинска "буква" Qс подписана значка с квартилен номер. Това е ясно Q 2 съвпада с мен. За първи и трети квартил представяме формулите и изчислението съгласно табл. 5.6.

защото Q 2 = Me = 29,5 c/ha, вижда се, че разликата между първия квартил и медианата е по-малка, отколкото между медианата и третия квартил. Този факт показва наличието на известна асиметрия в средната област на разпределението, което също се забелязва на фиг. 5.1.

Наричат ​​се характеристичните стойности, които разделят серията на пет равни части квинтилина десет части децили,сто части процентили.Тъй като тези характеристики се използват само когато е необходимо да се проучи подробно структурата на вариационните серии, ние няма да даваме техните формули и изчисление.

Режим на разпространение

Несъмнено важностима такава стойност на признака, която най-често се среща в изследваната серия, в съвкупност. Това количество се нарича модаи обозначават Mo. В дискретна серия режимът се определя без изчисление като стойност на признака с най-висока честота. Например, според табл. 5.1 най-често са отбелязани 2 гола във футболен мач - 71 пъти. Режимът е номер 2. Обикновено има редове с една модална стойност на характеристиката. Ако две или повече равни (и дори няколко различни, но по-големи от съседните) стойности на характеристика присъстват в серията вариации, тя се счита съответно за бимодална („подобна на камила“) или мултимодална. Това показва хетерогенността на набора, вероятно представляваща съвкупност от няколко комплекта с различни режими.

Така че в тълпата от туристи, които идват от различни страни, вместо едно модно облекло, преобладаващо сред местните жители, можете да намерите смесица от различни „моди“, възприети от различни народиспокойствие.

В серия от интервални вариации, особено при непрекъсната вариация на характеристика, строго погледнато, всяка стойност на характеристиката се среща само веднъж. Модалният интервал е интервалът с най-висока честота.В рамките на този интервал се намира условната стойност на атрибута, в близост до която плътността на разпределение, т.е. броят на единиците съвкупност на единица измерване на променлив атрибут достига максимум. Това е условна стойност и се взема предвид мода на точки.Логично е да се приеме, че такава точкова мода е разположена по-близо до тази на границите на интервала, отвъд която честотата в съседния интервал е по-голяма от честотата в интервала зад другата граница на модалния интервал. Следователно имаме често използваната формула (5.15):

където х 0 - долната граница на модалния интервал;

fMo - честота в модалния интервал;

fMo -1 - честота в предходния интервал;

fMo +1 - честота в следващия интервал след модала;

аз - интервална стойност.

Според табл. 5.6 изчислете модата:

Режим на изчисление в интервални сериимного условно. Приблизително Mo може да се определи графично (виж фиг. 5.1).

Средноаритметичната стойност също е от значение за изследване на структурата на вариационния ред, въпреки че основната стойност на този обобщаващ показател е друга. В сериите на разпределение на фермите по добив (Таблица 5.6), средният добив се изчислява като честотно претеглената среда на интервалите х(по формула (5.2)):

Връзка между средна стойност, медиана и мода

Разликата между средното аритметично, медианата и модата в това разпределение е малка. Ако разпределението по форма е близко до нормалния закон, тогава медианата е между модата и средната стойност и е по-близо до средната, отколкото до модата.

С дясностранна асиметрия х̅ > Аз > Мо;

с лявостранна асиметрия х̅ < аз< Mo.

За умерено изкривени разпределения равенството е вярно:

5.8. Мерки за размер и интензитет вариации

Абсолютни средни размери на вариация

Следващият етап в изследването на вариацията на признака в съвкупността е измерването на характеристиките на силата, величината на вариацията. Най-простият от тях може да бъде обхватили амплитуда на вариация -абсолютната разлика между максималните и минималните стойности на черта от стойностите, налични в изследвания набор от стойности. По този начин диапазонът на вариация се изчислява по формулата

Тъй като величината на диапазона характеризира само максималната разлика в стойностите на атрибута, той не може да измери регулярната сила на неговата вариация в цялата популация. Индикаторът, предназначен за тази цел, трябва да отчита и обобщава всички разлики в стойностите на атрибута в съвкупността, без изключение. Броят на тези разлики е равен на броя на комбинациите от две от всички единици на съвкупността; според табл. 5.6 ще бъде: C^= 10 153. Въпреки това, няма нужда да се вземат предвид, изчисляват и осредняват всички отклонения. По-лесно е да се използва средната стойност на отклоненията на отделните стойности на атрибута от средноаритметичната стойност на атрибута, а те са само 143. Но средното отклонение на стойностите на атрибута от средноаритметичната стойност, според към добре известното свойство на последния, е нула. Следователно индикаторът за силата на вариацията не е алгебричен средно отклонение, а среден модул на отклонения:

Според табл. 5.6 среден модул, или средно линейно отклонение,в абсолютна стойност се изчислява като честотно претеглено отклонение по модул средните точки на интервалите от средната аритметична стойност, т.е. според формулата

Това означава, че средно добивът в изследваната група стопанства се отклонява от средния добив в района с 6,85 ц/ха. Простотата на изчисление и интерпретация са положителните страни на този индикатор, но математическите свойства на модулите са „лоши“: тяхне може да се приведе в съответствие с никакъв вероятностен закон, включително нормална дистрибуция, чийто параметър не е средният модул на отклоненията, а стандартно отклонение(в английски компютърни програми, наречени "стандартно отклонение", съкратено "s.d." или просто « с», на рускоезични - NKO). В статистическата литература стандартното отклонение от средната стойност обикновено се означава с малка (малка буква) гръцка буквасигма (st) или с(виж гл. 7):

за класирани серии

за интервални серии

Според табл. 5.6 стандартното отклонение на добива на зърно е:

Трябва да се отбележи, че известно закръгляване на средната стойност и средните точки на интервалите, например до цели числа, има малък ефект върху стойността на σ, която тогава би възлизала на 8,55 c/ha.

Стандартното отклонение в величината в реалните популации винаги е по-голямо от средния модул на отклонение. Съотношение (при: азависи от наличието на резки, изпъкнали отклонения в агрегатите и може да служи като индикатор за "замърсеността" на агрегата с разнородни елементи с основната маса: колкото по-голямо е това съотношение, толкова по-силно е такова "замърсяване". За нормален законразпределения σ : а = 1,2.

Концепцията за дисперсия

Квадратът на стандартното отклонение дава стойността дисперсия σ 2 .Формула за дисперсия:

просто (за негрупирани данни):

претеглени (за групирани данни):

Почти всички методи на математическата статистика се основават на дисперсия. От голямо практическо значение е правилото за добавяне на отклонения (виж гл. 6).

Други мерки за вариация

Друг показател за силата на вариацията, който я характеризира не в цялата популация, а само в централната й част, е средно четвърт разстояние,тези. средната стойност на разликата между квартилите, означена по-долу като q:

За разпределението на земеделските предприятия по добив в табл. 5.2

р\u003d (36.25 - 25.09): 2 \u003d 5,58 kg / ha. Силата на вариация в централната част на популацията като правило е по-малка, отколкото в цялата популация. Съотношението между средния модул на отклонения и средното тримесечно отклонение също служи за изследване на структурата на вариацията: голяма стойност на това съотношение показва наличието на слабо вариращо "ядро" и силно разпръсната среда около това ядро ​​или "ореол" “ в изследваната популация. За данните в табл. 5,6 съотношение а: в= 1,23, което показва малка разлика в силата на вариацията в централната част на популацията и в нейната периферия.

За да се оцени интензивността на вариацията и да се сравни в различни популации и още повече за различни признаци, е необходимо да относителни показатели за вариация.Те се изчисляват като отношение на абсолютните показатели за силата на вариация, разгледани по-рано, към средноаритметичната стойност на признака. Получаваме следните показатели:

1) относителен обхват на вариация p:

2) относително отклонение по модул T:

3) коефициент на вариация като относително квадратно отклонение v:

4) относителна четвърт разстояние д:

където р - средно квартилно разстояние.

За да варирате добива според табл. 5.6 тези индикатори са:

ρ = 42,4: 30,3 = 1,4, или 140%;

T= 6,85 : 30,3 = 0,226, или 22,6%;

v = 8,44: 30,3 = 0,279, или 27,9%;

д= 5,58: 30,3 = 0,184, или 18,4%.

Оценката на степента на интензивност на вариацията е възможна само за всяка отделна характеристика на популация с определен състав. Така че, за набор от селскостопански предприятия, вариацията в добива в един и същи естествен регион може да се оцени като слаба, ако v < 10%, умеренная при 10% < v < 25% и сильная при v > 25%.

Напротив, вариацията във височината в популацията на възрастни мъже или жени вече с коефициент, равен на 7%, трябва да се оценява и възприема от хората като силна. По този начин оценката на интензитета на вариацията се състои в сравняване на наблюдаваната вариация с някаква нейна обичайна интензивност, взета за стандарт. Ние сме свикнали с факта, че производителността, доходите или доходите на глава от населението, броят на жилищните стаи в сградата могат да се различават няколко или дори десетки пъти, но разликата във ръста на хората поне един път и половина вече се възприема като много силен.

Различна сила, вариация на интензитета поради обективни причини. Например продажната цена на щатския долар в търговските банки в Санкт Петербург на 24 януари 1997 г. варира от 5675 до 5640 рубли. на средна цена от 5664 рубли. Относителен диапазон на вариация ρ = 35:5664 = 0.6%. Такава малка вариация се дължи на факта, че при значителна разлика в обменния курс на долара веднага ще има отлив на купувачи от „скъпата“ банка към „по-евтините“. Напротив, цената на килограм картофи или говеждо месо в различните региони на Русия варира значително - с десетки процента и повече. Това се дължи на различните разходи за доставка на стоки от региона на производителя до региона на потребителя, т.е. поговорката "юница в чужбина е половината, но рублата се транспортира."

5.9. Моменти на разпределение и показатели неговите форми

Разпределителни централни моменти

За по-нататъшно изследване на естеството на вариацията се използват средните стойности на различни степени на отклонение на отделните стойности на даден признак от неговата средна аритметична стойност. Тези показатели се наричат централни моментиразпределения на реда, съответстващ на мощността, до която се повишават отклоненията (Таблица 5.7), или просто моменти (нецентралните моменти се използват рядко и няма да бъдат разглеждани тук). Стойността на третия момент ts- зависи, подобно на неговия знак, от преобладаването на положителните кубове на отклонения над отрицателните кубове или обратно. При нормално и всяко друго строго симетрично разпределение сумата от положителните кубове е строго равна на сумата от отрицателните кубове.

Индикатори за асиметрия

Въз основа на момента на третия ред е възможно да се конструира индикатор, характеризиращ степента на асиметрия на разпределението:

КатоНаречен фактор на асиметрия.Може да се изчисли както от групирани, така и от негрупирани данни. Според табл. 5.6 индексът на асиметрия беше:

тези. асиметрията е лека. Английският статистик К. Пиърсън, въз основа на разликата между средната стойност и режима, предложи друг показател за асиметрия

Таблица 5.7

Централни моменти

Според табл. 5.6 Индексът на Pearson е:

Индексът на Pearson зависи от степента на асиметрия в средната част на серията на разпределение, а индексът на асиметрия, базиран на момента от третия ред, зависи от екстремните стойности на признака. Така в нашия пример в средната част на разпределението асиметрията е по-значима, което се вижда и от графиката (фиг. 5.1). Разпределенията със силна дясна и лява (положителна и отрицателна) асиметрия са показани на фиг. 5.3.

Характеризиране на ексцеса на разпределението

С помощта на момента от четвърти ред, още по-сложно свойство на реда на разпределение от асиметрията, т.е. ексцес.


Ориз. 5.3. Асиметрия, разпределения

Индикаторът за ексцес се изчислява по формулата

(5.30)

Често ексцесът се тълкува като "стръмност" на разпределението, но това е неточно и непълно. Графиката на разпределението може да изглежда произволно стръмна в зависимост от силата на вариацията на чертата: колкото по-слаба е вариацията, толкова по-стръмна е кривата на разпределение в даден мащаб. Да не говорим за факта, че чрез смяна на мащабите по абсцисата и по ординатата всяко разпределение може изкуствено да се направи "стръмно" и "наклонено". За да покажете какъв е ексцесът на разпределението и да го интерпретирате правилно, трябва да сравните серии с еднаква сила на вариация (една и съща стойност на σ) и различни показатели за ексцес. За да не объркате ексцеса с изкривяването, всички сравнявани редове трябва да са симетрични. Такова сравнение е показано на фиг. 5.4.

Фиг.5.4. Ексцес на разпределение

За вариационна серия с нормално разпределение стойностите аз показател за ексцес, изчислен по формула (5.30), j е равно на три.

Такъв показател обаче не трябва да се нарича терминът "ексцекс", което в превод означава "излишък". Терминът "ексцес" трябва да се прилага не към самото съотношение по формулата (5.30), а към сравнението на такова съотношение за изследваното разпределение със стойността на даденото съотношение на нормалното разпределение, т.е. със стойност 3. Оттук и окончателните формули за показателя ексцес, т.е. ексцесиите в сравнение с нормалното разпределение със същата сила на вариация имат формата:

за класирани серии

за интервални и дискретни вариационни серии

Наличието на положителен ексцес, както и отбелязаната по-рано значителна разлика между малко тримесечно разстояние и голямо стандартно отклонение, означава, че в изследваната маса от явления има „ядро“, което варира леко в тази характеристика, заобиколено от разпръснат „ореол“. При значителен отрицателен ексцес изобщо няма такова „ядро“.

По стойностите на показателите за асиметрия и ексцес на разпределението може да се съди за близостта на разпределението до нормалното, което е от съществено значение за оценка на резултатите от корелацията и регресионен анализ, възможности за вероятностна оценка на прогнозите (вижте глави 7,8,9). Разпределението може да се счита за нормално, или по-точно, хипотезата за сходството на действителното разпределение с нормалното разпределение не може да бъде отхвърлена, ако показателите за асиметрия и ексцес не надвишават техните двукратни стандартни отклонения Cm. Тези стандартни отклонения се изчисляват по формулите:

5.10. Максимално възможни стойности вариационни индикатори и тяхното приложение

При прилагането на всякакъв вид статистически показатели е полезно да се знае какви са максималните възможни стойности на даден показател за изследваната система и какво е съотношението на реално наблюдаваните стойности към максимално възможните. Този проблем е особено актуален при изучаване на вариациите на показателите за обем, като обема на производството на определен вид продукт, наличието на определени ресурси, разпределението на капиталовите инвестиции, доходите и печалбите. Нека разгледаме теоретично и практически този въпрос на примера на разпределението на зеленчукопроизводството между земеделските предприятия в региона.

Очевидно е, че минималната възможна стойност на показателите за вариация се постига при строго равномерно разпределение на обемния признак между всички единици на съвкупността, т.е. при еднакъв обем на продукцията във всяко от земеделските предприятия. При такова ограничаващо (разбира се, много малко вероятно на практика) разпределение няма вариация и всички показатели, вариации са равни на нула.

Максималната възможна стойност на показателите за вариация се постига при такова разпределение на обемния признак в популацията, при което целият му обем е съсредоточен в една единица от популацията; например целият обем зеленчукопроизводство - в едно земеделско предприятие от областта при липса на производство в други стопанства. Вероятността за такава изключително възможна концентрация на обема на признак в една единица от съвкупността не е толкова малка; във всеки случай е много по-голяма от вероятността за строго равномерно разпределение.

Разгледайте експонентите на вариацията за посочения граничен случай на неговия максимум. Нека обозначим броя на единиците от съвкупността П,средната стойност на признака х̅ , тогава общият обем на характеристиката в съвкупността ще бъде изразен като х̅ П.Целият този обем е концентриран в една единица от съвкупността, така че хмакс= х̅ стр. хмин = 0, откъдето следва, че максималната стойност на амплитудата (диапазон на изменение) е равна на:

За да изчислим максималните стойности на средните модулни и квадратични отклонения, ще изградим таблица с отклонения (Таблица 5.8).

Таблица 5.8

Модули и квадрати на отклонения от средната стойност при максимумвъзможна вариация

Брой единици на населението

Стойности на характеристиките

Отклонения от средната стойност

x i - х̅

Модули за отклонение

|x i - x̅|

Квадрати за отклонение

аз- х̅ ) 2

х̅ П

х̅ (P - 1)

-х̅

-х̅

-х̅

х̅ (P - 1)

х̅

х̅

х̅

х̅ 2 (P - 1) 2

х̅ 2

х̅ 2

х̅ 2

х̅ П

2х̅ (P - 1)

х̅ 2 [(P - 1) 2 +(n-1)]

Въз основа на изразите в последния ред на табл. 5.8, получаваме следните максимални възможни стойности на индикаторите за вариация.

Среден модул на отклонения или средно линейно отклонение:

Стандартно отклонение:

Относително модулно (линейно) отклонение:

Коефициентът на вариация:

Що се отнася до тримесечното разстояние, системата с максимално възможна вариация има изродена структура на разпределението на характеристиките, в която няма („не работят“) характеристики на структурата: медиана, квартили и други подобни.

Въз основа на получените формули за максимално възможните стойности на основните показатели на вариация, на първо място, следва заключението за зависимостта на тези стойности от обема на популацията П.Тази зависимост е обобщена в табл. 5.9.

Най-тесните граници на изменение и слабата зависимост от размера на популацията разкриват средния модул и относителното линейно отклонение. Напротив, стандартното отклонение и коефициентът на вариация силно зависят от броя на единиците от съвкупността. Тази зависимост трябва да се вземе предвид, когато се сравнява интензивността на вариация в популации с различни размери. Ако в съвкупността от шест предприятия коефициентът на вариация в обема на производството е 0,58, а в съвкупността от 20 предприятия е 0,72, тогава справедливо ли е да се заключи, че обемът на производството във втората съвкупност е по-неравномерен? Наистина, в първия, по-малък, той възлиза на 0,58: 2,24 = 25,9% от максимално възможния, т.е. граница, нивото на концентрация на производство в едно предприятие от шест, а във втората, по-голяма група, наблюдаваният коефициент на вариация е само 0,72: 4,36 = 16,5% от максимално възможния.

Таблица 5.9

Гранични стойности на показателите за вариация на обемна характеристика за различни размери на популацията

Размер на населението

Максимални стойности на индикаторите

х̅

х̅

1,5х̅

1,73х̅

1,67х̅

2,24х̅

1,80х̅

3х̅

1,90х̅

4,36х̅

1,96х̅

7х̅

1,98х̅

9,95х̅

2х̅

От практическо значение е такъв показател като съотношението на действителния среден модул на отклонение към максимално възможния. Така за съвкупността от шест предприятия това съотношение е: 0,47 : 1,67 = 0,281, или 28,1%. Тълкуването на получения показател е следното: за да се премине от наблюдаваното разпределение на продукцията между предприятията към равномерно разпределение, ще е необходимо да се преразпределят

, или 23,4% от общото производство. Ако степента на действителната концентрация на производството (действителната стойност на σ или v) е определена част от пределната стойност в случай на монополизиране на производството в едно предприятие, тогава съотношението на действителния показател към пределния може да характеризира степента на концентрация (или монополизация) на производството.

Съотношенията на действителните стойности на показателите за вариация или промяна в структурата към максимално възможните също се използват при анализа на структурните промени (виж Глава 11).

1. Джийни К.Средни стойности. - М.: Статистика, 1970.

2. Кривенкова Л. Н., Юзбашев М. М.Областта на съществуване на вариационни индикатори и неговото приложение // Статистически бюлетин. - 1991. - № 6. - С. 66-70.

3. Пасхавер И. С.Средни стойности в статистиката. - М.: Статистика. 1979 г.

4. Шураков В. В., Даитбегов Д. М. и др.автоматизиран работно мястостатистическа обработка на данни (Глава 4. Предварителна статистическа обработка на данни). - М.: Финанси и статистика, 1990.

Споделете с приятели или запазете за себе си:

Зареждане...