Методи и основни етапи на статистическото изследване.

За да получите представа за конкретно явление, да направите изводи, е необходимо да проведете статистическо изследване. Предмет на статистически изследвания в здравеопазването и медицината може да бъде здравето на населението, организацията на медицинската помощ, различни раздели от дейността на лечебните заведения, факторите на околната среда, които влияят върху здравословното състояние.

Методическата последователност на извършване на статистическо изследване се състои от определени етапи.

Етап 1. Съставяне на план и програма за изследване.

Етап 2. Събиране на материал (статистическо наблюдение).

Етап 3. Развитие на материала, статистическо групиране и обобщение

Етап 4. Статистически анализ на изследваното явление, формулиране на изводи.

Етап 5 Литературна обработка и представяне на резултатите.

След приключване на статистическото изследване се разработват препоръки и управленски решения, резултатите от изследването се прилагат на практика и се оценява ефективността.

При провеждането на статистическо изследване най-важният елемент е спазването на строга последователност при изпълнението на тези етапи.

Първи етап статистическото изследване - съставяне на план и програма - е подготвително, при което се определят целта и задачите на изследването, изготвят се план и изследователска програма, разработва се програма за обобщаване на статистически материали и се решават организационни въпроси.

При започване на статистическо изследване е необходимо точно и ясно да се формулират целта и задачите на изследването, да се проучи литературата по тази тема.

Целта определя основната насока на изследването и като правило е не само теоретична, но и практическа. Целта е формулирана ясно, ясно, недвусмислено.

За разкриване на целта се определят изследователските задачи.

Важен аспект от подготвителната фаза е разработването на организационен план. Организационният план на изследването предвижда определянето на мястото (административно-териториалните граници на наблюдението), времето (конкретните срокове за провеждане на наблюдението, разработването и анализа на материала) и предмета на изследването (организатори, изпълнители, методическо и организационно ръководство, източници на финансиране на изследванията).

Пла n изследванияд ова ниавключва:

Дефиниране на обекта на изследване (статистическа съвкупност);

Обхватът на изследването (непрекъснато, непродължително);

Видове (текущи, еднократни);

Начини за събиране на статистическа информация. Изследователска програмавключва:

Дефиниране на единицата за наблюдение;

Списък с въпроси (отчетни знаци), които трябва да бъдат регистрирани във връзка с всяка единица на наблюдение*



Разработване на индивидуална счетоводна (регистрационна) форма със списък на въпросите и характеристиките за записване;

Разработване на оформления на таблици, в които след това се въвеждат резултатите от изследването.

За всяка единица за наблюдение се попълва отделен формуляр, който съдържа паспортна част, ясно формулирани въпроси от програмата, поставени в определена последователност, и датата на попълване на документа.

Като счетоводни форми могат да се използват счетоводни медицински формуляри, използвани в практиката на лечебните заведения.

Като източници за получаване на информация могат да служат други медицински документи (истории на заболяването и индивидуални карти на амбулаторен пациент, история на развитието на дете, история на раждане), отчетни форми на лечебни заведения и др.

За да се даде възможност за статистическа обработка на данните от тези документи, информацията се копира в специално разработени счетоводни форми, чието съдържание се определя за всеки отделен случай в съответствие с целите на изследването.

Понастоящем, във връзка с машинната обработка на резултатите от наблюдението с помощта на компютър, програмните въпроси могат да бъдат формализирани , когато въпросите в счетоводния документ са поставени под формата на алтернативи (да, не) , или се предлагат готови отговори, от които следва да се избере конкретен отговор.

На първия етап от статистическото изследване, заедно с програмата за наблюдение, се съставя програма * от обобщението на получените данни, която включва установяване на принципите на групиране, избор на групови характеристики , определяне на комбинации от тези знаци, изготвяне на оформления на статистически таблици.

Втора фаза- събиране на статистически материал (статистическо наблюдение) - състои се в регистриране на отделни случаи на изследваното явление и счетоводните признаци, които ги характеризират в регистрационните форми. Преди и по време на изпълнението на тази работа се провежда инструктаж (устен или писмен) на наблюдателите, като им се предоставят регистрационни формуляри.

По времево отношение статистическото наблюдение може да бъде текущо и еднократно.

При текущо наблюдениеЮ отричанеявлението се изучава за някакъв отделен период от време (седмица, тримесечие , година и т.н.) чрез ежедневно записване на явлението при възникване на всеки случай. Пример за текущо наблюдение е отчитането на броя на ражданията , умрял, болен , изписани от болницата и т.н. Това отчита бързо променящите се явления.

При еднократно наблюдениеЮ отричанестатистическите данни се събират в определен (критичен) момент от време. Еднократни наблюдения са: преброяване на населението, изследване на физическото развитие на децата, отчитане на болничните легла за коне на годината, сертифициране на лечебни заведения и др. Превантивните прегледи на населението също принадлежат към този тип. Еднократната регистрация отразява състоянието на явлението към момента на изследването. Този тип наблюдение се използва за изследване на бавно променящи се явления.

Изборът на вида наблюдение във времето се определя от целта и задачите на изследването. Например, характеристиките на хоспитализираните пациенти могат да бъдат получени в резултат на текущата регистрация на напусналите болницата (текущо наблюдение) или чрез еднодневно преброяване на пациентите, които са в болница (еднократно наблюдение).

В зависимост от пълнотата на обхващане на изследваното явление се разграничават непрекъснато и непродължително изследване.

При непрекъснатоИзследването изучава всички единици на наблюдение, включени в съвкупността, т.е. общото население. Провежда се непрекъснато изследване, за да се установят абсолютните размери на явлението, например общата популация, общият брой на ражданията или смъртните случаи, общият брой случаи на дадено заболяване и т.н. Използва се и непрекъснатият метод в случаите, когато информацията е необходима за оперативна работа (отчитане на инфекциозни заболявания, натовареност на лекарите и др.)

При прекъснатПроучването изследва само част от общата популация. Разделя се на няколко вида: въпросник, монографичен, основен масив, селективен. Най-често срещаният метод в медицинските изследвания е методът на вземане на проби.

Монографичен метод- дава подробно описание на отделни единици от съвкупността, характерни във всяко отношение, и дълбоко, изчерпателно описание на обектите.

Метод на основния масив- включва изследване на онези обекти, в които са концентрирани по-голямата част от единиците за наблюдение. Недостатъкът на този метод е, че част от популацията остава необхваната от изследването, макар и малка по размер, но която може да се различава значително от основния масив.

Анкетен метод- това е събирането на статистически данни с помощта на специално разработени въпросници, адресирани до определен кръг от хора. Това проучване се основава на принципа на доброволността, така че връщането на въпросниците често е непълно. Често отговорите на поставените въпроси носят отпечатъка на субективизъм и случайност. Този метод се използва за получаване на приблизително описание на изследваното явление.

Метод на вземане на проби- се свежда до изучаване на някаква специално избрана част от единиците на наблюдение за характеризиране на цялата генерална съвкупност. Този метод има предимството да получава резултати с висока степен на надеждност, както и значително по-ниска цена. В изследването участват по-малък брой изпълнители , освен това изисква по-малко време.

В медицинската статистика ролята и мястото на метода на вземане на проби е особено голяма, тъй като медицинските работници обикновено се занимават само с част от изследваното явление: те изучават група пациенти с определено заболяване, анализират работата на отделни отдели и медицински институции , оценяват качеството на определени събития и др.

Според метода за получаване на информация в хода на статистическото наблюдение и характера на неговото провеждане се разграничават няколко вида:

1) пряко наблюдение(клиничен преглед на пациенти , диригентска лаборатория , инструментални изследвания , антропометрични измервания и др.)

2) социологически методи: метод на интервю (анкета лице в лице), анкетиране (кореспондентска анкета - анонимна или неанонимна) и др.;

3) документални изследванияа nie(копие от информация от счетоводни и отчетни медицински документи, информация от официалната статистика на институции и организации.)

Трети етап- групиране и обобщение на материала - започва с проверка и уточняване на броя на наблюденията , пълнота и коректност на получената информация , идентифициране и отстраняване на грешки, дублиращи се записи и др.

За правилното развитие на материала се използва криптиране на първичните счетоводни документи. , тези. обозначаване на всеки признак и неговата група със знак - буквен или цифров. Шифроването е техника , улесняване и ускоряване на материалното развитие , подобряване на качеството, точността на разработката. Шифровете - символите - се разработват произволно. При кодиране на диагнози се препоръчва използването на международната номенклатура и класификация на болестите; при кодиране на професии - речник на професиите.

Предимството на криптирането е, че при необходимост след края на основната разработка можете да се върнете към материала за разработка, за да изясните нови връзки и зависимости. Криптираните счетоводни материали го правят по-лесно и по-бързо , отколкото некриптирани. След проверка функциите се групират.

групиране- разделяне на съвкупността от изследваните данни на еднородни , типични групи според най-съществените признаци. Групирането може да се извърши по качествени и количествени признаци. Изборът на признак за групиране зависи от естеството на изследваната популация и целите на изследването.

Типологичното групиране се извършва според качествени (описателни, атрибутивни) характеристики, например по пол , професия, групи заболявания, тежест на протичане на заболяването, следоперативни усложнения и др.

Групирането по количествени (вариационни) признаци се извършва въз основа на числения размер на признака , например , по възраст , продължителността на заболяването, продължителността на лечението и др. Количественото групиране изисква решение на въпроса за размера на груповия интервал: интервалът може да бъде равен, а в някои случаи - неравен, дори да включва така наречените отворени групи.

Например , при групиране по възраст могат да се определят открити групи: до 1г . 50 години и повече.

При определяне на броя на групите изхождайте от целта и задачите на изследването. Необходимо е групирането да може да разкрие моделите на изследваното явление. Голям брой групи могат да доведат до прекомерно смачкване на материала, ненужни детайли. Малкият брой групи води до затъмняване на характерните черти.

След като приключите с групирането на материала, преминете към резюмето.

ОТ водка- обобщение на изолирани случаи , получени в резултат на статистическо изследване, в определени групи, тяхното изчисляване и включване в таблиците за оформление.

Обобщението на статистическия материал се извършва с помощта на статистически таблици. Таблица , не е изпълнено с числа , наречено оформление.

Статистическите таблици са списък , хронологичен, териториален.

Таблицата има субект и предикат. Статистическият обект обикновено се поставя на хоризонтални линии от лявата страна на таблицата и отразява основната, основна характеристика. Статистическият предикат е разположен отляво надясно по вертикалните колони и отразява допълнителни счетоводни характеристики.

Статистическите таблици са разделени на прости , група и комбинация.

AT прости масипредставено е численото разпределение на материала по един признак , неговите съставни части (Таблица 1). Простата таблица обикновено съдържа прост списък или резюме на съвкупността от изследваното явление.

маса 1

Разпределение на починалите в Н. болница по възраст

AT групови масипредставя комбинация от два знака във връзка един с друг (Таблица 2).

таблица 2

Разпределение на починалите в Н. болница по пол и възраст

AT комбинирама циотносно тези таблицидадено е разпределението на материала по три или повече взаимосвързани признака (табл. 3).

Таблица 3

Разпределение на починалите в Н. болница с различни заболявания по възраст и пол

Диагностика на основното заболяване Възраст
0-14 15-19 20-39 40-59 60 и > Обща сума
м и м и м и м и м и м и m+f
Болести на кръвоносната система. - - - -
Нараняване и отравяне - - -
злокачествено заболяване. неоплазми. - - - - - -
Други заб. - - - -
Всички се разболяха. - -

При съставянето на таблици трябва да се спазват определени изисквания:

Всяка таблица трябва да има заглавие, което отразява нейното съдържание;

В рамките на таблицата всички колони също трябва да имат ясни, кратки заглавия;

При попълване на таблицата всички клетки на таблицата трябва да съдържат съответните цифрови данни. Клетките на таблицата, които остават празни поради липсата на тази комбинация, се зачертават ("-"), а при липса на информация в клетката се поставя "n.s." или "...";

След попълване на таблицата в долния хоризонтален ред и в последната вертикална колона вдясно се сумират резултатите от вертикалните колони и хоризонталните редове.

Таблиците трябва да имат еднократна последователна номерация.

При изследвания с малък брой наблюдения, обобщаването се извършва ръчно. Всички счетоводни документи се разделят на групи в съответствие със знаковия код. След това данните се изчисляват и записват в съответната клетка на таблицата.

В момента компютрите се използват широко за сортиране и обобщаване на материали. . които позволяват не само да се сортира материалът според изучаваните признаци , но направете изчисленията.

Четвърти етап- статистически анализ - е ключов етап от изследването. На този етап изчисляването на статистическите показатели (честота , структури , средният размер на изследваното явление), е дадено тяхното графично представяне , динамика , се установяват тенденции, връзки между явленията . дават се прогнози и др. Анализът включва интерпретация на получените данни, оценка на надеждността на резултатите от изследването. В заключение се правят изводи.

Пети етап- Литературната обработка е окончателна. Това включва финализиране на резултатите от статистическо изследване. Резултатите могат да бъдат представени под формата на статия, доклад, доклад , дисертации и др. За всеки тип дизайн има определени изисквания , които трябва да се спазват при литературната обработка на резултатите от статистическо изследване.

Резултатите от медицински и статистически изследвания се внедряват в здравната практика. Възможни са различни варианти за използване на резултатите от изследването: запознаване с резултатите на широка аудитория от медицински и научни работници; изготвяне на инструктивно-методически документи; формулиране на рационализационно предложение и други.

2.1 Схема за провеждане на статистическо изследване

Системите за статистически анализ на данни са модерен и ефективен инструмент за статистически изследвания. Широки възможности за обработка на статистически данни имат специални системи за статистически анализ, както и универсални инструменти - Excel, Matlab, Mathcad и др.

Но дори и най-съвършеният инструмент не може да замени изследователя, който трябва да формулира целта на изследването, да събере данни, да избере методи, подходи, модели и инструменти за обработка и анализ на данни и да интерпретира резултатите.

Фигура 2.1 показва схемата за провеждане на статистическо изследване.

Фиг.2.1 - Принципна диаграма на статистическо изследване

Отправната точка на статистическото изследване е формулирането на проблема. При определянето му се взема предвид целта на изследването, определя се каква информация е необходима и как ще се използва при вземане на решение.

Самото статистическо изследване започва с подготвителен етап. По време на подготвителната фаза анализаторите проучват техническо задание- документ, съставен от клиента на изследването. Заданието трябва ясно да посочва целите на изследването:

    дефиниран е обектът на изследване;

    изброява предположенията и хипотезите, които трябва да бъдат потвърдени или опровергани по време на изследването;

    описва как ще бъдат използвани резултатите от изследването;

    времевата рамка, в която ще се проведе изследването, и бюджетът за проучването.

Въз основа на техническото задание, a структура на аналитичния отчет- тогава, под всякаква формада се представят резултатите от изследването, както и програма за статистическо наблюдение. Програмата е списък от признаци, които трябва да бъдат записани по време на процеса на наблюдение (или въпроси, на които трябва да се получат надеждни отговори за всяка изследвана единица на наблюдение). Съдържанието на програмата се определя както от характеристиките на наблюдавания обект и целите на изследването, така и от избраните от анализаторите методи за по-нататъшна обработка на събраната информация.

Основният етап на статистическото изследване включва събирането на необходимите данни и техния анализ.

Последният етап от проучването е изготвянето на аналитичен доклад и предоставянето му на клиента.

На фиг. 2.2 е диаграма на анализ на статистически данни.

Фиг.2.2 - Основните етапи на статистическия анализ

2.2 Събиране на статистическа информация

Събирането на материали включва анализ на техническото задание на изследването, идентифициране на източниците на необходимата информация и (ако е необходимо) разработване на въпросници. При изследването на източниците на информация всички необходими данни са разделени на първичен(данните не са налични и трябва да се събират директно за това проучване), и вторичен(събрани преди това за други цели).

Събирането на вторични данни често се нарича "наборно" или "библиотечно" изследване.

Примери за първично събиране на данни: наблюдения на посетители на магазина, анкети на болнични пациенти, обсъждане на проблем на среща.

Вторичните данни се делят на вътрешни и външни.

Примери за вътрешни вторични източници на данни:

    информационна система на организацията (включително счетоводна подсистема, подсистема за управление на продажбите, CRM (CRM-система, съкращение от Customer Relationship Management) - приложен софтуер за организации, предназначен за автоматизиране на стратегии за взаимодействие с клиенти) и други);

    предишни проучвания;

    писмени доклади от служителите.

Примери за външни вторични източници на данни:

    отчети на статистически органи и други държавни институции;

    доклади от маркетингови агенции, професионални асоциации и др.;

    електронни бази данни (адресни указатели, ГИС и др.);

    библиотеки;

    средства за масова информация.

Основните резултати от фазата на събиране на данни са:

    планиран размер на извадката;

    структура на извадката (наличие и размер на квоти);

    вид статистическо наблюдение (анкета за събиране на данни, анкетиране, измерване, експеримент, изследване и др.);

    информация за параметрите на проучването (например възможността за факта на фалшифициране на въпросници);

    схема за кодиране на променливите в базата данни на програмата, избрана за обработка;

    план-схема на трансформация на данни;

    план-схема на използваните статистически процедури.

Този етап включва и самата процедура по разпит. Разбира се, въпросниците се разработват само за получаване на първична информация.

Получените данни трябва да бъдат подходящо редактирани и подготвени. Всеки въпросник или форма за наблюдение се проверява и при необходимост се коригира. На всеки отговор се присвояват цифрови или буквени кодове - информацията се кодира. Подготовката на данните включва редактиране, дешифриране и валидиране на данни, кодиране и необходими трансформации.

2.3 Характеризиране на пробата

По правило данните, събрани в резултат на статистическо наблюдение за статистически анализ, са извадкови. Последователността на преобразуване на данните в процеса на статистическо изследване може да бъде схематично представена по следния начин (фиг. 2.3)

Фигура 2.3 Схема за преобразуване на статистически данни

Анализирайки извадката, е възможно да се направят заключения относно генералната съвкупност, представена от извадката.

Окончателно определяне на общите параметри за вземане на пробипроизведени, когато всички въпросници са събрани. Включва:

    определяне на реалния брой респонденти,

    определяне на структурата на пробата,

    разпределение според мястото на изследването,

    установяване на ниво на достоверност на статистическата надеждност на извадката,

    изчисляване на статистическата грешка и определяне на представителността на извадката.

Реално количествореспондентите може да са повече или по-малко от планираното. Първият вариант е по-добър за анализ, но неблагоприятен за клиента на изследването. Вторият може да повлияе неблагоприятно на качеството на изследването и следователно е нерентабилен както за анализатори, така и за клиенти.

Примерна структурамогат да бъдат случайни или неслучайни (респондентите са избрани въз основа на предварително известен критерий, например по квотния метод). Случайните проби са априори представителни. Неслучайните извадки може умишлено да не са представителни за общата съвкупност, но предоставят важна информация за изследване. В този случай трябва също така внимателно да разгледате въпросите за филтриране на въпросника, които са предназначени специално за отсяване на неподходящи респонденти.

За определяне на точността на оценката, на първо място, е необходимо да се установи нивото на доверие (95% или 99%). Тогава максимумът статистическа грешкапробата се изчислява като

или
,

където - размер на извадката, - вероятността за настъпване на изследваното събитие (попадане на респондента в извадката), - вероятността от обратното събитие (респондентът да не бъде включен в извадката), - коефициент на доверие,
е дисперсията на характеристиката.

Таблица 2.4 изброява най-често използваните стойности на вероятността за доверие и коефициентите на доверие.

Таблица 2.4

2.5 Компютърна обработка на данни

Анализът на данни с помощта на компютър включва редица необходими стъпки.

1. Определяне на структурата на изходните данни.

2. Въвеждане на данни в компютър в съответствие с тяхната структура и програмни изисквания. Редактиране и трансформиране на данни.

3. Задаване на метода на обработка на данните в съответствие с целите на изследването.

4. Получаване на резултата от обработката на данните. Редактиране и запазване в желания формат.

5. Интерпретация на резултата от обработката.

Стъпки 1 (подготвителна) и 5 ​​(заключителна) не могат да бъдат изпълнени от никаква компютърна програма - изследователят ги прави сам. Стъпки 2-4 се изпълняват от изследователя, използващ програмата, но изследователят е този, който определя необходимите процедури за редактиране и трансформиране на данни, методите за обработка на данни и формата за представяне на резултатите от обработката. Помощта на компютъра (стъпки 2-4) в крайна сметка е в прехода от дълга последователност от числа към по-компактна. На „входа“ на компютъра изследователят подава масив от първоначални данни, които са недостъпни за разбиране, но подходящи за компютърна обработка (стъпка 2). След това изследователят дава команда на програмата да обработи данните в съответствие със задачата и структурата на данните (стъпка 3). На „изхода“ той получава резултата от обработката (стъпка 4) - също масив от данни, само по-малък, достъпен за разбиране и смислена интерпретация. В същото време изчерпателният анализ на данните обикновено изисква тяхната многократна обработка с различни методи.

2.6 Избор на стратегия за анализ на данни

Изборът на стратегия за анализиране на събраните данни се основава на познаване на теоретичните и практическите аспекти на изследваната предметна област, спецификата и известните характеристики на информацията, свойствата на конкретните статистически методи, както и опита и възгледите на изследователят.

Трябва да се помни, че анализът на данни не е крайната цел на изследването. Целта му е да получи информация, която ще помогне за решаването на конкретен проблем и вземането на адекватни управленски решения. Изборът на стратегия за анализ трябва да започне с преглед на резултатите от предишните етапи на процеса: дефиниране на проблема и разработване на изследователски план. Като "чернова" се използва предварителен план за анализ на данни, разработен като един от елементите на плана за изследване. След това, когато допълнителна информация стане достъпна на следващите етапи от изследователския процес, може да се наложи да се направят определени промени.

Статистическите методи се разделят на едно- и многовариантни. Едномерните методи (едномерни техники) се използват, когато всички елементи на извадката се оценяват по един показател или ако има няколко от тези показатели за всеки елемент, но всяка променлива се анализира отделно от всички останали.

Многовариантните техники са чудесни за анализ на данни, ако се използват два или повече индикатора за оценка на всеки примерен елемент и тези променливи се анализират едновременно. Такива методи се използват за определяне на зависимости между явленията.

Многовариантните методи се различават от едномерните методи главно по това, че изместват фокуса от нивата (средните) и разпределенията (вариациите) на явленията и се фокусират върху степента на връзка (корелация или ковариация) между тези явления.

Едномерните методи могат да бъдат класифицирани въз основа на това дали анализираните данни са метрични или неметрични (Фигура 3). Метричните данни се измерват по интервална скала или относителна скала. Неметричните данни се оценяват по номинална или ординална скала

В допълнение, тези методи са разделени на класове въз основа на това колко проби - една, две или повече - са анализирани по време на изследванията.

Класификацията на едномерните статистически методи е представена на фигура 2.4.

Ориз. 2.4 Класификация на едномерните статистически методи в зависимост от анализираните данни

Броят на пробите се определя от това как се обработват данните за конкретен анализ, а не от това как са събрани данните. Например, данни за мъже и жени могат да бъдат получени в рамките на една и съща извадка, но ако техният анализ е насочен към разкриване на разлика във възприятието въз основа на разликата в пола, изследователят ще трябва да работи с две различни извадки. Пробите се считат за независими, ако не са експериментално свързани една с друга. Измерванията, направени в една проба, не влияят на стойностите на променливите в друга. За анализ данните, свързани с различни групи респонденти, като тези, събрани от жени и мъже, обикновено се третират като независими извадки.

От друга страна, ако данните за две извадки се отнасят за една и съща група респонденти, извадките се считат за двойки - зависими.

Ако има само една извадка от метрични данни, може да се използва z- и t-тест. Ако има две или повече независими проби, в първия случай можете да използвате z- и t-теста за две проби, във втория случай методът на еднопосочната ANOVA. За две свързани проби се използва сдвоен t-тест. Когато става въпрос за неметрични данни върху единична проба, изследователят може да използва критериите за честотно разпределение, хи-квадрат, тест на Колмогоров-Смирнов (K~S), тест за серии и биномен тест. За две независими проби с неметрични данни могат да се използват следните методи за анализ: хи-квадрат, Ман-Уитни, медиани, K-S, еднопосочен дисперсионен анализ на Крускал-Уолис (DA K-U). За разлика от това, ако има две или повече свързани проби, трябва да се използват тестовете със знак, McNemar и Wilcoxon.

Многовариантните статистически методи са насочени към идентифициране на съществуващи модели: взаимозависимост на променливи, връзка или последователност от събития, междуобектно сходство.

По-скоро условно е възможно да се отделят пет стандартни типа модели, чието изследване представлява значителен интерес: асоциация, последователност, класификация, групиране и прогнозиране.

Асоциация възниква, когато няколко събития са свързани едно с друго. Например, проучване, проведено в супермаркет, може да покаже, че 65% от тези, които купуват царевичен чипс, приемат и Coca-Cola, а когато има намаление за такъв комплект, те купуват Coca-Cola в 85% от случаите. Имайки информация за такава асоциация, мениджърите лесно могат да преценят колко ефективна е предоставената отстъпка.

Ако има верига от събития, свързани във времето, тогава се говори за последователност. Така например след закупуване на жилище в 45% от случаите в рамките на един месец се купува и нова печка, а в рамките на две седмици 60% от новодошлите се сдобиват с хладилник.

С помощта на класификацията се разкриват признаци, които характеризират групата, към която принадлежи този или онзи обект. Това става чрез анализиране на вече класифицирани обекти и формулиране на определен набор от правила.

Групирането се различава от класификацията по това, че самите групи не са предварително определени. С помощта на групирането се разграничават различни хомогенни групи от данни.

Основата за всички видове системи за прогнозиране е историческа информация, съхранявана под формата на времеви редове. Ако е възможно да се намерят модели, които адекватно отразяват динамиката на поведението на целевите индикатори, вероятно с тяхна помощ е възможно да се предвиди поведението на системата в бъдеще.

Многовариантните статистически методи могат да бъдат разделени на методи за анализ на връзката и класификационен анализ (фиг. 2.5).

Фиг.2.5 - Класификация на многовариантните статистически методи

Всяко статистическо изследване на масовите социални явления включва 3 основни етапа:

    Статистическо наблюдение - формират се първични статистически данни или изходна статистическа информация, която е в основата на статистическото изследване. Ако е допусната грешка при събирането на първични статистически данни или материалът се е оказал с лошо качество, това ще повлияе на коректността и надеждността както на теоретичните, така и на практическите заключения;

    Обобщаване и групиране на данни - на този етап съвкупността се разделя по признаците на разлика и се комбинира по признаците на сходство, изчисляват се общите показатели за групите и като цяло. С помощта на метода на групиране изучаваните явления се разделят на видове, групи и подгрупи в зависимост от съществените признаци. Методът на групиране позволява да се ограничат качествено съществено хомогенните съвкупности, което служи като предпоставка за определяне и прилагане на обобщаващи показатели;

    Обработка и анализ на получените данни, идентифициране на закономерности. На този етап с помощта на обобщаващи показатели се изчисляват относителни и средни стойности, дава се обобщена оценка на вариацията на признаците, характеризира се динамиката на явленията, прилагат се индекси, балансови конструкции, изчисляват се показатели, които характеризират близостта на връзките в промяната на знаците. С цел максимално рационално и визуално представяне на дигиталния материал, той е представен под формата на таблици и графики.

Лекция номер 2. Статистическо наблюдение

1. Понятие и форми на статистическото наблюдение

Статистическото наблюдение е първият етап на всяко статистическо изследване.

Статистическо наблюдениее научно организирана работа по събиране на масивни първични данни за явленията и процесите на социалния живот.

Въпреки това, не всяко събиране на информация е статистическо наблюдение. За статистическо наблюдение може да се говори само когато се изучават статистически закономерности, т.е. такива, които се появяват само в масов процес, в голям брой единици от някакъв агрегат.

Следователно статистическото наблюдение трябва да бъде:

    системност - да се изготвят и провеждат по разработения план, който включва въпроси на методологията, организацията, технологията за събиране на информация, наблюдението на качеството на събрания материал, неговата достоверност и представянето на крайните резултати;

    масово - да обхваща голям брой случаи на проявление на този процес, достатъчни за получаване на достоверни статистически данни, характеризиращи не само отделни единици, но и цялото население като цяло;

    систематичен - изследването на тенденциите и закономерностите на социално-икономическите процеси, характеризиращи се с количествени и качествени промени, е възможно само въз основа на систематичност.

Към статистическото наблюдение се налагат следните основни изисквания:

    пълнота на статистическите данни (пълнота на обхващане на единици от изследваната съвкупност, аспекти на конкретно явление, както и пълнота на покритие във времето);

    надеждност и точност на данните;

    еднаквост и съпоставимост на данните.

В статистическата практика се използват две организационни форми на наблюдение:

1) отчитането е такава организационна форма, в която звената за наблюдение предоставят информация за своята дейност под формата на формуляри на регламентирана извадка. Особеността на докладването е, че е задължително, документирано и законно потвърдено с подписа на ръководителя;

2) специално статистическо изследване, пример за което е провеждането на преброявания на населението, социологически проучвания, преброявания на материални остатъци и други наблюдения, които се извършват, ако възникнат задачи, за които няма достатъчно информация за решаване. Те предоставят допълнителен материал към докладваните данни или с тяхна помощ проверяват докладваните данни.

Статистическа методология- система от техники, методи и методи, насочени към изучаване на количествени закономерности, които се проявяват в структурата, динамиката и връзките на социално-икономическите явления. Методиката е основа на статистически изследвания.

Етапи на статистическото изследване:

1. статистическо наблюдение или събиране на информация;

2. обобщаване и групиране на резултатите от статистическо наблюдение или обработка на информация;

3. анализ на получената информация.

Статистическо наблюдение- това е масово, систематично, научно организирано наблюдение на явленията от социалния и икономически живот, което се състои в регистриране на избрани характеристики за всяка единица от съвкупността.

Процес статистическо наблюдениевключва следните стъпки:

1) подготовка на наблюдение;

2) провеждане на масово събиране на данни;

3) подготовка на данни за автоматизирана обработка;

4) разработване на предложения за подобряване на статистическото наблюдение.

Резюме- набор от последователни операции за обобщаване на данни от статистическо наблюдение за характеризиране на статистическата съвкупност като цяло и нейните отделни части (изчисляване на междинни и общи резултати). групиране - разграничаване на общата статистическа съвкупност на групи от качествено еднородни единици. Резултатите от статистическото обобщаване и групиране се представят под формата на статистически таблици.

Анализ или изследванесъщността на изучаваните явления, изследва структурата, динамиката и взаимовръзките на социалните явления и процеси.

Има следните стъпки:

1) излагане на факти и тяхната оценка;

2) установяване на характерните особености и причините за всяко явление;

3) сравнение на едно явление с други (включително със стандарта);

4) формулиране на хипотези, изводи и предложения.

5) Статистическа проверка на поставените хипотези с помощта на специални статистически показатели

38. Статистически методи за прогнозиране, базирани на показатели от поредица от динамика.Процесът на прогнозиране, базиран на статистически методи, е разделен на два етапа. Първият, индуктивен, е да обобщи данните, наблюдавани за повече или по-малко дълъг период от време, и да представи съответните статистически модели под формата на модел. Статистическият модел се получава или под формата на аналитично изразена тенденция на развитие, или под формата на уравнение в зависимост от един или повече фактори-аргументи. В редица случаи при изучаване на сложни комплекси от икономически показатели се прибягва до разработването на така наречените взаимозависими системи от уравнения, които отново се състоят главно от уравнения, характеризиращи статистически зависимости. Процесът на конструиране и прилагане на статистически модел за прогнозиране, независимо от формата на последния, задължително включва избор на формата на уравнение, което описва динамиката или връзката на явленията, и оценка на неговите параметри с помощта на един или друг метод. Вторият етап, самата прогноза, е дедуктивен. На този етап въз основа на откритите статистически закономерности се определя очакваната стойност на прогнозирания признак.

Трябва да се подчертае, че получените резултати не могат да се считат за нещо окончателно. При оценката и използването им трябва да се вземат предвид фактори, условия или ограничения, които не са взети предвид при разработването на статистически модел, и откритите статистически характеристики да се коригират в съответствие с очакваната промяна в обстоятелствата на тяхното формиране. Накратко, прогностичните оценки, получени с помощта на статистически методи, са важен материал, който обаче трябва да бъде критично разгледан. В същото време основното е да се вземат предвид възможните промени в самите тенденции в развитието на икономическите явления и обекти.

39. Статистически таблици, техните видове, съставни елементи и правила за построяване на таблици. Статистическа таблица - форма на най-рационалното представяне на полученото статистическо обобщение и групиране на числени (числови) данни. На външен вид представлява комбинация от вертикални и хоризонтални линии, съдържащи странични и горни заглавки. Статистическата таблица съдържа субекта и предиката.

Предметът на таблицата представлява статистическата съвкупност, посочена в таблицата, т.е. списък на отделни или всички единици от съвкупността или техните групи. Най-често темата се поставя от лявата страна на таблицата и съдържа списък от низове.

41. СТРУКТУРНА СРЕДСТВА МОДА И НЕГОВОТО ОПРЕДЕЛЕНИЕ. Стойността на средната стойност се определя от всички стойности на атрибута, намерени в дадена серия на разпределение. Има такива структурни средни като: (1) режим (2) медиана (3) квартил (4) децил (5) процентил Модата е най-често срещаният вариант на серията. Модата се използва например при определяне на размера на дрехите, обувките, които са в най-голямо търсене сред купувачите. Режимът за дискретна серия е вариантът с най-висока честота. Когато изчислявате режима за серията от интервални вариации, първо трябва да определите модалния интервал (по максималната честота), а след това стойността на модалната стойност на атрибута съгласно формулата: където:

Предикат на таблицата - показатели, с помощта на които се дава характеристика на изобразеното в таблицата явление.

Ако темата на таблицата съдържа прост списък от всякакви обекти, таблицата се нарича проста. Предметът на обикновена таблица не съдържа групи от статистически данни. Ако темата на проста таблица съдържа списък с територии, тогава такава таблица се нарича териториална.

Простата таблица съдържа само описателна информация, нейните аналитични възможности са ограничени. Дълбокият анализ на изследваната съвкупност, връзката на знаците включва изграждането на по-сложни таблици - групови и комбинирани.

Груповите таблици съдържат в предмета групиране на единици от обекта на наблюдение според един съществен признак. Най-простият тип групова таблица са таблици, които представляват серии на разпределение. Груповата таблица може да бъде по-сложна, ако предикатът съдържа не само броя на единиците във всяка група, но и редица други важни показатели, които количествено и качествено характеризират предметните групи. Такива таблици често се използват за сравняване на обобщени показатели по групи, което позволява да се направят определени практически изводи.

Комбинираните таблици се наричат ​​статистически таблици, чийто предмет е група единици, формирани по един признак, разделени на подгрупи по един или повече признаци. За разлика от простите и груповите таблици, комбинираните таблици ни позволяват да проследим зависимостта на предикатните показатели от няколко признака, които са в основата на комбинираното групиране в предмета.

Основни правила за изграждане на статистически таблици:

1) заглавието трябва да отразява обекта, знака, времето и мястото на събитието;

2) колоните и редовете трябва да бъдат номерирани;

3) колоните и редовете трябва да съдържат мерни единици;

4) информацията, сравнена по време на анализа, се поставя в съседни колони (или една под друга);

5) числата в таблицата се поставят в средата на колоната, строго едно под друго; препоръчително е числата да се закръглят със същата степен на точност;

6) липсата на данни се обозначава със знака за умножение ( ), ако тази позиция не се попълва, липсата на информация се обозначава с многоточие (...), или n.d., или n. St., при липса на явление се поставя тире (-);

7) за показване на много малки числа използвайте обозначението 0.0 или 0.00; ако числото е получено въз основа на условни изчисления, то се взема в скоби, съмнителните числа се придружават от въпросителен знак, а предварителните - със знака (*).

40. Средна структурна медиана и нейното определение.Медиана- това е числената стойност на признака за единицата от популацията, която е в средата на класираната серия (построена във възходящ или низходящ ред на стойностите на изследвания признак). Медианапонякога се нарича среден вариант, защото тя разделя съвкупността на две равни части по такъв начин, че от двете й страни има еднакъв брой единици от съвкупността. Ако на всички единици от серия са присвоени поредни номера, тогава поредният номер на медианата ще се определи по формулата (n + 1): 2 за серия, където n е странно. Ако един ред с дориброй единици, тогава Медианаще бъде средната стойност между две съседни опции, определена по формулата: n:2, (n+1):2, (n:2)+1.

В дискретни вариационни серии с нечетен брой единици на съвкупността това е специфична числена стойност в средата на серията.

Намирането на медианата в интервални вариационни серии изисква предварително определяне на интервала, в който се намира медианата, т.е. среден интервал- този интервал се характеризира с факта, че неговата кумулативна (кумулативна) честота е равна на половината от сумата или надвишава половината от сумата на всички честоти от серията.

X Me - долната граница на средния интервал

h Me - стойността на средния интервал;

S Me-1 - сумата от натрупаните честоти на интервала, предхождащ медианния интервал;

  • f Me е локалната честота на средния интервал.

Честотата на интервала след модала

42. Същност и значение на графиките, техните основни елементи. В статистиката графикНаречен илюстративно изображениеПредставяне на статистически величини и техните връзки с помощта на геометрични точки, линии, фигури или географски карти.

Графики прикачвампредставяне на статистика по-голяма видимостотколкото таблици, изразителност, улесняват тяхното възприемане и анализиране. Позволява ви визуално да оцените естеството на изследваното явление, неговите присъщи модели, тенденции на развитие, връзки с други показатели, географската разделителна способност на изследваните явления. Още в древността китайците са казали, че едно изображение замества хиляда думи.Когато е възможно, се препоръчва винаги да започваме анализа на статистическите данни с тяхното графично представяне. Графиката ви позволява незабавно да получите обща представа за целия набор от статистически показатели. Графичният метод на анализ действа като логическо продължение на табличния метод и служи за получаване на обобщаващи статистически характеристики на процесите, присъщи на масовите явления.
С помощта на графикастатистически изображения стр решени задачистат.проучвания:

1) визуално представяне на величината на показателите (явленията) в сравнение един с друг;

2) характеристика на структурата на всяко явление;

3) промяна на явлението във времето;

4) напредъка на плана;

5) зависимостта на промяната в едно явление от промяната в друго;

6) разпространението или разпределението на каквито и да било количества на територията

Във всяка графика се разграничават (разграничават): основни елементи:

  • 1) пространствени референтни точки (координатна система);
  • 2) графично изображение;
  • 3) поле за диаграма;
  • 4) мащабни ориентири;
  • 5) обяснение на графика;
  • 6) име на диаграмата

43. Същност и значение на средните стойности.средна стойност- обобщена характеристика на нивото на стойностите на атрибутите, получени за единица съвкупност. Средната стойност се изчислява за признаци, които са качествено еднородни и се различават само количествено, които са присъщи на всички явления в даден набор.

Средните стойности са често срещани (отразяват населението като цяло) и група (отразете характеристиката по групи). Те са разделени на 2 категории - силови и структурни .

към власттавключват - средно хармонично, средно геометрично, средно аритметично, средно квадратично. Най-често - ср. аритметика. ср хармоникаизползва се като обратна на аритметиката. RMSизползвани при изчисляване на индикаторите за вариация, срв. геометричен– при анализа на динамиката.

към структурниса модата и медианата. Мода- стойността на изследвания признак с най-висока честота. Медиана- стойността на характеристиката, която достига до средата на диапазонираната серия. Модата се използва в търговската практика за изследване на потребителското търсене и записване на цени. В дискретна серия режимът е вариантът с най-висока честота. В интервалната вариационна серия модата е централният вариант на интервала, който има най-висока честота. Използването на медианата ви позволява да получите по-точни резултати, отколкото използването на други форми на средни стойности. Свойството на медианата е, че сумата от абсолютните отклонения на стойностите на чертата от медианата е по-малка от всяка друга стойност. определяне на натрупаните честоти за тази класирана серия; според натрупаните честоти намираме средния интервал.

Споделете с приятели или запазете за себе си:

Зареждане...