Методи та основні етапи статистичних досліджень.

Щоб отримати уявлення про те чи інше явище, зробити висновки необхідно провести статистичне дослідження. Предметом статистичного дослідження в охороні здоров'я та медицині можуть бути здоров'я населення, організація медичної допомоги, різні розділи діяльності лікувально-профілактичних установ, фактори довкілля, що впливають на стан здоров'я.

Методична послідовність виконання статистичного дослідження складається з певних етапів.

1 етап. Складання плану та програми дослідження.

2 етап. Збір матеріалу (статистичний нагляд).

3 етап. Розробка матеріалу, статистична угруповання та зведення

4 етап. Статистичний аналіз явища, що вивчається, формулювання висновків.

5 етап. Літературна обробка та оформлення отриманих результатів.

Після завершення статистичного дослідження розробляються рекомендації та управлінські рішення, проводиться впровадження результатів дослідження у практику, оцінюється ефективність.

У проведенні статистичного дослідження найважливішим елементомє дотримання суворої послідовності здійсненні названих етапів.

Перший етап статистичного дослідження - складання плану та програми - є підготовчим, на якому визначається мета та завдання дослідження, складається план та програма дослідження, розробляється програма зведення статистичного матеріалу та вирішуються організаційні питання.

Приступаючи ж статистичного дослідження, слід точно і чітко сформулювати мету та завдання дослідження, вивчити з цієї теми літературу.

Мета визначає основний напрямок дослідження і носить, як правило, не тільки теоретичний, а й практичний характер. Ціль формулюється ясно, чітко, недвозначно.

Для розкриття мети визначаються завдання дослідження.

p align="justify"> Важливим моментом підготовчого етапу є розробка організаційного плану. Організаційний план дослідження передбачає визначення місця (адміністративно-територіальних меж спостереження), час (конкретних термінів здійснення спостереження, проведення розробки та аналізу матеріалу) та суб'єкта дослідження (організаторів, виконавців, методичного та організаційного керівництва, джерел фінансування дослідження).

Пла н іслед іва нявключає:

визначення об'єкта дослідження (статистичної сукупності);

Обсяг дослідження (суцільне, несплошне);

видів (поточне, одноразове);

Способів збирання статистичної інформації. Програма дослідженнявключає:

визначення одиниці спостереження;

Перелік питань (облікових ознак), що підлягають реєстрації щодо кожної одиниці спостереження*



Розробку індивідуального облікового (реєстраційного) бланка з переліком питань та ознак, що підлягають обліку;

Розробку макетів таблиць, які потім вносяться результати дослідження.

На кожну одиницю спостереження заповнюється окремий бланк, містить паспортну частину, чітко сформульовані, поставлені у певній послідовності питання програми та дату заповнення документа.

Як облікові бланки можуть бути використані застосовувані в практиці лікувально-профілактичних установ облікові медичні форми.

Джерелами отримання інформації можуть бути інші медичні документи (історії хвороби та індивідуальні карти амбулаторного хворого, історії розвитку дитини, історії пологів), звітні форми лікувально-профілактичних установ та ін.

Для забезпечення можливості статистичної розробки даних із цих документів викопують відомості на спеціально розроблені облікові бланки, зміст яких визначається в кожному окремому випадку відповідно до завдань дослідження.

В даний час у зв'язку з машинною обробкою результатів спостереження з використанням ЕОМ питання програми можуть бути формалізовані , коли питання в обліковому документі ставляться у вигляді альтернативи (так, ні) , або пропонуються вже готові відповіді, з яких слід вибрати відповідь.

На першому етапі статистичного дослідження поряд із програмою спостереження складається програм* зведення отриманих даних, що включає встановлення принципів угруповання, виділення групувальних ознак , визначення комбінацій цих ознак; складання макетів статистичних таблиць.

Другий етап- Збір статистичного матеріалу (статистичне спостереження) - полягає в реєстрації окремих випадків досліджуваного явища і характеризують їх облікових ознак у реєстраційні бланки. Перед та під час виконання цієї роботи проводиться інструктаж (усний чи письмовий) виконавців спостереження, забезпечення їх формами реєстрації.

За часом статистичне спостереження може бути поточним та одноразовим.

При поточному наблю деніїявище вивчається за якийсь окремий період (тиждень, квартал , рік тощо) шляхом повсякденної реєстрації явища у міру виникнення кожного випадку. Прикладом поточного спостереження є облік числа народжених , померлих, хворих , виписаних зі стаціонару і т. п. Так враховуються явища, що швидко змінюються.

При одноразовому наблю деніїстатистичні дані збираються на певний (критичний) час. Одночасним спостереженням є: перепис населення, вивчення фізичного розвиткудітей, облік лікарняних ліжок на коней року, паспортизація лікувально-профілактичних установ тощо. буд. До цього виду ставляться профілактичні огляди населення. Одноразова реєстрація відбиває стан явища на даний момент вивчення. Цей вид спостереження використовується для вивчення явищ, що повільно змінюються.

Вибір вид спостереження за часом визначається метою та завданнями дослідження. Наприклад, характеристику госпіталізованих хворих можна отримати в результаті поточної реєстрації вибулих зі стаціонару (поточне спостереження) або шляхом одноденного перепису хворих, які перебувають у стаціонарі (одноразове спостереження).

Залежно від повноти охоплення явища, що вивчається, розрізняють суцільне і несуцільне дослідження.

При суцільномуДослідженні вивчаються все що входять до сукупності одиниці спостереження, тобто. Генеральна сукупність. Суцільне дослідження проводять з метою встановлення абсолютних розмірів явища, наприклад, загальної чисельності населення, загальної кількості народжених чи померлих, загальної кількостіхворих тих чи іншим захворюванням та інших. Суцільний метод застосовується у тому випадку, коли відомості необхідні оперативної роботи (облік інфекційної захворюваності, навантаження лікарів та інших.)

При несуцільномуДослідженні вивчається лише частина генеральної сукупності. Воно підрозділяється кілька видів: анкетне, монографічне, основного масиву, вибіркове. Найпоширенішим у медичних дослідженнях є вибірковий метод.

Монографічний метод- дає детальний опис окремих характерних у будь-якому відношенні одиниць сукупності та глибокий, всебічний опис об'єктів.

Метод основного масиву- передбачає вивчення тих об'єктів, у яких зосереджено значну більшість одиниць спостереження. Недоліком цього є те, що залишається неохопленої дослідженням частина сукупності, хоча й невелика за розмірами, але яка може значно відрізнятися від основного масиву.

Анкетний метод- це збирання статистичних даних за допомогою спеціально розроблених анкет, адресованих певному колу осіб. Це дослідження ґрунтується на принципі добровільності, тому повернення анкет найчастіше буває неповним. Нерідко відповіді на поставлені питання мають відбиток суб'єктивності та випадковості. Цей метод застосовується щоб одержати приблизної характеристики досліджуваного явища.

Вибірковий метод- зводиться до вивчення певної спеціально відібраної частини одиниць спостереження для характеристики всієї генеральної сукупності. Перевагою цього є отримання результатів високого ступенянадійності, а також значно нижча вартість. У дослідженні зайнято менше виконавців , крім того, він вимагає менших витрат часу.

У медичної статистикироль та місце вибіркового методуособливо великі, оскільки медичні працівники мають справу зазвичай лише з частиною явища, що вивчається: вивчають групу хворих з тим чи іншим захворюванням, аналізують роботу окремих підрозділів і медичних установ , оцінюють якість певних заходів тощо.

За способом отримання відомостей у ході проведення статистичного спостереження та характером його здійснення виділяють декілька видів:

1) безпосереднє спостереження(Клінічний огляд хворих , проведення лабораторних , інструментальних досліджень , антропометричні виміри тощо)

2) соціологічні методи: метод інтерв'ю (очний опитування), анкетування (заочне опитування - анонімне або неанонімне) та ін;

3) документальне дослідженняа ня(Викопування відомостей з обліково-звітних медичних документів, відомості офіційної статистики установ та організацій.)

Третій етап- угруповання та зведення матеріалу - починається з перевірки та уточнення числа спостережень , повноти та правильності отриманих відомостей , виявлення та усунення помилок, дублікатів записів тощо.

Для правильної розробки матеріалу застосовується шифрування первинних облікових документів , тобто. позначення кожної ознаки та її групи знаком - буквеним чи цифровим. Шифрування - це технічний прийом , що полегшує та прискорює розробку матеріалу , що підвищує якість, точність розробки. Шифри – умовні позначення – виробляються довільно. При шифруванні діагнозів рекомендується користуватися міжнародною номенклатурою та класифікацією хвороб; при шифруванні професій – словником професій.

Перевагою шифрування є те, що за необхідності після закінчення основної розробки можна повернутися до матеріалу для розробки з метою з'ясування нових зв'язків та залежностей. Зашифрований обліковий матеріал дозволяє зробити це легше та швидше , ніж незашифрований. Після перевірки проводиться угруповання ознак.

Угруповання- Розчленування сукупності даних на однорідні , типові групи за найістотнішими ознаками. Угруповання може проводитися за якісними та кількісними ознаками. Вибір групувального ознаки залежить від характеру досліджуваної сукупності та завдань дослідження.

Типологічне угруповання проводиться за якісними (описовими, атрибутивними) ознаками, наприклад, за статтю , професії, груп хвороби, тяжкості перебігу хвороби, післяопераційних ускладнень тощо.

Угруповання за кількісними (варіаційними) ознаками проводиться на підставі числових розмірів ознаки , наприклад , за віком , тривалість захворювання, тривалість лікування і т.д. Кількісне угруповання вимагає вирішення питання про величину групувального інтервалу: інтервал може бути рівним, а в ряді випадків - нерівний, навіть включати так звані відкриті групи.

Наприклад , при угрупованні за віком можуть бути визначені відкриті групи: до 1 року . 50 років та старше.

При визначенні числа груп виходять із мети та завдань дослідження. Необхідно, щоб угруповання могли розкрити закономірності явища, що вивчається. Багато груп може призвести до надмірного дроблення матеріалу, непотрібної деталізації. Невелика кількість груп призводить до загасування характерних рис.

Закінчивши угруповання матеріалу, приступають до зведення.

З горілка- узагальнення поодиноких випадків , отриманих у результаті статистичного дослідження, у певні групи, їх підрахунок та внесення до макети таблиць.

Зведення статистичного матеріалу проводять за допомогою статистичних таблиць. Таблиця , не заповнена цифрами , називається макетом.

Статистичні таблиці бувають перелікові , хронологічні, територіальні.

Таблиця має підмет і присудок. Статистичне підлягає зазвичай розміщується горизонтальними рядках у лівій частині таблиці і відбиває головний, основний ознака. Статистичне присудок розміщується зліва направо по вертикальних графах і відображає додаткові облікові ознаки.

Статистичні таблиці поділяються на прості , групові та комбінаційні.

У простих таблицяхпредставлено числове розподілматеріалу за однією ознакою , складових його (табл.1). Проста таблиця містить зазвичай простий перелік чи результат по всій сукупності досліджуваного явища.

Таблиця 1

Розподіл померлих у лікарні Н. за віком

У групових таблицяхпредставлено поєднання двох ознак у зв'язку один з одним (табл.2).

Таблиця 2

Розподіл померлих у лікарні Н. за статтю та віком

У комбіна ціпро нних таблицяхдається розподіл матеріалу за трьома і більш взаємозалежними ознаками (Таблиця 3).

Таблиця 3

Розподіл померлих у лікарні Н. при різних захворюванняхза віком та статтю

Діагноз основного захворювання Вік
0-14 15-19 20-39 40-59 60 та > Усього
м ж м ж м ж м ж м ж м ж м+ж
Хвороби системи кровообігу. - - - -
Травми та отруєння - - -
Злоякісності. новообразів. - - - - - -
Інші заб. - - - -
Все захворів. - -

При складанні таблиць повинні дотримуватися певних вимог:

Кожна таблиця повинна мати заголовок, який відображатиме її зміст;

Усередині таблиці всі графи також повинні мати чіткі короткі назви;

При заповненні таблиці усі клітини таблиці повинні містити відповідні числові дані. Ті, що залишилися незаповненими через відсутність даної комбінації клітини таблиці прокреслюються ("-"), а за відсутності відомостей у клітині проставляється "н.с." або "...";

Після заповнення таблиці в нижній горизонтальному ряду і в останньому правому вертикальному стовпці підбиваються підсумки вертикальних граф і горизонтальних рядків.

Таблиці повинні мати послідовну нумерацію.

У дослідженнях, які мають невеликий обсяг спостережень, зведення проводиться вручну. Усі облікові документи розкладаються на групи відповідно до шифру ознаки. Далі проводиться підрахунок та запис даних у відповідну клітину таблиці.

В даний час у проведенні сортування та зведення матеріалу широко використовуються ЕОМ . які дозволяють не тільки відсортувати матеріал за ознаками, що вивчаються , Проте здійснити розрахунки показників.

Четвертий етап - статистичний аналіз– є відповідальним етапом дослідження. На цьому етапі проводиться обчислення статистичних показників (частоти , структури , середніх розмірів явища, що вивчається), дається їх графічне зображення , вивчається динаміка , тенденції, встановлюються зв'язки між явищами . даються прогнози тощо. Аналіз передбачає інтерпретацію одержаних даних, оцінку достовірності результатів дослідження. На закінчення робляться висновки.

П'ятий етап- Літературна обробка є завершальним. Він передбачає остаточне оформлення результатів статистичного дослідження. Результати можуть бути оформлені у вигляді статті, звіту, доповіді , дисертації та ін. Для кожного виду оформлення існують певні вимоги , які повинні дотримуватися під час літературної обробки результатів статистичного дослідження.

Результати медико-статистичного дослідження впроваджуються у практику охорони здоров'я. Можливі різні варіантивикористання результатів дослідження: ознайомлення з результатами широкої аудиторії медичних та науковців; підготовка інструктивно-методичних документів; оформлення раціоналізаторської пропозиції та інші.

2.1 Схема проведення статистичного дослідження

Системи статистичного аналізу даних – це сучасний ефективний інструмент статистичного дослідження. Широкі можливості обробки статистичних даних мають спеціальні системи статистичного аналізу, і навіть універсальні засоби – Excel, Matlab, Mathcad та інших.

Але навіть найдосконаліший інструмент не може замінити дослідника, який повинен сформулювати мету дослідження, провести збір даних, вибрати методи, підходи, моделі та засоби проведення обробки та аналізу даних, а також інтерпретувати отримані результати.

На малюнку 2.1 представлено схему проведення статистичного дослідження.

Рис.2.1 – Принципова схема статистичного дослідження

Вихідним пунктом статистичного дослідження є формулювання проблеми. При її визначенні враховується мета дослідження, визначається яка інформація необхідна і як вона використовуватиметься при прийнятті рішення.

Саме статистичне дослідження починається з попереднього етапу. Під час підготовчого етапу аналітики вивчають технічне завдання- Документ, що складається замовником дослідження. У технічному завданні мають бути чітко сформульовані цілі дослідження:

    визначено об'єкт дослідження;

    перераховані припущення та гіпотези, які під час дослідження мають бути підтверджені або спростовані;

    описано те, як використовуватимуться результати дослідження;

    терміни, у яких дослідження має бути проведено бюджет дослідження.

На основі технічного завдання розробляється структура аналітичного звіту- те, в якому виглядімають бути представлені результати дослідження, а також програма статистичного спостереження . Програма є переліком ознак, що підлягають реєстрації в процесі спостереження (або питань на які повинні бути отримані достовірні відповіді щодо кожної обстежуваної одиниці спостереження). Зміст програми визначається як особливостями об'єкта, що спостерігається, і цілями дослідження, так і методами, обраними аналітиками для подальшої обробки зібраної інформації.

Основний етап статистичного дослідження включає збирання необхідних даних та їх аналіз.

Фінальним етапом дослідження є складання аналітичного звіту та надання його замовнику.

На рис. 2.2 представлено схему статистичного аналізу даних.

Рис.2.2 - Основні етапи статистичного аналізу

2.2 Збір статистичної інформації

Збір матеріалів передбачає аналіз технічного завдання дослідження, визначення джерел необхідної інформації та (за необхідності) розробку анкет. При дослідженні джерел інформації всі необхідні дані поділяють на первинні(дані, яких немає в наявності та які мають бути зібрані безпосередньо для даного дослідження), та вторинні(Зібрані раніше для інших цілей).

Збір вторинних даних часто називають "кабінетним" чи "бібліотечним" дослідженням.

Приклади збору первинних даних: спостереження відвідувачів магазину, анкетування пацієнтів лікарні, обговорення проблеми на нараді.

Вторинні дані ділять на внутрішні та зовнішні.

Приклади джерел внутрішніх вторинних даних:

    інформаційна система організації (що включає бухгалтерську підсистему, підсистему управління продажами, CRM (CRM-система, скорочення від англ. Customer Relationship Management) - прикладне програмне забезпечення для організацій, призначене для автоматизації стратегій взаємодії з замовниками) та інші);

    раніше проведені дослідження;

    письмові звіти працівників.

Приклади джерел зовнішніх вторинних даних:

    звіти органів статистики та інших державних установ;

    звіти маркетингових агенцій, професійних асоціацій тощо;

    електронні бази даних (адресні довідники, ГІС тощо);

    бібліотеки;

    засоби масової інформації.

Основними вихідними даними на етапі збору даних є:

    запланований обсяг вибірки;

    структура вибірки (наявність та розмір квот);

    вид статистичного спостереження (збір даних опитування, анкетування, вимір, експеримент, експертиза, ін.);

    інформація про параметри опитування (наприклад, можливість факту фальшування анкет);

    схема кодування змінних у базі даних програми, обраної для обробки;

    план-схема перетворення даних;

    план-схема використовуваних статистичних процедур.

Цей етап включає безпосередньо процедуру анкетування. Зрозуміло, анкети розробляються лише отримання первинної інформації.

Отримані дані мають бути відповідним чином відредаговані та підготовлені. Кожна анкета чи форма спостереження перевіряється та, якщо потрібно, коригується. Кожній відповіді надаються числові або літерні коди – здійснюється кодування інформації. Підготовка даних включає редагування, розшифровку і перевірку даних, їх кодування і необхідні перетворення.

2.3 Визначення характеристик вибірки

Як правило, дані, зібрані в результаті статистичного спостереження щодо статистичного аналізу є вибірковою сукупністю. Послідовність перетворення даних на процес статистичного дослідження можна схематично представити так (рис. 2.3)

Рис 2.3 Схема перетворення статистичних даних

Аналізуючи вибірку, можна робити висновки про генеральну сукупність, подану вибіркою.

Остаточне визначення загальних параметрів вибіркивиробляють коли всі анкети зібрані. Воно включає:

    визначення реальної кількості респондентів,

    визначення структури вибірки,

    розподіл за місцем опитування,

    встановлення довірчого рівня статистичної надійності вибірки,

    розрахунок статистичної помилки та визначення репрезентативності вибірки.

Реальна кількістьреспондентів може бути більшим чи меншим запланованого. Перший варіант кращий для аналізу, але невигідний замовнику дослідження. Другий може негативно позначитися якості дослідження, отже, невигідний ні аналітикам, ні замовникам.

Структура вибіркиможе бути випадковою або невипадковою (респонденти відбиралися на основі попередньо відомого критерію, наприклад методом квотування). Випадкові вибірки апріорі є репрезентативними. Невипадкові вибірки можуть бути нерепрезентативними щодо генеральної сукупності, але давати важливу інформацію для досліджень. У цьому випадку також слід уважно поставитися до фільтраційних питань анкети, які призначені спеціально для відсіювання респондентів, що не підходять під вимоги.

Для визначення точності оцінювання, насамперед, необхідно встановити рівень довірчої ймовірності(95% чи 99%). Тоді максимальна статистична помилкавибірки розраховується як

або
,

де - обсяг вибірки, - ймовірність настання досліджуваної події (попадання респондента у вибірку), - ймовірність зворотної події (непопадання респондента на вибірку), - Коефіцієнт довірчої ймовірності,
- Дисперсія ознаки.

У таблиці 2.4 наведено найбільш уживані значення довірчої ймовірності та коефіцієнтів довірчої ймовірності.

Таблиця 2.4

2.5 Обробка даних на комп'ютері

Аналіз даних із застосуванням комп'ютера включає виконання низки необхідних кроків.

1. Визначення структури вихідних даних.

2. Введення даних у комп'ютер відповідно до їх структури та вимог програми. Редагування та перетворення даних.

3. Завдання методу обробки даних відповідно до завдань дослідження.

4. Отримання результату обробки даних. Його редагування та збереження у потрібному форматі.

5. Інтерпретація результату обробки.

Кроки 1 (підготовчий) та 5 (заключний) не здатна виконати жодна комп'ютерна програма – їх дослідник робить сам. Кроки 2-4 виконуються дослідником з використанням програми, але саме дослідник визначає необхідні процедури редагування та перетворення даних, методи обробки даних, а також формат подання результатів обробки. Допомога комп'ютера (кроки 2–4) полягає, зрештою, у переході від довгої послідовності чисел до компактнішої. На "вхід" комп'ютера дослідник подає масив вихідних даних, який недоступний осмисленню, але придатний для комп'ютерної обробки (крок 2). Потім дослідник дає програмі команду на обробку даних відповідно до поставленого завдання та структури даних (крок 3). На «виході» він отримує результат обробки (крок 4) - теж масив даних, лише менший, доступний осмисленню і змістовної інтерпретації. При цьому вичерпний аналіз даних зазвичай вимагає багаторазової обробки з застосуванням різних методів.

2.6 Вибір стратегії аналізу даних

Вибір стратегії аналізу зібраних даних ґрунтується на знанні теоретичних та практичних аспектів досліджуваної предметної галузі, специфіки та відомих характеристик інформації, властивостей конкретних статистичних методів, а також на досвіді та поглядах дослідника.

Необхідно пам'ятати, що аналіз даних - це не кінцева мета дослідження. Його мета – отримати інформацію, яка допоможе вирішити певну проблему та прийняти адекватні управлінські рішення. Вибір стратегії аналізу має починатися з дослідження підсумків попередніх етапів процесу: визначення проблеми та розробка плану дослідження. Як "чернетки" використовується попередній план аналізу даних, розроблений як один з елементів плану дослідження. Потім, у ході надходження на наступних стадіях процесу дослідження додаткової інформації може знадобитися внесення певних змін.

Статистичні методи поділяються на одно- та багатовимірні. Одновимірні методи (univariatetechniques) використовуються тоді, коли всі елементи вибірки оцінюються одним показником, або якщо цих показників кілька для кожного елемента, але кожна змінна аналізується при цьому окремо від усіх інших.

Багатовимірні методи (multivariate techniques) чудово підходять для аналізу даних, якщо для оцінки кожного елемента вибірки використовують два або більше показників і ці змінні аналізуються одночасно. Такі методи застосовуються визначення залежностей між явищами.

Багатовимірні методи відрізняються від одномірних передусім тим, що з їх використання центр уваги зміщується з рівнів (середніх показників) і розподілів (дисперсій) явищ і зосереджується на рівні взаємозв'язку (кореляції чи ковариации) між цими явищами.

Одномірні методи можна класифікувати з урахуванням того, які дані аналізуються: метричні чи неметричні (рис. 3). Метричні дані (metric data) вимірюються за інтервальною шкалою або відносною шкалою. Неметричні дані (nonmetric data) оцінюються за номінальною або порядковою шкалою

З іншого боку, ці методи ділять на класи з урахуванням того, скільки вибірок - одна, дві чи більше - аналізується під час досліджень.

Класифікація одновимірних статистичних методів представлена ​​на рис.2.4.

Мал. 2.4 Класифікація одновимірних статистичних методів залежно від аналізованих даних

Число вибірок визначається тим, як ведеться робота з даними для конкретного аналізу, а не тим, яким способом збиралися дані. Наприклад, дані по особам чоловічої та жіночої статі можна отримати в межах однієї вибірки, але якщо їх аналіз націлений на виявлення різниці у сприйнятті, заснованої на різниці статей, досліднику доведеться оперувати двома різними вибірками. Вибірки вважаються незалежними, якщо вони експериментально не пов'язані між собою. Вимірювання, проведені в одній вибірці, не впливають на значення змінних до іншої. Для аналізу дані, що стосуються різних груп респондентів, наприклад зібрані від осіб жіночої та чоловічої статі, зазвичай обробляються як незалежні вибірки.

З іншого боку, якщо дані щодо двох вибірок відносяться до однієї і тієї ж групи респондентів, вибірки вважаються об'єднаними в пари залежними.

Якщо існує лише одна вибірка метричних даних, можна використовувати z- і t-критерій. Якщо ж незалежних вибірок дві чи більше, у першому випадку можна скористатися z-і t-критерієм для двох вибірок, у другому - методом однофакторного дисперсійного аналізу. Для двох пов'язаних вибірок використовують парний t-критерій. Якщо йдеться про неметричні дані за однією вибіркою, дослідник може скористатися критеріями частотного розподілу, хі-квадратом, критерієм Колмогорова-Смирнова (K~S), критерієм серій та біноміальним критерієм. Для двох незалежних вибірок з неметричними даними можна вдатися до наступних методів аналізу: хі-квадрат, Манна-Уітні, медіани, К-С, однофакторним дисперсійним аналізом Крускала-Уолліса (ТА К-У). На відміну від цього, якщо існує дві або більше взаємопов'язаних вибірок, слід скористатися критеріями знаків Мак-Немара та Вілкоксона.

Багатомірні статистичні методи націлені виявлення існуючих закономірностей: взаємозалежності змінних, взаємозв'язку чи послідовності подій, межобъектного подібності.

Досить умовно можна виділити п'ять стандартних типів закономірностей, дослідження яких становить значний інтерес: асоціація, послідовність, класифікація, кластеризація та прогнозування

Асоціація має місце у разі, якщо кілька подій пов'язані друг з одним. Наприклад, дослідження, проведене в супермаркеті, може показати, що 65% тих, хто купив кукурудзяні чіпси, беруть також і "кока-колу", а за наявності знижки за такий комплект "колу" набувають у 85% випадків. Маючи у своєму розпорядженні відомості про таку асоціацію, менеджерам легко оцінити, наскільки дієва знижка, що надається.

Якщо існує ланцюжок пов'язаних у часі подій, то говорять про послідовність. Так, наприклад, після покупки будинку в 45% випадків протягом місяця купується нова кухонна плита, а в межах двох тижнів 60% новоселів обзаводяться холодильником.

За допомогою класифікації виявляються ознаки, що характеризують групу, до якої належить той чи інший об'єкт. Це робиться у вигляді аналізу вже класифікованих об'єктів і формулювання деякого набору правил.

Кластеризація відрізняється від класифікації тим, що групи заздалегідь не задані. За допомогою кластеризації виділяють різні однорідні групи даних.

Основою для всіляких систем прогнозування є історична інформація, що зберігається у вигляді часових рядів. Якщо вдається побудувати визначити закономірності, адекватно відбивають динаміку поведінки цільових показників, є можливість, що з допомогою можна передбачити і поведінка системи у майбутньому.

Багатомірні статистичні методи можна поділити на методи аналізу взаємозв'язку та класифікаційний аналіз (рис. 2.5).

Рис.2.5 - Класифікація багатовимірних статистичних методів

Будь-яке статистичне дослідження масових суспільних явищ включає 3 основні етапи:

    Статистичне спостереження - формуються первинні статистичні дані, чи вихідна статистична інформація, що є основою статистичного дослідження. Якщо при зборі первинних статистичних даних припущено помилку або матеріал виявився недоброякісним, це вплине на правильність і достовірність як теоретичних, так і практичних висновків;

    Зведення та угруповання даних - на цій стадії сукупність ділиться за ознаками відмінності та об'єднується за ознаками подібності, підраховуються сумарні показники за групами та загалом. За допомогою методу угруповань досліджувані явища залежно від суттєвих ознак поділяються на типи, групи та підгрупи. Метод угруповань дозволяє обмежувати якісно однорідні у суттєвому відношенні сукупності, що є передумовою визначення та застосування узагальнюючих показників;

    Обробка та аналіз отриманих даних, виявлення закономірностей. На цьому етапі за допомогою узагальнюючих показників розраховуються відносні та середні величини, дається зведена оцінка варіації ознак, характеризується динаміка явищ, застосовуються індекси, балансові побудови, розраховуються показники, що характеризують тісноту зв'язків у зміні ознак. З метою найбільш раціонального та наочного викладу цифрового матеріалу він подається у вигляді таблиць та графіків.

Лекція №2. Статистичне спостереження

1. Поняття та форми статистичного спостереження

Статистичне спостереження – це перша стадія будь-якого статистичного дослідження.

Статистичне спостереженняявляє собою науково організовану роботу зі збору масових первинних даних про явища та процеси суспільного життя.

Проте чи всякий збір відомостей є статистичним спостереженням. Про статистичному спостереженні можна казати лише тоді, коли вивчаються статистичні закономірності, тобто. такі, що виявляються лише у масовому процесі, у великому числі одиниць якоїсь сукупності.

Отже, статистичне спостереження має бути:

    планомірним - готуватися та проводитись за розробленим планом, який включає питання методології, організації, техніки збору інформації, контролю за якістю зібраного матеріалу, його достовірності, оформлення підсумкових результатів;

    масовим - охоплювати велике числовипадків прояву даного процесу, достатній у тому, щоб отримати правдиві статистичні дані, що характеризують як окремі одиниці, а й усю сукупність загалом;

    систематичним – вивчення тенденцій та закономірностей соціально-економічних процесів, що характеризуються кількісними та якісними змінами, можливе лише на основі систематичності.

До статистичного спостереження висуваються такі основні вимоги:

    повнота статистичних даних (повнота охоплення одиниць сукупності, сторін того чи іншого явища, що вивчається, а також повнота охоплення в часі);

    достовірність та точність даних;

    однаковість та сумісність даних.

У статистичній практиці використовуються дві організаційні форми спостереження:

1) звітність - це така організаційна форма, коли він одиниці спостереження представляють інформацію про своєї діяльності як формулярів регламентованого зразка. Особливість звітності полягає в тому, що вона є обов'язковою, документально обґрунтованою та юридично підтвердженою підписом керівника;

2) спеціальне статистичне обстеження, прикладом чого є проведення переписів населення, соціологічні дослідження, перепису залишків матеріалу та ін. спостереження, які проводяться, якщо виникають завдання, на вирішення яких немає достатньої інформації. Вони дають додатковий матеріалдо звітних даних або за їх допомогою перевіряють звітні дані.

Статистична методологія– система прийомів, методів і методів, вкладених у вивчення кількісних закономірностей, що виявляються у структурі, динаміці та взаємозв'язках соціально-економічних явищ. Методологія є основою статистичного дослідження.

Етапи статистичного дослідження:

1. статистичне спостереження, чи збирання інформації;

2. зведення та угруповання результатів статистичного спостереження, або обробка інформації;

3. аналіз отриманої інформації.

Статистичне спостереження- Це масове, планомірне, науково-організоване спостереження за явищами соціального та економічного життя, яке полягає в реєстрації відібраних ознак у кожної одиниці сукупності.

Процес проведення статистичного спостереженнявключає наступні етапи:

1) підготовка спостереження;

2) проведення масового збирання даних;

3) підготовка даних до автоматизованої обробки;

4) розробка пропозицій щодо вдосконалення статистичного спостереження.

Зведення- Комплекс послідовних операцій з узагальнення даних статистичного спостереження для характеристики статистичної сукупності в цілому та окремих її частин (підрахунок проміжних та загальних підсумків). Угруповання - Розмежування загальної статистичної сукупності на групи якісно однорідних одиниць. Результати статистичного зведеннята угруповання викладаються у вигляді статистичних таблиць.

Аналіз чи дослідженнясутності досліджуваних явищ, досліджує структуру, динаміку та взаємозв'язки суспільних явищ та процесів.

Має такі етапи:

1) констатація фактів та їх оцінка;

2) встановлення характерних рис та причин кожного явища;

3) зіставлення одного явища коїться з іншими (зокрема з стандартом);

4) формулювання гіпотез, висновків та пропозицій.

5) Статистична перевіркависунутих гіпотез за допомогою спеціальних статистичних показників

38. Статистичні методи прогнозування з урахуванням показників низки динаміки.Процес прогнозування, що спирається на статистичні методи, розпадається на два етапи. Перший, індуктивний, полягає в узагальненні даних, що спостерігаються за більш менш тривалий період часу, і в поданні відповідних статистичних закономірностей у вигляді моделі. Статистичну модель отримують або у вигляді аналітично вираженої тенденції розвитку, або у вигляді рівняння залежності від одного або кількох факторів-аргументів. У ряді випадків – щодо складних комплексів економічних показників– вдаються до розробки про взаємозалежних систем рівнянь, які у основному знову-таки із рівнянь, характеризуючих статистичні залежності. Процес побудови та застосування статистичної моделі для прогнозування, який би вигляд остання не мала, обов'язково включає вибір форми рівняння, що описує динаміку або взаємозв'язок явищ, та оцінювання його параметрів за допомогою того чи іншого методу. Другий етап, власне прогноз, є дедуктивним. На цьому етапі на основі знайдених статистичних закономірностей визначають очікуване значення прогнозованої ознаки.

Слід наголосити, що отримані результати не можуть розглядатися як щось остаточне. При їх оцінці та використанні повинні братися до уваги фактори, умови чи обмеження, які не були враховані при розробці статистичної моделі, має здійснюватись коригування виявлених статистичних характеристик відповідно до очікуваної зміни обставин їх формування. Коротше кажучи, знайдені за допомогою статистичних методів прогностичні оцінки є важливим матеріалом, який має бути критично осмислений. При цьому головним є облік можливих змін у самих тенденціях розвитку економічних явищ та об'єктів.

39. Статистичні таблиці, їх види, складові елементи та правила побудови таблиць. Статистична таблиця - форма найбільш раціонального викладу отриманих у результаті статистичного зведення та угруповання числових (цифрових) даних. за зовнішньому виглядувона є комбінацією вертикальних і горизонтальних рядків, що містить бічні і верхні заголовки. Статистична таблиця містить підмет і присудок.

Те, що підлягає таблиці, представляє ту статистичну сукупність, про яку йде мовау таблиці, т. е. перелік окремих чи всіх одиниць сукупності чи його груп. Найчастіше підлягає розміщується в лівій частині таблиці і містить перелік рядків.

41. СТРУКТУРНА СЕРЕДНЯ МОДА І ЇЇ ВИЗНАЧЕННЯ. Величина середньої визначається всіма значеннями ознаки, що зустрічаються в даному рядурозподілу. Розрізняють такі структурні середні, як: (1) мода (2) медіана (3) квартиль (4) дециль (5) перцентиль Мода - це варіант ряду, що найчастіше зустрічається. Мода застосовується, наприклад, щодо розміру одягу, взуття, що користується найбільшим попитом у покупців. Модою для дискретного ряду є варіанти, що мають найбільшу частоту. При обчисленні моди для інтервального варіаційного ряду необхідно спочатку визначити модальний інтервал (за максимальною частотою), а потім значення модальної величини ознаки за формулою: де:

Дані таблиці - показники, за допомогою яких дається характеристика явища, що відображається в таблиці.

Якщо підлягає таблиці міститься простий перелік будь-яких об'єктів, таблиця називається простий. У простій таблиці немає будь-яких угруповань статистичних даних. Якщо підлягає простий таблиці містить перелік територій, така таблиця називається територіальною.

Проста таблиця містить лише описові відомості, її аналітичні можливості обмежені. Глибокий аналіз досліджуваної сукупності, взаємозв'язків ознак передбачає побудову складніших таблиць - групових і комбінаційних.

Групові таблиці містять у підлягає угруповання одиниць об'єкта спостереження за однією істотною ознакою. Найпростішим видом груповий таблиці є таблиці, у яких представлені ряди розподілу. Групова таблиця може бути складнішою, якщо в присудку наводиться не тільки число одиниць у кожній групі, але і ряд інших важливих показників, що кількісно і якісно характеризують групи підлягає. Такі таблиці часто використовуються з метою зіставлення узагальнюючих показників за групами, що дозволяє зробити певні практичні висновки.

Комбінаційними називаються статистичні таблиці, е підлягає яких групи одиниць, утворені за однією ознакою, поділяються на підгрупи за однією або декількома ознаками. На відміну від простих та групових таблиць, комбінаційні дозволяють простежити залежність показників присудка від кількох ознак, які лягли в основу комбінаційного угруповання в підметі.

Основні правила побудови статистичних таблиць:

1) у заголовку повинні бути відображені об'єкт, ознака, час та місце здійснення події;

2) графи та рядки слід нумерувати;

3) графи та рядки повинні містити одиниці виміру;

4) зіставлювану під час аналізу інформацію мають у сусідніх графах (чи одну під іншою);

5) числа у таблиці проставляють у середині граф, суворо одне під іншим; числа доцільно округляти з однаковим ступенем точності;

6) відсутність даних позначається знаком множення ( ), якщо дана позиція не підлягає заповненню, відсутність відомостей позначається трьома крапками (...), або н.д., або н. св., за відсутності явища ставиться знак тире (-);

7) для відображення дуже малих чисел використовують позначення 0.0 чи 0.00; якщо число отримано виходячи з умовних розрахунків, його беруть у дужки, сумнівні числа супроводжують запитальним знаком, а попередні - знаком (*).

40. Структурна середня медіаната її визначення.Медіана- це чисельне значення ознаки в тієї одиниці сукупності, що у середині ранжированного ряду (побудованого порядку зростання, чи зменшення значень досліджуваного ознаки). Медіануіноді називають серединною варіантою, т.к. вона ділить сукупність на дві рівні частини таким чином, щоб по обидві сторони було однакове число одиниць сукупності. Якщо всім одиницям ряду присвоїти порядкові номери, то порядковий номер медіани визначатиметься за формулою (n+1):2 для рядів, де n – непарне. Якщо ж ряд з парнимчислом одиниць, то медіаноюбуде середнє значення між двома сусідніми варіантами, визначеними за формулою: n:2, (n+1):2, (n:2)+1.

У дискретних варіаційних рядах з непарним числом одиниць сукупності – це конкретне чисельне значення у середині ряду.

Знаходження медіани в інтервальних варіаційних рядах вимагає попереднього визначення інтервалу, де знаходиться медіана, тобто. медіанного інтервалу– цей інтервал характеризується тим, що його кумулятивна (накопичена) частота дорівнює напівсумі або перевищує напівсуму всіх частот ряду.

X Me - нижня межа медіанного інтервалу

h Me - величина медіанного інтервалу;

S Me-1 -сума накопичених частот інтервалу, що передує медіанному інтервалу;

  • f Me локальна частота медіанного інтервалу.

Частота інтервалу, наступного за модальним

42. Сутність та значення графіків, їх основні елементи. У статистиці графікомназивають наочне зображенняаження статистичних величинта їх співвідношень за допомогою геометричних точок, ліній, фігур або географічних картосхем.

Графіки надаютьвикладу статистичних даних велику наочність, ніж таблиці, виразність, полегшують їх сприйняття та аналіз. Дозволяє візуально оцінити характер явища, що досліджується, властиві йому закономірності, тенденції розвитку, взаємозв'язки з іншими показниками, географічне дозвіл досліджуваних явищ. Ще в давнину китайці говорили, що одне зображення замінює тисячу слів. За будь-якої можливості аналіз статистичних даних рекомендується завжди починати з них графічного зображення. Графік дозволяє відразу отримати загальне уявлення про всю сукупність статистичних показників. Графічний методаналізу постає як логічне продовження табличного методу і є цілям отримання узагальнюючих статистичних характеристик процесів, властивих масовим явищам.
За допомогою графічногозображення стат.даних р ішаютьсязавданнястат.дослідження:

1) наочне уявлення величини показників (явлень) проти один з одним;

2) характеристика структури будь-якого явища;

3) зміна явища у часі;

4) хід виконання плану;

5) залежність зміни одного явища від зміни іншого;

6) поширеність чи розміщення будь-яких величин по території

У кожному графіку виділяють (розрізняють) такі основні елементи:

  • 1) просторові орієнтири (систему координат);
  • 2) графічний образ;
  • 3) поле графіка;
  • 4) масштабні орієнтири;
  • 5) експлікація графіка;
  • 6) найменування графіка

43. Сутність та значення середніх величин. Середня величина - Узагальнена характеристика рівня значень ознаки, отримана в розрахунку на одиницю сукупності. Середня величина обчислюється для ознак якісно однорідних та різних лише кількісно, ​​які притаманні всім явищам у даній сукупності.

Середні величини бувають загальними (відбивають сукупність загалом) і груповими (Відображають особливість по групах). Поділяються на 2 категорії – статечні та структурні .

До статечнимвідносяться - середня гармонійна, середня геометрична, середня арифметична, середня квадратична. Найпоширеніша – порівн.арифметична. Ср.гармонічнувикористовують як зворотну порівн.арифметичної. порівн.квадратичнавикористовується при розрахунку показників варіації, порівн. геометрична- При аналізі динаміки.

До структурнихвідносяться – мода та медіана. Мода– значення ознаки, що вивчається, з найбільшою частотою. Медіана- Значення ознаки, що приходить на середину ранжованого ряду. Мода застосовується в комерційній практиці для вивчення купівельного попиту та реєстрації цін. У дискретному рядумода – це варіанти з найбільшою частотою. В інтервальному варіаційному рядумодою вважають центральний варіант інтервалу, що має найбільшу частоту. Застосування медіани дозволяє отримати точніші результати, ніж при використанні інших форм середніх. Властивість медіани полягає в тому, що сума абсолютних відхиленьзначень ознаки від медіани менше, ніж від будь-якої іншої величини. Порядок знаходження медіани в інтервальному варіаційному ряду наступний: маємо індивідуальні значення ознаки за ранжиром; визначаємо для даного ранжованого ряду накопичені частоти; за даними про накопичені частоти знаходимо медіанний інтервал.

Поділіться з друзями або збережіть для себе:

Завантаження...