Формула довірчої ймовірності в оцінці генеральної середньої. Середня квадратична помилка повторної та безповторної вибірок та побудова довірчого інтервалу для генеральної середньої

На підставі зареєстрованих відповідно до програми статистичного спостереження значень ознак одиниць вибіркової сукупності розраховуються узагальнюючі вибіркові характеристики: вибіркова середня() та вибіркова часткаодиниць, що володіють яким-небудь дослідників, що цікавить ознакою, в загальній їх чисельності ( w).

Різниця між показниками вибіркової та генеральної сукупності називається помилкою вибірки.

Помилки вибірки, як помилки будь-якого іншого виду статистичного спостереження, поділяються на помилки реєстрації та помилки репрезентативності. Основним завданням вибіркового методу є вивчення та вимірювання випадкових помилок репрезентативності.

Вибіркова середня та вибіркова частка є випадковими величинами, які можуть приймати різні значеннязалежно від цього, які одиниці сукупності потрапили у вибірку. Отже, помилки вибірки також є випадковими величинамиі можуть набувати різних значень. Тому визначають середню із можливих помилок.

Середня помилка вибірки (µ - мю) дорівнює:

для середньої ; для частки ,

де р- Частка певної ознаки в генеральній сукупності.

У цих формулах σ х 2і р(1-р) є характеристиками генеральної сукупності, які при вибірковому спостереженніневідомі. Насправді їх замінюють аналогічними характеристиками вибіркової сукупності виходячи з закону великих чисел, яким вибіркова сукупність при досить великому обсязі досить точно відтворює характеристики генеральної сукупності. Методи розрахунку середніх помилок вибірки для середньої та для частки при повторному та безповторному відборах наведено у табл. 6.1.

Таблиця 6.1.

Формули розрахунку середньої помилки вибірки для середньої та для частки

Величина завжди менше одиниці, тому величина середньої помилки вибірки при безповторному відборі виявляється меншою, ніж при повторному. У випадках, коли частка вибірки незначна і множник близький до одиниці, поправкою можна знехтувати.

Стверджувати, що генеральна середня значенняпоказника чи генеральна частка не вийде за межі середньої помилки вибірки можна лише з певним ступенем ймовірності. Тому для характеристики помилки вибірки крім середньої помилки розраховують граничну помилку вибірки(Δ), яка пов'язана з рівнем ймовірності, що гарантує її.

Рівень ймовірності ( Р) визначає величина нормованого відхилення ( t), і навпаки. Значення tдаються у таблицях нормального розподілуймовірностей. Найчастіше використовувані поєднання tі Рнаведено у табл. 6.2.

Таблиця 6.2

Значення нормованого відхилення tпри відповідних значеннях рівнів ймовірності Р

t	1,0	1,5	2,0	2,5	3,0	3,5
Р	0,683	0,866	0,954	0,988	0,997	0,999

t- Коефіцієнт довіри, що залежить від ймовірності, з якої можна гарантувати, що гранична помилка не перевищить t-кратну середню помилку Він показує, скільки середніх помилок міститься в граничній помилці. Так, якщо t= 1, то з ймовірністю 0,683 можна стверджувати, що різниця між вибірковими та генеральними показниками не перевищить однієї середньої помилки.

Формули до розрахунку граничних помилок вибірки наведено у табл. 6.3.

Таблиця 6.3.

Формули розрахунку граничної помилки вибірки для середньої та для частки

Після обчислення граничних помилок вибірки знаходять довірчі інтервали для генеральних показників. Імовірність, яка приймається при розрахунку помилки вибіркової характеристики, називається довірчою. Довірчий рівень ймовірності 0,95 означає, що тільки у 5 випадках зі 100 помилка може вийти за встановлені межі; ймовірності 0,954 - у 46 випадках з 1000, а при 0,999 - у 1 випадку з 1000.

Для генеральної середньої найбільш ймовірні межі, в яких вона буде з урахуванням граничної помилки репрезентативності, матимуть вигляд:

Найбільш ймовірні межі, в яких буде розташована генеральна частка, матимуть вигляд:

Звідси, генеральна середня , генеральна частка .

Наведені у табл. 6.3. формули використовуються щодо помилок вибірки, здійснюваної власне випадковим і механічним методами.

При стратифікованому відборі у вибірку обов'язково потрапляють представники всіх груп і зазвичай у тих самих пропорціях, що у генеральної сукупності. Тому помилка вибірки у разі залежить головним чином середньої з внутрішньогрупових дисперсій. Виходячи з правила складання дисперсій можна зробити висновок, що помилка вибірки для стратифікованого відбору завжди буде меншою, ніж для власне випадкового.

При серійному (гніздовому) відборі мірою коливання буде міжгрупова дисперсія.

Між показниками вибіркової сукупності та шуканими показниками (параметрами) генеральної сукупності, як правило, існують деякі розбіжності, які називають помилками вибірки.Загальна помилка вибіркової характеристики складається з помилок двох пологів: помилки реєстрації та помилки репрезентативності.

Помилки реєстрації властиві будь-кому статистичного спостереженняі їх може бути викликано неуважністю реєстратора, неточністю підрахунків, недосконалістю вимірювальних приладів тощо.

Помилки репрезентативності притаманні лише вибірковому спостереженню і зумовлені самою його природою, оскільки як би ретельно і правильно не проводився відбір одиниць, середні та відносні показники вибіркової сукупності завжди будуть якоюсь мірою відрізнятися від відповідних показників генеральної сукупності.

Розрізняють систематичні та випадкові помилки репрезентативності. Систематичні помилки репрезентативності - це неточності, які виникають внаслідок недотримання умов відбору одиниць у вибіркову сукупність, не надання рівної можливості кожній одиниці генеральної сукупності потрапити у вибірку. Випадкові помилки репрезентативності - це похибки, що виникають унаслідок те, що вибіркова сукупність точно не відтворює характеристики генеральної сукупності (середнє, частку, дисперсію та інших.) з несплошного характеру обстеження.

При дотриманні принципу випадкового відбору розмір помилки вибірки залежить від чисельності вибірки. Чим більше чисельністьвибірки за інших рівних умов, тим менше величина помилки вибірки. При великій чисельності вибірки виразніше проявляється дія закону великих чисел, згідно з яким: з ймовірністю, як завгодно близькою до одиниці, можна стверджувати, що при досить великому обсязі вибірки та обмеженої дисперсії вибіркові характеристики (середня частка) будуть мало відрізнятися від відповідних генеральних характеристик .

Розміри помилки вибірки також безпосередньо пов'язані зі ступенем варіювання ознаки, що вивчається, а ступінь варіювання, як зазначалося вище, у статистиці характеризується розміром дисперсії (розсіяння): чим менше дисперсія, тим менше помилка вибірки, тим більше надійні статистичні висновки. Тому на практиці дисперсію ототожнюють із помилкою вибірки.

Оскільки параметр генеральної сукупності є шукана величина і він невідомий, потрібно орієнтуватися не так на конкретну помилку, а середню з усіх можливих вибірок.

Якщо з генеральної сукупності відібрати кілька вибіркових сукупностей, кожна з отриманих вибірок дасть різне значенняконкретну помилку.

Середня квадратична величина /іобчислена з усіх можливих значень конкретних помилок (;) становитиме:

де *і – вибіркові середні; х - генеральна середня;)] - чисельність вибірок за величиною є1 = ~си - х.

Середнє квадратичне відхиленнявибіркових середніх від середньої генеральної називають середньою помилкою вибірки.

Залежність величини помилки вибірки від її чисельності та від ступеня варіювання ознаки знаходить вираз у формулі середньої помилки вибірки /і.

Квадрат середньої помилки (дисперсія вибіркових середніх) прямо пропорційний дисперсіїСто і обернено пропорційний чисельності вибірки п:

де – дисперсія ознаки у генеральній сукупності.

Звідси середню помилку в загальному виглядівизначають за формулою:

Отже, визначивши за вибіркою середнє квадратичне відхилення, можна встановити значення середньої помилки вибірки, величина якої, як випливає з формули, тим більше, чим більша варіація випадкової величини і тим менше, чим більша чисельність вибірки.

Тому зі зростанням обсягу вибірки розмір середньої помилки зменшується. Якщо, наприклад, потрібно зменшити середню помилку вибірки вдвічі, то чисельність вибірки слід збільшити вчетверо, якщо треба зменшити помилку вибірки втричі, то обсяг вибірки слід збільшити у дев'ять разів тощо.

У практичних розрахунках застосовуються дві формули середньої помилки вибірки для середньої та частки.

При вибірковому вивченні середніх показників формула середньої помилки така:

При вивченні відносних показників(приватних ознак) формула середньої помилки має вигляд:

дег - частка ознаки у генеральній сукупності.

Застосування наведених формул середньої помилки передбачає, що відомі генеральна дисперсія та генеральна частка. Однак насправді ці показники невідомі та обчислити їх неможливо через відсутність даних щодо генеральної сукупності. Тому виникає потреба заміни генеральної дисперсії та генеральної частки іншими, близькими до них, величинами.

У математичної статистикидоведено, що такими величинами можуть бути вибіркова дисперсія (ст) та вибіркова частка (с).

З урахуванням сказаного формули середньої помилки можуть бути записані так:

Ці формули дозволяють визначити середню помилку при повторній вибірці. Застосування простої випадкової повторної вибіркиу практиці є обмеженим. Насамперед практично недоцільно, інколи ж неможливо повторне обстеження тих самих одиниць. Застосування безповторного відбору замість повторного диктується вимогою підвищення ступеня точності і надійності вибірки. Тому практично частіше використовують спосіб безповторного випадкового відбору. За цим способом відбору одиниця сукупності, відібрана у вибірку, у подальшому відборі не бере участі. Одиниці відбирають із генеральної сукупності, зменшеної на кількість раніше відібраних одиниць. Тому у зв'язку зі зміною чисельності генеральної сукупності після кожного відбору та ймовірності відбору для залишених одиниць у формули середньої помилки вибірки вводиться поправочний множник

де N – чисельність генеральної сукупності; п- Чисельність вибірки. При достатньо великому значенні N можна одиницею в знаменнику знехтувати. Тоді

Отже, формули середньої помилки вибірки для безповторного відбору для середньої та для частки відповідно мають вигляд:

Оскільки пзавжди менше М, то додатковий множник завжди менше одиниці. Отже, абсолютне значення помилки вибірки при безповторному відборі завжди буде меншим, ніж при повторному.

Якщо чисельність вибірки досить велика, то величина 1 близька до одиниці, а тому нею можна знехтувати. Тоді середню помилку випадкового безповторного відбору визначають за такою формулою власне-випадкової повторної вибірки.

Розрахуємо для нашого прикладу середню помилку для врожайності та частки ділянок із врожайністю 25 ц/га та більше.

Середня помилка вибірки

а) середньої врожайності ячменю

Середня врожайність ячменю в генеральній сукупності х -Г^= 25,1±0,12 ц/га, тобто знаходиться в межах від 24,98 до 25,22 ц/га.

Частка ділянок з урожайністю 25 ц/га і більше у генеральній сукупності р

Т-^Г = 0,80±0,07, тобто. знаходиться у межах від 73 до 87%.

Середня помилка вибірки показує можливі відхилення показників вибіркової сукупності від показників генеральної сукупності. Разом про те під час проведення вибіркового спостереження перед дослідниками часто стоїть завдання розрахунку як середньої помилки, а й визначення граничної можливої помилки вибірки. Знаючи середню помилку, можна визначити межі, за які не вийде величина помилки вибірки. Однак стверджувати, що ці відхилення не перевищать заданої величини, можна не з абсолютною достовірністю, а лише з певним ступенем ймовірності. Рівень ймовірності, що приймається щодо можливих меж, у яких містяться значення параметрів генеральної сукупності, називається довірчим рівнем ймовірності.

Довірча ймовірність- це досить висока і така, що практично вважається здійсненою в кожному конкретному випадку, ймовірність, що гарантує отримання надійних статистичних висновків. Позначимо її через Га можливість перевищити цей рівень - а. Отже,а =1 - Р Ймовірністьа називають рівнем значимості(суттєвості), який характеризує відносне числопомилкових висновків у загальному числі висновків і визначається як різниця між одиницею та довірчою ймовірністю, що приймається.

Рівень довірчої ймовірностівстановлює дослідник виходячи зі ступеня відповідальності та характеру завдань, що вирішуються. У статистичних дослідженняхв економіці найчастіше приймається рівень довірчої ймовірності Г = 0,95; Р = 0,99 (відповідно рівень значимостіа = 0,05; а = 0,01) рідшеГ = 0,999. Наприклад, довірча ймовірністьГ = 0,99 означає, що помилка оцінки в 99 випадках зі 100 не перевищить встановленої величини і тільки в одному випадку зі 100 може досягти обчисленого значення, або перевищити його.

Помилка вибірки, обчислена із заданим ступенем надійної ймовірності, називаєтьсяграничною помилкою вибірки Єр.

Розглянемо, як встановлюється величина можливої граничної помилки вибірки. Величинаєр пов'язана з нормованим відхиленням та, яке визначається як відношення граничної помилки вибіркиєр до середньої помилкита:

Для зручності розрахунків відхилення випадкової величини від середнього значення зазвичай виражають в одиницях середнього квадратичного відхилення. Вираз

називаютьнормованим відхиленням. в У статистичній літературіі називаютькоефіцієнтом довіри, чи коефіцієнтом кратності середньої помилки вибірки.

Так, нормоване відхилення вибіркової середньої можна визначити за такою формулою:

та _є_р_

З виразу 1 можна знайти можливу граничну помилку вибірки

ер = і/л.

Підставивши замістьр. у її значення, наведемо формули граничних помилок вибірки для середньої та для частки при безповторному випадковому відборі:

Отже, гранична помилка вибірки залежить від величини середньої помилки та нормованого відхилення та дорівнює ± кратному числу середніх помилок вибірки.

Середня і гранична помилки вибірки - іменовані величини і виражаються у тих самих одиницях, як і середня арифметична і середнє квадратичне відхилення.

Нормоване відхилення функціонально пов'язані з ймовірністю. Для знаходження значеньі складено спеціальні таблиці (доб.2), якими можна знайти значенняіпри заданому рівні довірчої ймовірності та значення ймовірності при відомому і.

Наведемо значенняі та відповідні їм ймовірності для вибірок із чисельністюп > 30, що найчастіше використовується у практичних розрахунках:

Отже, приі = 1 ймовірність відхилення вибіркових характеристик від генеральних величину одноразової середньої помилки вибірки дорівнює 0,6827. Це означає, що в середньому з кожної 1000 вибірок 683 дадуть узагальнені характеристики, які відрізнятимуться від генеральних узагальнених характеристик не більше ніж на величину одноразової середньої помилки. При і = 2 ймовірність дорівнює 0,9545. в Це означає, що з кожного 1000 вибірок 954 дадуть узагальнені характеристики, які відрізнятимуться від генеральних узагальнених характеристик лише на двократну середню помилку вибірки тощо.

Однак у зв'язку з тим, що зазвичай проводиться тільки одна вибірка, то ми говоримо, що, наприклад, з ймовірністю 0,9545 можна гарантувати, що розміри граничної помилки не перевищать дворазову середню помилку вибірки.

Математично доведено, що відношення помилки вибірки до середньої помилки, як правило, не перевищує± 3д при досить великій чисельності п, незважаючи на те, що помилка вибірки може набувати будь-яких значень. Інакше кажучи можна сказати, що з досить високої ймовірності судження (Р = 0,9973) гранична помилка вибірки, зазвичай, вбирається у трьох середніх помилок вибірки. Тому величину Ер = 3д можна прийняти межу можливої помилки вибірки.

Визначимо для нашого прикладу граничну помилку вибірки для середньої врожайності та частки ділянок із врожайністю 25 ц/га та більше. Довірчий рівень ймовірності приймемо рівним Р = 0,9545. в За таблицею (додаток.2) знайдемо значення і = 2. Середні помилки вибірки для врожайності та частки ділянок з урожайністю 25 ц/га та більше були знайдені раніше та відповідно становили: Ц~= ±0,12 ц/га;МР = ±0,07.

Гранична помилка середньої врожайності ячменю:

Отже, різниця між вибірковою середньою врожайністю та генеральною середньою буде не більше 0,24 ц/га. Межі середньої врожайності у генеральній сукупності: х = х ± є ~ = 25,1 + 0,24, тобто від 24,86 до 25,34 ц/га.

Гранична помилка частки ділянок із врожайністю 25 ц/га та більше:

Отже, гранична помилка у визначенні частки ділянок із врожайністю 25 ц/га і більше не перевищить 14%, тобто питома вага ділянок із зазначеною врожайністю у генеральній сукупності знаходиться в межах: г= а> ± ер = 0,80 ± 0,14, тобто від 66 до 94%.

Помилка вибірки- це об'єктивно виникає розбіжність між характеристиками вибірки та генеральної сукупності. Вона залежить від низки чинників: ступеня варіації досліджуваного ознаки, чисельності вибірки, шляхом відбору одиниць у вибіркову сукупність, прийнятого рівня достовірності результату дослідження.

Для репрезентативності вибірки важливо забезпечити випадковість відбору, щоб всі об'єкти генеральної сукупності мали рівні ймовірності потрапити у вибірку. Для забезпечення репрезентативності вибірки застосовують такі способи відбору:

· власне-випадкова(проста випадкова) вибірка (послідовно відбирається перший об'єкт, що випадково попався);

· механічна(систематична) вибірка;

· типова(стратифікована, розшарована) вибірка (об'єкти відбираються пропорційно до представництва різних типів об'єктів у генеральній сукупності);

· серійна(Гніздова) вибірка.

Відбір одиниць у вибіркову сукупність може бути повторним чи безповторним. При повторному відборіщо у вибірку одиниця піддається обстеженню, тобто. реєстрації значень її ознак, що повертається в генеральну сукупність і нарівні з іншими одиницями бере участь у подальшій процедурі відбору. При безповторному відборіодиниця, що потрапила у вибірку, піддається обстеженню і в подальшій процедурі відбору не бере участі.

Вибіркове спостереження завжди пов'язане з помилкою, оскільки кількість відібраних одиниць не дорівнює початковій (генеральній) сукупності. Випадкові помилки вибірки обумовлені дією випадкових чинників, які містять будь-яких елементів системності у бік впливу розраховані вибіркові характеристики. Навіть за суворого дотримання всіх принципів формування вибіркової сукупності вибіркові і генеральні характеристики дещо відрізнятимуться. Тому випадкові помилки, що отримуються, повинні бути статистично оцінені і враховані при поширенні результатів вибіркового спостереження на всю генеральну сукупність. Оцінка таких помилок і є основним завданням, яке вирішується в теорії вибіркового спостереження. Зворотним завданням є визначення такої мінімально необхідної чисельності вибіркової сукупності, коли помилка не перевищить заданої величини. На вироблення навичок у вирішенні цих завдань і спрямований матеріал цього розділу.

Власно-випадкова вибірка. Її суть полягає у відборі одиниць із генеральної сукупності загалом, без поділу її на групи, підгрупи чи серії окремих одиниць. При цьому одиниці відбираються у випадковому порядку, що не залежить ні від послідовності розташування одиниць у сукупності, ні від значень їх ознак.

Після проведення відбору з використанням одного з алгоритмів, що реалізують принцип випадковості, або на основі таблиці випадкових чисел, Визначаються межі генеральних характеристик. Для цього розраховуються середня та гранична помилки вибірки.

Середня помилка повторної власно-випадкової вибіркивизначається за формулою

де σ - середнє квадратичне відхилення ознаки, що вивчається;

n - обсяг (кількість одиниць) вибіркової сукупності.

Гранична помилка вибіркипов'язана із заданим рівнем ймовірності. При вирішенні поданих нижче завдань необхідна ймовірність становить 0,954 (t = 2) або 0,997 (t = 3). З урахуванням обраного рівня ймовірності та відповідного йому значення t гранична помилка вибірки становитиме:

Тоді можна стверджувати, що за заданої ймовірності генеральна середня перебуватиме у таких межах:

При визначенні кордонів генеральної часткипри розрахунку середньої помилки вибірки використовується дисперсія альтернативної ознаки, яка обчислюється за такою формулою:

де w - вибіркова частка, тобто частка одиниць, які мають певний варіант або варіанти досліджуваного ознаки.

При вирішенні окремих завдань необхідно враховувати, що за невідомої дисперсії альтернативної ознаки можна використовувати її максимально можливу величину, що дорівнює 0,25.

приклад. Внаслідок вибіркового обстеження незайнятого населення, шукає роботу, проведеного на основі власне-випадкової повторної вибіркибули отримані дані, наведені у табл. 1.14.

Таблиця 1.14

Результати вибіркового обстеження незайнятого населення

Із ймовірністю 0,954 визначте межі:

а) середнього віку незайнятого населення;

б) частки (питомої ваги) осіб, молодших 25 років, у загальній чисельності незайнятого населення.

Рішення.Для визначення середньої помилки вибірки необхідно, перш за все, визначити вибіркову середню величину та дисперсію ознаки, що вивчається. Для цього при ручному способі розрахунку доцільно побудувати таблицю 1.15.

Таблиця 1.15

Розрахунок середнього віку незайнятого населення та дисперсії

На підставі даних таблиці розраховуються необхідні показники:

· Вибіркова середня величина:

;

· Дисперсія:

· середньоквадратичне відхилення:

Середня помилка вибірки складе:

року.

Визначимо з ймовірністю 0,954 ( t= 2) граничну помилку вибірки:

року.

Встановимо межі генеральної середньої: (41,2 - 1,6) (41,2+1,6) або:

Таким чином, на підставі проведеного вибіркового обстеження з ймовірністю 0,954 можна зробити висновок, що середній вікнезайнятого населення, яке шукає роботу, лежить у межах від 40 до 43 років.

Для відповіді на питання, поставлене в пункті «б» даного прикладу, за вибірковими даними визначимо частку осіб віком до 25 років та розрахуємо дисперсію частки:

Розрахуємо середню помилку вибірки:

Гранична помилка вибірки з заданою ймовірністюскладе:

Визначимо межі генеральної частки:

Отже, з ймовірністю 0,954 можна стверджувати, частка осіб віком до 25 років у кількості незайнятого населення перебуває у межах від 3,9 до 1 1,9%.

При розрахунку середньої помилки власне-випадковою безповторноювибірки необхідно враховувати виправлення на безповторність відбору:

де N - обсяг (кількість одиниць) генеральної сукупності/

Необхідний обсяг власно-випадкової повторної вибіркивизначається за формулою:

Якщо відбір безповторний, то формула набуває наступного вигляду:

Отриманий на основі використання цих формул результат завжди округляється у велику сторону до цілого значення.

приклад.Необхідно визначити, скільки учнів перших класів шкіл району необхідно відібрати в порядку власно-випадкової безповторної вибірки, щоб з ймовірністю 0,997 визначити межі середнього зростання першокласників з граничною помилкою 2 см. Відомо, що всього в перших класах шкіл району навчається 1100 учнів за результатами аналогічного обстеження в іншому районі становила 24.

Рішення.Необхідний обсяг вибірки при рівні ймовірності 0,997 ( t= 3) складе:

Таким чином, для отримання даних про середнє зростання першокласників із заданою точністю необхідно обстежити 52 школярі.

Механічна вибірка. Ця вибірка полягає у відборі одиниць із загального списку одиниць генеральної сукупності через рівні інтервали відповідно до встановленого відсотка відбору. При вирішенні завдань визначення середньої помилки механічної вибірки, і навіть необхідної її чисельності, слід використовувати наведені вище формули, застосовувані при власне-випадковому безповторному відборі.

Так, при 2% вибірці відбирається кожна 50-а одиниця (1:0,02), при 5% вибірці - кожна 20 одиниця (1:0,05) і т.д.

Таким чином, відповідно до прийнятої частки відбору, генеральна сукупність механічно розбивається на рівновеликі групи. З кожної групи у вибірку відбирається лише одна одиниця.

Важливою особливістю механічної вибірки і те, що формування вибіркової сукупності можна здійснити, не вдаючись до складання списків. Насправді часто використовують той порядок, у якому фактично розміщуються одиниці генеральної сукупності. Наприклад, послідовність виходу готових виробів з конвеєра чи потокової лінії, порядок розміщення одиниць партії товару під час зберігання, транспортування, реалізації тощо.

Типова вибірка.Ця вибірка застосовується у випадках, коли одиниці генеральної сукупності об'єднані у кілька великих типових груп. Відбір одиниць у вибірку проводиться усередині цих груп пропорційно їх обсягу на основі використання власне-випадкової або механічної вибірки (за наявності необхідної інформації відбір також може проводитися пропорційно варіації ознаки, що вивчається в групах).

Типова вибірка зазвичай застосовується щодо складних статистичних сукупностей. Наприклад, при вибірковому обстеженні продуктивність праці працівників торгівлі, які з окремих груп з кваліфікації.

Важливою особливістю типової вибірки і те, що вона дає точніші результати проти іншими способами відбору одиниць у вибіркову сукупність.

Середня помилка типової вибірки визначається за формулами:

(Повторний відбір);

(Безповторний відбір),

де - середня з внутрішньогрупових дисперсій.

приклад. З метою вивчення доходів населення за трьома районами області сформовано 2%-ву вибірку, пропорційну чисельності населення цих районів. Отримані результати наведено в табл. 16.

Таблиця 16

Результати вибіркового обстеження доходів населення

Необхідно визначити межі середньодушових доходів населення області загалом за рівня ймовірності 0,997.

Рішення.Розрахуємо середню із внутрішньогрупових дисперсій:

де N i- Об `єм i-і групи;

n, - обсяг вибірки з/- та групи.

Серійна вибірка. Ця вибірка використовується у випадках, коли одиниці досліджуваної сукупності об'єднані в невеликі рівновеликі групи чи серії. Одиницею відбору у разі є серія. Серії відбираються з допомогою власно-випадкової чи механічної вибірки, а всередині відібраних серій обстежуються все без винятку одиниці.

В основі розрахунку середньої помилки серійної вибірки лежить міжгрупова дисперсія:

(Повторний відбір);

(Безповторний відбір),

де x i- кількість відібраних i- серій;

R - загальне числосерій.

Міжгрупову дисперсію при рівновеликих групах обчислюють так:

де х i- середня i-ї серії;

х- загальна середня по всій вибірковій сукупності.

приклад. З метою контролю якості комплектуючих із партії виробів, упакованих у 50 ящиків по 20 виробів у кожному, було здійснено 10%-ву серійну вибірку. По ящикам, що потрапили у вибірку, середнє відхилення параметрів виробу від норми відповідно склало 9 мм, 11, 12, 8 і 14 мм. З ймовірністю 0,954 визначте середнє відхилення параметрів у всій партії загалом.

Рішення.Вибіркова середня:

мм.

Розмір міжгрупової дисперсії:

З урахуванням встановленої ймовірності Р = 0,954 (t= 2) гранична помилка вибірки складе:

мм.

Зроблені розрахунки дозволяють зробити висновок, що середнє відхилення параметрів всіх виробів від норми знаходиться в наступних межах:

Для визначення необхідного обсягу серійної вибірки при заданій граничній помилці використовуються такі формули:

(Повторний відбір);

(Безповторний відбір).

Розглянемо докладно перераховані вище способи формування вибіркової сукупності і помилки репрезентативності, що виникають при цьому.

Власне-випадкова вибірка ґрунтується на відборі одиниць із генеральної сукупності навмання без будь-яких елементів системності. Технічно власне-випадковий відбір проводять методом жеребкування (наприклад, розіграші лотерей) або за таблицею випадкових чисел.

Власно-випадковий відбір «у чистому вигляді» у практиці вибіркового спостереження застосовується рідко, але він є вихідним серед інших видів відбору, у ньому реалізуються основні засади вибіркового спостереження. Розглянемо деякі питання теорії вибіркового методу та формули помилок для простої випадкової вибірки.

Помилка вибіркового спостереження - це різницю між величиною параметра у генеральній сукупності, та її величиною, обчисленої за результатами вибіркового спостереження. Для середньої кількісної ознаки помилка вибірки визначається

Показник називається граничною помилкою вибірки.

Вибіркова середня є випадковою величиною, яка може набувати різних значень залежно від того, які одиниці потрапили у вибірку. Отже, помилки вибірки є випадковими величинами і можуть приймати різні значення. Тому визначають середню з можливих помилок – середню помилку вибірки, яка залежить від:

1) обсягу вибірки: чим більша чисельність, тим менша величина середньої помилки;
2) ступеня зміни досліджуваного ознаки: що менше варіація ознаки, отже, і дисперсія, тим менше середня помилка вибірки.

При випадковому повторному відборі середня помилка розраховується

Практично генеральна дисперсія точно не відома, але теоретично ймовірності доведено, що

Оскільки величина за досить великих n близька до 1, вважатимуться, що. Тоді середня помилка вибірки може бути розрахована:

Але у випадках малої вибірки (при n30) коефіцієнт необхідно враховувати і середню помилку малої вибірки розраховувати за формулою

При довільній безповторній вибірці наведені формули коригуються на величину. Тоді середня помилка безповторної вибірки:

Т.к. завжди менше, то множник () завжди менше 1. Це означає, що середня помилка при безповторному відборі завжди менша, ніж при повторному.

Механічна вибірка застосовується, коли генеральна сукупність у будь-який спосіб упорядкована (наприклад, списки виборців за алфавітом, телефонні номери, номери будинків, квартир). Відбір одиниць здійснюється через певний інтервал, що дорівнює зворотному значенню відсотка вибірки. Так за 2% вибірці відбирається кожна 50 одиниця =1/0,02 , при 5% кожна 1/0,05=20 одиниця генеральної сукупності.

Початок відліку вибирається різними способами: випадковим чином, із середини інтервалу, зі зміною початку відліку. Головне при цьому – уникнути систематичної помилки. Наприклад, при 5% вибірці, якщо першою одиницею обрано 13-ту, то наступні 33, 53, 73 і т.д.

За точністю механічний відбір близький до власно-випадкової вибірки. Тому визначення середньої помилки механічної вибірки використовують формули власне-випадкового відбору.

При типовому відборі обстежувана сукупність попередньо розбивається однорідні, однотипні групи. Наприклад, при обстеженні підприємств це можуть бути галузі, підгалузі, щодо населення - райони, соціальні чи вікові групи. Потім здійснюється незалежний вибір із кожної групи механічним або власне-випадковим способом.

Типова вибірка дає більш точні результати проти іншими способами. Типізація генеральної сукупності забезпечує представництво у вибірці кожної типологічної групи, що дозволяє виключити вплив міжгрупової дисперсії на середню помилку вибірки. Отже, при знаходженні помилки типової вибірки згідно з правилом складання дисперсій () необхідно врахувати лише середню з групових дисперсій. Тоді середня помилка вибірки:

при повторному відборі

при безповторному відборі

де - середня із внутрішньогрупових дисперсій у вибірці.

Серійний (або гніздовий) відбір застосовується у разі, коли генеральна сукупність розбита на серії чи групи на початок вибіркового обстеження. Цими серіями можуть бути упаковки готової продукції, студентські групи, бригади. Серії для обстеження вибираються механічним чи власне-випадковим способом, а всередині серії проводиться суцільне обстеження одиниць. Тому середня помилка вибірки залежить лише від міжгрупової (міжсерійної) дисперсії, яка обчислюється за такою формулою:

де r – число відібраних серій;

Середня і-та серія.

Середня помилка серійної вибірки розраховується:

при повторному відборі

при безповторному відборі

де R – загальна кількість серій.

Комбінований відбір є поєднанням розглянутих способів відбору.

Середня помилка вибірки за будь-якого способу відбору залежить головним чином абсолютної чисельності вибірки й у меншою мірою - від відсотка вибірки. Припустимо, що проводиться 225 спостережень у першому випадку з генеральної сукупності 4500 одиниць і у другому - 225000 одиниць. Дисперсії в обох випадках дорівнюють 25. Тоді в першому випадку при 5% відборі помилка вибірки складе:

У другому випадку при 0,1%-ному відборі вона дорівнюватиме:

Таким чином, при зменшенні відсотка вибірки в 50 разів помилка вибірки збільшилася незначно, оскільки чисельність вибірки не змінилася.

Припустимо, що кількість вибірки збільшили до 625 спостережень. У цьому випадку помилка вибірки дорівнює:

Збільшення вибірки в 2,8 разу за однієї й тієї ж чисельності генеральної сукупності знижує розміри помилки вибірки більш як 1,6 разу.

Середня та гранична помилки вибірки

Основна перевага вибіркового спостереження серед інших - можливість розрахувати випадкову помилку вибірки.

Помилки вибірки бувають систематичні та випадкові.

Систематичні- у разі, коли порушено основний принцип вибірки - випадковості. Випадкові- виникають зазвичай з огляду на те, що структура вибіркової сукупності завжди відрізняється від структури генеральної сукупності, як би правильно не був проведений відбір, тобто, незважаючи на принцип випадковості відбору одиниць сукупності, все ж таки є розбіжності між характеристиками вибіркової та генеральної сукупності. Вивчення та вимірювання випадкових помилок репрезентативності та є основним завданням вибіркового методу.

Як правило, найчастіше розраховують помилку середньої та помилку частки. При розрахунках використовуються такі умовні позначення:

Середня, розрахована у межах генеральної сукупності;

Середня, розрахована у межах вибіркової сукупності;

р- частка цієї групи у генеральній сукупності;

w- частка цієї групи у вибірковій сукупності.

Використовуючи умовні позначення, помилки вибірки для середньої та для частки можна записати наступним чином:

Вибіркова середня та вибіркова частка є випадковими величинами, які можуть набувати будь-яких значень залежно від того, які одиниці сукупності потрапили у вибірку. Отже, помилки вибірки є випадковими величинами і можуть приймати різні значення. Тому визначають середню з можливих помилок .

На відміну від систематичної, випадкову помилку можна визначити заздалегідь, до проведення вибірки, відповідно до граничних теорем, що розглядаються в математичній статистиці.

Середня помилка визначається із ймовірністю 0,683. У разі іншої ймовірності говорять про граничну помилку.

Середня помилка вибірки для середньої та для частки визначається наступним чином:

У цих формулах дисперсія ознаки є характеристикою генеральної сукупності, які під час вибіркового спостереження невідомі. Насправді їх замінюють аналогічними характеристиками вибіркової сукупності виходячи з закону великих чисел, яким вибіркова сукупність великому обсязі точно відтворює характеристики генеральної сукупності.

Формули визначення середньої помилки для різних спосібвідбору:

Спосіб відбору	Повторний	Неповторний
помилка середньої	помилка частки	помилка середньої	помилка частки
Власно-випадковий та механічний
Типовий
Серійний

μ - середня помилка;

∆ - гранична помилка;

п -чисельність вибірки;

N -чисельність генеральної сукупності;

Загальна дисперсія;

w -частка цієї категорії у загальній чисельності вибірки:

Середня з внутрішньогрупових дисперсій;

Δ 2 - міжгрупова дисперсія;

r -число серій у вибірці;

R- загальна кількість серій.

Гранична помилкадля всіх способів відбору пов'язана із середньою помилкою вибірки наступним чином:

де t- Коефіцієнт довіри, функціонально пов'язаний з ймовірністю, з якою забезпечується величина граничної помилки. Залежно від ймовірності коефіцієнт довіри t приймає наступні значення:

t	P
	0,683
1,5	0,866
2,0	0,954
2,5	0,988
3,0	0,997
4,0	0,9999

Наприклад, ймовірність помилки дорівнює 0,683. Це означає, що генеральна середня відрізняється від вибіркової середньої за абсолютною величиною не більше ніж на величину μ з ймовірністю 0,683, якщо - вибіркова середня, - генеральна середня, то зймовірністю 0,683.

Якщо ми хочемо забезпечити більшу ймовірність висновків, то ми збільшуємо межі випадкової помилки.

Таким чином, величина граничної помилки залежить від наступних величин:

Коливання ознаки (прямий зв'язок), яку характеризує величина дисперсії;

Чисельності вибірки (зворотній зв'язок);

Довірчої ймовірності (прямий зв'язок);

Метод відбору.

Приклад розрахунку помилки середньої та помилки частки.

Для визначення середньої кількості дітей у сім'ї методом випадкової безповторної вибірки з 1000 сімей відібрано 100. Результати наведені в таблиці:

Визначте:.

- з ймовірністю 0,997 граничну помилку вибірки та кордону, в яких перебуває середня кількість дітей у сім'ї;

- з ймовірністю 0,954 кордону, в яких знаходиться питома вага сімей із двома дітьми.

1. Визначимо граничну помилку середньої з ймовірністю 0,977. Для спрощення розрахунків скористаємося способом моментів:

p = 0,997 t= 3

середня помилка середньої, 0,116 - гранична помилка

2,12 – 0,116 ≤ ≤ 2,12+ 0,116

2,004 ≤ ≤ 2,236

Отже, з ймовірністю 0,997 середня кількість дітей у сім'ї у генеральній сукупності, тобто серед 1000 сімей, перебуває у інтервалі 2,004 - 2,236.