Основы криминологического измерения. Тест: Бесплатный тест по статистике

Предмет статистической науки и задачи статистики на современном этапе

Статистика произошло от лат «ststus»-состояние или положение. Статистика - это совокупность цифр; это вид деятельности по сбору и анализу данных; это наука сформировавшаяся в 18в и изначально называл «политическая арифметика». Предмет статист - количественная сторона массовых соц-экон явл в неразрывной связи с их качественной стороной в конкретн услов места и времени. Объект – общество происходящие в нем процессы, т.е. совокупность соц-экономических явлений. Основн метод статистики – закон больших чисел. Важнейшие задачи стат-ки – организ стат наблюдений; обраб-ка данных и получение системы обобщ показателей для анализа; предоставлен гос управл достов информации для своевремен принятия управл решений; публикац информации для информиров-я по соц-экон процессам. Стат. исследования проходят след этапы : 1.статистичек наблюдение(формы и виды сбора информ);2.стасистическа сводка и группировка(систематизация);3.расчет и анализ обобщающих показателей(абсолютн и относ велич, средн велич, показатели вариации, показатели выборочного наблюдения, показатели рядов динамики, индексы).

Статистическая совокупность, ее виды. Единицы совокупности и классификация их признаков.

Статистическая совокупность – совокупность однородных по какому-либо признаку предметов, ограниченных пространством и временем. Совокупность называется однородной, если один или несколько изучаемых существенных признаков ее объектов являются общими для всех единиц. Совокупность, в которую входят явления разного типа, считается разнородной. Пример СС - множество студентов некоторого вуза, обучающихся на 2-ом курсе дневного отделения. Данное множество является качественно однородным, так как объединяет молодых людей, обучающихся в одном и том же вузе на 2-ом курсе дневного отделения. В то же время элементы данного множества - студенты отличаются друг от друга успеваемостью, способностями, состоянием здоровья и т.п. Единица совокупности (элемент) - частный случай проявления изучаемой закономерности; это первичный элемент статистической совокупности, являющийся носителем признаков, подлежащих регистрации и основой ведущегося при обследовании счета. Признак - это свойство, характеристика единицы статистической совокупности. Например, единица статистической совокупности - «студент» имеет следующие признаки: фамилия, имя, отчество, возраст, оценки по предметам, посещаемость занятий и т.д Чем более однороднее совокупность, тем больше общих признаков имеют ее единицы и меньше варьируют их значения.


1. Средние величины: сущность, значение, виды

Важный вклад в обоснование и развитие теории средних величин внес крупный ученый XIX века Адольф Кетле (1796-1874), член Бельгийской академии наук, член-корреспондент Петербургской академии наук.

Средняя величина - обобщающая характеристика изучаемого признака в исследуемой совокупности. Она определяет его типичный уровень в расчёте на единицу совокупности в конкретных условиях места и времени.

Средняя величина всегда именованная, имеет ту же размерность (единицу измерения), что и признак у отдельных единиц совокупности.

Основным условием научного использования средней величины является качественная однородность совокупности, по которой исчислена средняя.

    степенные (средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая, средняя кубическая);

    структурные (мода, медиана).

Степенная средняя – корень степени k из средней всех вариантов, взятых в k –й степени, имеет следующий вид:

где – признак, по которому находится средняя, называется осредняемым признаком,

х i или (х 1 , х 2 …х n ) – величина осредняемого признака у каждой единицы совокупности,

f i – повторяемость индивидуального значения признака.

В зависимости от степени k получаются различные виды степенных средних, формулы расчета которых показаны ниже в таблице 1.

Таблица 1 – Виды степенных средних

Значение k

Наименование средней

Формулы средней

взвешенная

Средняя гармоническая

, w i = x i · f i

Средняя геометрическая

Средняя арифметическая

=

=

Средняя квадратическая

=

=

f i частота повторения индивидуального значения признака (его вес)

Весом может быть и частотость, т.е. отношение частоты повторения индивидуального значения признака к сумме частот:

Выбор вида средней величины:

Средняя арифметическая простая применяется в случае, если индивидуальное значение признака у единиц совокупности на повторяется или встречается одни раз или одинаковое число раз, т.е. когда средняя рассчитывается по несгруппированным данным.

Когда отдельное значение изучаемого признака встречается несколько раз у единиц изучаемой совокупности, тогда частота повторения индивидуальных значений признака (вес) присутствует в расчетных формулах степенных средних. В этом случае они называются формулами взвешенных средних .

Если по условию задачи необходимо, чтобы неизменной оставалась при осреднении суммы величин, обратных, индивидуальным значениям признака, то средняя величина является гармонической средней .

Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменным произведение индивидуальных величин, то следует применить среднюю геометрическую . Средняя геометрическая используется для расчета средних темпов роста в анализе рядов динамики.

Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменной сумму квадратов исходных величин, то средняя будет являться квадратической средней величиной . Средняя квадратическая используется для расчета среднего квадратического отклонения при анализе вариации признака в рядах распределения.

Степенные средние разных видов, исчисленные по одной и той же совокупности, имеют различные количественные и чем больше показатель степени k , тем больше и величина соответствующей средней, если все исходные значения признака равны, то и все средние равны этой постоянной:

Гарм. ≤ геом. ≤ арифм. ≤ кв. ≤ куб.

Это свойство степенных средних возрастать с повышением показателя степени определяющей функции называется мажорантностью средних .

Структурные средние применяют в том случае, когда расчет степенных средних невозможен или нецелесообразен.

К структурным средним относят: моду и медиану .

Мода – это наиболее часто встречающееся значение признака у единиц данной совокупности. При наличии вариантов и частот в ряду распределения величина моды соответствует значению признака у наибольшего числа единиц (наибольшей частоте), т.е. для дискретного вариационного ряда мода находится по определению.

Медиана – значение признака у единицы совокупности в середине ранжированного ряда распределения, когда все индивидуальные значения признака изучаемых единиц расположены в порядке их возрастания или убывания.

В случае нечетного числа наблюдений медиана находится по определению, т.е. вариант (где n – число наблюдений). При четном числе наблюдений медиана определяется по формуле:

Для интервального ряда распределения величина моды и медианы рассчитываются по следующим формулам:
;
,

где: - нижняя граница модального или медианного интервала;

Величина интервала;

и
- частоты, предшествующие и следующие за модальным интервалом;

- частота модального или медианного интервала;

- сумма накопленных частот в интервалах, предшествующих медианному.

Расчет медианы по несгруппированным данным производится следующим образом:

1. Индивидуальные значения признака располагаются в возрастающем порядке. 2. Определяется порядковый номер медианы № Ме = (n +1) / 2

    Показатели вариации, сущность, значение, виды. Законы вариации

Для измерения вариации признака применяются различные абсолютные и относительные показатели.

К абсолютным показателям (мера) вариации относятся: размах колебаний, среднее абсолютное отклонение, дисперсия, среднее квадратическое отклонение.

Размах вариации – это разность между максимальным и минимальным значениями признака:
.

Размах вариации показывает, в каких пределах колеблется размер признака, образующего ряд распределения

Среднее абсолютное отклонение (САО) - средняя из абсолютных значений отклонений отдельных вариант от средней.

(простая),
(взвешенная)

Дисперсия- средняя из квадратов отклонений вариантов значений признака от их средней величины:

(простая),
(взвешенная)

Дисперсия может быть разложена на составные элементы, позволяющих оценить влияние различных факторов, обуславливающих вариацию признака

т.е. дисперсия равна разности между средним квадратом значений признака и квадратом средней.

Свойства дисперсии, позволяющие упростить способ ее вычисления:

    Дисперсия постоянной величины равна 0.

    Если все варианты значений признака уменьшить на одно и то же число раз, то дисперсия не уменьшится.

    Если все варианты значений признака уменьшить в одно и то же число раз (k раз), то дисперсия уменьшится в k 2 раз.

Среднее квадратическое отклонение (СКО) представляет собой корень квадратный из дисперсии, показывает насколько в среднем колеблется величина признака у единиц изучаемой совокупности: =

СКО является мерилом надежности. Чем меньше СКО, тем лучше средняя арифметическая отражает собой всю представляемую совокупность.

Размах вариации, САО, СКО являются величинами именованными, т.е. имеют те же единицы измерения, что и индивидуальные значения признака.

Существуют 4 вида дисперсии: общая, межгрупповая, внутригрупповая, групповая.

Дисперсию, вычисляемую для всей совокупности в целом называют общей дисперсией. Она измеряет колеблемость зависимого признака (результатного), вызванную действием на него всех без исключения факторов.

Общая дисперсия равна сумме средней из внутригрупповой и межгрупповой дисперсии:

Если совокупность разбита на группы, то для каждой группы может быть определена своя дисперсия, характеризующая вариацию внутри группы. Групповая дисперсия – средние квадратические отклонения от групповой средней, т.е. от средней величины признака в данной группе.

где j – порядковый номер x и f в пределах группы.

Групповая дисперсия характеризует вариацию признака в пределах группы за счет всех прочих факторов, кроме положенного в основании группировки.

Измерение вариации по совокупности в целом, исчисляем как среднюю из внутригрупповых дисперсии:

где – групповые дисперсии,

n j – число единиц в группах.

Групповые средние отличаются одна от другой и от общей средней, т.е. варьируют. Их вариацию называют межгрупповой вариацией. Для ее характеристики исчисляют средний квадрат отклонений групповых средних от общей средней:

где j групповые средние, – общая средняя, n j – число единиц в группе.

Межгрупповая дисперсия (дисперсия групповых средних) измеряет вариацию результатного признака за счет факторного признака, положенного в основании группировки.

При сравнении колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях с различной величиной средней арифметической пользуются относительными показателями вариации.

Эти показатели вычисляются как отношение абсолютных показателей вариации к средней арифметической (или медиане)

Коэффициент вариации

Относительное линейное отклонение

Коэффициент осцилляции

Наиболее часто применяемый показатель относительной колеблемости – коэффициент вариации , который показывает среднее отклонение от среднего значения признака в процентах.

Его используют для: сравнительной оценки вариации; характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%, т.е. меньше 33%.

Законы вариации .

Закон вариации индивидуальных значений признака или «правило трех сигм». Бельгийский статистик А.Кетле обнаружил, что вариации некоторых массовых явлений подчиняются закону распределения ошибок, открытому К.Гауссом и П. Лапласом почти одновременно. Кривая, отображающая это распределение, имеет вид колокола (рис.2).

По нормальному закону (термин предложен английским статистиком К.Пирсоном) распределения колеблемость индивидуальных значений признака находится в пределах
(правило трех сигм).

Нормальному закону распределения подчиняются естественные свойства человека (рост, вес, физическая сила), характеристики промышленных изделий (размер, вес, электрическое сопротивление, упругость и т.п.). В сфере быстроизменяющихся общественных явлений действие этого закона проявляется сравнительно редко. Однако, в ряде случаев, использование правила трех сигм практически возможно.

Закон вариации средних величин . Вариация средних величин меньше вариации индивидуальных значений признака. Средние значения признака изменяются в пределах:
, где n – число единиц.

Информатика и математика - Теоретические материалы для первого коллоквиума

1. Предмет математической статистики, её основные разделы. Понятие о статистическом распределении. Нормальное распределение. В каких условиях случайная величина распределена нормально?

Статистика – наука, узучающая совокупн. масс. явл-я с целью выявления закономерн. и изуч-я их с помощью обобщенных показателей.

Все методы математической статистики можно отнести к двум основным ее разделам: теории статистического оценивания параметров и теории проверки статистических гипотез .

Разделы :

1. дескриптивная статистика

2. выборочный метод, доверительные интервалы

3. корреляционный анализ

4. регрессионный анализ

5. анализ качественных признаков

6. многомерный статистический анализ:

а) кластерный

б) факторный

7. анализ временных рядов

8. дифференциальные уравнения

9. математическое моделирование исторических процессов

Распределение:

Теоретическое (бесконечно много объектов и они ведут себя идеально)

Эмпирическое (реальные данные, которые можно выстроить в гистограмму)

Нормальное распределение – когда характер распределения влияют много факторов, и ни один из них не является определяющим. Особенно часто используется на практике.


2. Нормальное распределение можно изобразить графически в виде симметричной одновершинной кривой, напоминающей по форме колокол. Высота (ордината) каждой точки этой кривой показывает, как часто встречается соответствующее значение. Дескриптивная статистика. Средние значения - среднее арифметическое, медиана, мода. В каких ситуациях эти три меры дают близкие значения, а в каких они сильно различаются?

Дескриптивная статистика - Это описательная статистика.

среднее арифметическое, медиана, мода – меры среднего – коэф-ты, которые могут охарактеризовать совокупность объектов

· среднее (арифметическое) значение ‑ сумма всех значений, отнесенная к общему числу наблюдений (принятые обозначения: Mean или ), т.е. средним арифметическим значением признака называется величина

где - значение признака у i -го объекта, n - число объектов в совокупности.

· мода – наиболее часто встречающееся значение переменной (M)

· медиана – среднее по порядку значение (принятые обозначения: Median, m). Медиана - это "серединное" значение признака в том смысле, что у половины объектов совокупности значения этого признака меньше, а у другой половины - больше медианы. Приближенно вычислить медиану можно, упорядочив все значения признака по возрастанию (убыванию) и найдя число в этом вариационном ряду, которое либо имеет номер (n +1)/2 - в случае нечетного n , либо находится посередине между числами с номерами n /2 и (n +1)/2 - в случае четного n .

Не все из перечисленных характеристик можно вычислять для качественных признаков. Если признак качественный и номинальный, то для него можно найти только моду (ее значением будет название наиболее часто встречающейся категории номинального признака). Если признак ранговый, то кроме моды для него можно найти еще и медиану. Среднее арифметическое значение можно вычислять только для количественных признаков.

В случае количественных данных все характеристики среднего уровня измеряются в тех же единицах, что и сам исходный признак.

Значения коэф-тов совпадают, если график распределения симметричен.


3. Показатели неоднородности - дисперсия, среднее квадратическое (стандартное) отклонение, коэффициент вариации. В каких единицах они измеряются? Зачем вводится понятие коэффициента вариации?

· среднее квадратическое или стандартное отклонение ‑ мера разброса значений признака около среднего арифметического значения (принятые обозначения: Std.Dev. (standard deviation ), s или s). Величина этого отклонения вычисляется по формуле

.

· дисперсия признака ( s 2 или s 2 )

· коэффициент вариации ‑ отношение стандартного отклонения к среднему арифметическому, выраженное в процентах (обозначается в статистике буквой V ). Коэффициент вычисляется по формуле: .

Все эти меры можно вычислять только для количественных признаков. Все они показывают, насколько сильно варьируют значения признака (а точнее - их отклонения от среднего) в данной совокупности. Чем меньше значение меры разброса, тем ближе значения признака у всех объектов к своему среднему значению, а значит, и друг к другу. Если величина меры разброса равна нулю, значения признака у всех объектов одинаковы.

Наиболее часто используется среднее квадратическое (или стандартное) отклонение s. Оно измеряется, как и среднее арифметическое, в тех же единицах, что и сам исходный признак. При изменении всех значений признака в несколько раз, точно так же изменится и стандартное отклонение, однако если все значения признака увеличить (уменьшить) на некоторую величину, его стандартное отклонение не изменится . Наряду со стандартным отклонением часто пользуются дисперсией (=его квадрату), однако на практике она является менее удобной мерой, т.к. единицы измерения дисперсии не соответствуют единицам измерения.

Смысл коэффициента вариации состоит в том, что он, в отличие от s, измеряет не абсолютную, а относительную меру разброса значений признака в статистической совокупности.

Чем больше V , тем совокупность менее однородна.

Однородная Переходная Неоднородная

V =0 – 30% V =30 – 50% V =50 – 100%

Может быть »100% (слишком неоднородная совокупность).


4. Понятие о выборочном методе. Репрезентативная выборка, методы её формированияю Два вида ошибок выборки. Доверительная вероятность.

Выборка:

Репрезентативная

Случайная

Механическая выборка – сходна со случайной выборкой (кажд. 10й, 20й и т.п.).

Естественная(то, что осталось от ГС с течением времени) выборки.

Репрезентативная выборка – точно отражает свойства генеральной совокупности.

Чтобы выборка правильно отражала основные свойства, присущие генеральной совокупности, она должна быть случайной , т.е. все объекты генеральной совокупности должны иметь равные шансы попасть в выборку

Выборки формируются с помощью спец. методик. Наиболее простым является случайный отбор, например, при помощи обычной жеребьевки (для небольших совокупностей) или с использованием таблиц случайных чисел. Для более обширных, но достаточно однородных совокупностей используется механический отбор (применявшийся еще в земской статистике). Для неоднородных совокупностей с определенной структурой чаще применяется типический отбор. Существуют и другие методы, в том числе - комбинации разных способов отбора на нескольких этапах построения выборочной совокупности.

В выборочных результатах всегда присутствуют ошибки. Эти ошибки можно разделить на два класса: случайные и систематические. К первым относятся случайные отклонения выборочных характеристик от генеральных, обусловленные самой природой выборочного метода. Величина случайной ошибки поддается вычислению (оценке). Систематические ошибки, наоборот, не носят случайного характера; они связаны с отклонением структуры выборки от реальной структуры генеральной совокупности. Систематические ошибки появляются тогда, когда нарушается основное правило случайного отбора - обеспечение для всех объектов равных шансов поапсть в выборку. Ошибки этого рода статистика не умеет оценивать.

Основными источниками систематических ошибок являются: а) неадекватность сформированной выборки задачам исследования; б) незнание характера распределения в генеральной совокупности и, как следствие, нарушение в выборке структуры генеральной совокупности; в) сознательный отбор наиболее удобных и выигрышных элементов генеральной совокупности.

Доверительная вероятность –


5. Доверительная вероятность. Средняя (стандартная) и предельная ошибки выборки. Доверительный интервал для оценки среднего значения в генеральной совокупности. Проверка гипотезы о статистической значимости различия двух выборочных средних.

Доверительный интервал - тот значений рассчитываемого коэф-та, в к-й, мы считаем,должно попасть это значение для ген. Совокуп-ти.

Доверительная вероятность – вероятность того, что значение рассчитываемого коэф-та для ген. Совокупности попадет в доверительный интервал. Чеи больше ДВ, тем больше ДИ.

Неизбежный разброс выборочных средних вокруг генеральной средней (т.е. стандартное отклонение выборочных средних) называется стандартной ошибкой выборки m , которая выражается формулой (s - среднее квадратическое отклонение, n - объем выборки). стандартная ошибка выборки тем меньше, чем меньше величина s (которая характеризует разброс значений признака) и чем больше объем выборки n .

Если выборочный метод используется для работы с неколичественными данными, то роль среднего арифметического значения в совокупности играет доля или частота q признака. Доля вычисляется как отношение числа объектов, обладающих данным признаком (), к числу объектов во всей совокупности: . Роль меры разброса играет величина .

В этом случае стандарная ошибка выборки m вычисляется по формуле:

Точность и надежность оценки параметров генеральной совокупности по выборке находятся в обратной зависимости: чем больше точность (т.е. чем меньше предельная ошибка и чем уже доверительный интервал), тем меньше надежность такой оценки (степень уверенности). И наоборот - чем ниже точность оценки, тем выше ее надежность. Часто доверительный интервал строят для надежности 95%, соответственно предельная ошибка выборки обычно равна удвоенной средней ошибке m ..

Доверительный интервал для оценки среднего значения в генеральной совокупности:

X (г.с.) = x (выб.) +-Δ = x (выб.) +- = X (выб.) +- σ(г.с.)/√ n

Критерий для разности средних значений

Часто возникает задача сравнения двух выборочных средних с целью проверки гипотезы о том, что эти выборки получены из одной и той же генеральной совокупности, а реальные расхождения в значениях выборочных средних объясняются случайностями выборок.

Испытуемую гипотезу можно сформулировать следующим образом: различие между выборочными средними случайно, т.е. генеральные средние в обоих случаях равны. В качестве статистической характеристики снова используется величина t , предсталяющая собой разность выборочных средних, деленную на усредненную стандартную ошибку среднего по обеим выборкам.

Фактическое значение статистической характеристики сравнивается с критическим значением, соответсвующим выбранному уровню значимости. Если фактическое значение больше, чем критическое, испытуемая гипотеза отклоняется, т.е. различие между средними считается значимым (существенным).


7. Корреляционная связь. Линейный коэффициент корреляции, его формула, пределы его значений. Коэффициент детерминации, его содержательный смысл. Понятие о статистической значимости коеффициента корреляции.

Коэффициент корреляции показывает, насколько тесно две переменных связаны между собой .

Коэффициент корреляции r принимает значения в диапазоне от -1 до +1. Если r = 1, то между двумя переменными существует функциональная положительная линейная связь, т.е. на диаграмме рассеяния соответствующие точки лежат на одной прямой с положительным наклоном. Если r = -1, то между двумя переменными существует функциональная отрицательная зависимость. Если r = 0, то рассматриваемые переменные линейно независимы , т.е. на диаграмме рассеяния облако точек "вытянуто по горизонтали".

Уравнение регрессии и коэффициент корреляции целесообразно вычислять лишь в том случае, когда зависимость между переменными может хотя бы приближенно считаться линейной. В противном случае результаты могут быть совершенно неверными, в частности коэффициент корреляции может оказаться близким к нулю при наличии сильной взаимосвязи. В особенности это характерно для случаев, когда зависимость имеет явно нелинейный характер (например, зависимость между переменными приблизительно описывается синусоидой или параболой). Во многих случаях эту проблему можно обойти, преобразовав исходные переменные. Однако, чтобы догадаться о необходимости подобного преобразования, т.е. для того чтобы узнать, что данные могут содержать сложные формы зависимости, их желательно “увидеть”. Именно поэтому исследование взаимосвязей между количественными переменными обычно должно включать просмотр диаграмм рассеяния.

Коэффициенты корреляции можно вычислять и без предварительного построения линии регрессии. В этом случае вопрос о интерпретации признаков как результативных и факторных, т.е. зависимых и независимых, не ставится, а корреляции понимается как согласованность или синхронность одновременного изменения значений признаков при переходе от объекта к объекту.

Если объекты характеризуются целым набором количественных признаков, можно сразу построить т.н. матрицу корреляции, т.е. квадратную таблицу, число строк и столбцов которой равно числу признаков, а на пересечении каждых строки и столбца стоит коэффициент корреляции соответствующей пары признаков.

Коэффициент корреляции не имеет содержательной интерпретации. Однако его квадрат, называемый коэффициентом детерминации (R 2 ), имеет.

коэффициентом детерминации (R 2) – это показатель того, насколько изменения зависимого признака объясняются изменениями независимого. Более точно, это доля дисперсии независимого признака, объясняемая влиянием зависимого .

Если две переменные функционально линейно зависимы (точки на диаграмме рассеяния лежат на одной прямой), то можно сказать, что изменение переменной y полностью объясняется изменением переменной x, а это как раз тот случай, когда коэффициент детерминации равен единице (при этом коэффициент корреляции может быть равен как 1, так и -1). Если две переменные линейно независимы (метод наименьших квадратов дает горизонтальную прямую), то переменная y своими вариациями никоим образом "не обязана" переменной x – в этом случае коэффициент детерминации равен нулю. В промежуточных случаях коэффициент детерминации указывает, какая часть изменений переменной y объясняется изменением переменной x (иногда удобно представлять эту величину в процентах).


8. Парная и множественная линейная регрессия. Коэффициент множественной корреляции. Содержательный смысл коэффициента регрессии, его значимость, понятие о t -статистике. Содержательный смысл коэффициента детерминации R 2.

Регрессионный анализ - Статистический метод, позволяющий строить объясняющие модели на основе взаимодействия признаков.

Самым простым случаем взаимосвязи является парная взаимосвязь , т.е. связь между двумя признаками. При этом предполагается, что взаимосвязь двух переменных носит, как правило, причинный характер т.е. одна из них зависит от другой. Первая (зависимая) называется в регрессионном анализе результирующей, вторая (независимая) - факторной . Следует заметить, что не всегда можно однозначно определить, какая из двух переменных является независимой, а какая - зависимой. Часто связь может рассматриваться как двунаправленная.

Уравнение парной регрессии : y = kx + b .

Чаще всего на зависимую переменную действуют сразу несколько факторов, среди которых трудно выделить единственный или главный Так, к примеру, доход предприятия зависит одновременно от двух факторов производства - числа рабочих и энерговооруженности. Причем оба этих фактора сами не являются независимыми друг от друга.

Уравнение множественной регрессии : y = k 1 · x 1 + k 2 · x 2 + … + b,

где x 1 , x 2 , . . . – независимые переменные, от которых в той или иной степени зависит исследуемая (результирующая) переменная y;

k 1 , k 2 . . . – коэффициенты при соответствующих переменных (коэффициенты регрессии ), показывающие, насколько изменится значение результирующей переменной при изменении отдельной независимой переменной на единицу.

Уравнение множественной регрессии задает регрессионную модель , объясняющую поведение зависимой переменной. Никакая регрессионная модель не в состоянии указать, какая переменная является зависимой (следствием), а какие – независимыми (причинами).

R – множественный коэф. корреляции, измеряет совокупность воздействия независимых признаков, тесноту связи результирующего признака со всей совокупностью независимых признаков, выраженных в %.

Показывает какова доля учтенных признаков в отделении результата, т.е. на сколько % вариация признака у объясняется вариациями учтенных признаков Х1, Х2, Х3.

T -статистика показывает уровень стат. значимости кажд. ккоэф-та регресии, т.е. его устойчивость по отношению к выборке.

T = b / Δb

Статистически значимыми явл-ся t >2. Чем больше коэф-т, тем лучше.

через R ² мы делаем заключение о том, на сколько % учтенные признаки объясняют результат.


9.Методы многомерного статистического анализа. Кластер-анализ. Понятие об иерархическом методе и о методе К-средних. Многомерная классификация с использованием нечетких множеств.

МСА :

Кластерный анализ

Факторный анализ

Многомерное шкалирование

Кластерный анализ – объединение объектов в группу с единой целью (признаков много).

Способы кластерного анализа:

1. иерархический (дерево иерархического анализа):

основная идея иерархического метода заключается в последовательном объединении группируемых объектов - сначала самых близких, а затем все более удаленных друг от друга. Процедура построения классификации состоит из последовательных шагов, на каждом из которых производится объединение двух ближайших групп объектов (кластеров ).

2. метод К-средних .

Требует заранее заданных классов (кластеров). Подчеркивает внутриклассовую дисперсию. основан на гипотезе о наиболее вероятном количестве классов. Задачей метода является построение заданного числа кластеров, которые должны максимально отличаться друг от друга.

Процедура классификации начинается с построения заданного числа кластеров, полученных путем случайной группировки объектов. Каждый кластер должен состоять из максимально "похожих" объектов, причем сами кластеры должны быть максимально "непохожими" друг на друга.

Результаты этого метода позволяют получить центры всех классов (а также и другие параметры дескриптивной статистики) по каждому из исходных признаков, а также увидеть графическое представление о том, насколько и по каким параметрам различаются полученные классы.

Если рез-ты классификаций, полученные разными методами совпадают, то это подтверждает реальн. Сущ-е групп (надежность, достоверность).


10. Методы многомерного статистического анализа. Факторный анализ, цели его использования. Понятие о факторных весах, пределы их значений; доля суммарной дисперсии, объясняемой факторами.

Многомерный статистический анализ. Его цель: построение упрощенного укрупненного ряда объектов.

МСА :

Кластерный анализ

Факторный анализ

Многомерное шкалирование

В основе факторного анализа лежит идея о том, что за сложными взаимосвязями явно заданных признаков стоит относительно более простая структура, отражающая наиболее существенные черты изучаемого явления, а "внешние" признаки являются функциями скрытых общих факторов, определяющих эту структуру.

Цель: переход от большего числа признаков к небольшому числу факторов.

в факторном анализе все величины, входящие в факторную модель, стандартизированы, т.е. являются безразмерными величинами со средним арифметическим значением 0 и средним квадратическим отклонением 1.

Коэффициент взаимосвязи между некоторым признаком и общим фактором, выражающий меру влияния фактора на признак, называется факторной нагрузкой данного признака по данному общему фактору . Это число в интервале от -1 до 1. Чем дальше от 0, тем более сильная связь. Значение факторной нагрузки по некоторому фактору, близкое к нулю, говорит о том, что этот фактор практически на данный признак не влияет.

Значение (мера проявления) фактора у отдельного объекта называется факторным весом объекта по данному фактору. Факторные веса позволяют ранжировать, упорядочить объекты по каждому фактору. Чем больше факторный вес некоторого объекта, тем больше в нем проявляется та сторона явления или та закономерность, которая отражается данным фактором. Факторы являются стандартизованными величинами, не могут быть = нулю. Факторные веса, близкие к нулю, говорят о средней степени проявления фактора, положительные – о том, что эта степень выше средней, отрицательные – о том. что она ниже средней.

Таблица факторных весов имеет n строк по числу объектов и k столбцов по числу общих факторов. Положение объектов на оси каждого фактора показывает, с одной стороны, тот порядок, в котором они ранжированы по этому фактору, а с другой стороны, равномерность или же неравномерность в их расположении, наличие скоплений точек, изображающих объекты, что дает возможность визуально выделять более или менее однородные группы.


11. Виды качественных признаков. Номинальные признаки, примеры из исторических источников. Таблица сопряженности. Коэффициент связи номинальных признаков, пределы его значений.

Номинальные данные представлены категориями, для которых порядок абсолютно не важен. Для них не определен никакой другой способ сравнения, кроме как на буквальное совпадение/несовпадение.

Примеры номинальных переменных:

· Национальность: англичанин, белорус, немец, русский, японец и пр.

· Род занятий: служащий, врач, военный, учитель и т.д.

· Профиль образования: гуманитарное, техническое, медицинское, юридическое и т.д.

Если в случае с уровнем образования мы еще могли сравнивать людей в терминах "лучше-хуже" или "выше-ниже", то теперь мы лишены даже этой возможности; единственный корректный способ сравнения ‑ это говорить, что данные персоналии "все являются историками", или "все не являются юристами".

Таблицы сопряженности

Таблицей сопряженности называется прямоугольная таблица, по строкам которой указываются категории одного признака (например, разные социальные группы), а по столбцам - категории другого (например, партийная принадлежность). Каждый объект совокупности попадает в какую-либо из клеток этой таблицы в соответствии с тем, в какую категорию он попадает по каждому из двух признаков. Таким образом, в клетках таблицы стоят числа, представляющие собой частоты совместной встречаемости категорий двух признаков (число людей, принадлежащих конкретной социальной группе и входящих в определенную партию). В зависимости от характера распределения этих частот внутри таблицы можно судить о том, существует ли связь между признаками. Что означает связь между социальным статусом и партийной принадлежностью? В данном случае о наличии связи свидетельствовало бы наличии определенных политических пристрастий у членов разных социальных групп. Формально говоря, эта связь понимается как более частая (или наоборот, редкая) совместная встречаемость отдельных комбинаций категорий по сравнению с ожидаемой встречаемостью - ситуацией чисто случайного попадания объектов туда (например, более высокая доля крестьян в партии трудовиков, а дворян - в партии кадетов, чем доли этих социальных групп во всей совокупности депутатов Думы).


12. Виды качественных признаков. Ранговые признаки, примеры из исторических источников. В каких пределах находятся значения коэффициента ранговой корреляции? Какие коэффициенты следует использовать для оценки связи рангового и номинального признаков?

качественные (или категориальные) данные делятся на два типа: ранговые и номинальные.

Ранговые данные представлены категориями, для которых можно указать порядок, т.е. категории сравнимы по принципу "больше-меньше" или "лучше-хуже".

Примеры ранговых переменных:

· Оценки на экзаменах имеют явно выраженную ранговую природу и выражаются категориями типа: "отлично", "хорошо", "удовлетворительно" и т.д.

· Уровень образования может быть представлен как набор категорий: "высшее", "среднее" и т.п.

Несомненно, мы можем ввести ранговую шкалу и с ее помощью упорядочить всех людей, для которых мы знаем их уровень образования или балл на экзамене. Однако, верно ли, что оценка "хорошо" на столько же хуже, чем "отлично", насколько оценка "удовлетворительно" хуже, чем "хорошо"? Несмотря на то, что формально, в случае с оценками, можно получить разницу в баллах, вряд ли корректно измерять расстояние от "отличника" до "хорошиста" пользуясь теми же правилами, что для расстояния от Москвы до Петербурга. В случае с уровнем образования особенно отчетливо видно, что простые вычисления невозможны, поскольку не существует единого правила вычитания "среднего" уровня образования из "высшего", даже, если мы присвоим высшему образованию код "3", а среднему – код "2".

Своеобразие качественных данных не означает, что их нельзя анализировать с помощью математических и статистических методов.

Ряд объектов, упорядоченных в соответствии со степенью проявления некоторого свойства, называют ранжированным, каждому числу такого ряда присваивается ранг .

Меры взаимосвязи между парой признаков, каждый из которых ранжирует изучаемую совокупность объектов, называются в статистике коэффициентами ранговой корреляции .

Эти коэффициенты строятся на основе следующих трех свойств:

· если ранжированные ряды по обоим признакам полностью совпадают (т.е. каждый объект занимает одно и то же место в обоих рядах), то коэффициент ранговой корреляции должен быть равен +1, что означает полную положительную корреляцию:

· если объекты в одном ряду расположены в обратном порядке по сравнению со вторым, коэффициент равен -1, что означает полную отрицательную корреляцию;

· в остальных ситуациях значения коэффициента заключены в интервале [-1, +1]; возрастание модуля коэффициента от 0 до 1 характеризует увеличение соответствия между двумя ранжированными рядами.

Указанными свойствами обладают коэффициенты ранговой корреляции Спирмена r и Кедалла t .

Коэффициент Кедалла дает более осторожную оценку корреляции, чем коэффициент Спирмена (числовое значение t всегда меньше, чем r ).

Коэффициенты взаимосвязи качественных признаков

Для оценки связи качественных признаков необходим коэффициент, к-й имел бы определенный максимум в случае максимальной связи и позволял бы сравнивать между собой разные таблицы по силе связи между признаками. В данном случае нам подходит коэффициент Крамера V .

Базируясь на значении критерия хи-квадрат, коэффициент Крамера позволяет измерять силу связи между двумя категоризованными переменными - измерить ее числом, принимающим значения от 0 до 1, т.е. от полного отсутствия связи до максимальной сильной связи. Коэффициент позволяет сравнить зависимости разных признаков, с тем, чтобы выявить более и менее сильные связи.


13. Математическое моделирование исторических процессов и явлений. Определение понятия «модель». Три типа моделей, примеры их использования в исторических исследованиях.

14. Дифференциальные уравнения как основной инструмент построения математических моделей теоретического типа. Их особенности в сравнении с моделями иммитационного и статистического типа. Пример такой модели.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

хорошую работу на сайт">

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Задача 1

В некотором регионе в текущем году было совершено 12 390 преступлений, а в предыдущем году - 11 800 преступлений. Вычислите (в %) темп роста и темп прироста количества преступлений, зарегистрированных в текущем году по отношению к предыдущему. Рассчитайте также коэффициенты преступности за каждый год, если численность населения региона в конце предыдущего года составляла 1 475 000, а в конце текущего года - 1 770 000 чел. Сделайте выводы о динамике преступности в регионе.

Решение: Для получения точной картины преступности огромное значение имеет такой показатель преступности, как динамика, то есть изменение во времени. Динамика преступности характеризуется понятиями абсолютный рост (или снижение) и темпы роста и прироста преступности, для определения которых производится вычисление этих характеристик согласно определенным формулам.

Темпы роста преступности рассчитываются на основе базисных показателей динамики, что предполагает сопоставление данных за ряд лет (а иногда десятилетий, если нужен широкий охват материала) с постоянным базисом, под которым понимается уровень преступности в начальном для анализа периоде. Такой расчет позволяет криминологам в значительной мере гарантировать сопоставимость относительных показателей, вычисляемых в процентах, которые показывают, каким образом соотносится преступность последующих периодов с предыдущим.

В расчете за 100 % принимаются данные исходного года; показатели, полученные за последующие годы, отражают только процент прироста, что делает расчет точным, а картину более объективной; при оперировании относительными данными удается исключить влияние на снижение или рост преступности увеличения или снижения численности жителей, достигших возраста уголовной ответственности.

Темп прироста преступности вычисляется в процентах. Темп прироста преступности показывает, насколько увеличился или уменьшился последующий уровень преступности по сравнению с предыдущим периодом. Принято условное обозначение вектора темпа прироста: если процентное соотношение возрастает, ставится знак "плюс", если снижается - ставится знак "минус".

Применительно к условиям нашей задаче следует применить соответствующие формулы и вычислить рост и прирост преступности.

1) Темп роста преступности исчисляется по формуле^

Тр=U/U2 * 100 %,

где U - показатель уровня преступности, а U2 - показатель уровня преступности предшествующего периода. Так темп роста преступности по условиям задачи составит - 12390/11800*100 %=1,05 %.

2) Темп прироста преступности рассчитывается по следующей формуле:

Тпр=Тр-100 %.

Так темп прироста по условиям задачи составит 1,05 %-100 %= 98,95 %.

Коэффициент преступности - это конкретный обобщающий показатель общего количества учтенных преступлений, соотнесенного с численностью населения. Он расшифровывается как число преступлений на 100 тыс., 10 тыс. или 1 тыс. населения и является объективным измерителем преступности, позволяющим сопоставлять ее уровни в разных регионах и в разные годы.

Коэффициент преступности помогает более адекватно оценить и динамику уровня преступности, рассчитанного на душу населения.

Коэффициент преступности рассчитывается по формуле:

КП = (П х 100000): Н,

где П - абсолютное число учтенных преступлений; а Н - абсолютная численность всего населения.

Оба показателя берутся в одном и том же территориальном и временном объеме. Число преступлений обычно рассчитывается на 100 тыс. населения. Но при малых числах преступлений и населения (в городе, районе, на предприятии) коэффициент преступности может рассчитываться на 10 тыс. или на 1 тыс. жителей. в любом случае эти числа означают размерность рассматриваемого коэффициента, которая обязательно указывается: число преступлений на 100 тыс. или 10 тыс. населения.

Рассчитаем коэффициент преступности применительно к условиям нашей задачи:

1) КП= (12390*100000): 1 770 000 чел. = 700 (в текущем году).

2) КП= (11800*100000): 1 475 000 = 800 (в предыдущем году).

Преступность в регионе снижается, поскольку, анализируя коэффициент преступности, можно сделать вывод, что при увеличении населения в регионе (на 16,6 %), и незначительном увеличении количества преступлений на 1,05 %, в целом прирост преступности снижается (-98,95 %).

Задача 2

Возраст 11 молодых специалистов учреждения, принятых на службу, в текущем году составил соответственно 19,25,21,23,23,23,25,20,18,20,21 лет. Произведите сводку и группировку данных в виде статистической таблицы частот. Для наглядности постройте полигон частот, а также найдите модальное, медианное и среднее значение возраста принятых сотрудников.

Решение: Группировка - это разбиение совокупности на группы, однородные по какому-либо признаку. С точки зрения отдельных единиц совокупности группировка - это объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам.

Метод группировки основывается на следующих категориях - это группировочный признак, интервал группировки и число групп.

Группировочный признак - это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы.

Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе.

Определение числа групп .

Число групп приближенно определяется по формуле Стэрджесса:

n = 1 + 3,2log n = 1 + 3,2log(11) = 4.

Ширина интервала составит:

Xmax - максимальное значение группировочного признака в совокупности. Xmin - минимальное значение группировочного признака. Определим границы группы.

Номер группы

Нижняя граница

Верхняя граница

Одно и тоже значение признака служит верхней и нижней границами двух смежных (предыдущей и последующей) групп.

Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Для этого сортируем ряд по возрастанию.

№ совокупности

Частота fi

Полигон частоты - это график плотности и вероятности случайной величины, представляет собой ломанную соединяющую точки, соответствующие срединным значениям интервалов группировки частотам этих интервалов.

Среднее значение :

Мода льное значение. Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

где x 0 - начало модального интервала; h - величина интервала; f 2 - частота, соответствующая модальному интервалу; f 1 - предмодальная частота; f 3 - послемодальная частота.

Выбираем в качестве начала интервала 19.75, так как именно на этот интервал приходится наибольшее количество.

Наиболее часто встречающееся значение ряда - 20.92.

Медиана . Медиана делит выборку на две части: половина вариант меньше медианы, половина - больше.

В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 19.75-21.5, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).

Таким образом, 50 % единиц совокупности будут меньше по величине 21.28.

Задача 3

Определите требуемый объем выборки для исследования среднего возраста аттестованных сотрудников ФСИН России при условии, что среднее квадратическое отклонение составляет 10 лет, а максимально допустимая ошибка выборки не должна превышать 5 %.

Решение ищем по формуле определения численности выборки для повторного отбора.

Ф(t) = г/2 = 0.95/2 = 0.475 и этому значению по таблице Лапласа соответствует t=1.96.

Оценка среднеквадратического отклонения s = 10; ошибка выборки е = 5.

Задача 4

В следующей таблице даны официальные ведомственные статистические сведения о распределении осужденных по срокам заключения (наказания) за 2002-2011 годы, размещенные на официальном сайте ФСИН России: www.fsin.su. Найдите размах и коэффициент вариации количества осужденных за каждый календарный год и сделайте выводы об однородности структуры данного статистического признака.

Основным показателем, характеризующим однородность данных, является коэффициент вариации. В статистике принято считать, что, если значение коэффициента менее 33 %, то совокупность данных является однородной, если более 33 %, то - неоднородной.

Коэффициент вариации

Поскольку v ? 30 %, то совокупность однородна, а вариация слабая. Полученным результатам можно доверять.

Срок наказания

От 1 до 3 лет

От 3 до 5 лет

От 5 до 10 лет

От 10 до 15 лет

Свыше 15 лет

Максимальное значение (функция МАКС)

Минимальное значение (функция МИН)

Размах вариации

Среднее значение (функция СРЗНАЧ)

Среднее квадратическое отклонение (функция СТАНДАР ЛОНА)

Коэффициент вариации

Простая средняя :

Мода льное значение

Медиана

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 70580. Следовательно, медиана Me = 70580.

Показатели вариации . .

R = X max - X min .

R = 295916-2250 = 293666.

Среднее линейное отклонение

Каждое значение ряда отличается от другого в среднем на 90895.71.

Дисперсия

(средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 103008 в среднем на 107169.83.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>

или

Коэффициент осцилляции

Простая средняя :

Мода

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 76186. Следовательно, медиана Me = 76186.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min

R = 291112-3101 = 288011.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 83422.69.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 97334.29 в среднем на 100750.25.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя :

Мода льное значение. Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 71093. Следовательно, медиана Me = 71093.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min

R = 243852-3856 = 239996.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 68998.08.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 85765.57 в среднем на 82541.55.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

:

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 74588. Следовательно, медиана Me = 74588.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min ,

R = 242984-5304 = 237680.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 73148.73.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 92104.14 в среднем на 82873.1.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 76678. Следовательно, медиана Me = 76678

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min .

R = 249346-6536 = 242810.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 79680.53.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 99551.71 в среднем на 87389.04.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 76461. Следовательно, медиана Me = 76461.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min .

R = 254722-6704 = 248018.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 82302.82.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 102346.71 в среднем на 89787.88.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 78959. Следовательно, медиана Me = 78959.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min .

R = 261334-7635 = 253699.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 83791.55.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 104898.86 в среднем на 91616.15.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 75916. Следовательно, медиана Me = 75916.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min .

R = 263863-8145 = 255718.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 82767.96.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 103440.71 в среднем на 91207.92.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 78019. Следовательно, медиана Me = 78019.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min

R = 260094-7798 = 252296.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 77827.76.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 99212.29 в среднем на 88081.39.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 72248. Следовательно, медиана Me = 72248.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min .

R = 242137-7173 = 234964.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 70459.02.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 91375.14 в среднем на 80674.43.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Задача 5

В условиях предыдущей задачи произведите перегруппировку заданных интервалов сроков наказания с целью улучшения относительных показателей вариации признака в 2010 году. Постройте гистограммы распределения осужденных по срокам заключения (наказания) за 2010 год до и после произведенной группировки данных и сделайте выводы об однородности структуры исследуемого статистического признака.

Решение:

Поскольку v>30 %, но v<70 %, то вариация умеренная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична.

Совершим перегруппировку данных следующим образом:

В группу 1) входит группы: до года, год, от 1-3 лет соответственно 156978.

В группу 2) входит от группы свыше 3 до 5 лет полностью и 1\5 от группы свыше 5 до 10 лет получаем 1\5*260094+168651=220669,8.

В группу 3) входит 3\5 группы от 5 до 10 т.е. 3\5*260094=156056,4.

Группа 4) (1\5*260094)+(1\5*78019)=67622,6.

Группа 5) 3\5*78019=46811,4.

Группа 6 30744+(1\5*78019)=46347,8.

Гистограмма. Для получения вывода о однородности исследуемого статистического признака Вычислим коэффициент вариации:

Поскольку v>30 %, но v<70 %, то вариация умеренная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична.

Задача 6

Изложить в краткой форме (тезисно, на 1-2 страницах) содержание и результаты недавнего официального статистического исследования в социально-правовой сфере (тематика - на Ваш выбор, ссылки на Интернет-ресурсы - обязательны), сделать выводы и выдвинуть соответствующие статистические гипотезы на краткосрочную перспективу.

В качестве официального статистического исследования было взято исследование о просроченной задолженности по заработной плате на 1 декабря 2015 года.

На 1 декабря 2015 г., по сведениям организаций (не относящихся к субъектам малого предпринимательства), суммарная задолженность по заработной плате по кругу наблюдаемых видов экономической деятельности составила3900 млн. рубл ей и по сравнению с 1 ноября 2015 г. увеличилась на 395 млн. рублей (на 11,3 %).

Просроченная задолженность по заработной плате из-за отсутствия у организаций собственных средств на 1 декабря 2015г. составила3818 млн. рубл ей , или 97,9 % общей суммы просроченной задолженности. По сравнению с 1 ноября 2015г. она увеличилась на 389 млн. рублей (на 11,3 %). Задолженность из-за несвоевременного получения денежных средств из бюджетов всех уровней составила82 млн. рубл ей и увеличилась по сравнению с 1 ноября 2015г. на 6 млн. рублей (на 7,7 %), в том числе задолженность из федерального бюджета составила 62 млн. рублей и снизилась по сравнению с 1 ноября 2015г. на 6 млн. рублей (на 8,6 %),бюджетов субъектов Российской Федерации составила 1,1 млн. рублей (увеличение на 0,2 млн. рублей или на 20,7 %), местных бюджетов - 19 млн. рублей (увеличение на 12 млн. рублей, или в 2,5 раза).

В добыче полезных ископаемых, обрабатывающих производствах, здравоохранении и предоставлении социальных услуг, рыболовстве и рыбоводстве 100 % просроченной задолженности по заработной плате образовано из-за нехватки у организаций собственных средств.

В общем объеме просроченной задолженности по заработной плате 37 % приходится на обрабатывающие производства, 29 % - на строительство, 9 % - на производство и распределение электроэнергии, газа и воды, 7 % - на транспорт, 6 % - на добычу полезных ископаемых, 5 % - на сельское хозяйство, охоту и предоставление услуг в этих областях, лесозаготовки.

Объем просроченной задолженности по заработной плате на 1 декабря 2015г. составил менее 1 % месячного фонда заработной платы работников наблюдаемых видов экономической деятельности.

Задолженность по заработной плате за последний месяц , за который производились начисления, в общем объеме просроченной задолженности составила в среднем 29 %: производстве и распределении электроэнергии, газа и воды - 75 %, деятельности в области образования - 37 %, здравоохранения и предоставления социальных услуг - 35 %, научных исследований и разработок - 32 %, строительства - 29 %, транспорта - 23 %, обрабатывающих производствах - 22 %.

Из общей суммы невыплаченной заработной платы на долги, образовавшиеся в 2014г.,приходится 457 млн. рублей (11,7 %), в 2013г. и ранее - 657 млн. рублей (16,8 %).

В целом наблюдая картину задолженности по заработной плате в динамике (http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image 5258.gif), можно сделать вывод что значительный спад придется на январь, февраль 2016 года.

Основной процент задолженности приходится на обрабатывающие производства - 37 %, 29 % - на строительство скорее всего это происходит в связи со снижением потребительского спроса на продукцию, соответственно уменьшается прибыль.

Выдвинем гипотезу. С января 2016 года процент задолженности будет сокращаться, в связи с распределением годового бюджета на будущий год с учетом частичного погашения задолженности по заработной плате, и составит 2700 млн. динамика преступность вариация медианное

Для проверки гипотезы (За основу берем данный таблицы http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image5258.gif).

Построим дискретный вариационный ряд. Для этого отсортируем ряд по возрастанию и подсчитаем количество повторения для каждого элемента ряда.

Вычислим среднюю:

Вычислим дисперсию. Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Используя односторонний критерий с б = 0,05, проверить эту гипотезу, если в выборке из n =24 месяца средний показатель оказался равным 2741,25, а дисперсия известна и равна у =193469,27

Решение . Среднеквадратическое отклонение:

Выдвигается нулевая гипотеза H 0 о том, что значение математического ожидания генеральной совокупности равно числу м 0: = 2700.

Альтернативная гипотеза:

H 1: м? 2700, критическая область - двусторонняя.

Для проверки нулевой гипотезы используется случайная величина:

где x - выборочное среднее; S - среднеквадратическое отклонение генеральной совокупности.

Если нулевая гипотеза верна, то случайная величина T имеет стандартное нормальное распределение. Критическое значение статистики T определяется исходя из вида альтернативной гипотезы:

P(|T|

Найдем экспериментальное значение статистики T:

Поскольку объем выборки достаточно большой (n>30), то вместо истинного значения среднеквадратического отклонения можно использовать его оценку S=439.851.

Ф(t кр)=(1-б)/2 = (1-0.05)/2 = 0.475.

По таблице функции Лапласа найдем, при каком t kp значение Ф(t kp) = 0.475.

Экспериментальное значение критерия T не попало в критическую область T ? t kp , поэтому нулевую гипотезу следует принять. Значение математического ожидания генеральной совокупности можно принять равным 2700

Список используемой литературы

1. Казанцев С.Я. Правовая статистика: Учебник / Под ред. С.Я. Казанцева, С.Я. Лебедева - М.: ЮНИТИ-ДАНА: Закон и право, 2009 г.

2. Курыс?в К.Н. Основы правовой статистики: учеб. пособие / К.Н. Курыс?в; ВЮИ ФСИН России. - Владимир, 2005. - 44 с.

3. Макарова Н.В. Статистика в Exсel: учеб. пособие / Н.В. Макарова, В.Я. Трофимец. - М.: Финансы и статистика.

4. Кондратюк Л.В., Овчинский В.С. Криминологическое измерение /под ред. К.К. Горяинова. - М.: Норма, 2008.

5. Яковлев В.Б. Статистика. Расчеты в Microsoft Excel: учеб. Пособие для вузов / В.Б. Яковлев. - М.: Колосc, 2005. - 352 c.

Размещено на Allbest.ru

...

Подобные документы

    Исследование преступности несовершеннолетних с позиций объекта криминологического исследования. Взаимосвязь подросткового алкоголизма, токсикомании, наркомании и преступности. Причины и условия и пути профилактики преступности несовершеннолетних.

    курсовая работа , добавлен 08.04.2011

    Методика конкретного криминологического исследования. Криминологическая характеристика насильственной преступности и ее предупреждение. Общественная опасность и тяжесть причиняемых последствий насильственных преступлений. Статистика преступности.

    контрольная работа , добавлен 15.01.2011

    Формула расчета коэффициента преступности. Расчет среднегодовой нагрузки на одного судью, среднего срока расследования уголовных дел, среднегодовых темпов роста преступности. Расчет показателей моды, медианы, вариации и среднеквадратического отклонения.

    контрольная работа , добавлен 20.04.2011

    Изучение основ корыстной преступности: понятие, элементы, объекты и субъективные стороны. Описание социального и специально-криминологического предупреждения преступности из корыстных побуждений. Разработка комплекса мер по предупреждению преступлений.

    дипломная работа , добавлен 09.11.2012

    Понятие и предмет криминологического прогнозирования. Установление возможных изменений в состоянии, уровне, структуре и динамике преступности в будущем. Оценка развития преступности в перспективе. Планирование борьбы с преступностью, ее предупреждение.

    курсовая работа , добавлен 29.05.2015

    Исследование видов криминологического прогнозирования и проектирования в сфере преступности. Особенности прогнозирования преступности несовершеннолетних в Республике Казахстан. Разработка программ борьбы с преступностью на общегосударственном уровне.

    дипломная работа , добавлен 25.10.2015

    Преступность несовершеннолетних как объект криминологического исследования. Основные, криминологические характеристики преступности несовершеннолетних. Состояние преступности. Особенности личностной характеристики несовершеннолетних.

    реферат , добавлен 01.04.2003

    Тенденции криминального поведения современных женщин: рост и устойчивый удельный вес тяжких и рецидивных преступлений, омоложение преступниц и увеличение количества женщин пожилого возраста среди осужденных. Общие меры предупреждения женской преступности.

    реферат , добавлен 01.03.2014

    Расчет относительных показателей структуры и координации категорий осужденных по степени тяжести совершенных преступлений. Коэффициенты преступности и судимости по федеральным округам и в целом по России. Расчет показателей динамики с помощью MS Excel.

    контрольная работа , добавлен 31.07.2011

    Понятие, виды, значения, детерминанты латентной преступности, причины ее возникновения, предупреждение и способы сокращения. Определение уровня и анализ структуры преступности. Системный подход в изучении латентной преступности как социального явления.

Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности.

При определении медианы в интервальных вариационных рядах сначала определяется интервал, в котором она находится (медианный интервал). Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда производится по формуле:

где х 0 – нижняя граница интервала;

h – величина интервала;

fm – частота интервала;

f – число членов ряда;

?m- 1 – сумма накопленных членов ряда, предшествующих данному.

    Понятие вариации и её значение. Основные показатели вариации, их достоинства и значение.

Вариация - колеблемость, изменяемость величины признака у единиц совокупности. Отдельные числовые значения признака, встречающиеся в изу­чаемой совокупности, называют вариантами значений. Недостаточность средней величины для полной характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Наличие вариации обусловлено влиянием большого числа факторов на формирование уровня признака. Эти факторы действуют с неодинаковой силой и в разных направлениях. Для описания меры изменчивости признаков используют показатели вариации. Задачи статистического изучения вариации: 1) изучение характера и степени вариации признаков у отдельных единиц совокупности; 2) определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности. В статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых изме­ряется вариация. Исследование вариаций имеет важное значение. Измерение вариаций необходимо при проведении выборочного наблюдения, корреляционном и дисперсионном анализе и т. д. По степени вариации можно судить об однородности совокупности, об устойчивости отдельных значений признаков и типичности средней. На их основе разрабатываются показатели тесноты связи между признаками, показатели оценки точности выборочного наблюдения. Различают вариацию в пространстве и вариацию во времени . Под вариацией в пространстве понимают колеблемость значений признака у единиц совокупности, представляющих отдельные территории. Под вариацией во времени подразумевают изменение значений признака в различные периоды времени. Для изучения вариации в рядах распределения проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда. Самыми простыми признаками вариации являются минимум и максимум - самое наименьшее и наибольшее значение признака в совокупности. Число повторений отдельных вариантов значений признаков называют частотой повторения (fi). Частоты удобно заменять частостями – wi. Частость - относительный показатель частоты, который может быть выражен в долях единицы или процентах и позволяет сопоставлять вариационные ряды с различным числом наблюдений. Выражается формулой: Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение. К относительным показателям колеблемости относят коэффициент осцилляции, относительное линейное отклонение, коэффициент вариации.

    Виды дисперсий и правило их сложения. Коэффициент детерминации и эмпирическое корреляционное отношение: экономическое значение и их расчёт.

Показатели вариации

Одних только средних недостаточно для оценки тех или иных явлений, так как средние уравнивают, сглаживают индивидуальные особенности отдельных единиц совокупности, показывают типичный для данных условий уровень варьирующих признаков, и тем самым могут затушевывать различные тенденции в развитии. В этом случае исчисляют показатели вариации ,характеризующие средние отклонения каждой единицы совокупности от среднего значения признака в целом .

Вариация имеет объективный характер и помогает познать сущность изучаемого явления.

Для измерения вариации в статистике применяют несколько способов, описательная характеристика которых представлена в табл. 5.6.

Дисперсия имеет ряд математических свойств, упрощающих технику ее расчета.

1. Если из всех вариант отнять какое-то постоянное число А , то дисперсия от этого не изменится.

2. Если все значения вариант разделить на какое-то постоянное число h , то дисперсия уменьшится от этого в h 2 раз, а среднее квадратическое отклонение – в h раз.

Таблица 5.6.

Показатели вариации

Название показателя

Обозначение и методика расчета

Сущностная храктеристика

по несгруппированным данным

по сгруппированным данным

Размах вариации

Улавливает только крайние отклонения значений признака, но не отражает отклонений от средней всех вариант в ряду. Чем больше размах вариации, тем менее однородна исследуемая совокупность

Среднее линейное отклонение

Представляет собой среднее арифметическое значение абсолютных отклонений признака от его среднего уровня. Чем меньше среднее линейное отклонение, тем более однородны значения признака изучаемого явления

Дисперсия

Представляет собой средний квадрат отклонений значений признака от его среднего уровня

Среднее квадратическое отклонение

Является абсолютной мерой вариации и зависит не только от степени вариации признака, но и от абсолютных уровней вариант и средней, что не позволяет непосредственно сравнивать средние квадратические отклонения вариационных рядов с разными уровнями. Оно выражается в тех именованных числах, в которых выражены варианта и средняя

Коэффициент вариации

Является относительной мерой вариации. Чем больше его величина, тем больше разброс значений признака вокруг средней, тем менее однородна совокупность по своему составу и тем менее представительна (типична) средняя

Методика расчета показателя дисперсии упрощенными способами показана на рис. 5.4. Отметим, что способ моментов применим в том случае, если задан интервальный ряд с равными интервалами , а способ разности применяется в любых рядах распределения : дискретных и интервальных с равными и неравными интервалами.

Вариация признака определяется различными факторами, в результате чего различают общую дисперсию, межгрупповую дисперсию и внутригрупповую дисперсию.

Общая дисперсия (σ 2 ) измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Вместе с тем, благодаря методу группировок можно выделить и измерить вариацию, обусловленную группировочным признаком, и вариацию, возникающую под влиянием неучтенных факторов.

Межгрупповая дисперсия (σ 2 м.гр ) характеризует систематическую вариацию, т. е. различия в величине изучаемого признака, возникающие под влиянием признака – фактора, положенного в основание группировки.

Рис.5.4. Упрощенные способы расчета дисперсии

,

где k – количество групп, на которые разбита вся совокупность;

m j – количество объектов, наблюдений, включенных в группу j ;

–среднее значение признака по группе j ;

–общее среднее значение признака.

Внутригрупповая дисперсия (σ 2 j,вн.гр ) отражает случайную вариацию, т.е. часть вариации, возникающую под влиянием неучтенных факторов и независящую от признака фактора, положенного в основание группировки.

, или, на основе метода разностей ,

где x ij – значение i -ой варианты в группе j .

Если в сформированных группах отдельные данные встречаются не один раз, то для расчета внутригрупповой дисперсии используется формула средней арифметической взвешенной.

Среднее значение внутригрупповых дисперсий рассчитывается по формуле:

.

Существует закон согласно которому, общая дисперсия, возникающая под воздействием всех факторов, равна сумме дисперсии, возникающей за счет группировочного признака и дисперсии, появляющейся под влиянием всех прочих факторов. Этот закон связывает три вида дисперсии.

Правило сложения дисперсий : .

Правило сложения дисперсии широко применяется при исчислении тесноты связей между признаками (факторным и результативным). Для этого определяют эмпирический коэффициент детерминации и эмпирическое корреляционное отношение.

Эмпирический коэффициент детерминации (η 2) показывает, какая доля всей вариации признака обусловлена признаком, положенным в основание группировки . (η – греческая буква «эта»).

Эмпирическое корреляционное отношение (η ) показывает тесноту связи между признаками - группировочным и результативным.

Оно изменяется в пределах от 0 до 1. Если η = 0, то группировочный признак не оказывает влияния на результативный, если η =1,то результативный признак изменяется только в зависимости от признака, положенного в основание группировки, а влияние прочих факторов равно нулю. Характеристика связи между признаками при соответствующих значениях эмпирического корреляционного отношения приведена в табл. 5.7.

Таблица 5.7

Качественная оценка связи между признаками

  1. Понятие и классификация рядов динамики. Сопоставимость уровней и смыкание рядов динамики.

Динамика – процесс развития движения соц.эк. явлений во времени. Для её отображения строят ряды динамики. Ряд динамики представл. Собой ряд расположенных в хронологической последовательности знач. Стат. показателей, характер. развитие явления Анализ рядов динамики позволяет выявить тенденции и закономерности соц.эк развития. Ряд динамики состоит из 2-ух элементов: 1)показатели времени (t) – либо определенные даты, либо отдельные периоды (годы, кварталы и тд.) 2)Уровни ряда (y) – они отображают количественную оценку развития во времени изучаемого явления. Виды рядов динамики : 1. По времени отражаемому в динамич. Рядах они делятся на: -моментальные отображают состояние изучаемых явлений на опр даты (моменты времени) С помощью моментных рядов изучают: численность населения, стоимость осн средств, товар запасы. Уровни мом. Рядов динамики суммировать не имеет смысла, т.к. мож. Возникнуть повторный счет – интервальные – отображают итоги развития изучаемого явления за отдельные периоды (интервалы времени) : ряды динамики произ-ва прод-ции, инвестиций, затраченных средств. Уровни интервального ряда динамики абсолют. Величин мож суммировать, т.к. их можно рассматривать как итог за более длительный период времени. 2. В зависимости от способа выражения уровней ряда динамики различают ряды: - абсолютных величин, - относительных, - средних величин. 3. В зависимости от расстояния м/у уровнями различ. ряды динамики с равностоящими и не равностоящими уровнями во времени. Основ условием для получения правильных выводов при анализе ряда динамики явл-ся сопоставимость его уровней. Условия сопоставимости уров. Ряда динамики. 1)Долж. Быть обеспечена одинаковая полнота охвата различных частей явления. Уровни динамического ряда за отдельные периоды времени долж харка-вать размер явления по одному и тому же кругу, входящий в его состав частей. 2)При определении сравниваемых уровней ряда динамики необх. Использовать единую методологию их расчета. 3)Равенство периодов, за к-рые приводятся данные. 4)Необходимо использовать одинаковые единицы измерения. При харак-ки стоимостных показателей во времени долж. б. устранено влияние изменение цен необх. оценка изучаемого показ-ля в ценах одного периода (в сопоставимых ценах) 5)Исходя из цели исследов-ия данные по тер-риям, границы которые изменились долж. б. пересчитаны в старых пределах. Для приведения уровней ряда дин-ки к сопоставимому виду использ. Прием, который наз-ся Смыкание рядов динамики. Смыкание- объединение в один ряд двух или нескольких рядов динам., уровни которых исчислены по разной методике или разными территориальными границами. Чтобы произвести смыкание рядов необх, чтобы для одного из периодов (переходного) имелись данные, рассчитанные по разной методике или в разных границах.

    Показатели интенсивности изменения уровня ряда динамики. Цепной и базисный способы расчёта.

Для качественной оценки динамики, изучаемых явлений применяется ряд стат. показателей получаемых в результате сравнения уровней м/у собой. При этом сравниваемый уров. Наз-ся отчетный, а уров., с которым происх. Сравнение базисным. К основ. показателям динамики относятся абсолют. Прирост, темп роста, темп прироста, абсолют. Значение одного % прироста. В зависимости от применяемого способа сопоставления показатели динамики мог. вычисляться с постоянной и переменной базой сравнения y 1← y 2← y 3← y 4← y 5 Абсолютный прирост характ. размер увеличения или уменьшения уровня ряда динамики за определенный период времени и определ-ся как разность м/у 2-мя уровнями ряда. ∆y ц = y i – y i - 1 ∆ y б = y i – y 0 м/у цепным и базисными абсолютными приростами сущ-ет взаимосвязь: сумма ценных абсол-ых приростов равна базисному абсол-му приросту последнего периода ряда динамики. ∑∆y ц = ∆ y бп Темп роста характеризует интенсивность изменения уравнения ряда и показывает во сколько раз уров. текущего периода больше или меньше уровня предыдущего (базисного) периода или сколько % он составляет по отношению к предыдущему периоду Трц = y i /y i-1 * 100% Трб = y i /y 0 * 100% м/у цепными и базис темпами роста имеется взаимосвязь: произведение последовательных цепных коэффициентов роста равно базисному коэффициенту роста последнего периода ряда динамики. П Крц = Крб Темп прироста показывает на сколько % - ов уров. данного периода больше или меньше уровня принятого за базу сравнения: Он мож б рассчитан 2 способами: а) как отношение абсол.-го прироста к уровню, принятому за базу сравнения Тпрц = ∆ y i / y i-1 * 100% Тпрб = ∆ y i / y 0 * 100% б) как разность м/у темпом роста и 100%-ми Тпр = Тр – 100% Абсолютное значение 1% присрота показывает какая абсло-ая величина содержится в относ-ном показателе – одном % прироста. Это отношение абсло-ого прироста к темпу прироста, выраженному в %-ах. Данный показатель рассчитывается по цепным данным А % =∆ y i / Тпр % = ∆ y i / (∆ y i / y i-1)*100 = y i-1 / 100 Для получения обобщающих показателей динамики соц.эк. явлений определяют средние величины: ср уровень ряда, сред абсол-ый прирост, след темп роста, сред темп прироста. Средний уровень ряда динамики дает общую характ-ку уровня явлен. За весь период. Методы его расчета зависят от вида ряда динамики. а) для моментных рядов для ровно стоящими расчит сред. уров. ряда осущ-ся по форм. средней хронологич-кой. y` = (½ y 1 + y 2 + y 3 + ….½y n)/n-1 n – число уровней ряда. б)для моментных рядов с не равностоящими уров-ми предварительно находятся значения уровней в серединах интервалов y` 1 = y 1 + y 2 /2 ; y 2 = y 2 + y 3 /2,……..,y` n = y n-1 + y n /2 Затем определяется общий сред уров. ряда по формуле средней арифм-ой взвешенной: y` = ∑y` i * t i / ∑t i y` I – сред уровни в интервалах м/у датами, ti – длительность интервала времени м/у уровнями. в) Для интервальных рядов с равностоящими уровн-ми во времени, сред уров расситыв-ся по формуле средней арифм-кой простой y` = ∑ y i /n Средний абсолютгый прирост показывает на сколько в среднем за единицу времени увеличивается (уменьшается) уровень ряда. ∆ y i = ∑ y iц / n-1 или ∆ y i = y n – y 1 /n-1

y1 – начальный уровень ряда динамики yn – конечный уровень ряда динамики. Средний темп роста показывает во сколько раз в среднем за единицу времени изменился уровень ряда динамик. Он опред-ся по форм. средней геометрической из цепных коэф-тов роста. Т`р = n – 1 √К ц р 1 * К ц р 2 *……*К ц р n – 1 = n – 1 √ ПКр ц = n -1 √Крб = n – 1 √ y n /y 1 * x 100%

Средний темп прироста показ-ет на сколько % в среднем за единицу времени увеличился (уменьшился) уровень ряда Т`пр = Т` - 100%.

    Средние показатели ряда динамики, их расчёт.

Каждый ряд динамики можно рассматривать как некую совокупность n меняющихся во времени показателей, которые можно обобщать в виде средних величин. Такие обобщенные (средние) показатели особенно необходимы при сравнении изменений того или иного показателя в разные периоды, в разных странах и т.д.

Обобщенной характеристикой ряда динамики может служить прежде всего средний уровень ряда . Способ расчета среднего уровня зависит от того, моментный ряд или интервальный (периодный).

В случае интервального ряда его средний уровень определяется по формуле простой средней арифметической величины из уровней ряда, т.е.

Если имеетсямоментный ряд, содержащий n уровней (y1, y2, …, yn ) с равными промежутками между датами (моментами времени), то такой ряд легко преобразовать в ряд средних величин. При этом показатель (уровень) на начало каждого периода одновременно является показателем на конец предыдущего периода. Тогда средняя величина показателя для каждого периода (промежутка между датами) может быть рассчитана как полусумма значений у на начало и конец периода, т.е. как . Количество таких средних будет. Как указывалось ранее, для рядов средних величин средний уровень рассчитывается по средней арифметической. Следовательно, можно записать. После преобразования числителя получаем,

где Y1 и Yn - первый и последний уровни ряда; Yi - промежуточные уровни.

Эта средняя известна в статистике каксредняя хронологическая для моментных рядов. Такое название она получила от слова «cronos» (время, лат.), так как рассчитывается из меняющихся во времени показателей.

В случае неравных промежутков между датами среднюю хронологическую для моментного ряда можно рассчитать как среднюю арифметическую из средних значений уровней на каждую пару моментов, взвешенных по величине расстояний (отрезков времени) между датами, т.е. . В данном случае предполагается, что в промежутках между датами уровни принмали разные значения, и мы из двух известных (yi и yi+1 ) определяем средние, из которых затем уже рассчитываем общую среднюю для всего анализируемого периода. Если же предполагается, что каждое значение yi остается неизменным до следующего (i+ 1)- го момента, т.е. известна точная дата изменения уровней, то расчет можно осуществлять по формуле средней арифметической взвешенной: ,

где – время, в течение которого уровеньоставался неизменным.

Кроме среднего уровня в рядах динамики рассчитываются и другие средние показатели – среднее изменение уровней ряда (базисным и цепным способами), средний темп изменения .

Базисное среднее абсолютное изменение представляет собой частное от деления последнего базисного абсолютного изменения на количество изменений. То есть

Цепное среднее абсолютное изменение уровней ряда представляет собой частное от деления суммы всех цепных абсолютных изменений на количество изменений, то есть

По знаку средних абсолютных изменений также судят о характере изменения явления в среднем: рост, спад или стабильность.

Из правила контроля базисных и цепных абсолютных изменений следует, что базисное и цепное среднее изменение должны быть равными.

Наряду со средними абсолютным изменением рассчитывается и среднее относительное тоже базисным и цепным способами.

Базисное среднее относительное изменение определяется по формуле

Цепное среднее относительное изменение определяется по формуле

Естественно, базисное и цепное среднее относительное изменения должны быть одинаковыми и сравнением их с критериальным значением 1 делается вывод о характере изменения явления в среднем: рост, спад или стабильность. Вычитанием 1 из базисного или цепного среднего относительного изменения образуется соответствующий среднийтемп изменения , по знаку которого также можно судить о характере изменения изучаемого явления, отраженного данным рядом динамики.

    Методы анализа основной тенденции в рядах динамики.

Измените уровней ряда динамики обуславливается на изучаемое явление определяющее влияние и формируют в рядах динамики основную тенденцию развития (тренд) Воздействие факторов действующих периодически вызывает повторяемые во времени колебания уровней ряда динамики. Действие разовых факторов отображается случайными (кратковременных) изменениями уровней ряда дин-ки. Т.т ряд дин-ки вкл след основ. компоненты: 1)основ тенденция (тренд) 2)циклические (периодические колебания) 3)Случайные колебания Основной тенденцией развития (трендом) наз-ся плавное и устойчивое изменения уровня явлений во времени свободное от случ. Колебний. Выявление основ тенденции изменения уровней ряда предполагает её количественное выражение в некоторой мере свободное от случайных воздействий. Для выявления тренда испо-ся различные способы сглаживания (выравнивания ряда) : 1)Метод укрепления интервалов – заключ-ся в том что первоначальный ряд динамики преобразуется в ряд более продолжительных периодов (Напр. ряд, содержащий данные в месячном выпуске продукции преобразуется в ряд квартальных данных) 2)Метод скользящей средней. Состоит в том сто исходные уровни ряда заменяются средними величинами, к-рые получают из данного уровня и нескольких симметрично его окружающих. Число уровней, поск-ым рассчитываются сред. значение наз-ся интервалом сглаживания, он мож. четным и нечетным. Расчет средних ведется способом скольжения, т.е. постепенным исключением их принятого периода скольжения. 1-ого уровня и включением следующего. Нахождение скользящей средней по четному числу уровней осложняется тем, что средняя мож быть отнесена толь. к середине укрупненного интер-ла. Поэт. для определения сглаженных уровней производится центрирование, т.е. нахождение средней из двух смежных скользящих средних для отнесения полученного уровня к определенной дате. 3)Аналитическое выравнивание. Суть метода заключается в подборе матем. Функции, к-рая наилучшим образом характеризует исходные уровни ряда динамики. Эмпирические (фактические) уровни ряда динамики заменяют на плавно изменяющиеся теоретические уровни, рассчитанные по какой-либо функц. Зависимости отклонение исходных уровней ряда от уровней, соответ-щих общей тенденции объясняется действием случайных или периодических факторов. Для выравнивания используют след. матем. Функции: а) линейная y t =a 0 +a 1 t

Поделитесь с друзьями или сохраните для себя:

Загрузка...