Средние статистические величины. Московский государственный университет печати. Выбор средней предполагает такую последовательность

Средней величиной называется статистический показатель, который дает обобщенную характеристику однородных .

Величина средней дает обобщающую количественную характеристику всей совокупности и характеризует ее в отношении данного признака.

Так, например, средняя дает обобщающую количественную характеристику состояния оплаты труда рассматриваемой совокупности работников. Кроме того, используя средние величины, имеется возможность сопоставлять различные информационные совокупности. Так, например, можно сравнивать различные организации по уровню производительности труда, а также по уровню , и по другим показателям.

Сущность средней заключается в том, что в ней взаимопогашаются случайные отклонения значений признака и учитываются изменения вызванные основным фактором.

Статистическая обработка методом средних величин заключается в замене индивидуальных значений варьирующего признака некоторой уравновешенной средней величиной .

Например, индивидуальная выработка у 5 операционистов коммерческого банка за день составила 136, 140, 154 и 162 операции. Чтобы получить среднее число операций за день, выполненных одним операционистом, необходимо сложить эти индивидуальные показатели и полученную сумму разделить на количество операционистов:

Операций.

Как видно из приведенного примера, среднее число операций не совпадает ни с одним из индивидуальных, так как ни один операционист не сделал 150 операций. Но если мы представим себе, что каждый операционист сделал по 150 операций, то их общая сумма не изменится, а будет также равна 750. Таким образом, мы пришли к основному свойству средних величин: сумма индивидуальных значений признака равна сумме средних величин.

Это свойство еще раз подчеркивает, что средняя величина является обобщающей характеристикой всей статистической совокупности.

Средние величины широко применяются в различных отраслях знаний. Особо важную роль они играют в экономике и статистике: при анализе, планировании, прогнозировании, при расчете нормативов и при оценке достигнутого уровня. Средняя всегда именованная величина и имеет ту же размерность, что и отдельная единица совокупности.

Важнейшими условиями (принципами) для правильного вычисления и использования средних величин является следующие:

  1. В каждом конкретном случае необходимо исходить из качественного содержания осредняемого признака, учитывать взаимосвязь изучаемых признаков и имеющиеся для расчета данные.
  2. Индивидуальные значения, из которых вычисляются средние, должны относиться к однородной совокупности, а число их должно быть значительным.

Виды средних величин

Средние величины делятся на два больших класса: степенные средние и структурные средние

Степенные средние: Структурные средние:

Выбор формы средней величины зависит от исходной базы расчета средней и от имеющейся экономической информации для ее расчета.

Исходной базой расчета и ориентиром правильности выбора формы средней величины являются экономические соотношения, выражающие смысл средних величин и взаимосвязь между показателями.

Расчет некоторых средних величин:

  • Средняя заработная плата 1 работника = Фонд заработной платы / Число работников
  • Средняя цена 1 продукции = Стоимость производства / Количество единиц продукции
  • Средняя себестоимость 1 изделия = Стоимость производства / Количество единиц продукции
  • Средняя урожайность = Валовый сбор / посевная площадь
  • Средняя производительность труда = объем продукции, работ, услуг / Отработанное время
  • Средняя трудоемкость = отработанное время / объем продукции, работ, услуг
  • Средняя фондоемкость = Средняя стоимость основных фондов / объем продукции, работ и услуг
  • Средняя фондоотдача = объем продукции, работ и услуг / средняя стоимость основных фондов
  • Средняя фондовооруженность = средняя величина основных производственных фондов / среднесписочная численность производственного персонала
  • Средний процент брака = (стоимость бракованной продукции / Стоимость всей произведенной продукции) * 100%

Степенные средние величины

Степенные средние в зависимости от представления исходных данных могут быть простыми и взвешенными .
Если вариант встречается один раз, расчеты проводим по средней простой (например зарплата в 3 тыс.руб. встречается только у одного рабочего), а если вариант повторяется неодинаковое число раз, то есть имеет разные


Средняя величина – это обобщающий показатель, характеризующий типический уровень явления. Он выражает величину признака, отнесенную к единице совокупности.

Средняя величина это:

1) наиболее типичное для совокупности значение признака;

2) объем признака совокупности, распределенный поровну между единицами совокупности.

Признак, для которого рассчитывается средняя величина, в статистике называется «осредняемый».

Средняя всегда обобщает количественную вариацию признака, т.е. в средних величинах погашаются индивидуальные различия единиц совокупности, обусловленные случайными обстоятельствами. В отличие от средней абсолютная величина, характеризующая уровень признака отдельной единицы совокупности, не позволяет сравнивать значения признака у единиц, относящихся к разным совокупностям. Так, если нужно сопоставить уровни оплаты труда работников на двух предприятиях, то нельзя сравнивать по данному признаку двух работников разных предприятий. Оплата труда выбранных для сравнения работников может быть не типичной для этих предприятий. Если же сравнивать размеры фондов оплаты труда на рассматриваемых предприятиях, то не учитывается численность работающих и, следовательно, нельзя определить, где уровень оплаты труда выше. В конечном итоге сравнить можно лишь средние показатели, т.е. сколько в среднем получает один работник на каждом предприятии. Таким образом, возникает необходимость расчета средней величины как обобщающей характеристики совокупности.

Важно отметить, что в процессе осреднения совокупное значение уровней признака или конечное его значение (в случае расчета средних уровней в ряду динамики) должно оставаться неизменным. Другими словами, при расчете средней величины объем исследуемого признака не должен быть искажен, и выражения, составляемые при расчетах средней, обязательно должны иметь смысл.

Вычисление среднего – один из распространенных приемов обобщения; средний показатель отрицает то общее, что характерно (типично) для всех единиц изучаемой совокупности, в то же время он игнорирует различия отдельных единиц. В каждом явлении и его развитии имеет место сочетание случайности и необходимости. При исчислении средних в силу действия закона больших чисел случайности взаимопогашаются, уравновешиваются, поэтому можно абстрагироваться от несущественных особенностей явления, от количественных значений признака в каждом конкретном случае. В способности абстрагироваться от случайности отдельных значений, колебаний и заключена научная ценность средних как обобщающих характеристик совокупностей.

Для того, чтобы средний показатель был действительно типизирующим, он должен рассчитываться с учетом определенных принципов.

Остановимся на некоторых общих принципах применения средних величин.

1. Средняя должна определяться для совокупностей, состоящих из качественно однородных единиц.

2. Средняя должна исчисляться для совокупности, состоящей из достаточно большого числа единиц.

3. Средняя должна рассчитываться для совокупности, единицы которой находятся в нормальном, естественном состоянии.

4. Средняя должна вычисляться с учетом экономического содержания исследуемого показателя.

5.2. Виды средних и способы их вычисления

Рассмотрим теперь виды средних величин, особенности их исчисления и области применения. Средние величины делятся на два больших класса: степенные средние, структурные средние.

К степенным средним относятся такие наиболее известные и часто применяемые виды, как средняя геометрическая, средняя арифметическая и средняя квадратическая.

В качестве структурных средних рассматриваются мода и медиана.

Остановимся на степенных средних. Степенные средние в зависимости от представления исходных данных могут быть простыми и взвешенными. Простая средняя считается по не сгруппированным данным и имеет следующий общий вид:

,

где X i – варианта (значение) осредняемого признака;

n – число вариант.

Взвешенная средняя считается по сгруппированным данным и имеет общий вид

,

где X i – варианта (значение) осредняемого признака или серединное значение интервала, в котором измеряется варианта;

m – показатель степени средней;

f i – частота, показывающая, сколько раз встречается i-e значение осредняемого признака.

Если рассчитать все виды средних для одних и тех же исходных данных, то значения их окажутся неодинаковыми. Здесь действует правило мажорантности средних: с увеличением показателя степени m увеличивается и соответствующая средняя величина:

В статистической практике чаще, чем остальные виды средних взвешенных, используются средние арифметические и средние гармонические взвешенные.

Виды степенных средних

Вид степенной
средней

Показатель
степени (m)

Формула расчета

Простая

Взвешенная

Гармоническая

Геометрическая

Арифметическая

Квадратическая

Кубическая

Средняя гармоническая имеет более сложную конструкцию, чем средняя арифметическая. Среднюю гармоническую применяют для расчетов тогда, когда в качестве весов используются не единицы совокупности – носители признака, а произведения этих единиц на значения признака (т.е. m = Xf). К средней гармонической простой следует прибегать в случаях определения, например, средних затрат труда, времени, материалов на единицу продукции, на одну деталь по двум (трем, четырем и т.д.) предприятиям, рабочим, занятым изготовлением одного и того же вида продукции, одной и той же детали, изделия.

Главное требование к формуле расчета среднего значения заключается в том, чтобы все этапы расчета имели реальное содержательное обоснование; полученное среднее значение должно заменить индивидуальные значения признака у каждого объекта без нарушения связи индивидуальных и сводных показателей. Иначе говоря, средняя величина должна исчисляться так, чтобы при замене каждого индивидуального значения осредняемого показателя его средней величиной оставался без изменения некоторый итоговый сводный показатель, связанный тем или другим образом с осредняемым. Этот итоговый показатель называется определяющим, поскольку характер его взаимосвязи с индивидуальными значениями определяет конкретную формулу расчета средней величины. Покажем это правило на примере средней геометрической.

Формула средней геометрической

используется чаще всего при расчете среднего значения по индивидуальным относительным величинам динамики.

Средняя геометрическая применяется, если задана последовательность цепных относительных величин динамики, указывающих, например, на рост объема производства по сравнению с уровнем предыдущего года: i 1 , i 2 , i 3 ,…, i n . Очевидно, что объем производства в последнем году определяется начальным его уровнем (q 0) и последующим наращиванием по годам:

q n =q 0 × i 1 × i 2 ×…×i n .

Приняв q n в качестве определяющего показателя и заменяя индивидуальные значения показателей динамики средними, приходим к соотношению

Отсюда



Особый вид средних величин – структурные средние – применяется для изучения внутреннего строения рядов распределения значений признака, а также для оценки средней величины (степенного типа), если по имеющимся статистическим данным ее расчет не может быть выполнен (например, если бы в рассмотренном примере отсутствовали данные и об объеме производства, и о сумме затрат по группам предприятий).

В качестве структурных средних чаще всего используют показатели моды – наиболее часто повторяющегося значения признака – и медианы – величины признака, которая делит упорядоченную последовательность его значений на две равные по численности части. В итоге у одной половины единиц совокупности значение признака не превышает медианного уровня, а у другой – не меньше его.

Если изучаемый признак имеет дискретные значения, то особых сложностей при расчете моды и медианы не бывает. Если же данные о значениях признака Х представлены в виде упорядоченных интервалов его изменения (интервальных рядов), расчет моды и медианы несколько усложняется. Поскольку медианное значение делит всю совокупность на две равные по численности части, оно оказывается в каком-то из интервалов признака X. С помощью интерполяции в этом медианном интервале находят значение медианы:

,

где X Me – нижняя граница медианного интервала;

h Me – его величина;

(Sum m)/2 – половина от общего числа наблюдений или половина объема того показателя, который используется в качестве взвешивающего в формулах расчета средней величины (в абсолютном или относительном выражении);

S Me-1 – сумма наблюдений (или объема взвешивающего признака), накопленная до начала медианного интервала;

m Me – число наблюдений или объем взвешивающего признака в медианном интервале (также в абсолютном либо относительном выражении).

При расчете модального значения признака по данным интервального ряда надо обращать внимание на то, чтобы интервалы были одинаковыми, поскольку от этого зависит показатель повторяемости значений признака X. Для интервального ряда с равными интервалами величина моды определяется как

,

где Х Mo – нижнее значение модального интервала;

m Mo – число наблюдений или объем взвешивающего признака в модальном интервале (в абсолютном либо относительном выражении);

m Mo-1 – то же для интервала, предшествующего модальному;

m Mo+1 – то же для интервала, следующего за модальным;

h – величина интервала изменения признака в группах.

ЗАДАЧА 1

Имеются следующие данные по группе промышленных предприятий за отчетный год


предприятия

Объем продукции, млн. руб.

Среднесписочное число работников, чел.

Прибыль, тыс. руб.

197,7

10,0

13,5

22,8

1500

136,2

465,5

18,4

1412

97,6

296,2

12,6

1200

44,4

584,1

22,0

1485

146,0

480,0

119,0

1420

110,4

57805

21,6

1390

138,7

204,7

30,6

466,8

19,4

1375

111,8

292,2

113,6

1200

49,6

423,1

17,6

1365

105,8

192,6

30,7

360,5

14,0

1290

64,8

280,3

10,2

33,3

Требуется выполнить группировку предприятий по обмену продукции, приняв следующие интервалы:

    до 200 млн. руб.

    от 200 до 400 млн. руб.

  1. от 400 до 600 млн. руб.

    По каждой группе и по всем вместе определить число предприятий, объем продукции, среднесписочное число работников, среднюю выработку продукции на одного работника. Результаты группировки представить в виде статистической таблицы. Сформулировать вывод.

    РЕШЕНИЕ

    Произведем группировку предприятий по обмену продукции, расчет числа предприятий, объема продукции, среднесписочного числа работников по формуле простой средней. Результаты группировки и расчетов сводим в таблицу.

    Группы по объему продукции


    предприятия

    Объем продукции, млн. руб.

    Среднегодовая стоимость основных средств, млн. руб.

    Среднеспи

    сочное число работников, чел.

    Прибыль, тыс. руб.

    Средняя выработка продукции на одного работника

    1 группа

    до 200 млн. руб.

    1,8,12

    197,7

    204,7

    192,6

    10,0

    9,4

    8,8

    900

    817

    13,5

    30,6

    30,7

    28,2

    2567

    74,8

    0,23

    Средний уровень

    198,3

    24,9

    2 группа

    от 200 до 400 млн. руб.

    4,10,13,14

    196,2

    292,2

    360,5

    280,3

    12,6

    113,6

    14,0

    10,2

    1200

    1200

    1290

    44,4

    49,6

    64,8

    33,3

    1129,2

    150,4

    4590

    192,1

    0,25

    Средний уровень

    282,3

    37,6

    1530

    64,0

    3 группа

    от 400 до

    600 млн.

    2,3,5,6,7,9,11

    592

    465,5

    584,1

    480,0

    578,5

    466,8

    423,1

    22,8

    18,4

    22,0

    119,0

    21,6

    19,4

    17,6

    1500

    1412

    1485

    1420

    1390

    1375

    1365

    136,2

    97,6

    146,0

    110,4

    138,7

    111,8

    105,8

    3590

    240,8

    9974

    846,5

    0,36

    Средний уровень

    512,9

    34,4

    1421

    120,9

    Всего по совокупности

    5314,2

    419,4

    17131

    1113,4

    0,31

    В среднем по совокупности

    379,6

    59,9

    1223,6

    79,5

    Вывод. Таким образом, в рассматриваемой совокупности наибольшее число предприятий по объему продукции попало в третью группу – семь, или половина предприятий. Величина среднегодовой стоимости основных средств также в данной группе, как и большая величина среднесписочного числа работников – 9974 человек, наименее прибыльны предприятия первой группы.

    ЗАДАЧА 2

    Имеются следующие данные по предприятиям фирмы

    Номер предприятия, входящего в фирму

    I квартал

    II квартал

    Выпуск продукции, тыс. руб.

    Отработано рабочими человеко-дней

    Средняя выработка на одного рабочего в день, руб.

    59390,13

Средняя величина - это обобщающий показатель статистической совокупности, который погашает индивидуальные различия значений статистических величин, позволяя сравнивать разные совокупности между собой.

Существует 2 класса средних величин: и .

К структурным средним относятся мода и медиана , но наиболее часто применяются степенные средние различных видов.

Степенные средние величины

Степенные средние могут быть простыми и взвешенными .

Простая средняя величина рассчитывается при наличии двух и более несгруппированных статистических величин, расположенных в произвольном порядке по следующей общей формуле:

Взвешенная средняя величина рассчитывается по сгруппированным статистическим величинам с использованием следующей общей формулы:

Где X – значения отдельных статистических величин или середин группировочных интервалов;
m - показатель степени, от значения которого зависят следующие виды степенных средних величин :
при m = -1 ;
при m = 0 ;
при m = 1 ;
при m = 2 ;
при m = 3 .

Используя общие формулы простой и взвешенной средних при разных показателях степени m, получаем частные формулы каждого вида, которые будут далее подробно рассмотрены.

Средняя арифметическая

Средняя арифметическая - это самая часто используемая средняя величина, которая получается, если подставить в общую формулу m=1. Средняя арифметическая простая имеет следующий вид:

Где X - значения величин, для которых необходимо рассчитать среднее значение; N - общее количество значений X (число единиц в изучаемой совокупности).

Например, студент сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. Рассчитаем средний балл по формуле средней арифметической простой: (3+4+4+5)/4 = 16/4 = 4.

Средняя арифметическая взвешенная имеет следующий вид:

Где f - количество величин с одинаковым значением X (частота).

Например, студент сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. Рассчитаем средний балл по формуле средней арифметической взвешенной: (3*1 + 4*2 + 5*1)/4 = 16/4 = 4.

Если значения X заданы в виде интервалов, то для расчетов используют середины интервалов X, которые определяются как полусумма верхней и нижней границ интервала. А если у интервала X отсутствует нижняя или верхняя граница (открытый интервал), то для ее нахождения применяют размах (разность между верхней и нижней границей) соседнего интервала X.

Например, на предприятии 10 работников со стажем работы до 3 лет, 20 - со стажем от 3 до 5 лет, 5 работников - со стажем более 5 лет. Тогда рассчитаем средний стаж работников по формуле средней арифметической взвешенной, приняв в качестве X середины интервалов стажа (2, 4 и 6 лет):
(2*10+4*20+6*5)/(10+20+5) = 3,71 года.

Средняя арифметическая применяется чаще всего, но бывают случаи, когда необходимо применение других видов средних величин. Рассмотрим такие случаи далее.

Средняя гармоническая

Средняя гармоническая применяется, когда исходные данные не содержат частот f по отдельным значениям X, а представлены как их произведение Xf. Обозначив Xf=w, выразим f=w/X, и, подставив эти обозначения в формулу средней арифметической взвешенной, получим формулу средней гармонической взвешенной:

Таким образом, средняя гармоническая взвешенная применяется тогда, когда неизвестны частоты f, а известно w=Xf. В тех случаях, когда все w=1, то есть индивидуальные значения X встречаются по 1 разу, применяется формула средней гармонической простой:

Например, автомобиль ехал из пункта А в пункт Б со скоростью 90 км/ч, а обратно - со скоростью 110 км/ч. Для определения средней скорости применим формулу средней гармонической простой, так как в примере дано расстояние w 1 =w 2 (расстояние из пункта А в пункт Б такое, же как и из Б в А), которое равно произведению скорости (X) на время (f). Средняя скорость = (1+1)/(1/90+1/110) = 99 км/ч.

Средняя геометрическая

Средняя геометрическая применяется при определении средних относительных изменений, о чем сказано в теме Ряды динамики . Геометрическая средняя величина дает наиболее точный результат осреднения, если задача стоит в нахождении такого значения X, который был бы равноудален как от максимального, так и от минимального значения X.

Например, в период с 2005 по 2008 годы индекс инфляции в России составлял: в 2005 году - 1,109; в 2006 - 1,090; в 2007 - 1,119; в 2008 - 1,133. Так как индекс инфляции - это относительное изменение (индекс динамики), то рассчитывать среднее значение нужно по средней геометрической: (1,109*1,090*1,119*1,133)^(1/4) = 1,1126, то есть за период с 2005 по 2008 ежегодно цены росли в среднем на 11,26%. Ошибочный расчет по средней арифметической дал бы неверный результат 11,28%.

Средняя квадратическая

Средняя квадратическая применяется в тех случая, когда исходные значения X могут быть как положительными, так и отрицательными, например при расчете средних отклонений.

Главной сферой применения квадратической средней является измерение вариации значений X, о чем пойдет речь .

Средняя кубическая

Средняя кубическая применяется крайне редко, например, при расчете индексов нищеты населения для развивающихся стран (ИНН-1) и для развитых (ИНН-2), предложенных и рассчитываемых ООН.

Структурные средние величины

К наиболее часто используемым структурным средним относятся и .

Статистическая мода

Статистическая мода - это наиболее часто повторяющееся значение величины X в статистической совокупности.

Если X задан дискретно , то мода определяется без вычисления как значение признака с наибольшей частотой. В статистической совокупности бывает 2 и более моды, тогда она считается бимодальной (если моды две) или мультимодальной (если мод более двух), и это свидетельствует о неоднородности совокупности.

Например, на предприятии работает 16 человек: 4 из них - со стажем 1 год, 3 человека - со стажем 2 года, 5 - со стажем 3 года и 4 человека - со стажем 4 года. Таким образом, модальный стаж Мо=3 года, поскольку частота этого значения максимальна (f=5).

Если X задан равными интервалами , то сначала определяется модальный интервал как интервал с наибольшей частотой f. Внутри этого интервала находят условное значение моды по формуле:

Где Мо – мода;
Х НМо – нижняя граница модального интервала;
h Мо – размах модального интервала (разность между его верхней и нижней границей);
f Мо – частота модального интервала;
f Мо-1 – частота интервала, предшествующего модальному;
f Мо+1 – частота интервала, следующего за модальным.

Например, на предприятии 10 работников со стажем работы до 3 лет, 20 - со стажем от 3 до 5 лет, 5 работников - со стажем более 5 лет. Рассчитаем модальный стаж работы в модальном интервале от 3 до 5 лет: Мо = 3 + 2*(20-10)/(2*20-10-5) = 3,8 (года).

Если размах интервалов h разный, то вместо частот f необходимо использовать плотности интервалов, рассчитываемые путем деления частот f на размах интервала h.

Статистическая медиана

Статистическая медиана – это значение величины X, которое делит упорядоченную по возрастанию или убыванию статистическую совокупность на 2 равных по численности части. В итоге у одной половины значение больше медианы, а у другой - меньше медианы.

Если X задан дискретно , то для определения медианы все значения нумеруются от 0 до N в порядке возрастания , тогда медиана при четном числе N будет лежать посередине между X c номерами 0,5N и (0,5N+1), а при нечетном числе N будет соответствовать значению X с номером 0,5(N+1).

Например, имеются данные о возрасте студентов-заочников в группе из 10 человек - X: 18, 19, 19, 20, 21, 23, 23, 25, 28, 30 лет. Эти данные уже упорядочены по возрастанию, а их количество N=10 - четное, поэтому медиана будет находиться между X с номерами 0,5*10=5 и (0,5*10+1)=6, которым соответствуют значения X 5 =21 и X 6 =23, тогда медиана: Ме = (21+23)/2 = 22 (года).

Если X задан в виде равных интервалов , то сначала определяется медианный интервал (интервал, в котором заканчивается одна половина частот f и начинается другая половина), в котором находят условное значение медианы по формуле:

Где Ме – медиана;
Х НМе – нижняя граница медианного интервала;
h Ме – размах медианного интервала (разность между его верхней и нижней границей);
f Ме – частота медианного интервала;
f Ме-1 – сумма частот интервалов, предшествующих медианному.

В ранее рассмотренном примере при расчете модального стажа (на предприятии 10 работников со стажем работы до 3 лет, 20 - со стажем от 3 до 5 лет, 5 работников - со стажем более 5 лет) рассчитаем медианный стаж. Половина общего числа работников составляет (10+20+5)/2 = 17,5 и находится в интервале от 3 до 5 лет, а в первом интервале до 3 лет - только 10 работников, а в первых двух - (10+20)=30, что больше 17,5, значит интервал от 3 до 5 лет - медианный. Внутри него определяем условное значение медианы: Ме = 3+2*(0,5*30-10)/20 = 3,5 (года).

Также как и в случае с модой, при определении медианы если размах интервалов h разный, то вместо частот f необходимо использовать плотности интервалов, рассчитываемые путем деления частот f на размах интервала h.

Показатели вариации

Вариация - это различие значений величин X у отдельных единиц статистической совокупности. Для изучения силы вариации рассчитывают следующие показатели вариации : , , , , .

Размах вариации

Размах вариации – это разность между максимальным и минимальным значениями X из имеющихся в изучаемой статистической совокупности:

Недостатком показателя H является то, что он показывает только максимальное различие значений X и не может измерять силу вариации во всей совокупности.

Cреднее линейное отклонение

Cреднее линейное отклонение - это средний модуль отклонений значений X от среднего арифметического значения. Его можно рассчитывать по формуле средней арифметической простой - получим :

Например, студент сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. = 4. Рассчитаем среднее линейное отклонение простое: Л = (|3-4|+|4-4|+|4-4|+|5-4|)/4 = 0,5.

Если исходные данные X сгруппированы (имеются частоты f), то расчет среднего линейного отклонения выполняется по формуле средней арифметической взвешенной - получим :

Вернемся к примеру про студента, который сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5. = 4 и = 0,5. Рассчитаем среднее линейное отклонение взвешенное: Л = (|3-4|*1+|4-4|*2+|5-4|*1)/4 = 0,5.

Линейный коэффициент вариации

Линейный коэффициент вариации - это отношение среднего линейного отклонение к средней арифметической:

С помощью линейного коэффициента вариации можно сравнивать вариацию разных совокупностей, потому что в отличие от среднего линейного отклонения его значение не зависит от единиц измерения X.

В рассматриваемом примере про студента, который сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5, линейный коэффициент вариации составит 0,5/4 = 0,125 или 12,5%.

Дисперсия

Дисперсия - это средний квадрат отклонений значений X от среднего арифметического значения. Дисперсию можно рассчитывать по формуле средней арифметической простой - получим дисперсию простую :

В уже знакомом нам примере про студента, который сдал 4 экзамена и получил оценки: 3, 4, 4 и 5, = 4. Тогда дисперсия простая Д = ((3-4) 2 +(4-4) 2 +(4-4) 2 +(5-4) 2)/4 = 0,5.

Если исходные данные X сгруппированы (имеются частоты f), то расчет дисперсии выполняется по формуле средней арифметической взвешенной - получим дисперсию взвешенную :

В рассматриваемом примере про студента, который сдал 4 экзамена и получил следующие оценки: 3, 4, 4 и 5, рассчитаем дисперсию взвешенную: Д = ((3-4) 2 *1+(4-4) 2 *2+(5-4) 2 *1)/4 = 0,5.

Если преобразовать формулу дисперсии (раскрыть скобки в числителе, почленно разделить на знаменатель и привести подобные), то можно получить еще одну формулу для ее расчета как разность средней квадратов и квадрата средней:

Еще проще можно найти среднее квадратическое отклонение , если предварительно рассчитана дисперсия, как корень квадратный из нее:

В примере про студента, в котором выше , найдем среднее квадратическое отклонение как корень квадратный из нее: .

Квадратический коэффициент вариации

Квадратический коэффициент вариации - это самый популярный относительный показатель вариации:

Критериальным значением квадратического коэффициента вариации V служит 0,333 или 33,3%, то есть если V меньше или равен 0,333 - вариация считает слабой, а если больше 0,333 - сильной. В случае сильной вариации изучаемая статистическая совокупность считается неоднородной , а средняя величина - нетипичной и ее нельзя использовать как обобщающий показатель этой совокупности.

В примере про студента, в котором выше , найдем квадратический коэффициент вариации V = 0,707/4 = 0,177, что меньше критериального значения 0,333, значит вариация слабая и равна 17,7%.

Пример. По данным табл. 2.1 требуется рассчитать среднюю заработную плату в целом по трем предприятиям.

Таблица 2.1

Заработная плата предприятий АО

Пред приятие

Численность промышленно- производственного персонала (ППП), чел.

Месячный фонд заработной платы, руб.

Средняя заработная плата, руб.

564840

2092

332750

2750

517540

2260

Итого

1415130

Конкретная расчетная формула зависит от того, какие данные табл. 7 являются исходными. Соответственно возможны варианты: данные столбцов 1 (численность ППП) и 2 (месячный ФОТ); либо - 1 (численность ППП) и 3 (средняя ЗП); или 2 (месячный ФОТ) и 3 (средняя ЗП). Если имеются только данные столбцов 1 и 2 . Итоги этих граф содержат необходимые величины для расчета искомой средней. Используется формула средней агрегатной: Если имеются только данные столбцов 1 и 3 , то известен знаменатель исходного соотношения, но не известен его числитель. Однако фонд заработной платы можно получить умножением средней заработной платы на численность ППП. Поэтому общая средняя может быть рассчитана по формуле средней арифметической взвешенной : Необходимо учитывать, что вес (f i ) в отдельных случаях может представлять собой произведение двух или даже трех значений. Кроме того, в статистической практике находит применение и средняя арифметическая невзвешенная : . где n - объем совокупности. Эта средняя используется тогда, когда веса (f i ) отсутствую (каждый вариант признака встречается только один раз) или равны между собой. Если имеются только данные столбцов 2 и 3. , т. е. известен числитель исходного соотношения, но не известен его знаменатель. Численность ППП каждого предприятия можно получить делением ФОТ на среднюю ЗП. Тогда расчет средней ЗП в целом по трем предприятиям проводится по формуле средней гармонической взвешенной : При равенстве весов (f i ) расчет среднего показателя может быть произведен по средней гармонической невзвешенной: . В нашем примере использовались разные формы средних, но получили один и тот же ответ. Это обусловлено тем, что для конкретных данных каждый раз реализовывалось одно и то же исходное соотношение средней. Средние показатели могут рассчитываться по дискретным и интервальным вариационным рядам. При этом расчет производится по средней арифметической взвешенной. Для дискретного ряда данная формула используется так же, как и в приведенном выше примере. В интервальном же ряду для расчета определяются середины интервалов. Пример. По данным табл. 2.2 определим величину среднедушевого денежного дохода за месяц в условном регионе. Таблица 2.2 Исходные данные (вариационный ряд)
Среднедушевой денежный доход в среднем за месяц, х, руб. Численность населения, % к итогу/
До 400 30,2
400 - 600 24,4
600 - 800 16,7
800 - 1000 10,5
1000-1200 6,5
1200 - 1600 6,7
1600 - 2000 2,7
2000 и выше 2,3
Итого 100
Среднедушевой денежный доход 688,5 руб. Среднее гармоническое рассчитывается в тех случаях, когда: · среднее арифметическое по имеющимся данным рассчитать невозможно; · расчет средних гармонических более удобен , где Х варианты осредняемого признака. Пример. Требуется исчислить производительность труда рабочей силы, если 1-ому рабочему требуется для изготовления единицы продукции 0,25 часа, второму 1/3 часа, а третьему 1/2 часа. Получаем:

Начиная рассуждать о средних величинах, чаще всего вспоминают, как заканчивали школу и поступали в учебное заведение. Тогда по аттестату рассчитывался средний балл: все оценки (и хорошие, и не очень) складывали, полученную сумму делили на их количество. Так вычисляется самый простой вид средней, которая называется средняя арифметическая простая. На практике в статистике применяются различные виды средних величин: арифметическая, гармоническая, геометрическая, квадратическая, структурные средние. Тот или иной их вид используется в зависимости от характера данных и целей исследования.

Средняя величина является наиболее распространенным статистическим показателем, с помощью которого дается обобщающая характеристика совокупности однотипных явлений по одному из варьирующих признаков. Она показывает уровень признака в расчете на единицу совокупности. С помощью средних величин проводится сравнение различных совокупностей по варьирующим признакам, изучаются закономерности развития явлений и процессов общественной жизни.

В статистике применяются два класса средних: степенные (аналитические) и структурные. Последние используются для характеристики структуры вариационного ряда и будут рассмотрены далее в гл. 8.

К группе степенных средних относят среднюю арифметическую, гармоническую, геометрическую, квадратическую. Индивидуальные формулы для их вычисления можно привести к виду, общему для всех степенных средних, а именно

где m - показатель степенной средней: при m = 1 получаем формулу для вычисления средней арифметической, при m = 0 - средней геометрической, m = -1 - средней гармонической, при m = 2 - средней квадратической;

x i - варианты (значения, которые принимает признак);

f i - частоты.

Главным условием, при котором можно использовать степенные средние в статистическом анализе, является однородность совокупности, которая не должна содержать исходных данных, резко различающихся по своему количественному значению (в литературе они носят название аномальных наблюдений).

Продемонстрируем важность этого условия на следующем примере.

Пример 6.1. Вычислим среднюю заработную плату сотрудников малого предприятия.

Таблица 6.1. Заработная плата работников
№ п/п Заработная плата, руб. № п/п Заработная плата, руб.
1 5 950 11 7 000
2 6 790 12 5 950
3 6 790 13 6 790
4 5 950 14 5 950
5 7 000 5 6 790
6 6 790 16 7 000
7 5 950 17 6 790
8 7 000 18 7 000
9 6 790 19 7 000
10 6 790 20 5 950

Для расчета среднего размера заработной платы необходимо просуммировать заработную плату, начисленную всем работникам предприятия (т.е. найти фонд заработной платы), и разделить на число работающих:


А теперь добавим в нашу совокупность всего лишь одного человека (директора этого предприятия), но с окладом в 50 000 руб. В таком случае вычисляемая средняя будет совсем другая:

Как видим, она превышает 7000 руб., т.д. она больше всех значений признака за исключением одного-единственного наблюдения.

Для того чтобы таких случаев не происходило на практике, и средняя не теряла бы своего смысла (в примере 6.1 она уже не выполняет роль обобщающей характеристики совокупности, которой должна быть), при расчете средней следует аномальные, резко выделяющиеся наблюдения либо исключить из анализа и тем самым сделать совокупность однородной, либо разбить совокупность на однородные группы и вычислить средние значения по каждой группе и анализировать не общую среднюю, а групповые средние значения.

6.1. Средняя арифметическая и ее свойства

Средняя арифметическая вычисляется либо как простая, либо как взвешенная величина.

При расчете средней заработной платы по данным таблицы примера 6.1 мы сложили все значения признака и поделили на их количество. Ход наших вычислений запишем в виде формулы средней арифметической простой

где х i - варианты (отдельные значения признака);

п - число единиц в совокупности.

Пример 6.2. Теперь сгруппируем наши данные из таблицы примера 6.1, т.д. построим дискретный вариационный ряд распределения работающих по уровню заработной платы. Результаты группировки представлены в таблице.

Запишем выражение для вычисления среднего уровня заработной платы в более компактной форме:

В примере 6.2 была применена формула средней арифметической взвешенной

где f i - частоты, показывающие, сколько раз встречается значение признака х i y единиц совокупности.

Расчет средней арифметической взвешенной удобно проводить в таблице, как это показано ниже (табл. 6.3):

Таблица 6.3. Расчет средней арифметической в дискретном ряду
Исходные данные Расчетный показатель
заработная плата, руб. численность работающих, чел. фонд заработной платы, руб.
x i f i x i f i
5 950 6 35 760
6 790 8 54 320
7 000 6 42 000
Итого 20 132 080

Следует отметить, что средняя арифметическая простая используется в тех случаях, когда данные не сгруппированы или сгруппированы, но все частоты равны между собой.

Часто результаты наблюдения представляют в виде интервального ряда распределения (см. таблицу в примере 6.4). Тогда при расчете средней в качестве x i берут середины интервалов. Если первый и последний интервалы открыты (не имеют одной из границ), то их условно "закрывают", принимая за величины данного интервала величину примыкающего интервала, т.д. первый закрывают исходя из величины второго, а последний - по величине предпоследнего.

Пример 6.3. По результатам выборочного обследования одной из групп населения рассчитаем размер среднедушевого денежного дохода.

В приведенной таблице середина первого интервала равна 500. Действительно, величина второго интервала - 1000 (2000-1000); тогда нижняя граница первого равна 0 (1000-1000), а его середина - 500. Аналогично поступаем с последним интервалом. За его середину принимаем 25 000: величина предпоследнего интервала 10 000 (20 000-10 000), тогда его верхняя граница - 30 000 (20 000 + 10 000), а середина, соответственно, - 25 000.

Таблица 6.4. Расчет средней арифметической в интервальном ряду
Среднедушевой денежный доход, руб. в месяц Численность населения к итогу, % f i Середины интервалов x i x i f i
До 1 000 4,1 500 2 050
1 000-2 000 8,6 1 500 12 900
2 000-4 000 12,9 3 000 38 700
4 000-6 000 13,0 5 000 65 000
6 000-8 000 10,5 7 000 73 500
8 000-10 000 27,8 9 000 250 200
10 000-20 000 12,7 15 000 190 500
20 000 и выше 10,4 25 000 260 000
Итого 100,0 - 892 850

Тогда среднедушевой размер месячного дохода составит

Похожие публикации