Контрольная работа по Статистике 10
Работа добавлена на сайт bukvasha.net: 2015-10-25Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
от 25%
договор
Таблица 1
Исходные данные
Номер организации | Выпуск продукции, млн руб. | Затраты на производство продукции, млн руб. | Номер организации | Выпуск продукции, млн руб. | Затраты на производство продукции, млн руб. |
1 | 36,45 | 30,255 | 16 | 36,936 | 31,026 |
2 | 23,4 | 20,124 | 17 | 53,392 | 42,714 |
3 | 46,54 | 38,163 | 18 | 41 | 33,62 |
4 | 59,752 | 47,204 | 19 | 55,68 | 43,987 |
5 | 41,415 | 33,546 | 20 | 18,2 | 15,652 |
6 | 26,86 | 22,831 | 21 | 31,8 | 26,394 |
7 | 79,2 | 60,984 | 22 | 39,204 | 32,539 |
8 | 54,72 | 43,776 | 23 | 57,128 | 45,702 |
9 | 40,424 | 33,148 | 24 | 28,44 | 23,89 |
10 | 30,21 | 25,376 | 25 | 43,344 | 35,542 |
11 | 42,418 | 34,359 | 26 | 70,82 | 54,454 |
12 | 64,575 | 51,014 | 27 | 41,832 | 34,302 |
13 | 51,612 | 41,806 | 28 | 69,345 | 54,089 |
14 | 35,42 | 29,753 | 29 | 35,903 | 30,159 |
15 | 14,4 | 12,528 | 30 | 50,22 | 40,678 |
Номер организации | Затраты на производство продукции, млн руб.. | Сумма ожидаемой прибыли, млн руб. | Номер организации | Затраты на производство продукции, млн руб. | Сумма ожидаемой прибыли, млн руб. |
1 | 30,255 | 6,195 | 16 | 31,026 | 5,91 |
2 | 20,124 | 3,276 | 17 | 42,714 | 10,678 |
3 | 38,163 | 8,377 | 18 | 33,62 | 7,38 |
4 | 47,204 | 12,548 | 19 | 43,987 | 11,693 |
5 | 33,546 | 7,869 | 20 | 15,652 | 2,548 |
6 | 22,831 | 4,029 | 21 | 26,394 | 5,406 |
7 | 60,984 | 18,216 | 22 | 32,539 | 6,665 |
8 | 43,776 | 10,944 | 23 | 45,702 | 11,426 |
9 | 33,148 | 7,276 | 24 | 23,89 | 4,55 |
10 | 25,376 | 4,834 | 25 | 35,542 | 7,802 |
11 | 34,359 | 8,059 | 26 | 54,454 | 16,366 |
12 | 51,014 | 13,561 | 27 | 34,302 | 7,53 |
13 | 41,806 | 9,806 | 28 | 54,089 | 15,256 |
14 | 29,753 | 5,667 | 29 | 30,159 | 5,744 |
15 | 12,528 | 1,872 | 30 | 40,678 | 9,542 |
Задание 1
По исходным данным (табл.1) необходимо выполнить следующее:
1. Построить статистический ряд распределения организаций по признаку сумма ожидаемой прибыли, образовав пять групп с равными интервалами.
2. Постройте графики полученного ряда распределения. Графически определить значение моды и медианы.
3. Рассчитать характеристики ряда распределения: среднюю арифметическую, среднее квадратическое отклонение, коэффициент вариации.
4. Вычислить среднюю арифметическую по исходным данным (табл. 1.1), сравнить её с аналогичным показателем, рассчитанным в п. 3 для интервального ряда распределения. Объяснить причину их расхождения.
Сделать выводы по результатам выполнения Задания 1.
1.Построение интервального ряда распределения банков по объему кредитных вложений
Для построения интервального вариационного ряда, характеризующего распределение организаций по признаку сумма ожидаемой прибыли, необходимо вычислить величину и границы интервалов ряда.
При построении ряда с равными интервалами величина интервала h определяется по формуле
, (1)
где
– наибольшее и наименьшее значения признака в исследуемой совокупности, k
- число групп интервального ряда.
(((((Число групп k задается в условии задания или рассчитывается по формуле Г.Стерджесса
k
=1+3,322
lg
n
, (2)
где n
- число единиц совокупности.)))))
Определение величины интервала по формуле (1) при заданных k
= 5, xmax = 18,216 млн руб., xmin
= 1,872 млн руб.:
При h = 3,269 млн руб. границы интервалов ряда распределения имеют следующий вид (табл. 2):
Таблица 2
Номер группы | Нижняя граница, млн руб. | Верхняя граница, млн руб. |
1 | 1,872 | 5,1408 |
2 | 5,1408 | 8,4096 |
3 | 8,4096 | 11,6784 |
4 | 11,6784 | 14,9472 |
5 | 14,9472 | 18,216 |
Для построения интервального ряда необходимо подсчитать число организаций, входящих в каждую группу (частоты групп). При этом возникает вопрос, в какую группу включать единицы совокупности, у которых значения признака выступают одновременно и верхней, и нижней границами смежных интервалов (для демонстрационного примера – это 90, 140, 190 млн руб.). Отнесение таких единиц к одной из двух смежных групп рекомендуется осуществлять по принципу полуоткрытого интервала [ ). Т.к. при этом верхние границы интервалов не принадлежат данным интервалам, то соответствующие им единицы совокупности включаются не в данную группу, а в следующую. В последний интервал включаются и нижняя, и верхняя границы.
Процесс группировки единиц совокупности по признаку Сумма ожидаемой прибыли представлен во вспомогательной (разработочной) таблице 3 (графа 4 этой таблицы необходима для построения аналитической группировки в Задании 2).
Таблица 3
Разработочная таблица для построения интервального ряда распределения и аналитической группировки
Группы банков по объему кредитных вложений, млн руб. | Номер банка | Сумма ожидаемой прибыли млн руб. | Затраты на производство, млн руб. |
1 | 2 | 3 | 4 |
1,872-5,141 | 15 | 1,872 | 12,528 |
| 20 | 2,548 | 15,652 |
| 2 | 3,276 | 20,124 |
| 6 | 4,029 | 22,831 |
| 24 | 4,55 | 23,89 |
| 10 | 4,834 | 25,376 |
Всего | 6 | 21,109 | 120,401 |
5,141-8,410 | 21 | 5,406 | 26,394 |
| 14 | 5,667 | 29,753 |
| 29 | 5,744 | 30,159 |
| 16 | 5,91 | 30,255 |
| 1 | 6,195 | 31,026 |
| 22 | 6,665 | 32,539 |
| 9 | 7,276 | 33,148 |
| 18 | 7,38 | 33,546 |
| 27 | 7,53 | 33,62 |
| 25 | 7,802 | 34,302 |
| 5 | 7,869 | 34,359 |
| 11 | 8,059 | 35,542 |
| 3 | 8,377 | 38,163 |
Всего | 13 | 89,88 | 422,806 |
8,410-11,678 | 30 | 9,542 | 40,678 |
| 13 | 9,806 | 41,806 |
| 17 | 10,678 | 42,714 |
| 8 | 10,944 | 43,776 |
| 23 | 11,426 | 45,702 |
Всего | 5 | 52,396 | 214,676 |
11,678-14,947 | 19 | 11,693 | 43,987 |
| 4 | 12,548 | 47,204 |
| 12 | 13,561 | 51,014 |
Всего | 3 | 37,802 | 142,205 |
14,947-18,216 | 28 | 15,256 | 54,089 |
| 26 | 16,366 | 54,454 |
| 7 | 18,216 | 60,984 |
Всего | 3 | 49,838 | 169,527 |
ИТОГО | 30 | 215,025 | 1069,615 |
На основе групповых итоговых строк «Всего» табл. 3 формируется итоговая табл. 4, представляющая интервальный ряд распределения организаций по признаку сумма ожидаемой прибыли .
Таблица 4
Распределение банков по объему кредитных вложений
Номер группы | Группы банков по объему кредитных вложений, млн руб., х | Число банков, f |
1 | 1,872-5,141 | 6 |
2 | 5,141-8,410 | 13 |
3 | 8,410-11,678 | 5 |
4 | 11,678-14,947 | 3 |
5 | 14,947-18,216 | 3 |
| Итого | 30 |
Помимо частот групп в абсолютном выражении в анализе интервальных рядов используются ещё три характеристики ряда, приведенные в графах 4 - 6 табл. 1.4. Это частоты групп в относительном выражении, накопленные (кумулятивные) частоты Sj, получаемые путем последовательного суммирования частот всех предшествующих (j-1) интервалов, и накопленные частости, рассчитываемые по формуле .
Таблица 5
Структура банков по объему кредитных вложений
№ группы | Группы организаций по сумме ожидаемой прибыли, млн руб. | Число организаций, fj | Накопленная частота, Sj | Накопленная частоcть, % | |
в абсолютном выражении | в % к итогу | ||||
1 | 2 | 3 | 4 | 5 | 6 |
1 | 1,872-5,141 | 6 | 20,00% | 6 | 20,00% |
2 | 5,141-8,410 | 13 | 43,33% | 19 | 63,33% |
3 | 8,410-11,678 | 5 | 16,67% | 24 | 80,00% |
4 | 11,678-14,947 | 3 | 10,00% | 27 | 90,00% |
5 | 14,947-18,216 | 3 | 10,00% | 30 | 100,00% |
| Итого | 30 | 100 | | |
Вывод. Анализ интервального ряда распределения изучаемой совокупности организаций показывает, что распределение организаций по признаку сумма ожидаемой прибыли не является равномерным: преобладают организации с суммой ожидаемой прибыли от 5,14 млн руб. до 8,41 млн руб. (это 13 организай, доля которых составляет 43,33%); 20% банков имеют кредитные вложения менее 5,14 млн руб., а 63,33% – менее 8,41 млн руб.
1.2. Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов
Мода и медиана являются структурными средними величинами, характеризующими (наряду со средней арифметической) центр распределения единиц совокупности по изучаемому признаку.
Мода Мо для дискретного ряда – это значение признака, наиболее часто встречающееся у единиц исследуемой совокупности[1]. В интервальном вариационном ряду модой приближенно считается центральное значение модального интервала (имеющего наибольшую частоту). Более точно моду можно определить графическим методом по гистограмме ряда (рис.1).
Рис. 1 Определение моды графическим методом
Конкретное значение моды для интервального ряда рассчитывается по формуле:
(3)
где хМo – нижняя граница модального интервала,
h
–величина модального интервала,
fMo – частота модального интервала,
fMo-1 – частота интервала, предшествующего модальному,
fMo+1 – частота интервала, следующего за модальным.
Согласно табл.1.3 модальным интервалом построенного ряда является интервал 5,14-8,41 млн. руб., так как его частота максимальна (f3 = 13).
Расчет моды по формуле (3):
Вывод. Для рассматриваемой совокупности банков наиболее распространенный объем кредитных вложений характеризуется средней величиной 6,67 млн руб.
Медиана Ме – это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности.
Медиану можно определить графическим методом по кумулятивной кривой (рис. 2). Кумулята строится по накопленным частотам (табл. 5, графа 5).
Рис. 2. Определение медианы графическим методом
Конкретное значение медианы для интервального ряда рассчитывается по формуле:
, (4)
где хМе– нижняя граница медианного интервала,
h – величина медианного интервала,
– сумма всех частот,
fМе – частота медианного интервала,
SMе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному.
Для расчета медианы необходимо, прежде всего, определить медианный интервал, для чего используются накопленные частоты (или частости) из табл. 5 (графа 5). Так как медиана делит численность ряда пополам, она будет располагаться в том интервале, где накопленная частота впервые равна полусумме всех частот или превышает ее (т.е. все предшествующие накопленные частоты меньше этой величины).
В демонстрационном примере медианным интервалом является интервал 5,14 – 8,41 млн. руб., так как именно в этом интервале накопленная частота Sj = 19 впервые превышает величину, равную половине численности единиц совокупности (=).
Расчет значения медианы по формуле (4):
Вывод. В рассматриваемой совокупности организаций половина организаций имеют в среднем сумму ожидаемой прибыли не более 7,40 млн руб., а другая половина – не менее 7,40 млн руб.
3. Расчет характеристик ряда распределения
Для расчета характеристик ряда распределения , σ
, σ
2, V
σ на основе табл. 5 строится вспомогательная табл. 6 (
– середина j-го интервала).
Таблица 6
Расчетная таблица для нахождения характеристик ряда распределения
Группы организаций по сумме ожидаемой прибыли, млн руб. | Середина интервала, | Число организ аций, fj | | | | |
1 | 2 | 3 | 4 | 5 | 6 | 7 |
1,872-5,141 | 3,5065 | 6 | 21,0384 | -4,79424 | 22,98474 | 137,9084 |
5,141-8,410 | 6,7755 | 13 | 88,0776 | -1,52544 | 2,326967 | 30,25057 |
8,410-11,678 | 10,044 | 5 | 50,22 | 1,74336 | 3,039304 | 15,19652 |
11,678-14,947 | 13,3125 | 3 | 39,9384 | 5,01216 | 25,12175 | 75,36524 |
14,947-18,216 | 16,5815 | 3 | 49,7448 | 8,28096 | 68,5743 | 205,7229 |
Итого | | | 249,0192 | | | 464,4437 |
Расчет средней арифметической взвешенной:
(5)
Расчет дисперсии:
(6)
Расчет среднего квадратического отклонения:
Расчет коэффициента вариации:
(7)
Вывод. Анализ полученных значений показателей и σ говорит о том, что средний объем кредитных вложений банков составляет 8,301 млн руб., отклонение от среднего объема в ту или иную сторону составляет в среднем 3,935 млн руб. (или 47,4%), наиболее характерные значения Суммы ожидаемой прибыли находятся в пределах от 4,346 млн руб. до 12,216 млн руб. (диапазон ).
Значение V
σ = 47,4% превышает 33%, следовательно, сумма ожидаемой прибыли в исследуемой совокупности организаций значительна и совокупность по данному признаку качественно не однородна. Расхождение между значениями , Мо и Ме значительно (=8,30млн руб., Мо=6,67млн руб., Ме=7,40млн руб.), что подтверждает вывод об неоднородности совокупности банков. Таким образом, найденное среднее значение суммы ожидаемой прибыли организации (8,30 млн руб.) не является типичной, надежной характеристикой исследуемой совокупности организаций.
4.Вычисление средней арифметической по исходным данным
Для расчета применяется формула средней арифметической простой:
, (8)
Причина расхождения средних величин, рассчитанных по формулам (8) и (5), заключается в том, что по формуле (8) средняя определяется по фактическим значениям исследуемого признака для всех 30-ти банков, а по формуле (5) средняя вычисляется для интервального ряда, когда в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным (за исключением случая равномерного распределения значений признака внутри каждой группы).
Задание 2
По исходным данным табл. 1 с использованием результатов выполнения Задания 1 необходимо выполнить следующее:
1. Установить наличие и характер корреляционной связи между признаками Затраты на производство продукции и сумма ожидаемой прибыли, используя метод аналитической группировки.
2. Оценить тесноту и силу корреляционной связи, используя коэффициент детерминации и эмпирическое корреляционное отношение.
3. Оценить статистическую значимость показателя силы связи.
Сделать выводы по результатам выполнения Задания 2.
Выполнение Задания 2
Целью выполнения данного Задания является выявление наличия корреляционной связи между факторным и результативным признаками, установление направления связи, оценка тесноты и силы связи.
Факторный и результативный признаки либо задаются в условии задания, либо определяются путем проведения предварительного теоретического анализа. Лишь после того, как выяснена экономическая сущность явления и определены факторный и результативный признаки, приступают к проведению корреляционного анализа данных.
По условию Задания 2 факторным является признак сумма ожидаемой прибыли (X), результативным – признак затраты на производство продукции (
Y).
1. Установление наличия и характера связи между признаками затраты на производство продукции и Сумма ожидаемой прибыли методом аналитической группировки
Применение метода аналитической группировки
При использовании метода аналитической группировки строится интервальный ряд распределения единиц совокупности по факторному признаку Х и для каждой j-ой группы ряда определяется среднегрупповое значение результативного признака Y. Если с ростом значений фактора Х от группы к группе средние значения систематически возрастают (или убывают), между признаками X и Y имеет место корреляционная связь.
Используя разработочную таблицу 3, строим аналитическую группировку, характеризующую зависимость между факторным признаком Х – Сумма ожидаемой прибыли и результативным признаком Y –затраты на производство продукции. Макет аналитической таблицы имеет следующий вид (табл. 7):
Таблица 7
Зависимость затрат на производство от суммы ожидаемой прибыли
Номер группы | Сумма ожидаемой прибыли, млн руб. | Число банков | Затраты на производство, млн руб. | |
всего | в среднем на один банк | |||
1 | 5,1408 | 6 | 120,401 | 20,06683 |
2 | 8,4096 | 13 | 422,806 | 32,52354 |
3 | 11,6784 | 5 | 214,676 | 42,9352 |
4 | 14,9472 | 3 | 142,205 | 47,40167 |
5 | 18,216 | 3 | 169,527 | 56,509 |
Итого | | 30 | 1069,615 | 35,65383 |
Групповые средние значения получаем из таблицы 3 (графа 4), основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 8.
Таблица 8
Зависимость суммы прибыли банков от объема кредитных вложений
Номер группы | Группы организаций по сумме ожидаемой прибыли, млн руб., х | Число банков, fj | Затраты на производство, млн руб. | |
всего | в среднем на одну организацию, | |||
1 | 2 | 3 | 4 | 5=4:3 |
1 | 1,872-5,141 | 6 | 120,401 | 20,06683 |
2 | 5,141-8,410 | 13 | 422,806 | 32,52354 |
3 | 8,410-11,678 | 5 | 214,676 | 42,9352 |
4 | 11,678-14,947 | 3 | 142,205 | 47,40167 |
5 | 14,947-18,216 | 3 | 169,527 | 56,509 |
| Итого | 30 | 1069,615 | 35,65383 |
Вывод. Анализ данных табл. 8 показывает, что с увеличением суммы ожидаемой прибыли от группы к группе систематически возрастает и средняя затрата на производство по каждой группе организаций, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.
2. Измерение тесноты и силы корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения
Для измерения тесноты и силы связи между факторным и результативным признаками рассчитывают специальные показатели – эмпирический коэффициент детерминации и эмпирическое корреляционное отношение .
Эмпирический коэффициент детерминации оценивает силу связи, определяя, насколько вариация результативного признака Y объясняется вариацией фактора Х (остальная часть вариации Y объясняется вариацией прочих факторов). Показатель рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле
, (9)
где – общая дисперсия признака Y,
– межгрупповая (факторная) дисперсия признака Y.
Значения показателя изменяются в пределах . При отсутствии корреляционной связи между признаками Х и Y имеет место равенство =0, а при наличии функциональной связи между ними - равенство =1.
Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных). Этот показатель вычисляется по формуле
, (10)
где y
i – индивидуальные значения результативного признака;
– общая средняя значений результативного признака;
n – число единиц совокупности.
Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности:
(11)
или как средняя взвешенная по частоте групп интервального ряда:
(12)
Для вычисления удобно использовать формулу (11), т.к. в табл. 8 (графы 3 и 4 итоговой строки) имеются значения числителя и знаменателя формулы.
Расчет по формуле (11):
Для расчета общей дисперсии применяется вспомогательная таблица 12.
Таблица 12
Вспомогательная таблица для расчета общей дисперсии
Номер организации п/п | затраты, млн руб. | | | |
1 | 2 | 3 | 4 | 5 |
1 | 30,255 | -5,39883 | 29,1474 | 915,365 |
2 | 20,124 | -15,5298 | 241,1757 | 404,9754 |
3 | 38,163 | 2,509167 | 6,295917 | 1456,415 |
4 | 47,204 | 11,55017 | 133,4064 | 2228,218 |
5 | 33,546 | -2,10783 | 4,442961 | 1125,334 |
6 | 22,831 | -12,8228 | 164,4251 | 521,2546 |
7 | 60,984 | 25,33017 | 641,6173 | 3719,048 |
8 | 43,776 | 8,122167 | 65,96959 | 1916,338 |
9 | 33,148 | -2,50583 | 6,279201 | 1098,79 |
10 | 25,376 | -10,2778 | 105,6339 | 643,9414 |
11 | 34,359 | -1,29483 | 1,676593 | 1180,541 |
12 | 51,014 | 15,36017 | 235,9347 | 2602,428 |
13 | 41,806 | 6,152167 | 37,84915 | 1747,742 |
14 | 29,753 | -5,90083 | 34,81983 | 885,241 |
15 | 12,528 | -23,1258 | 534,8042 | 156,9508 |
16 | 31,026 | -4,62783 | 21,41684 | 962,6127 |
17 | 42,714 | 7,060167 | 49,84595 | 1824,486 |
18 | 33,62 | -2,03383 | 4,136478 | 1130,304 |
19 | 43,987 | 8,333167 | 69,44167 | 1934,856 |
20 | 15,652 | -20,0018 | 400,0733 | 244,9851 |
21 | 26,394 | -9,25983 | 85,74451 | 696,6432 |
22 | 32,539 | -3,11483 | 9,702187 | 1058,787 |
23 | 45,702 | 10,04817 | 100,9657 | 2088,673 |
24 | 23,89 | -11,7638 | 138,3878 | 570,7321 |
25 | 35,542 | -0,11183 | 0,012507 | 1263,234 |
26 | 54,454 | 18,80017 | 353,4463 | 2965,238 |
27 | 34,302 | -1,35183 | 1,827453 | 1176,627 |
28 | 54,089 | 18,43517 | 339,8554 | 2925,62 |
29 | 30,159 | -5,49483 | 30,19319 | 909,5653 |
30 | 40,678 | 5,024167 | 25,24225 | 1654,7 |
Итого | 1069,6 | 0,000 | 3873,769 | 42009,64 |
Расчет общей дисперсии по формуле (10):
Общая дисперсия может быть также рассчитана по формуле
,
где – средняя из квадратов значений результативного признака,
– квадрат средней величины значений результативного признака.
Для демонстрационного примера
Тогда
Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле
, (13)
где –групповые средние,
– общая средняя,
–число единиц в j-ой группе,
k – число групп.
Для расчета межгрупповой дисперсии строится вспомогательная таблица 13 При этом используются групповые средние значения из табл. 8 (графа 5).
Таблица 13
Вспомогательная таблица для расчета межгрупповой дисперсии
Группы организаций по сумме ожидаемой прибыли, млн руб. | Число организаций, | Среднее значение в группе | | |
1 | 2 | 3 | 4 | 5 |
1,872-5,141 | 6 | 20,06683 | -15,587 | 1457,727 |
5,141-8,410 | 13 | 32,52354 | -3,13029 | 127,3837 |
8,410-11,678 | 5 | 42,9352 | 7,281367 | 265,0915 |
11,678-14,947 | 3 | 47,40167 | 11,74783 | 414,0348 |
14,947-18,216 | 3 | 56,509 | 20,85517 | 1304,814 |
Итого | 30 | | | 3569,051 |
Расчет межгрупповой дисперсии по формуле (11):
Расчет эмпирического коэффициента детерминации по формуле (9):
или 92,1%
Вывод. 92,1% вариации затрат на производство продуеции обусловлено вариацией суммы ожидаемой прибыли, а 7,9% – влиянием прочих неучтенных факторов.
Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле
(14)
Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 14):
Таблица 14
Шкала Чэддока
h | 0,1 – 0,3 | 0,3 – 0,5 | 0,5 – 0,7 | 0,7 – 0,9 | 0,9 – 0,99 |
Характеристика силы связи | Слабая | Умеренная | Заметная | Тесная | Весьма тесная |
Расчет эмпирического корреляционного отношения по формуле (14):
Вывод. Согласно шкале Чэддока связь между затратами на производство и суммой ожидаемой прибыли организаций является весьма тесной.
3. Оценка статистической значимости коэффициента детерминации
.
Показатели и рассчитаны для выборочной совокупности, т.е. на основе ограниченной информации об изучаемом явлении. Поскольку при формировании выборки на первичные данные могли иметь воздействии какие-либо случайные факторы, то есть основание полагать, что и полученные характеристики связи , несут в себе элемент случайности. Ввиду этого, необходимо проверить, насколько заключение о тесноте и силе связи, сделанное по выборке, будет правомерными и для генеральной совокупности, из которой была произведена выборка.
Проверка выборочных показателей на их неслучайность осуществляется в статистике с помощью тестов на статистическую значимость (существенность) показателя. Для проверки значимости коэффициента детерминации служит дисперсионный F
-критерий Фишера, который рассчитывается по формуле
,
где n – число единиц выборочной совокупности,
m – количество групп,
– межгрупповая дисперсия,
– дисперсия j-ой группы (j=1,2,…,m),
– средняя арифметическая групповых дисперсий.
Величина рассчитывается, исходя из правила сложения дисперсий:
,
где – общая дисперсия.
Для проверки значимости показателя рассчитанное значение F-критерия F
расч сравнивается с табличным F
табл
для принятого уровня значимости и параметров k
1,
k
2, зависящих от величин n
и
m : k
1
=
m
-1,
k
2
=
n
-
m
. Величина F
табл для значений , k
1,
k
2 определяется по таблице распределения Фишера, где приведены критические (предельно допустимые) величины F-критерия для различных комбинаций значений , k
1,
k
2
. Уровень значимости в социально-экономических исследованиях обычно принимается равным 0,05 (что соответствует доверительной вероятности Р=0,95).
Если F
расч
>
F
табл , коэффициент детерминации признается статистически значимым, т.е. практически невероятно, что найденная оценка обусловлена только стечением случайных обстоятельств. В силу этого, выводы о тесноте связи изучаемых признаков, сделанные на основе выборки, можно распространить на всю генеральную совокупность.
Если F
расч
<
F
табл, то показатель считается статистически незначимым и, следовательно, полученные оценки силы связи признаков относятся только к выборке, их нельзя распространить на генеральную совокупность.
Фрагмент таблицы Фишера критических величин F-критерия для значений =0,05; k1=3,4,5; k2=24-35 представлен ниже:
| k2 | |||||||||||
k1 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 |
3 | 3,01 | 2,99 | 2,98 | 2,96 | 2,95 | 2,93 | 2,92 | 2,91 | 2,90 | 2,89 | 2,88 | 2,87 |
4 | 2,78 | 2,76 | 2,74 | 2,73 | 2,71 | 2,70 | 2,69 | 2,68 | 2,67 | 2,66 | 2,65 | 2,64 |
5 | 2,62 | 2,60 | 2,59 | 2,57 | 2,56 | 2,55 | 2,53 | 2,52 | 2,51 | 2,50 | 2,49 | 2,48 |
Расчет дисперсионного F-критерия Фишера для оценки =92,1%, полученной при =129,13, =118,97:
F
расч
Табличное значение F-критерия при = 0,05:
n | m | k1=m-1 | k2=n-m | Fтабл (,4, 26) |
30 | 5 | 4 | 25 | 2,60 |
Вывод: поскольку F
расч
>
F
табл, то величина коэффициента детерминации =75,1% признается значимой (неслучайной) с уровнем надежности 95% и, следовательно, найденные характеристики связи между признаками Суммой ожидаемой прибыли и Затратами на производство продукции правомерны не только для выборки, но и для всей генеральной совокупности банков.
Задание 3
По результатам выполнения Задания 1 с вероятностью 0,683 необходимо определить:
1) ошибку выборки средней суммы прибыли границы, в которых будет находиться средняя сумма прибыли в генеральной совокупности.
2) ошибку выборки доли организаций с ожидаемой суммой прибыли 14,948 млн руб. и более и границы, в которых будет находиться генеральная доля.
Выполнение Задания 3
Целью выполнения данного Задания является определение для генеральной совокупности организаций региона границ, в которых будут находиться величина средней суммы ожидаемой прибыли и доля организаций с ожидаемой суммой прибыли 14,948 млн руб.
1. Определение ошибки выборки для средней суммы ожидаемой прибыли и границ, в которых будет находиться генеральная доля
Применение выборочного метода наблюдения всегда связано с установлением степени достоверности оценок показателей генеральной совокупности, полученных на основе значений показателей выборочной совокупности. Достоверность этих оценок зависит от репрезентативности выборки, т.е. от того, насколько полно и адекватно представлены в выборке статистические свойства генеральной совокупности. Как правило, генеральные и выборочные характеристики не совпадают, а отклоняются на некоторую величину ε, которую называют ошибкой выборки (ошибкой репрезентативности).
Значения признаков единиц, отобранных из генеральной совокупности в выборочную, всегда случайны, поэтому и статистические характеристики выборки случайны, следовательно, и ошибки выборки также случайны. Ввиду этого принято вычислять два вида ошибок - среднюю и предельную .
Средняя ошибка выборки - это среднее квадратическое отклонение всех возможных значений выборочной средней от генеральной средней, т.е. от своего математического ожидания M[].
Величина средней ошибки выборки рассчитывается дифференцированно (по различным формулам) в зависимости от вида и способа отбора единиц из генеральной совокупности в выборочную.
Для собственно-случайной и механической выборки с бесповторным способом отбора средняя ошибка выборочной средней определяется по формуле
, (15)
где – общая дисперсия выборочных значений признаков,
N – число единиц в генеральной совокупности,
n – число единиц в выборочной совокупности.
Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная средняя:
,
, (16)
где – выборочная средняя,
– генеральная средняя.
Границы задают доверительный интервал генеральной средней, т.е. случайную область значений, которая с вероятностью Р гарантированно содержит значение генеральной средней. Эту вероятность Р называют доверительной вероятностью или уровнем надёжности.
В экономических исследованиях чаще всего используются доверительные вероятности Р= 0.954, Р= 0.997, реже Р= 0,683.
В математической статистике доказано, что предельная ошибка выборки кратна средней ошибке µ с коэффициентом кратности t
(называемым также коэффициентом доверия), который зависит от значения доверительной вероятности Р. Для предельной ошибки выборочной средней это теоретическое положение выражается формулой
(17)
Значения t вычислены заранее для различных доверительных вероятностей Р и протабулированы (таблицы функции Лапласа Ф). Для наиболее часто используемых уровней надежности Р значения t задаются следующим образом (табл. 15):
Таблица 15
Доверительная вероятность P | 0,683 | 0,866 | 0,954 | 0,988 | 0,997 | 0,999 |
Значение t | 1,0 | 1,5 | 2,0 | 2,5 | 3,0 | 3,5 |
По условию демонстрационного примера выборочная совокупность насчитывает 30 организаций, выборка 20% механическая, следовательно, генеральная совокупность включает 150 банков. Выборочная средняя , дисперсия определены в Задании 1 (п. 3). Значения параметров, необходимых для решения задачи, представлены в табл. 16:
Таблица 16
Р | t | n | N | | |
0,683 | 1 | 30 | 150 | 8,30 | 15,4815 |
Расчет средней ошибки выборки по формуле (15):
,
Расчет предельной ошибки выборки по формуле (17):
Определение по формуле (16) доверительного интервала для генеральной средней:
8,30-1,228,30+1,22,
7,08 млн руб. 9,52 млн руб.
Вывод. На основании проведенного выборочного обследования организаций региона с вероятностью 0,683 можно утверждать, что для генеральной совокупности организаций средняя сумма ожидаемой прибыли находится в пределах от 7,08 млн руб. до 9,52 млн руб.
2. Определение ошибки выборки для доли организаций с ожидаемой суммой прибыли 14,948 млн руб. и более, а также границ, в которых будет находиться генеральная доля
Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой
, (18)
где m – число единиц совокупности, обладающих заданным свойством;
n – общее число единиц в совокупности.
Для собственно-случайной и механической выборки с бесповторным способом отбора предельная ошибка выборки доли единиц, обладающих заданным свойством, рассчитывается по формуле
, (19)
где w – доля единиц совокупности, обладающих заданным свойством;
(1-w
) – доля единиц совокупности, не обладающих заданным свойством,
N – число единиц в генеральной совокупности,
n– число единиц в выборочной совокупности.
Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная доля р единиц, обладающих заданным свойством:
(20)
По условию Задания 3 исследуемым свойством является равенство или превышение ожидаемой суммы прибыли 14,948 млн руб..
Число банков с заданным свойством определяется из табл. 3 (графа 3):
m=27
Расчет выборочной доли по формуле (18):
Расчет по формуле (19) предельной ошибки выборки для доли:
Определение по формуле (20) доверительного интервала генеральной доли:
0,802 0,998
или
80,2% 99,8%
Вывод. С вероятностью 0,683 можно утверждать, что в генеральной совокупности организаций с ожидаемой суммой прибыли 14,948 млн руб. и выше будет находиться в пределах от 80,2% до 99,8%.
Задание 4
Имеются следующие данные о реализации фруктов торговой организацией:
Товар | Цена за 1 кг, руб. | Товарооборот, тыс. руб. | ||
июнь | август | июнь | август | |
Яблоки | 20 | 10 | 160 | 200 |
Сливы | 35 | 15 | 140 | 270 |
Определите:
1.Индексы цен по каждому виду товара;
2. По двум товаром вместе:
а) индексы цен, физического объема товарооборота, индекс товарооборота;
б) абсолютную сумму экономии от снижения цен.
Постройте расчетную таблицу, сделайте выводы.
[1] Если в дискретном ряду все варианты встречаются одинаково часто, то в этом случае мода отсутствует. Могут быть распределения, где не один, а два (или более) варианта имеют наибольшие частоты. Тогда ряд имеет две (или более) моды, распределение является бимодальным (или многомодальным),что указывает на качественную неоднородность совокупности по изучаемому признаку.