Контрольная работа Построение и исследование вариационного ряда
Работа добавлена на сайт bukvasha.net: 2015-10-25Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
от 25%
договор
1.
2. Таблица с исходными данными, включающая: название страны (РФ), факторный (Уровень заболеваемости (на 1000 человек населения)), результативный (Ожидаемая продолжительность жизни) признак и признак для выполнения п. 3 (Уровень заболеваемости (на 1000 человек населения): болезни органов дыхания).
Название региона | Уровень заболеваемости (на 1000 человек населения) | Ожидаемая продолжительность жизни при рождении всего | Уровень заболеваемости (на 1000 человек населения): болезни органов дыхания |
Российская Федерация | 744,90 | 65,07 | 294,00 |
Центральный ф. д. | 720,90 | 65,81 | 318,40 |
Белгородская область | 806,10 | 68,26 | 271,30 |
Брянская область | 741,80 | 64,62 | 299,60 |
Владимирская область | 920,90 | 63,18 | 399,30 |
Воронежская область | 548,30 | 66,19 | 210,10 |
Ивановская область | 850,60 | 62,42 | 394,30 |
Калужская область | 816,30 | 64,56 | 342,00 |
Костромская область | 692,80 | 62,39 | 321,20 |
Курская область | 649,60 | 65,35 | 240,80 |
Липецкая область | 714,20 | 65,85 | 318,80 |
Московская область | 624,90 | 65,26 | 307,00 |
Орловская область | 821,70 | 65,23 | 304,10 |
Рязанская область | 641,60 | 63,91 | 245,50 |
Смоленская область | 777,20 | 62,34 | 331,80 |
Тамбовская область | 721,10 | 65,47 | 310,60 |
Тверская область | 754,10 | 61,53 | 339,60 |
Тульская область | 822,70 | 63,03 | 372,00 |
Ярославская область | 937,00 | 63,46 | 398,40 |
г. Москва | 711,70 | 69,64 | 333,60 |
Северо-Западный ф. о. | 749,90 | 63,43 | 313,60 |
Республика Карелия | 1057,30 | 60,81 | 437,70 |
Республика Коми | 984,80 | 61,67 | 439,80 |
Архангельская область | 930,30 | 62,11 | 384,80 |
Вологодская область | 808,20 | 62,47 | 369,50 |
Калининградская область | 668,90 | 61,68 | 255,30 |
Ленинградская область | 524,70 | 61,74 | 232,30 |
Мурманская область | 817,30 | 63,2 | 351,30 |
Новгородская область | 817,40 | 60,84 | 348,20 |
Псковская область | 606,10 | 60,86 | 276,20 |
г. Санкт-Петербург | 682,80 | 66,49 | 266,60 |
Южный ф.о. | 651,80 | 67,49 | 237,00 |
Республика Адыгея | 657,80 | 67,51 | 199,00 |
Республика Дагестан | 844,80 | 72,33 | 230,40 |
Республика Ингушетия | 485,80 | 75,13 | 130,30 |
Кабардино-Балкарская Республика | 354,40 | 68,7 | 120,60 |
Республика Калмыкия | 688,80 | 66,18 | 317,50 |
Карачаево-Черкесская Республика | 506,20 | 68,1 | 180,60 |
Республика Северная Осетия – Алания | 569,50 | 68,47 | 203,20 |
Чеченская Республика | … | 69,06 | … |
Краснодарский край | 570,30 | 67,33 | 202,90 |
Ставропольский край | 485,50 | 67,14 | 223,30 |
Астраханская область | 728,60 | 65,36 | 274,00 |
Волгоградская область | 776,20 | 66,43 | 288,70 |
Ростовская область | 776,20 | 66,47 | 294,90 |
Приволжский ф.о. | 799,60 | 65,29 | 303,10 |
Республика Башкортостан | 797,60 | 66,39 | 277,40 |
Республика Марий Эл | 768,30 | 63,99 | 265,00 |
Республика Мордовия | 696,80 | 66,28 | 235,50 |
Республика Татарстан | 760,80 | 67,84 | 276,70 |
Удмуртская Республика | 912,80 | 64,34 | 396,00 |
Чувашская Республика | 820,90 | 66,09 | 274,00 |
Кировская область | 706,30 | 63,71 | 307,90 |
Нижегородская область | 762,40 | 64,03 | 317,20 |
Оренбургская область | 908,50 | 65,35 | 308,00 |
Пензенская область | 852,10 | 65,67 | 317,90 |
Пермская область | 834,30 | 62,31 | 330,00 |
Самарская область | 844,00 | 65,59 | 335,70 |
Саратовская область | 675,70 | 65,46 | 263,10 |
Ульяновская область | 877,10 | 65,25 | 320,40 |
Уральский ф. о. | 774,10 | 64,79 | 304,80 |
Курганская область | 843,10 | 63,87 | 272,30 |
Свердловская область | 685,80 | 63,97 | 275,20 |
Тюменская область | 897,30 | 66,07 | 350,90 |
Челябинская область | 750,60 | 64,78 | 308,30 |
Сибирский ф. о. | 776,60 | 63,17 | 274,40 |
Республика Алтай | 876,70 | 60,24 | 242,40 |
Республика Бурятия | 610,70 | 61,25 | 213,80 |
Республика Тыва | 637,30 | 54,31 | 189,20 |
Республика Хакасия | 783,70 | 60,75 | 239,40 |
Алтайский край | 969,90 | 66,05 | 326,20 |
Красноярский край | 759,20 | 63,03 | 261,70 |
Иркутская область | 837,80 | 60,68 | 312,10 |
Кемеровская область | 741,70 | 61,86 | 267,70 |
Новосибирская область | 685,90 | 65,83 | 270,00 |
Омская область | 830,40 | 66,01 | 300,00 |
Томская область | 764,10 | 64,44 | 229,50 |
Читинская область | 620,30 | 60,24 | 224,40 |
Дальневосточный ф. о. | 758,60 | 62,42 | 292,30 |
Республика Саха (Якутия) | 847,70 | 63,96 | 326,60 |
Приморский край | 727,90 | 63,07 | 269,90 |
Хабаровский край | 715,90 | 61,85 | 289,60 |
Амурская область | 617,60 | 61,26 | 242,90 |
Камчатская область | 866,00 | 63 | 357,50 |
Магаданская область | 942,60 | 63,03 | 372,80 |
Сахалинская область | 932,10 | 61,44 | 333,20 |
Еврейская автономная область | 620,30 | 60,8 | 215,10 |
Чукотский автономный округ | 1296,80 | 59,1 | 620,30 |
Уровень заболеваемости населения – отношение числа больных с впервые в жизни установленным диагнозом к среднегодовой численности населения.
Ожидаемая продолжительность жизни при рождении – число лет, которое в среднем предстояло бы прожить одному человеку из некоторого гипотетического поколения родившихся при условии, что на протяжении всей жизни этого поколения уровень смертности в каждом возрасте останется таким, как в годы, для которых вычислен показатель. Ожидаемая продолжительность жизни является наиболее адекватной обобщающей характеристикой современного уровня смертности во всех возрастах.
2. Аналитическая группировка, характеризующая зависимость между факторным и результативным признаком
Таблица 1
Уровень заболеваемости (на 1000 человек) | Число регионов, входящих в группу | Численность населения | Средняя ожидаемая продолжительность жизни при рождении | Общая продолжительность жизни при рождение | Изменение средней ожидаемой жизни при рождение по сравнению с группой с минимальной ожидаемой продолжительностью жизни при рождение |
485,5–624,9 | 12 | 23973,4 | 64,91 | 843,77 | 118,2 |
624,9–696,8 | 10 | 20281,1 | 64,11 | 769,36 | 129,0 |
696,8–760,8 | 11 | 34529,2 | 64,51 | 838,61 | 139,4 |
760,8–820,9 | 12 | 24452,0 | 64,30 | 900,26 | 148,0 |
820,9–866 | 10 | 20481,7 | 64,51 | 774,1 | 164,4 |
866–1057,3 | 11 | 17667,9 | 63,31 | 823 | 75,0 |
Итого: | 66 | 141385,3 | 385,65 | 4949,1 | 774,0 |
№ группы | | | | V | Выводы об однородности данных в группах |
1 | 64,91 | 4,22 | 17,83 | 6,50% | Коэффициент вариации V=σ/x * 100% < 17% следовательно данные абсолютно однородны |
2 | 64,11 | 3,39 | 11,46 | 5,28% | |
3 | 64,51 | 2,30 | 5,29 | 3,57% | |
4 | 64,30 | 2,17 | 4,70 | 3,37% | |
5 | 64,51 | 2,82 | 7,96 | 4,37% | |
6 | 63,31 | 1,91 | 3,66 | 3,02% | |
| 385,65 | | | | |
Вывод: Таблица №1 отражает определенную зависимость между уровнем заболеваемости и ожидаемой продолжительностью жизни при рождение всего, зависимость прямая и так как количество регионов в группе сопоставимо (данные однородны).
3. Аналитическая группировка, характеризующая зависимость между территориальным и результативным признаком
Таблица 2
Название федерального округа | Кол-во регионов | Численность населения | Средняя продолжительность жизни при рождении | Изменение средней ожидаемой жизни при рождение по сравнению с группой с минимальной ожидаемой продолжительностью жизни при рождение |
Центральный | 17 | 37545,8 | 64,59 | 104,3 |
Северо-Западный | 10 | 13731 | 62,19 | 100,4 |
Южный | 13 | 22820,8 | 68,26 | 110,2 |
Приволжский | 14 | 30710,2 | 65,16 | 105,2 |
Уральский | 4 | 12279,2 | 64,67 | 104,4 |
Сибирский | 12 | 19794,2 | 62,06 | 100,2 |
Дальневосточный | 9 | 6593 | 61,95 | 103,5 |
Итого: | 79 | 143474,2 | 448,89 | 728,2 |
№ группы | | | | V | Выводы об однородности данных в группах |
1 | 64,59 | 2,05 | 4,19 | 3,17% | Коэффициент вариации V=σ/x * 100% < 17% следовательно данные абсолютно однородны |
2 | 62,19 | 1,61 | 2,58 | 2,58% | |
3 | 68,26 | 2,58 | 6,66 | 3,78% | |
4 | 65,16 | 1,33 | 1,78 | 2,05% | |
5 | 64,67 | 0,88 | 0,78 | 1,36% | |
6 | 62,06 | 3,21 | 10,28 | 5,17% | |
7 | 61,95 | 1,40 | 1,97 | 0,02% |
4. Построить вариационный ряд, характеризующий распределение регионов(стран) по величине признака, указанного в варианте (Уровень заболеваемости (на 1000 человек населения) болезни органов дыхания)
| Группа регионов по уровню заболеваемости (на 1000 человек населения): болезни органов дыхания% | Число регионов в группе | Среднее значение исследуемого признака | |
1 | 180,6 | 230,4 | 12 | 210,125 |
2 | 230,4 | 266,6 | 12 | 249,208 |
3 | 266,6 | 277,4 | 11 | 273,155 |
4 | 277,4 | 317,2 | 14 | 303,692 |
5 | 317,2 | 348,2 | 14 | 328,179 |
6 | 348,2 | 439,8 | 14 | 383,750 |
Итого: | 77 | |
Анализ однородности данных в группах
№ группы | | V | Выводы об однородности данных в группах | ||
1 | 210,13 | 15,10 | 227,97 | 7,19% | Коэффициент вариации V=σ/x * 100% < 17% следовательно данные абсолютно однородны |
2 | 249,21 | 11,83 | 139,88 | 4,75% | |
3 | 273,16 | 3,01 | 9,09 | 1,10% | |
4 | 303,69 | 8,32 | 69,27 | 2,74% | |
5 | 328,18 | 3,02 | 9,12 | 0,92% | |
6 | 383,75 | 27,67 | 765,85 | 7,21% |
Для построенного ряда определим:
· показатели центра распределения
· показатели вариации
· показатели дифференциации и концентрации
· показатели формы распределения
По результатам расчетов сделаем вывод о характере распределения регионов по величине признака.
Показатели центра распределения:
К показателям центра распределения относятся: средняя арифметическая, мода и медиана.
Средняя арифметическая –
%
Мода – наиболее часто встречающееся значение признака. Так как данный ряд имеет неравные интервалы, то модальным будет интервал с максимальной плотностью распределения.
Мода находится в 3 интервале (наибольшая плотность распределения, равная 1,02, соответствует именно ему). Конкретное значение моды определяется по формуле:
Медиана соответствует варианту, стоящему в середине ранжированного ряда. Положение медианы определяется её номером:
Следовательно, медианным является 5-ый интервал 317,2–348,2. Численное же значение медианы определяется по формуле:
319,414%
ВЫВОД: в качестве показателя центра распределения можно выбрать любой из полученных показателей, т. к. их численные значения примерно равны.
Показатели вариации (колеблемости) признака:
Абсолютные показатели:
Размах колебаний (размах вариации):
R=Xmax-Xmin
R= 439,8–180,6 = 259,2
Для расчета показателей вариации построим дополнительную таблицу:
Среднее линейное отклонение:
Дисперсия:
Среднее квадратичное отклонение:
%
Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем отличаются индивидуальные значения признака от среднего его значения.
Квартильное отклонение:
Квартиль – значения признака, которые делят ранжированный ряд на четыре равные по численности части.
Сначала определим положение квартилей:
Это 2 ой интервал 230,4 – 266,6
Это 3 ий интервал 266,6 – 277,4
Это 4 интервал 277,4 – 317,2
Теперь найдём значение квартилей:
, где
xQ – нижняя граница интервала, в котором находится квартиль
SQ-1 – накопленная частота интервала, предшествующего тому, в котором находится квартиль
fQ – частота интервала, в котором находится квартиль
Итак,
Квартильное отклонение применяется вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений.
Относительные показатели вариации:
Коэффициент осцилляции:
Коэффициент вариации:
Вывод: совокупность данных является однородной, т. к. коэффициент вариации не превышает 33%.
Относительное линейное отклонение:
Относительный показатель квартильной вариации:
Показатели дифференциации и концентрации:
Для оценки дифференциации используем фондовый коэффициент дифференциации и коэффициент децильной дифференциации.
Фондовый коэффициент дифференциации.
8 регионов – 10% от общего числа регионов.
Среднее значение признака для 10% самых мелких единиц совокупности (180,6; 189,2; 199; 202,9; 210,1; 213,8; 215,1; 223,3; 224,4; 229,5):
208,28
Среднее значение признака для 10% самых крупных единиц совокупности (369,5; 372; 372,8; 384,4; 394,3; 396; 398,4; 399,3; 437,7; 439,8):
396,46
Коэффициент децильной дифференциации.
– номер первой децили. Она находится в 1-ом интервале 180,6 – 230,4
– номер девятой децили. Она находится в 5-ом интервале 317,2 – 348,2
Вывод: наименьший показатель признака 10% регионов с наибольшими значениями по уровню заболеваемости на 1000 человек населения: болезни органов дыхания в 5,48 раза выше наивысшего показателя уровня заболеваемости на 1000 человек населения: болезни органов дыхания 10% регионов с наименьшими значениями признака.
Для оценки концентрации единиц по значению признака используем коэффициент концентрации Джинни и коэффициент Герфендаля.
Коэффициент Джинни:
Концентрацию можно считать несущественной, т. к. 0,08<0,3
Коэффициент Герфендаля (фактический):
= 0,179
Коэффициент Герфендаля при равномерном распределении:
, где 6 – число интервалов;
Сравним фактическое значение коэффициента Герфендаля с рассчитанным значением коэффициента для равномерного распределения. Т.к. 0,179 > 0,167, то концентрация очень высокая.
Показатели формы распределения.
Относительный показатель асимметрии:
Величина показателя асимметрии положительна, следовательно асимметрия правосторонняя.
Рассчитаем показатель асимметрии другим способом:
523514,77
2,62
Средняя квадратическая ошибка асимметрии:
Вывод: с вероятностью 99,7% асимметрия существенна (так как 9,70 > 3) и распределение признака в генеральной совокупности не является симметричным. Вследствие несимметричности распределения показатели эксцесса не рассчитываются.
К показателям центра распределения относятся: средняя арифметическая, мода и медиана.
Номер группы | 1 | 2 | 3 | 4 | 5 | 6 |
Центр интервала, x ’ | 205,5 | 248,5 | 272 | 297,3 | 332,7 | 394 |
Число регионов в группе, f | 12 | 12 | 11 | 14 | 14 | 14 |
Средняя арифметическая –
%
Мода – наиболее часто встречающееся значение признака. Так как данный ряд имеет неравные интервалы, то модальным будет интервал с максимальной плотностью распределения.
Номер интервала (группы) | 1 | 2 | 3 | 4 | 5 | 6 |
Плотность распределения, p | 0,24 | 0,33 | 1,02 | 0,35 | 0,45 | 0,15 |
Длина интервала, i | 49,8 | 36,2 | 10,8 | 39,8 | 31 | 91,6 |
Накопленная частота, F | 12 | 24 | 34 | 38 | 52 | 66 |
Мода находится в 3 интервале (наибольшая плотность распределения, равная 1,02, соответствует именно ему). Конкретное значение моды определяется по формуле:
Медиана соответствует варианту, стоящему в середине ранжированного ряда. Положение медианы определяется её номером:
Следовательно, медианным является 5-ый интервал 317,2–348,2. Численное же значение медианы определяется по формуле:
319,414%
ВЫВОД: в качестве показателя центра распределения можно выбрать любой из полученных показателей, т. к. их численные значения примерно равны.
Показатели вариации (колеблемости) признака:
Абсолютные показатели:
Размах колебаний (размах вариации):
R=Xmax-Xmin
R= 439,8–180,6 = 259,2
Для расчета показателей вариации построим дополнительную таблицу:
Группа регионов по уровню заболеваемости (на 1000 человек населения): болезни органов дыхания | Число регионов, f | x' | x' * f | d =| x' – x | | d*f | d2 * f | ||
180,6 | 230,4 | 12 | 90,3 | 1083,6 | 205,49 | 2465,88 | 506713,68 | |
230,4 | 266,6 | 12 | 115,2 | 1382,4 | 180,59 | 2167,08 | 391352,98 | |
266,6 | 277,4 | 11 | 133,3 | 1466,3 | 162,49 | 1787,39 | 290433,00 | |
277,4 | 317,2 | 14 | 138,7 | 1941,8 | 157,09 | 2199,26 | 345481,75 | |
317,2 | 348,2 | 14 | 158,6 | 2220,4 | 137,19 | 1920,66 | 263495,35 | |
348,2 | 439,8 | 14 | 174,1 | 2437,4 | 121,69 | 1703,66 | 207318,39 | |
Итого: | 77 | | 10531,9 | 964,54 | 12243,93 | 2004795,14 |
Среднее линейное отклонение:
Дисперсия:
Среднее квадратичное отклонение:
%
Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем отличаются индивидуальные значения признака от среднего его значения.
Квартильное отклонение:
Квартиль – значения признака, которые делят ранжированный ряд на четыре равные по численности части.
Сначала определим положение квартилей:
Это 2 ой интервал 230,4 – 266,6
Это 3 ий интервал 266,6 – 277,4
Это 4 интервал 277,4 – 317,2
Теперь найдём значение квартилей:
, где
xQ – нижняя граница интервала, в котором находится квартиль
SQ-1 – накопленная частота интервала, предшествующего тому, в котором находится квартиль
fQ – частота интервала, в котором находится квартиль
Итак,
Квартильное отклонение применяется вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений.
Относительные показатели вариации:
Коэффициент осцилляции:
Коэффициент вариации:
Вывод: совокупность данных является однородной, т. к. коэффициент вариации не превышает 33%.
Относительное линейное отклонение:
Относительный показатель квартильной вариации:
Показатели дифференциации и концентрации:
Для оценки дифференциации используем фондовый коэффициент дифференциации и коэффициент децильной дифференциации.
Фондовый коэффициент дифференциации.
8 регионов – 10% от общего числа регионов.
Среднее значение признака для 10% самых мелких единиц совокупности (180,6; 189,2; 199; 202,9; 210,1; 213,8; 215,1; 223,3; 224,4; 229,5):
208,28
Среднее значение признака для 10% самых крупных единиц совокупности (369,5; 372; 372,8; 384,4; 394,3; 396; 398,4; 399,3; 437,7; 439,8):
396,46
Коэффициент децильной дифференциации.
– номер первой децили. Она находится в 1-ом интервале 180,6 – 230,4
– номер девятой децили. Она находится в 5-ом интервале 317,2 – 348,2
Вывод: наименьший показатель признака 10% регионов с наибольшими значениями по уровню заболеваемости на 1000 человек населения: болезни органов дыхания в 5,48 раза выше наивысшего показателя уровня заболеваемости на 1000 человек населения: болезни органов дыхания 10% регионов с наименьшими значениями признака.
Для оценки концентрации единиц по значению признака используем коэффициент концентрации Джинни и коэффициент Герфендаля.
Коэффициент Джинни:
Концентрацию можно считать несущественной, т. к. 0,08<0,3
Коэффициент Герфендаля (фактический):
= 0,179
Коэффициент Герфендаля при равномерном распределении:
, где 6 – число интервалов;
Сравним фактическое значение коэффициента Герфендаля с рассчитанным значением коэффициента для равномерного распределения. Т.к. 0,179 > 0,167, то концентрация очень высокая.
Показатели формы распределения.
Относительный показатель асимметрии:
Величина показателя асимметрии положительна, следовательно асимметрия правосторонняя.
Рассчитаем показатель асимметрии другим способом:
523514,77
2,62
Средняя квадратическая ошибка асимметрии:
Вывод: с вероятностью 99,7% асимметрия существенна (так как 9,70 > 3) и распределение признака в генеральной совокупности не является симметричным. Вследствие несимметричности распределения показатели эксцесса не рассчитываются.