Реферат Статические ряды распределения
Работа добавлена на сайт bukvasha.net: 2015-10-28Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
от 25%
договор
Оглавление
Введение…………………………………………………………………………. 3
1. Понятие статистических рядов распределения, их виды………………….. 5
1.1. Атрибутивные ряды распределения…………………………………….. 6
1.2. Вариационные ряды распределения…………………………………….. 7
1.3. Расчет средних величин…………………………………………………. 9
1.4. Расчет моды и медианы………………………………………………….10
1.5. Графическое изображение статистических данных…………………...12
1.6. Расчет показателей вариации……………………………………………16
2. Расчетная часть……………………………………………………………….18
3. Аналитическая часть…………………………………………………………35
Заключение……………………………………………………………………….41
Список литературы………………………………………………………………43
ВВЕДЕНИЕ
Статистические ряды распределения являются одним из наиболее важных элементов статистики. Они представляют собой составную часть метода статистических сводок и группировок, но, по сути, ни одно из статистических исследований невозможно произвести, не представив первоначально полученную в результате статистического наблюдения информацию в виде статистических рядов распределения.
Первичные данные обрабатываются в целях получения обобщенных характеристик изучаемого явления по роду существенных признаков для дальнейшего осуществления анализа и прогнозирования; производится сводка и группировка; статистические данные оформляются с помощью рядов распределения в таблицы, в результате чего информация представляется в наглядном рационально изложенном виде, удобном для использования и дальнейшего исследования; строятся различного рода графики для наиболее наглядного восприятия и анализ информации. На основе статистических рядов распределения вычисляются основные величины статистических исследований: индексы, коэффициенты; абсолютные, относительные, средние величины и т.д., с помощью которых можно проводить прогнозирование, как конечный итог статистических исследований.
Актуальность данной темы обусловлена тем, что статистические ряды распределения являются базисным методом для любого статистического анализа. Понимание данного метода и навыки его использования необходимы для проведения статистических исследований.
В теоретической части курсовой работы рассмотрены следующие аспекты:
1) Понятие статистических рядов распределения, их виды;
2) Атрибутивные и вариационные ряды распределения;
3) Расчет средних величин, моды и медианы;
4) Графическое представление рядов распределения;
Расчетная часть курсовой работы включает решение задачи по теме из варианта расчетного задания.
Аналитическая часть работы включает в себя расчет средних величин, моды и медианы на основе данных, представленных в таблице «Результаты выборочного бюджетного обследования населения РФ», отображающей распределение населения РФ по среднедушевому доходу. В качестве источника статистических данных использован «Российский статистический ежегодник. Статистический сборник 2001».
При написании курсовой работе были использованы учебник базового курса, дополнительная литература, а также Интернет-ресурсы.
1.ПОНЯТИЕ СТАТИСТИЧЕСКИХ РЯДОВ РАСПРЕДЕЛЕНИЯ И ИХ ВИДЫ
Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических рядов распределения. Статистические ряды распределения представляют собой упорядоченное распределение единиц изучаемой совокупности на группы по группировочному (варьирующему) признаку. Они характеризуют состав (структуру) изучаемого явления, позволяют судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта. В зависимости от признака статистические ряды распределения делятся на:
- атрибутивные (качественные);
- вариационные (количественные)
а) дискретные;
б) интервальные.
1.1.
Атрибутивные ряды распределения
Атрибутивные ряды образуются по качественным признакам, которыми могут выступать занимаемая должность работников торговли, профессия, пол, образование и т.д.
Таблица 1.
Распределение работников предприятия по образованию.
Образование работников | Количество работников | |
абсолютное | в % к итогу | |
высшее | 20 | 15,4 |
неполное высшее | 25 | 19,2 |
среднее специальное | 35 | 26,9 |
среднее | 50 | 38,5 |
ИТОГО | 130 | 100 |
В данном примере группировочным признаком выступает образование работников предприятия (высшее, среднее). Данные ряды распределения являются атрибутивными, поскольку варьирующий признак представлен не количественными, а качественными показателями. Наибольшее число составляют работники со средним образованием (порядка 40%); остальные работники распределяются на группы по данному качественному признаку: со средним специальным образованием - 25%; с неполным высшим - 20%; с высшим - 15%.
1.2. Вариационные ряды распределения
Вариационные ряды строятся на основе количественного группировочного признака. Вариационные ряды состоят из двух элементов: вариант и частот.
Варианта - это отдельное значение варьируемого признака, которое он принимает в ряду распределения. Они могут быть положительными и отрицательными, абсолютными и относительными.
Частота - это численность отдельных вариант или каждой группы вариационного ряда. Частоты, выраженные в долях единицы или в процентах к итогу, называются частостями. Сумма частот называется объемом совокупности и определяет число элементов всей совокупности.
Частости – это частоты, выраженные в виде относительных величин (долях единиц или процентах). Сумма частостей равна единице или 100 %. Замена частот частостями позволяет сопоставлять вариационные ряды с разным числом наблюдений.
Вариационные ряды в зависимости от характера вариации подразделяются на дискретные (прерывные) и интервальные (непрерывные).
Дискретные ряды распределения основаны на дискретных (прерывных) признаках, имеющих только целые значения (например, тарифный разряд рабочих, число детей в семье).
Интервальные ряды распределения базируются на непрерывно изменяющемся значении признака, принимающем любые (в том числе и дробные) количественные выражения, т.е. значение признаков таких рядах задается в виде интервала.
При наличии достаточно большого количества вариантов значений признака первичный ряд является труднообозримым, и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности. Поэтому первым шагом в упорядочении первичного ряда является его ранжирование – расположение всех вариантов в возрастающем (убывающем) порядке.
Для построения дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты значений признака Xi, а затем подсчитывается частота повторения варианта fi. Ряд распределения принято оформлять в виде таблицы, состоящей из двух колонок (или строк), в одной из которых представлены варианты, а в другой - частоты.
Для построения ряда распределения непрерывно изменяющихся признаков, либо дискретных, представленных в виде интервалов, необходимо установить оптимальное число групп (интервалов), на которые следует разбить все единицы изучаемой совокупности.
1.3.
Расчет средних величин
Как правило, средние величины рассчитываются для получения обобщенных количественных характеристик уровня какого либо варьирующего признака по совокупности однородных по основным свойствам единиц конкретного явления или процесса. В статистике все средние величины обозначаются как `X. Существует несколько видов средних величин.
Основной средней величиной является средняя степенная. Она имеет следующий вид:
(1) ,
где `Х - средняя величина;
X - меняющаяся величина признака варианты;
n - число признаков или вариант;
m - показатель степени средней.
В зависимости от величины показателя степени средней она принимает следующие виды:
а). Средняя арифметическая невзвешенная, где m = 1.
Она имеет вид:
(2)
б). Средняя арифметическая взвешенная.
Она имеет вид:
(3)
где f - частоты или веса
1.4.
Расчет моды и медианы
Особым видом средних величин являются структурные средние. Они применяются для изучения внутреннего строения и структуры рядов распределения значений признака. К таким показателям относятся мода и медиана.
Мода - это величина признака (варианта), который наиболее часто встречается в данной совокупности, т.e. это варианта, имеющая наибольшую частоту.
В интервальном ряду распределения мода находится по следующей формуле:
(4) ,
где: минимальная граница модального интервала;
- величина модального интервала;
fMo -
fMo-1 - } частоты модального интервала, предшествующего и
следющего за ним
fMo+1 -
Модальный интервал определяется по наибольшей частоте. Мода широко используется в статистической практике при изучении покупательского спроса, регистрации цен и т.д.
Медиана - варианта, находящаяся в середине ряда распределения.
Медиана делит ряд на две равные (по числу единиц) части – со значениями признака меньше медианы и со значениями признака больше медианы.
В случае если вариационный ряд имеет число значений вариант четное, то расчет медианы производится по следующей формуле:
(5) , где - варианты, находящиеся в середине ряда.
В интервальном ряду распределения медиана рассчитывается следующим образом:
(6) ,
где: - нижняя граница медианного интервала;
- величина медианного интервала;
- полусумма частот ряда;
- сумма накопленных частот, предшествующих медианному интервалу;
- частота медианного интервала.
Структурные средние величины (мода и медиана) имеют довольно большое значение в статистике и широкое применение. Мода является именно тем числом, которое в действительности встречается наиболее часто. Медиана имеет важные свойства для анализа явлений: она обнаруживает типичные черты индивидуальных признаков явления, и, вместе с тем, учитывает влияние крайних значений совокупности. Медиана находит практическое применение в маркетинговой деятельности вследствие особого свойства – сумма абсолютных отклонений чисел ряда от медианы есть величина наименьшая:
Мода и медиана, как правило, отличаются от значения средней, совпадая с ней только в случае симметричного расположения частот вариационного ряда.
1.5.
Графическое изображение статистических данных
Ряды распределения удобно изучать с помощью графического метода.
Статистический график – это чертеж, на котором статистические совокупности, характеризуемые определенными показателями, описываются с помощью условных геометрических образов или знаков. Представление данных таблиц в виде графика производит более сильное впечатление, чем цифры, позволяет лучше осмыслить результаты статистического наблюдения, правильно их истолковывать, значительно облегчает понимание статистического материала, делает его наглядным и доступным. Это, однако, вовсе не означает, что графики имеют лишь иллюстративное значение. Они дают новое знание о предмете исследования, являясь методом обобщения исходной информации.
Значение графического метода в анализе и обобщении данных велико. Графическое изображение позволяет осуществить контроль достоверности статистических показателей, так как, представленные на графике, они более ярко показывают имеющиеся неточности, связанные либо с наличием ошибок наблюдения, либо с сущностью изучаемого явления. С помощью графического изображения возможны изучение закономерностей развития явления, установление существующих взаимосвязей. Простое сопоставление данных не всегда дает возможность уловить наличие причинных зависимостей, в то же время их графическое изображение способствует выявлению причинных связей, в особенности в случае установления первоначальных гипотез, подлежащих затем дальнейшей разработке. Графики также широко используются для изучения структуры явлений, их изменения во времени и размещения в пространстве. В них более выразительно проявляются сравнительные характеристики и отчетливо виды основные тенденции развития и взаимосвязи, присущие изучаемому явлению или процессу.
Таблица 2.
| 2002 | 2003 | 2004 | 2005 | 2006 | 2007 | 200 8 |
Валовой внутренний продукт в рыночных ценах* | 10830,5 | 13243,3 | 17048,1 | 21625,42 | 26903,5 | 33111,4 | 41668,0 |
*Номинальный объем произведенного ВВПв рыночных ценах, млрд. рублей
Рис.1. График динамики произведенного объема ВВП.
Для изображения и внесения суждений о развитии явления во времени и составе совокупности наряду с графиками строятся диаграммы.
Используются диаграммы: столбиковые, ленточные, квадратные, круговые, линейные, радикальные и др. Выбор вида диаграммы зависит в основном от особенностей исходных данных, цели исследования. Например, если имеется ряд динамики с несколькими неравноотносящимися уровнями во времени (1913, 1940, 1950, 1980, 1985, 1997 гг.), то часто для наглядности используют столбиковые, квадратные или круговые диаграммы. Они зрительно впечатляют, хорошо запоминаются, но не годны для изображения большого числа уровней, так как громоздки. Когда число уровней в ряду динамики велико, целесообразно применять линейные диаграммы, которые воспроизводят непрерывность процесса развития в виде непрерывной ломанной линии. Кроме того, линейные диаграммы удобно использовать: если целью исследования является изображение общей тенденции и характера развития явления; когда на одном графике необходимо изобразить несколько динамических рядов с целью их сравнения; если наиболее существенным является сопоставление темпов роста, а не уровней.
Основное назначение структурных диаграмм заключается в графическом представлении состава статистических совокупностей, характеризующихся как соотношение различных частей каждой из совокупностей. Состав статистической совокупности графически может быть представлен с помощью как абсолютных, так и относительных показателей. В первом случае не только размеры отдельных частей, но и размер графика в целом определяются статистическими величинами и измеряются в соответствии с изменениями последних. Во втором – размер всего графика не меняется (так как сумма всех частей любой совокупности составляет 100%), а меняются только размеры отдельных его частей. Графическое изображение состава совокупности по абсолютным и относительным показателям способствует проведению более глубокого анализа и позволяет проводить международные сопоставления и сравнения социально – экономических явлений.
В качестве графического образа для изображения структуры совокупностей применяются прямоугольники – для построения столбиковых и полосовых диаграмм и круги – для построения секторных диаграмм.
Рис. 2 Распределение работников предприятия по образованию.
Круговая диаграмма.
Рис. 3. Распределение работников предприятия по образованию.
Гистограмма.
1.6.
Расчет показателей вариации
Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Исследование вариации в статистике имеет большое значение, помогает познать сущность изучаемого явления. Показатели вариации характеризуют колеблемость отдельных значений вариант около средних величин. Показатели вариации определяют различия индивидуальных значений признака внутри изучаемой совокупности.
Существует несколько видов показателей вариации:
а) Размах вариации R представляет собой разность между максимальным и минимальным значениями признака:
R = Xmax – Xmin
Размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду.
б) Среднее линейное отклонение
(7) - невзвешенное;
(8) - взвешенное,
где: Х - варианты;
`Х - средняя величина;
n - число признаков;
f - частоты.
Линейное отклонение учитывает различия всех единиц изучаемой совокупности.
в) Дисперсия - показатель вариации, выражающий средний квадрат отклонений вариант от средних величин в зависимости от образующего вариационного фактора.
(9) - невзвешенная;
(10) - взвешенная.
Показатель дисперсии более объективно отражает меру вариации на практике.
г) Среднее квадратическое отклонение
(11) - взвешенное;
(12) - невзвешенное.
Среднее квадратическое отклонение является показателем надежности средней: чем меньше среднее квадратическое отклонение, тем лучше средняя арифметическая отражает собой всю статистическую совокупность.
д) Показатель вариации.
(13)
Показатель вариации отражает тенденцию развития явления, т.e. действие главных факторов. Показатель вариации выражается в % или коэффициентах.
Рассмотрим методику построения интервального ряда распределения и его применение на примере, представленном в расчетной части данной работы.
расчетная часть
По результатам 10%-ого выборочного обследования торговых предприятий района, проведенного на основе случайной бесповторной выборки, получены следующие данные за отчетный месяц (тыс. руб.):
Табл. 1
№ п/п | Товарооборот | Средние товарные запасы |
1 | 614 | 256 |
2 | 396 | 168 |
3 | 681 | 252 |
4 | 543 | 221 |
5 | 540 | 210 |
6 | 706 | 278 |
7 | 576 | 214 |
8 | 537 | 169 |
9 | 744 | 288 |
10 | 523 | 213 |
11 | 375 | 150 |
12 | 429 | 208 |
13 | 552 | 218 |
14 | 642 | 227 |
15 | 618 | 238 |
16 | 653 | 254 |
17 | 704 | 251 |
18 | 759 | 293 |
19 | 384 | 158 |
20 | 492 | 188 |
21 | 610 | 237 |
22 | 591 | 239 |
23 | 550 | 191 |
24 | 603 | 236 |
25 | 528 | 215 |
26 | 795 | 301 |
27 | 611 | 228 |
28 | 589 | 230 |
29 | 627 | 263 |
30 | 698 | 246 |
Задание 1
По исходным данным постройте статистический ряд распределения организации по признаку товарооборот, образовав заданное число групп с равными интервалами.
Число групп – 5.
1) а) Распределим исходные данные по возрастанию по признаку Товарооборот.
Табл. 2
№ п/п | Товарооборот | Средние товарные запасы |
11 | 375 | 150 |
19 | 384 | 158 |
2 | 396 | 168 |
12 | 429 | 208 |
20 | 492 | 188 |
10 | 523 | 213 |
25 | 528 | 215 |
8 | 537 | 169 |
5 | 540 | 210 |
4 | 543 | 221 |
23 | 550 | 191 |
13 | 552 | 218 |
7 | 576 | 214 |
28 | 589 | 230 |
22 | 591 | 239 |
24 | 603 | 236 |
21 | 610 | 237 |
27 | 611 | 228 |
1 | 614 | 256 |
15 | 618 | 238 |
29 | 627 | 263 |
14 | 642 | 227 |
16 | 653 | 254 |
3 | 681 | 252 |
30 | 698 | 246 |
17 | 704 | 251 |
6 | 706 | 278 |
9 | 744 | 288 |
18 | 752 | 293 |
26 | 795 | 301 |
б) При построении ряда с равными интервалами величина интервала i определяется по формуле:
,
где
– наибольшее и наименьшее значения признака в исследуемой совокупности, n
- число групп интервального ряда.
тыс. руб.
Таким образом, границы интервалов ряда распределения имеют следующий вид:
1 группа: 375 – 459 (xmin – x1, где x1 = xmin+ i)
2 группа: 459 – 543 (x1 – x2, где x2 = x1 + i)
3 группа: 543 – 627 (x2 – x3, где x3 = x2 + i)
4 группа: 627 – 711 (x3 – x4, где x4 = x3 + i)
5 группа: 711 – 795 (x4 – x5, где x5 = x4 + i)
в) Строим интервальный ряд распределения предприятий выборочной совокупности по объему товарооборота, тыс. руб. (если значение показателя соответствует значению верхней границы интервала одной группы и нижнему значению границы интервала другой группы, то эту организацию мы относим к последнему).
Табл. 3
№ группы | Группы по объему товарооборота | Кол-во предприятий в группе |
1 | 375-459 | 4 |
2 | 459-543 | 5 |
3 | 543-627 | 11 |
4 | 627-711 | 7 |
5 | 711-795 | 3 |
| Итого | 30 |
Вывод: Ряд распределения показывает, что наибольшее кол-во предприятий в выборочной совокупности имеют объем товарооборота от 543 до 627 тыс. руб.
2) Рассчитайте характеристики интервального ряда распределения: среднее арифметическое, среднее квадратическое отклонение, коэффициент вариации, моду и медиану. Сделайте выводы по результатам выполненного задания.
а) Среднее арифметическое определяется по следующей формуле:
где - сумма произведений средних показателей товарооборота предприятий в группе на количество предприятий в группе, - общее число предприятий.
Для характеристики средних величин определяем середину интервала и численности накопленных частот.
Табл. 4
№ группы | Группы предприятий по объему товарооборота | Кол-во предприятий в группе | Середина интервала | Накопленные частоты |
1 | 375-459 | 4 | 417 | 4 |
2 | 459-543 | 5 | 501 | 9 |
3 | 543-627 | 11 | 585 | 20 |
4 | 627-711 | 7 | 669 | 27 |
5 | 711-795 | 3 | 753 | 30 |
| Итого | 30 | | |
(тыс. руб.)
Вывод: в среднем объем товарооборота на предприятиях составляет 585 тыс. руб.
б) Среднее квадратическое отклонение:
(тыс. руб.)
Вывод: объем товарооборота выборочной совокупности отклоняется в среднем от среднего значения на ±98,9948 тыс. руб.
в) Коэффициент вариации:
Вывод: коэффициент вариации составляет < 33%, следовательно, совокупность считается однородной, а средняя типичной для этой совокупности.
г) Мода:
Для определения моды графическим методом строим по данным табл. 4 (графы 2 и 3) гистограмму распределения предприятий по изучаемому признаку.
Рис. 1. Гистограмма распределения предприятий по объему товарооборота, тыс. руб.
Расчет конкретного значения моды для интервального ряда распределения производится по формуле:
где хМo – нижняя граница модального интервала,
i
– величина модального интервала,
fMo – частота модального интервала,
fMo-1 – частота интервала, предшествующего модальному,
fMo+1 – частота интервала, следующего за модальным.
Согласно табл. 4 модальным интервалом построенного ряда является интервал 543 – 627 руб., т.к. он имеет наибольшую частоту (f3=11).
(тыс. руб.)
Вывод: мода, равная 593,4 тыс. руб. показывает, что наиболее часто в выборочной совокупности предприятий объем товарооборота будет составлять 593,4 тыс. руб.
д) медиана: для определения медианы графическим методом строим по данным табл. 4 (графы 2 и 5) кумуляту распределения предприятий по изучаемому признаку.
Рис. 2. Кумулята распределения предприятий по объему
товарооборота, тыс. руб.
Расчет конкретного значения медианы для интервального ряда распределения производится по формуле:
,
где х
Ме– нижняя граница медианного интервала,
i – величина медианного интервала,
∑f
- сумма всех частот,
fМе – частота медианного интервала,
S
Mе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному.
Определяем медианный интервал, используя графу 5 табл. 4. Медианным интервалом является интервал 543 – 627 тыс. руб., т.к. именно в этом интервале накопленная частота S3=20 впервые превышает полусумму всех частот .
(тыс. руб.)
Вывод: медиана показывает, что половина выборочной совокупности предприятий имеет значение по объему товарооборота <588,82 тыс. руб., а другая половина >588,82 тыс. руб.
Задание 2
1) Установите наличие и характер корреляционной связи между признаками товарооборот (факторный) и средние товарные запасы (результативный) методом аналитической группировки, образовав по факторному признаку заданное число групп с равными интервалами.
а) Построим разработочную таблицу.
Разработочная таблица Табл. 5
№ группы | Группы предприятий по объему товарооборота | № предприятия | Товарооборот | Средние товарные запасы |
1 | 375 - 459 | 11 | 375 | 150 |
| | 19 | 384 | 158 |
| | 2 | 396 | 168 |
| | 12 | 429 | 208 |
| Итого по 1ой группе | 4 | 1584 | 684 |
2 | 459 - 543 | 20 | 492 | 188 |
| | 10 | 523 | 213 |
| | 25 | 528 | 215 |
| | 8 | 537 | 169 |
| | 5 | 540 | 210 |
| Итого по 2ой группе | 5 | 2620 | 995 |
3 | 543 - 627 | 4 | 543 | 221 |
| | 23 | 550 | 191 |
| | 13 | 552 | 218 |
| | 7 | 576 | 214 |
| | 28 | 589 | 230 |
| | 22 | 591 | 239 |
| | 24 | 603 | 236 |
| | 21 | 610 | 237 |
| | 27 | 611 | 228 |
| | 1 | 614 | 256 |
| | 15 | 618 | 238 |
| Итого по 3ей группе | 11 | 6457 | 2508 |
4 | 627 - 711 | 29 | 627 | 263 |
| | 14 | 642 | 227 |
| | 16 | 653 | 254 |
| | 3 | 681 | 252 |
| | 30 | 698 | 246 |
| | 17 | 704 | 251 |
| | 6 | 706 | 278 |
| Итого по 4ой группе | 7 | 4711 | 1771 |
5 | 711 - 795 | 9 | 744 | 288 |
| | 18 | 759 | 293 |
| | 26 | 795 | 301 |
| Итого по 5ой группе | 3 | 2298 | 882 |
б) Построим аналитическую группировку, используя данные разработочной таблицы.
Аналитическая группировка выборочной совокупности предприятий по объему
товарооборота, тыс. руб. Табл. 6
№ группы | Группы по объему товарооборота | Кол-во предприятий в группе | Товарооборот в группе, тыс. руб. | Средние товарные запасы | ||
всего | в среднем по группе | всего | в среднем по группе | |||
1 | 375 – 459 | 4 | 1584 | 396 | 684 | 171 |
2 | 459 – 543 | 5 | 2620 | 524 | 995 | 199 |
3 | 543 – 627 | 11 | 6457 | 587 | 2508 | 228 |
4 | 627 – 711 | 7 | 4711 | 673 | 1771 | 253 |
5 | 711 – 795 | 3 | 2298 | 763,67 | 882 | 294 |
| Итого и в среднем | 30 | 17670 | 589 | 6840 | 228 |
Вывод: аналитическая группировка предприятий по объему товарооборота показывает, что с увеличением в среднем по группам группировочного признака также увеличивается и среднее значение товарооборота (результативного признака).
2) Измерьте тесноту корреляционной связи между названными признаками (товарооборот и средние товарные запасы) с использованием коэффициента детерминации η2 и имперического корреляционного отношения η.
Для расчета η и η2 построим промежуточную таблицу.
Расчетная таблица. Табл. 6
№ группы | Группы по объему товарооборота, тыс. руб. | № предприятия | Средние товарные запасы | | |
1 | 375 – 459 | 11 | 150 | 441 | 6084 |
| | 19 | 158 | 169 | 4900 |
| | 2 | 168 | 9 | 3600 |
| | 12 | 208 | 1369 | 400 |
| Итого | 4 | 684 | 497 | 14984 |
2 | 459 – 543 | 20 | 188 | 121 | 1600 |
| | 10 | 213 | 196 | 225 |
| | 25 | 215 | 256 | 169 |
| | 8 | 169 | 900 | 3481 |
| | 5 | 210 | 121 | 324 |
| Итого | 5 | 995 | 318,8 | 5799 |
3 | 543 – 627 | 4 | 221 | 49 | 49 |
| | 23 | 191 | 1369 | 1369 |
| | 13 | 218 | 100 | 100 |
| | 7 | 214 | 196 | 196 |
| | 28 | 230 | 4 | 4 |
| | 22 | 239 | 121 | 121 |
| | 24 | 236 | 64 | 64 |
| | 21 | 237 | 81 | 81 |
| | 27 | 228 | 0 | 0 |
| | 1 | 256 | 784 | 784 |
| | 15 | 238 | 100 | 100 |
| Итого | 11 | 2508 | 260,7273 | 2868 |
4 | 627 – 711 | 29 | 263 | 100 | 1225 |
| | 14 | 227 | 676 | 1 |
| | 16 | 254 | 1 | 676 |
| | 3 | 252 | 1 | 576 |
| | 30 | 246 | 49 | 324 |
| | 17 | 251 | 4 | 529 |
| | 6 | 278 | 625 | 2500 |
| Итого | 7 | 1771 | 208 | 5831 |
5 | 711 – 795 | 9 | 288 | 36 | 3600 |
| | 18 | 293 | 1 | 4225 |
| | 26 | 301 | 49 | 5329 |
| Итого | 3 | 882 | 28,6667 | 13154 |
По результатам таблицы:
Коэффициент детерминации характеризует силу влияния факторного (группировочного) признака Х на результативный признак Y и рассчитывается как доля межгрупповой дисперсии признака Y в его общей дисперсии :
где
– общая дисперсия признака Y,
– межгрупповая (факторная) дисперсия признака Y.
Рассчитываем межгрупповую дисперсию:
Рассчитываем общую дисперсию:
,
где
Т. о.
Корень квадратный из коэффициента детерминации – есть эмпирическое корреляционное отношение.
Вывод: эмпирическое корреляционное отношение η = 0,9014 показывает наличие сильной связи между размером товарооборота (тыс. руб.) и размером средних товарных запасов.
Коэффициент детерминации η2 = 0,8126 показывает, что только на 81,26% изменение размеров товарооборота обусловливает изменение средних товарных запасов, а на остальные 18,74% другими факторами.
Задание 3
По результатам выполнения задания 1 с вероятностью 0,954 определите:
а) ошибку выборки средней величины товарооборота торгового предприятия и границы, в которых будет находиться средняя величина товарооборота предприятия по району в целом.
Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная средняя:
,
где –
выборочная средняя,
–
генеральная средняя.
Предельная ошибка выборки Δ определяется по формуле:
где – общая дисперсия изучаемого признака,
N – число единиц в генеральной совокупности,
n – число единиц в выборочной совокупности,
t – коэффициент кратности.
Выборка 10%-ая, механическая, следовательно, n/N=0,1.
Вероятность р=954, следовательно, t=2.
Значения параметров, необходимых для решения задачи (определены в задании 1):
= 585 тыс. руб.
= ± 96,9948
= 9407,9912
(тыс. руб.)
585 - 33,6 ≤≥ 585 + 33,6
551,4 ≤≥ 618,6
Вывод: с вероятностью 0,954 можно утверждать, что средний объем товарооборот предприятия в генеральной совокупности будет находиться в пределах от 551,4 до 618,6.
б) ошибку выборки доли торговых предприятий района с объемом товарооборота 627 и более тыс. руб. и границы, в которых будет находиться генеральная доля.
Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная доля р единиц, обладающих исследуемым признаком:
w – ≤ p ≤ w +
Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой:
,
где m – число единиц совокупности, обладающих заданным свойством;
n – общее число единиц в совокупности.
Предельная ошибка выборки доли единиц, обладающих заданным свойством, рассчитывается по формуле:
,
где w –
доля единиц совокупности, обладающих заданным свойством
;
(1-w
)
– доля единиц совокупности, не обладающих заданным свойством,
N – число единиц в генеральной совокупности,
n – число единиц в выборочной совокупности.
По условию Задания 3 исследуемым свойством фирм является равенство или превышение объема товарооборота 627 тыс. руб.
Число предприятий с данным свойством определяется из табл. 5: m=10.
Рассчитаем выборочную долю:
Рассчитаем предельную ошибку выборки для доли:
Определим доверительный интервал генеральной совокупности:
w – Δw ≤ p ≥ w + Δw
0,3333 - 0,1633 ≤ р ≥ 0,3333 + 0,1633
0,17 ≤ р ≥ 0,4966
Вывод: с вероятностью 0,954 можно утверждать, что доля предприятий с объемом товарооборота 627 и более тыс. руб. в генеральной совокупности будет находиться в пределах от 0,17 до 0,4966.
Задание 4
Аналитическая часть
В результате обобщения итогов выборочного бюджетного обследования населения РФ построен вариационный интервальный ряд, отражающий распределение жителей Российской Федерации по величине среднедушевого дохода.*
Среднедушевой доход в месяц, руб. | Население | |
В млн. чел. | В % | |
До 500 | 4,5 | 3,1 |
500-750 | 10,5 | 7,2 |
750-1000 | 14,3 | 9,8 |
1000-1500 | 30,1 | 20,7 |
1500-2000 | 24,7 | 17,0 |
2000-3000 | 30,7 | 21,1 |
3000-4000 | 14,9 | 10,2 |
Свыше 4000,0 | 15,9 | 10,9 |
Итого | 145,6 | 100 |
*Российский статистический ежегодник. Статистический сборник 2001.
Задание:
Рассчитайте характеристики интервального ряда распределения: среднее арифметическое, среднее квадратическое отклонение, коэффициент вариации, моду и медиану. Сделайте выводы по результатам выполненного задания.
Решение:
а) Среднее арифметическое определяется по следующей формуле:
где - сумма произведений средних показателей среднедушевого дохода в группе на численность населения в группе, - общее число численности населения.
Для характеристики средних величин определяем середину интервала и численности накопленных частот.
Табл. 1
№ группы | Среднедушевой доход в месяц, руб. | Население, млн. чел. | Середина интервала | Накопленные частоты |
1 | 250 – 500 | 4,5 | 375 | 4,5 |
2 | 500 – 750 | 10,5 | 625 | 15 |
3 | 750 – 1000 | 14,3 | 875 | 29,3 |
4 | 1000 – 1500 | 30,1 | 1250 | 59,4 |
5 | 1500 – 2000 | 24,7 | 1750 | 84,1 |
6 | 2000 – 3000 | 30,7 | 2500 | 114,8 |
7 | 3000 – 4000 | 14,9 | 3500 | 129,7 |
8 | 4000 – 5000 | 15,9 | 4500 | 145,6 |
| Итого | 145,6 | | |
Вывод: в среднем размер среднедушевого дохода в месяц составляет 2033,9 руб.
б) Среднее квадратическое отклонение:
Вывод: размер среднедушевого дохода в месяц отклоняется в среднем от среднего значения на ±940,24 руб.
в) Коэффициент вариации:
Вывод: коэффициент вариации составляет > 33%, следовательно, совокупность считается однородной, а средняя типичной для этой совокупности.
г) Мода:
Для определения моды графическим методом строим по данным табл. 1 (графы 2 и 3) гистограмму распределения населения по изучаемому признаку.
Рис. 1. Гистограмма распределения населения по среднедушевому доходу в месяц.
Расчет конкретного значения моды для интервального ряда распределения производится по формуле:
где хМo – нижняя граница модального интервала,
i
– величина модального интервала,
fMo – частота модального интервала,
fMo-1 – частота интервала, предшествующего модальному,
fMo+1 – частота интервала, следующего за модальным.
Согласно табл. 1 модальным интервалом построенного ряда является интервал 2000 – 3000 руб., т.к. он имеет наибольшую частоту (f3=30,7).
(руб.)
Вывод: мода, равная 2275,2294 руб. показывает, что наиболее часто в выборочной совокупности размер среднедушевого дохода в месяц будет составлять 2275,2294 руб.
д) медиана: для определения медианы графическим методом строим по данным табл. 1 (графы 2 и 5) кумуляту распределения населения по изучаемому признаку.
Рис. 2. Кумулята распределения населения по среднедушевому доходу в месяц.
Расчет конкретного значения медианы для интервального ряда распределения производится по формуле:
,
где х
Ме– нижняя граница медианного интервала,
i – величина медианного интервала,
∑f
- сумма всех частот,
fМе – частота медианного интервала,
S
Mе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному.
Определяем медианный интервал, используя графу 5 табл. 1. Медианным интервалом является интервал 1500 - 2000 руб., т.к. именно в этом интервале накопленная частота S5=84,1 впервые превышает полусумму всех частот .
( руб.)
Вывод: медиана показывает, что половина выборочной совокупности населения имеет значение по размеру среднедушевого дохода в месяц <1771,2551 руб., а другая половина >1771,2551 руб.
Заключение
Итак, статистические ряды распределения представляют собой один из наиболее важных элементов статистического исследования.
Статистические ряды распределения являются базисным методом для любого статистического анализа.
Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку, характеризует структуру изучаемого явления. Анализируя рассчитанные показатели статистического ряда распределения, можно делать выводы об однородности или неоднородности совокупности, закономерности распределения и границах варьирования единиц совокупности. Изучив основные приемы исследования и практики применения рядов распределения, а также методику вычисления наиболее важных статистических величин, необходимо отметить, что конечная цель изучения статистики в целом - анализ изучаемого явления - крайне важен для всех сфер человеческой жизни. Анализ отображает явления в целом и вместе с этим учитывает влияние каждого фактора в отдельности. На основании проведенного анализа можно учитывать и прогнозировать факторы, негативно влияющие на развитие событий.
Социально-экономическая статистика обеспечивает предоставление важной цифровой информации об уровне и возможностях развития страны: ее экономическом положении, уровне жизни населения, его составе и численности, рентабельности предприятий, динамике безработице и т.д. Статистическая информация является одним из решающих ориентиров государственной экономической политики.
Статистические методы используют комплексно (системно). Выделяют три основные стадии экономико-статистического исследования: сбор первичной статистической информации, статистическая сводка и обработка первичной информации, обобщение и интерпретация статистической информации.
Качество, достоверность статистической информации определяют эффективность использования статистики на любом уровне и в любой сфере.
В настоящее время ведется работа по совершенствованию статистической методологии и завершению перехода Российской Федерации на принятую в международной практике систему учета и статистики в соответствии с требованиями развития рыночной экономики.
Список использованной литературы
1. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики: Учебник. - М.: «Инфра-М» 1998г.
2. Гусаров В.М. Теория статистики: - М.: «Аудит», « ЮНИТИ» 1998г.
3. Теория статистики: Учебник под редакцией профессора Шамойловой Р.А. -М.: «Финансы и статистика» 1998г.
4. Практикум по статистике: Учебное пособие для вузов/ под редакцией В.М. Симчеры/ВЗФЭИ.-М.: ЗАО «Финстатинформ», 1999.
5. Общая теория статистики:/Статистическая методология в коммерческой деятельности: учебник для вузов/под редакцией А.С. Спирина и О.Е. Башиной. – М.: Финансы и статистика, 1994.
6. Российский статистический ежегодник 2002. Статистический сборник. Госкомстат
7. Сироткина Т.С., Каманина А.М. Основы теории статистики: учебное пособие. – М.: АО «Финстатинформ», 1995.
8. Ряузов Н.Н. Общая теория статистики: Учебник для вузов.-М.: Финансы и статистика, 1984.
9. Сайт: www.gks.ru