Курсовая на тему Статистика 8
Работа добавлена на сайт bukvasha.net: 2014-07-13Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
от 25%
договор
Министерство образования Российской Федерации
Южно-Уральский Государственный Университет
Кафедра «Экономика и финансы»
Статистическая обработка и статистический анализ данных
по материалам статистического наблюдения
Пояснительная записка к курсовому проекту
по курсу «Статистика»
Руководитель:
Автор проекта:
студент группы ЭиУ-378
Проект защищен
с оценкой
« »2006 г .
Челябинск
2006
В данном курсовом проекте была произведена обработка и анализ статистических данных, полученных в результате статистического наблюдения над показателем, характеризующим долю денежных доходов, расходуемых на прирост финансовых активов в2004 г .
Актуальность статистического анализа вышеприведенного показателя можно обосновать, исходя из определения финансовых активов. Это кассовая наличность, депозиты в банках, вклады, чеки, страховые полисы, паи или долевые и т.п. Следовательно, результаты анализа можно использовать для расчета оборачиваемости денежных средств, развития экономики.
Целью данного курсового проекта является освоение инструментов статистики для дальнейшего применения в решении управленческих задач. В качестве задач курсового проекта следует выделить следующее:
овладение методами выполнения оценок параметров больших множеств по данным выборочного наблюдения;
приобретение навыков работы с большими массивами данных и навыков представления данных статистического наблюдения в удобном для восприятия, анализа и принятия решений виде;
развитие аналитических навыков в ходе применения вариационного метода интерпретации полученных результатов.
по материалам статистического наблюдения
Руководитель: Лазарева Г.В.
Автор проекта: Проект защищен
Введение
Содержание
Сводка и группировка данных статистического наблюдения
Группировка с выделением регионов со значением показателя выше и ниже среднего
Группировка с выделением регионов со значением показателя выше и ниже показателя в Челябинской области
Вариационный анализ
Структурные характеристики
Характеристики рассеяния
Характеристики формы распределения вариационного ряда
Моделирование ряда распределения
Оценка параметров генеральной совокупности на основе выборочных данных
Выборка 54 регионов
Выборка 24 региона
Анализ динамики
Показатели ряда динамики и тенденции динамики
Заключение
Приложения
Литература
Сводка и группировка данных статистического наблюдения
В данной курсовой работе рассматривается следующий показатель: «Доля денежных доходов, расходуемых на прирост финансовых активов, % «в 2004г. Все данные взяты из Российского Статистического ежегодника.
На основе полученных данных выполнена простая сводка (Приложение) по указанному показателю (далее просто показатель*). Но необходимо учитывать тот факт, что рассматривается относительная, а не абсолютная величина. Следовательно, для расчета средней величины понадобятся дополнительные данные, отображающие годовые доходы населения по регионам. Поэтому в сводку добавлен еще одни столбец с необходимой информацией.
Также стоит отметить, что пришлось внести исправления по некоторым позициям исходных данных. Первоначально присутствовали 5 регионов РФ, в состав которых входило 2 субъекта. Поэтому значения показателя в этих регионах были пересчитаны. Так, в состав Архангельской области входил Ненецкий автономный округ. Доля денежных доходов, расходуемых на прирост финансовых активов, в Архангельской области составила 29, 2%, причем сюда были включены значения показателя в Ненецком автономном округе (69,7%). Для Архангельской области было вычислено значение показателя в абсолютных единицах (руб.), затем из доходов населения по области были вычтены доходы населения в Ненецком автономном округе и рассчитано среднее значение показателя по Архангельской области.
Таблица SEQ Таблица \* ARABIC 1 – Группировка с выделением регионов со значением показателя выше и ниже среднего
По данным группировки построена REF _Ref152587434 \* MERGEFORMAT Диаграмма 1 . Анализ диаграммы показывает, что 69% регионов (т.е. в 61 регионе) доля денежных доходов, расходуемых на прирост финансовых активов, выше, чем средний показатель по стране. При этом среднее значение показателя в первой группе (ниже среднего) в 2,25 раза ниже, чем среднее значение во второй группе.
Диаграмма SEQ Диаграмма \* ARABIC 1 Распределение субъектов РФ с выделением регионов со значением показателя выше и ниже среднего
По данным группировки построена REF _Ref152588381 \* MERGEFORMAT Диаграмма 2 . Хотя значение показателя в Челябинской области незначительно превышает аналогичный показатель по стране, все же есть 58 регионов, в которых доля доходов, расходуемых на прирост финансовых активов, превышает соответствующую долю по Челябинской области. И лишь 34% (30) регионов имеют показатель ниже. Все вышеперечисленное позволяет сделать вывод о том, что Челябинская область по значению показателя* находится в конце списка регионов, и показатель большинства субъектов РФ превышает показатель Челябинской области.
Диаграмма SEQ Диаграмма \* ARABIC 2 – Распределение субъектов РФ с выделением регионов со значением показателя выше и ниже соответствующего показателя Челябинской области
Вариационный анализ
Первый этап вариационного анализа - это построение вариационного ряда. Так как изучаемый признак относится к непрерывному виду, то необходимо строить интервальный ряд.
По формуле Стержесса определяем длину интервала. Полученное значение k=7,46. Следовательно, будет 8 интервалов. Минимальное значение признака равно 0,2%, а максимальное – 70,6%. За нижнюю границу первого интервала примем 0%, а за верхнюю границу последнего интервала – 72%. Такие границы, несомненно, способствуют легкости восприятия и наглядности распределения. Кроме того, эти границы достаточно близки к соответственно минимальному и максимальному значению признака.
Вариационный ряд имеет вид ( REF _Ref152671474 \* MERGEFORMAT Таблица 2 – Вариационный ряд ):
Таблица SEQ Таблица \* ARABIC 2 – Вариационный ряд
Графически распределение представлено на диаграмме ( REF _Ref152591305 \* MERGEFORMAT Диаграмма 3 ).
Диаграмма SEQ Диаграмма \* ARABIC 3 – Распределение регионов по показателю*
Анализ диаграммы показывает, что распределение не подчиняется нормальному закону. Явно выражена правосторонняя, то есть положительная, асимметрия, из чего можно сделать вывод о том, что большинство значений признака сконцентрировано слева от средней и имеет значение, меньшее, чем среднее. По гистограмме можно приблизительно определить моду, значение которой попадает в середину третьего интервала и составляет приблизительно 22%.
Для построения кумуляты и огивы был произведен расчет накопленных частот.
SHAPE \* MERGEFORMAT \s Диаграмма SEQ Диаграмма \* ARABIC 4 – Кумулята и огива распределения
Анализ вышеприведенного графика позволяет примерно определить медианное значение, то есть значение изучаемого признака, приходящееся на середину ранжированной совокупности. В данном случае медиана составляет приблизительно 23%.
Второй этап вариационного анализа – расчет показателей. Для этого была оформлена дополнительная таблица (Приложение Б). В итоге получились следующие значения:
Таблица SEQ Таблица \* ARABIC 3 – Показатели вариации
Среднее значение показателя* по регионам составило 27,1%. Однако индивидуальные различия единиц совокупности погашаются, неточно передается структура ряда распределения.
Медина равна 21,91%. То есть половина единиц совокупности имеет значение показателя ниже данного, а вторая половина – не меньше медианного. Мода же равна 22,8%. Данная характеристика указывает на наиболее часто встречающееся значение признака. Однако, поскольку ряд интервальный, следует рассматривать моду как значение, вокруг которого плотность распределения достигает своего пика. То есть вокруг этого значения сконцентрировано наибольшее количество регионов РФ.
Для нормального закона характерно следующее соотношение: медиана находится в интервале между модой и средним значением, при чем она ближе к средней, чем к моде. В рассматриваемой совокупности имеет место иное соотношение, а именно: Xср>Me>Mo, что обусловлено выраженной правосторонней асимметрии. Таким образом, нельзя утверждать, что распределение подчиняется вышеуказанному закону.
Более точным будет такой показатель, который учитывает отклонение каждой из вариант от средней величины. Среднее линейное отклонение составило 10,86%. Именно на это значение отклоняется в среднем доля доходов, идущих на пополнение финансовых активов, от своего среднего значения. Также необходимо рассчитать среднее квадратическое отклонение. Оно равно 14,23%. По свойству мажорантности средних среднее квадратическое отклонение всегда больше среднего линейного отклонения. Соотношение среднего квадратического отклонения и среднего линейного отклонения, равное 1,31, позволяет сделать вывод об отсутствии нормального распределения.
Дисперсия – это средний квадрат отклонений индивидуальных значений признака от их средней величины. В нашем случае она равна 202,49%.
К относительным показателям вариации относят: относительный размах вариации (2,6), относительное линейное отклонение (0,4) и коэффициент вариации (0,53). Коэффициент вариации отражает состояние между вариацией выборки и ее центром. Данное значение коэффициента свидетельствует о том, что степень концентрации вокруг среднего допустима.
Относительное линейное отклонение показывает, что доля усредненного значения абсолютных отклонений от средней величины составляет 40%.
Относительный размах вариации отражает относительную колеблемость крайних значений признака вокруг средней. Такое значение коэффициента говорит о том, что относительный разброс значений признака достаточно высок.
Коэффициент асимметрии рассчитывается с помощью моментов третьего порядка. Для данной совокупности он равен 1,04. Такое значение показывает, что имеет место выраженная правосторонняя асимметрия и большинство значений признака имеет значение ниже среднего.
Так как коэффициент асимметрии не равен нулю, то не имеет смысла рассчитывать показатель эксцесса. Все вышеперечисленное подтверждает гипотезу об отсутствии нормального распределения.
Выдвинем гипотезу о том, что распределение в совокупности подчиняется нормальному закону. Воспользуемся для проверки гипотезы критерием согласия Пирсона, для чего возьмем за основу вариационный ряд, составленный ранее. Для расчетов понадобятся значения средней величины (27,1), среднего квадратического отклонения (14,23) и длина интервала (9). Дополним ряд так, чтобы получилась следующая таблица:
Таблица SEQ Таблица \* ARABIC 4 –Моделирование ряла распределения
Видно, что для последнего интервала округленная теоретическая частота, то есть частота, которая должна быть при нормальном распределении, статистически незначима. Для интервала 54-63 теоретическая частота равна 2, что тоже достаточно невысокий показатель. Объединим последние три интервала в один. Получим интервал 45-72 с длиной, равной 27. Необходимо также пересчитать среднее значение и среднее квадратическое отклонение. Они равны соответственно 27 и 13,84. После объединения получится следующая таблица:
Южно-Уральский Государственный Университет
Кафедра «Экономика и финансы»
Статистическая обработка и статистический анализ данных
по материалам статистического наблюдения
Пояснительная записка к курсовому проекту
по курсу «Статистика»
Руководитель:
Автор проекта:
студент группы ЭиУ-378
Проект защищен
с оценкой
« »
Челябинск
2006
Введение
Статистика - это отрасль человеческой деятельности, направленная на сбор, обработку и анализ данных народно-хозяйственного учета. Сама статистика является одним из видов учета. Предметом статистики является количественная сторона массовых общественных явлений в тесной связи с качественной стороной. Главная задача статистики на современном этапе состоит в обработке достоверной информации. Обработанные определенным образом данные позволяют судить о явлении, делать прогнозы. Статистические данные способны сказать языком статистических показателей о многом в весьма яркой и убедительной форме.В данном курсовом проекте была произведена обработка и анализ статистических данных, полученных в результате статистического наблюдения над показателем, характеризующим долю денежных доходов, расходуемых на прирост финансовых активов в
Актуальность статистического анализа вышеприведенного показателя можно обосновать, исходя из определения финансовых активов. Это кассовая наличность, депозиты в банках, вклады, чеки, страховые полисы, паи или долевые и т.п. Следовательно, результаты анализа можно использовать для расчета оборачиваемости денежных средств, развития экономики.
Целью данного курсового проекта является освоение инструментов статистики для дальнейшего применения в решении управленческих задач. В качестве задач курсового проекта следует выделить следующее:
овладение методами выполнения оценок параметров больших множеств по данным выборочного наблюдения;
приобретение навыков работы с большими массивами данных и навыков представления данных статистического наблюдения в удобном для восприятия, анализа и принятия решений виде;
развитие аналитических навыков в ходе применения вариационного метода интерпретации полученных результатов.
Содержание
"1-3" Статистическая обработка и статистический анализ данныхпо материалам статистического наблюдения
Руководитель: Лазарева Г.В.
Автор проекта: Проект защищен
Введение
Содержание
Сводка и группировка данных статистического наблюдения
Группировка с выделением регионов со значением показателя выше и ниже среднего
Группировка с выделением регионов со значением показателя выше и ниже показателя в Челябинской области
Вариационный анализ
Структурные характеристики
Характеристики рассеяния
Характеристики формы распределения вариационного ряда
Моделирование ряда распределения
Оценка параметров генеральной совокупности на основе выборочных данных
Выборка 54 регионов
Выборка 24 региона
Анализ динамики
Показатели ряда динамики и тенденции динамики
Заключение
Приложения
Литература
Сводка и группировка данных статистического наблюдения
В данной курсовой работе рассматривается следующий показатель: «Доля денежных доходов, расходуемых на прирост финансовых активов, % «в 2004г. Все данные взяты из Российского Статистического ежегодника.
На основе полученных данных выполнена простая сводка (Приложение) по указанному показателю (далее просто показатель*). Но необходимо учитывать тот факт, что рассматривается относительная, а не абсолютная величина. Следовательно, для расчета средней величины понадобятся дополнительные данные, отображающие годовые доходы населения по регионам. Поэтому в сводку добавлен еще одни столбец с необходимой информацией.
Также стоит отметить, что пришлось внести исправления по некоторым позициям исходных данных. Первоначально присутствовали 5 регионов РФ, в состав которых входило 2 субъекта. Поэтому значения показателя в этих регионах были пересчитаны. Так, в состав Архангельской области входил Ненецкий автономный округ. Доля денежных доходов, расходуемых на прирост финансовых активов, в Архангельской области составила 29, 2%, причем сюда были включены значения показателя в Ненецком автономном округе (69,7%). Для Архангельской области было вычислено значение показателя в абсолютных единицах (руб.), затем из доходов населения по области были вычтены доходы населения в Ненецком автономном округе и рассчитано среднее значение показателя по Архангельской области.
Группировка с выделением регионов со значением показателя выше и ниже среднего
Среднее значение показателя* по регионам считается как средняя взвешенная величина, где роль весов играют годовые доходы населения. Сумма годовых доходов населения по всей Российской Федерации составила 11071919713 тыс. руб. Сумма средств, идущих на прирост финансовых активов, равна 2210034642,258 тыс. руб. Следовательно, среднее значение показателя по РФ составит 19,96%. Исходя из этих данных, строим группировку с выделением регионов со значением показателя выше и ниже среднего.Таблица SEQ Таблица \* ARABIC 1 – Группировка с выделением регионов со значением показателя выше и ниже среднего
Группа | Количество регионов | Среднее значение, % |
Показатель ниже среднего | 27 | 12,6 |
Показатель выше среднего | 61 | 28,3 |
Диаграмма SEQ Диаграмма \* ARABIC 1 Распределение субъектов РФ с выделением регионов со значением показателя выше и ниже среднего
Группировка с выделением регионов со значением показателя выше и ниже показателя в Челябинской области
В данной группировке имеет место сравнение показателя* Челябинской области с соответствующими показателями остальных регионов РФ. Выделим две группы: регионы с показателем выше и ниже показателя Челябинской области. В итоге получим: Группа | Количество регионов | Среднее значение, % |
Показатель ниже показателя по Челябинской области | 30 | 13,0 |
Показатель выше показателя по Челябинской области | 58 | 29,0 |
Диаграмма SEQ Диаграмма \* ARABIC 2 – Распределение субъектов РФ с выделением регионов со значением показателя выше и ниже соответствующего показателя Челябинской области
Вариационный анализ
Первый этап вариационного анализа - это построение вариационного ряда. Так как изучаемый признак относится к непрерывному виду, то необходимо строить интервальный ряд.
По формуле Стержесса определяем длину интервала. Полученное значение k=7,46. Следовательно, будет 8 интервалов. Минимальное значение признака равно 0,2%, а максимальное – 70,6%. За нижнюю границу первого интервала примем 0%, а за верхнюю границу последнего интервала – 72%. Такие границы, несомненно, способствуют легкости восприятия и наглядности распределения. Кроме того, эти границы достаточно близки к соответственно минимальному и максимальному значению признака.
Вариационный ряд имеет вид ( REF _Ref152671474 \* MERGEFORMAT Таблица 2 – Вариационный ряд
Таблица SEQ Таблица \* ARABIC 2 – Вариационный ряд
Интервал (%) | Частота попадания |
0-9 | 5 |
9-18 | 16 |
18-27 | 32 |
27-36 | 18 |
36-45 | 8 |
45-54 | 2 |
54-63 | 4 |
63-72 | 3 |
Диаграмма SEQ Диаграмма \* ARABIC 3 – Распределение регионов по показателю*
Анализ диаграммы показывает, что распределение не подчиняется нормальному закону. Явно выражена правосторонняя, то есть положительная, асимметрия, из чего можно сделать вывод о том, что большинство значений признака сконцентрировано слева от средней и имеет значение, меньшее, чем среднее. По гистограмме можно приблизительно определить моду, значение которой попадает в середину третьего интервала и составляет приблизительно 22%.
Для построения кумуляты и огивы был произведен расчет накопленных частот.
SHAPE \* MERGEFORMAT
Анализ вышеприведенного графика позволяет примерно определить медианное значение, то есть значение изучаемого признака, приходящееся на середину ранжированной совокупности. В данном случае медиана составляет приблизительно 23%.
Второй этап вариационного анализа – расчет показателей. Для этого была оформлена дополнительная таблица (Приложение Б). В итоге получились следующие значения:
Показатель | Значение |
Среднее значение | 27,1 |
Мода | 22,8 |
Медиана | 21,91 |
Размах вариации | 70,4 |
Среднее линейное отклонение | 10,86 |
Среднее квадратическое отклонение | 14,23 |
Дисперсия | 202,49 |
Относительный размах вариации | 2,6 |
Относительное линейное отклонение | 0,4 |
Коэффициент вариации | 0,53 |
Коэффициент асимметрии | 1,04 |
Структурные характеристики
К данному типу характеристик относят среднее значение, моду и медиану. Для оценки моды и медианы можно использовать графики распределения и пересечения огивы с кумулятой соответственно.Среднее значение показателя* по регионам составило 27,1%. Однако индивидуальные различия единиц совокупности погашаются, неточно передается структура ряда распределения.
Медина равна 21,91%. То есть половина единиц совокупности имеет значение показателя ниже данного, а вторая половина – не меньше медианного. Мода же равна 22,8%. Данная характеристика указывает на наиболее часто встречающееся значение признака. Однако, поскольку ряд интервальный, следует рассматривать моду как значение, вокруг которого плотность распределения достигает своего пика. То есть вокруг этого значения сконцентрировано наибольшее количество регионов РФ.
Для нормального закона характерно следующее соотношение: медиана находится в интервале между модой и средним значением, при чем она ближе к средней, чем к моде. В рассматриваемой совокупности имеет место иное соотношение, а именно: Xср>Me>Mo, что обусловлено выраженной правосторонней асимметрии. Таким образом, нельзя утверждать, что распределение подчиняется вышеуказанному закону.
Характеристики рассеяния
Простейшим из показателей данной группы является вариационный размах. Он равен 70,4%, что является достаточно большим значением. Но он дает лишь самое общее представление о размерах вариации, так как показывает, насколько отчаются друг от друга крайние значения, но не указывают, насколько велики отклонения значений признака друг от друга внутри этого промежутка.Более точным будет такой показатель, который учитывает отклонение каждой из вариант от средней величины. Среднее линейное отклонение составило 10,86%. Именно на это значение отклоняется в среднем доля доходов, идущих на пополнение финансовых активов, от своего среднего значения. Также необходимо рассчитать среднее квадратическое отклонение. Оно равно 14,23%. По свойству мажорантности средних среднее квадратическое отклонение всегда больше среднего линейного отклонения. Соотношение среднего квадратического отклонения и среднего линейного отклонения, равное 1,31, позволяет сделать вывод об отсутствии нормального распределения.
Дисперсия – это средний квадрат отклонений индивидуальных значений признака от их средней величины. В нашем случае она равна 202,49%.
К относительным показателям вариации относят: относительный размах вариации (2,6), относительное линейное отклонение (0,4) и коэффициент вариации (0,53). Коэффициент вариации отражает состояние между вариацией выборки и ее центром. Данное значение коэффициента свидетельствует о том, что степень концентрации вокруг среднего допустима.
Относительное линейное отклонение показывает, что доля усредненного значения абсолютных отклонений от средней величины составляет 40%.
Относительный размах вариации отражает относительную колеблемость крайних значений признака вокруг средней. Такое значение коэффициента говорит о том, что относительный разброс значений признака достаточно высок.
Характеристики формы распределения вариационного ряда
Сюда относятся коэффициент асимметрии и коэффициент эксцесса.Коэффициент асимметрии рассчитывается с помощью моментов третьего порядка. Для данной совокупности он равен 1,04. Такое значение показывает, что имеет место выраженная правосторонняя асимметрия и большинство значений признака имеет значение ниже среднего.
Так как коэффициент асимметрии не равен нулю, то не имеет смысла рассчитывать показатель эксцесса. Все вышеперечисленное подтверждает гипотезу об отсутствии нормального распределения.
Моделирование ряда распределения
Нормальное распределение важно по многим причинам. Распределение многих статистик является нормальным или может быть получено из нормальных с помощью некоторых преобразований. Рассуждая философски, можно сказать, что нормальное распределение представляет собой одну из эмпирически проверенных истин относительно общей природы действительности и его положение может рассматриваться как один из фундаментальных законов природы.Выдвинем гипотезу о том, что распределение в совокупности подчиняется нормальному закону. Воспользуемся для проверки гипотезы критерием согласия Пирсона, для чего возьмем за основу вариационный ряд, составленный ранее. Для расчетов понадобятся значения средней величины (27,1), среднего квадратического отклонения (14,23) и длина интервала (9). Дополним ряд так, чтобы получилась следующая таблица:
X`j | Интервал | | t | ||||
4,5 | 0 | 9 | 5 | -1,59 | 0,1127 | 6 | 0,1667 |
13,5 | 9 | 18 | 16 | -0,96 | 0,2516 | 14 | 0,2857 |
22,5 | 18 | 27 | 32 | -0,32 | 0,3790 | 21 | 5,7619 |
31,5 | 27 | 36 | 18 | 0,31 | 0,3802 | 21 | 0,4286 |
40,5 | 36 | 45 | 8 | 0,94 | 0,2565 | 14 | 2,5714 |
49,5 | 45 | 54 | 2 | 1,57 | 0,1163 | 6 | 2,6667 |
58,5 | 54 | 63 | 4 | 2,21 | 0,0347 | 2 | 2,0000 |
67,5 | 63 | 72 | 3 | 2,84 | 0,0071 | 0 | ошибка деления на ноль |
Видно, что для последнего интервала округленная теоретическая частота, то есть частота, которая должна быть при нормальном распределении, статистически незначима. Для интервала 54-63 теоретическая частота равна 2, что тоже достаточно невысокий показатель. Объединим последние три интервала в один. Получим интервал 45-72 с длиной, равной 27. Необходимо также пересчитать среднее значение и среднее квадратическое отклонение. Они равны соответственно 27 и 13,84. После объединения получится следующая таблица:
X`j | Интервал | | t | ||||
4,5 | 0 | 9 | 5 | -1,63 | 0,1057 | 6 | 0,1667 |
13,5 | 9 | 18 | 16 | -0,98 | 0,2468 | 14 | 0,2857 |
22,5 | 18 | 27 | 32 | -0,33 | 0,3778 | 22 | 4,5455 |
31,5 | 27 | 36 | 18 | 0,33 | 0,3778 | 22 | 0,7273 |
40,5 | 36 | 45 | 8 | 0,98 | 0,2468 | 14 | 2,5714 |
58,5 | 45 | 72 | 9 | 2,28 | 0,0297 | 5 | 3,2 |
Итого | Х | Х | Х | Х | Х | Х | 11,4965 |
В данном ряду нет статистически незначимых частот, поэтому можно приступать к определению χ2. Предельное значение, определяющее условия отклонения гипотезы о нормальном характере распределения, для уровня значимости=0,05 при степени свободы=3 равно 7,815. Эмпирическое же значение равно 11,5. Так как теоретическое значение меньше полученного на практике, то гипотеза о нормальном законе распределения отвергается. Имеет место выраженная правосторонняя асимметрия со смещением в область более низких значений.
Оценка параметров генеральной совокупности на основе выборочных данных
В реальных условиях для наблюдения какого-то признака практически никогда не анализируется вся совокупность в целом. Вместо этого применяют выборочное наблюдение, то есть статистическому обследованию подвергаются определенным образом отобранные единицы изучаемой совокупности. Целью выборочного наблюдения является характеристика всей совокупности единиц по обследуемой части, при условии соблюдения всех правил и принципов статистического наблюдения. Это позволяет сэкономить материальные, трудовые ресурсы, время, дает возможность более детально и подробно изучить отдельные единицы статистической совокупности и их группы.Для проведения выборочного наблюдения необходимо определить способ отбора и тип выборки. В данном конкретном случае считаю оптимальным применение бесповторной собственно случайной выборки методом жеребьевки, так как единицы наблюдаемой совокупности не упорядочены и с равной вероятностью могут попасть в выборку.
Выборка 54 регионов
Из 88 регионов выберем 54. Выбранные единицы представлены в Приложении В.Рассчитаем выборочную среднюю для совокупности. Вследствие отсутствия весов рассчитывается как простая арифметическая средняя. Она равна 27,07%. Вычислим предельную ошибку средней с помощью коэффициента доверия для вероятностей 0,760, 0,860, 0,880 и 0,960.
Вероятность | Предельная ошибка |
0,76 | 6,05 |
0,86 | 6,68 |
0,88 | 6,80 |
0,96 | 7,25 |
Необходимо отметить, что используемая для расчета предельной ошибки средней дисперсия генеральной совокупности вычисляется из выборочной дисперсии путем ее умножения на величину n/(n-1), где n – размер выборочной совокупности. В нашем случае этот коэффициент равен 54/53.
В результате получаем следующие доверительные интервалы генеральной средней:
Вероятность | Интервал |
0,76 | 21,02 - 33,12 |
0,86 | 20,39 - 33,75 |
0,88 | 20,27 - 33,86 |
0,96 | 19,81 - 34,32 |
Выборка 24 региона
Выберем 24 региона из совокупности (Приложение Г). Рассчитаем среднее значение выборки как среднюю арифметическую величину. Оно равно 29,14%.Так как количество единиц в выборке меньше 30, то она относится к малым. Следовательно, расчет предельной средней необходимо проводить по правилам малой выборки.
Здесь используется критерий доверия Стьюдента. Также необходимо отметить, что применяется выборочная, а не генеральная дисперсия, и коэффициент корректировки на бесповторность. Получаем следующие предельные ошибки:
Степень значимости | Предельная ошибка |
0,24 | 3,43 |
0,14 | 4,45 |
0,12 | 4,45 |
0,04 | 6,49 |
Коэффициент корректировки на бесповторность равен 64/87. Число степеней свободы равно 23. Значение коэффициента доверия Стьюдента выбирается по соответствующей таблице.
Доверительные интервалы в малой выборке имеют вид:
Степень значимости | Интервал |
0,24 | 25,72 - 32,57 |
0,14 | 24,69 - 33,59 |
0,12 | 25,69 - 33,59 |
0,04 | 22,65 - 35, 63 |
Значение генеральной средней равно 27,1%. Для всех предложенных вероятностей оно попадает в доверительный интервал, рассчитанный как для малой, так и для большой выборки. Однако, на мой взгляд, к таким результатам привели большие значения предельных ошибок, которые в свою очередь зависят от дисперсии. Но формально можно считать обе выборки достаточно результативными.
Анализ динамики
Проанализируем динамику показателя «Среднедушевой доход в месяц, руб.», по Центральному федеральному округу за 2000-2004 годы. Построим ряд динамики: Год | 2000 | 2001 | 2002 | 2003 | 2004 |
Значение | 3230,6 | 4299,6 | 5435,6 | 7211,3 | 8999,5 |
Необходимо отметить, что ряд является интервальным и равномерным. Показатели в каждом интервале полностью сопоставимы по единицам измерения и территории.
Показатели ряда динамики и тенденции динамики
Наименование показателя | -2 | -1 | 0 | 1 | 2 | Средние характеристики |
Уровень ряда, руб. | 3230,60 | 4299,60 | 5435,60 | 7211,30 | 8999,50 | 5835,32 |
Абсолютный прирост (цепной), руб. | … | 1069,00 | 1136,00 | 1775,70 | 1788,20 | 1442,23 |
Абсолютный прирост (базисный), руб. | 0 | 1069,00 | 2205,00 | 3980,70 | 5768,90 | … |
Абсолютное ускорение (цепное) | … | … | 67,00 | 639,70 | 12,50 | 239,73 |
Темп роста (цепной),% | … | 133,09 | 126,42 | 132,67 | 124,80 | 129,19 |
Темп роста (базисный),% | 100,00 | 133,09 | 168,25 | 223,22 | 278,57 | … |
Темп прироста (цепной),% | … | 33,09 | 26,42 | 32,67 | 24,80 | 29,19 |
Темп прироста (базисный),% | 0 | 33,09 | 68,25 | 123,22 | 178,57 | … |
Абсолютное значение 1% прироста (цепного) | … | 32,31 | 43,00 | 54,36 | 72,11 | … |
Абсолютный цепной прирост показывает изменение значения показателя по отношению к предыдущему периоду, а абсолютный базисный прирост – по отношению к начальному периоду. Цепной темп роста – это соотношение значения показателя в текущем и предыдущем периоде. Видно, что во всех интервалах цепной темп роста больше 100%, следовательно, значение показателя увеличивается. Средний уровень ряда рассчитывается как простая арифметическая, так длина интервалов одинаковая, а показатель выражен в абсолютных величинах. Средний прирост уровня ряда составляет 1442,23 руб. в год. Средний темп прироста равен 29,19%, именно на эту величину в среднем увеличиваются среднедушевые доходы каждый год.
Выбор вида тренда
Так как количество уровней в ряду мало, то для выбора вида уравнения динамики можно использовать графический метод или метод наименьших квадратов.Применим графический метод. Нанесем на поле координат точки, соответствующие значениям признака в каждом периоде. Проведем прямую линию, наиболее точно отражающую тенденцию распределения точек.
На проведенной прямой выберем 2 произвольные точки. Используя их координаты, решим следующую систему уравнений:
a+b* = ;
a= , b= .
Уравнение динамики имеет вид: y= + .
Метод наименьших квадратов дает оценку параметров, отвечающую принципам максимального правдоподобия, лишь в том случае, когда распределение в совокупности подчиняется нормальному закону. В нашем случае гипотеза о нормальном характере распределения была отвергнута. Поэтому методу МНК нельзя полностью доверять.
Рассчитаем параметры уравнения прямой линейной зависимости:
0*a+10*b=14449,5
a=5835,32; b=1444,95; Сумма квадратов отклонений фактических значений признака от теоретических равна 329329,28.
Рассчитаем параметры уравнения параболы:
0*a+10*b+0*c=14449,5
10*a+0*b+34*c=60431,3
a=5538,45; b=1444,95; c=148,44. Сумма квадратов отклонений фактических значений признака от теоретических равна 20865,03.
Рассчитаем параметры уравнения третьей степени:
0*a+10*b+0*c+34*d=14449,5
10*a+0*b+34*c+0*d=60431,3
0*a+34*b+0*c+130*d=49062,9
a=5538,45; b=1460,392; c=148,44; d=-4,54. Сумма квадратов отклонений фактических значений признака от теоретических равна 20568,00.
Минимальное значение суммы квадратов отклонений фактических значений признака от теоретических соответствует последнему уравнению. Таким образом, уравнение динамики имеет вид:
y = -4,5417x3 + 148,44x2 + 1460,4x + 5538,4.
Рассчитаем показатели колеблемости, для чего сначала вычислим показатели отклонения от тренда:
Наименование показателя | -2 | -1 | 0 | 1 | 2 |
Уровень ряда (фактический), ед. | 3230,60 | 4299,60 | 5435,60 | 7211,30 | 8999,50 |
Уровень ряда (теоретический), ед. | 3247,74 | 4231,03 | 5538,45 | 7142,73 | 9016,64 |
Отклонение фактического уровня ряда от теоретического, ед. | -17,14 | 68,57 | -102,85 | 68,57 | -17,14 |
Наименование показателя | Значение |
Амплитуда отклонений от тренда | 171,41 |
Среднее линейное отклонение от тренда | 17,14 |
Среднее квадратическое отклонение от тренда | 143,42 |
Относительное линейное отклонение от тренда | 0,00 |
Коэффициент аппроксимации | 0,02 |
Анализ полученных результатов позволяет сделать вывод о том, что полученная зависимость наилучшим образом аппроксимирует исходные данные. Очень низкие коэффициент аппроксимации, показывающий очень слабую колеблемость тенденции, и относительное линейное отклонение от тренда позволяют использовать тренд для прогнозирования изменения значений показателя среднедушевых денежных доходов в месяц на срок приблизительно 1,5 года.
Заключение
В результате проделанной работы по многостороннему исследованию совокупности, состоящей из 88 регионов РФ, по показателю «Доля денежных доходов, расходуемых на прирост финансовых активов, % в 2004г.» можно сделать следующие выводы:Выяснилось, что лишь 34% регионов имеет показатель ниже среднего, оставшиеся 66 субъектов РФ имеют показатель выше среднего, что свидетельствует о достаточно высоких размерах финансовых активов.
Гипотеза о нормальном характере распределения не подтвердилась вследствие выраженной правосторонней асимметрии
В результате построения ряда динамики по показателю «Среднедушевой денежный доход в месяц, руб. по Центральному федеральному округу за 2000-2004гг.» и его последующего анализа было получено уравнение третьей степени, наилучшим образом описывающее тенденцию динамики:
y = -4,5417x3 + 148,44x2 + 1460,4x + 5538,4. Данное уравнение с большой долей вероятности можно использовать для прогнозирования.
При проведении выборки и анализе выборочных совокупностей установлено, что генеральная средняя попадает во все доверительные интервалы, рассчитанные для вероятностей 0,76; 0,86; 0,88; 0,96 как в малой, так и в большой выборке. Но значительной степени это объясняется не столько высокой репрезентативностью выборок, сколько большим значением предельной ошибки, на которую, в свою очередь, повлияла большая величина дисперсий.
В заключении необходимо отметить, что выполнение данного курсового проекта позволило приобрести навыки по обработке больших массивов статистических данных и их.
Приложение А
субъект | Доля денежных доходов, расходуемых на прирост финансовых активов, % | Годовые доходы населения, руб. |
Белгородская область | 24,3 | 73898551,2 |
Брянская область | 20,4 | 60761572,8 |
Владимирская область | 28,6 | 61031116,8 |
Воронежская область | 18,9 | 114358623,6 |
Ивановская область | 22,2 | 38765328 |
Калужская область | 11,4 | 51631927,2 |
Костромская область | 28,5 | 33240636 |
Курская область | 27,4 | 61666344 |
Липецкая область | 17,9 | 63852366 |
Московская область | 0,9 | 461383876,8 |
Орловская область | 17,6 | 39609660 |
Рязанская область | 14,4 | 52748044,8 |
Смоленская область | 19,5 | 54848736 |
Тамбовская область | 24,6 | 56341308 |
Тверская область | 11,6 | 68547835,2 |
Тульская область | 25,5 | 78740886 |
Ярославская область | 34,9 | 82593655,2 |
г. Москва | 13,8 | 2615676553 |
Республика Карелия | 25,1 | 49347250,8 |
Республика Коми | 27,6 | 112165236 |
Архангельская область * | 32,6 | 86642841,6 |
Ненецкий автономный округ | 69,7 | 10141588,8 |
Вологодская область | 30,6 | 79010784 |
Калининградская область | 16 | 53494500 |
Ленинградская область | 25,9 | 79962864 |
Мурманская область | 20,5 | 88350240 |
Новгородская область | 17,6 | 35761606,8 |
Псковская область | 12,2 | 38539353,6 |
г. Санкт-Петербург | 21,5 | 491351788,8 |
Республика Адыгея | 25,3 | 16448802 |
Республика Дагестан | 19 | 93681367,2 |
Республика Ингушетия | 63,1 | 10038840 |
Кабардино-Балкарская Республика | 24,8 | 34089001,2 |
Республика Калмыкия | 40 | 8073853,2 |
Карачаево-Черкесская Республика | 27,8 | 17534362,8 |
Республика Северная Осетия - Алания | 40,7 | 34663927,2 |
Краснодарский край | 4,8 | 268303960,8 |
Ставропольский край | 6,9 | 127122103,2 |
Астраханская область | 26,9 | 54509254,8 |
Волгоградская область | 19,1 | 149095663,2 |
Ростовская область | 17,5 | 263956135,2 |
Республика Башкортостан | 17,6 | 253209686,4 |
Республика Марий Эл | 18,7 | 22237022,4 |
Республика Мордовия | 32,9 | 34335345,6 |
Республика Татарстан | 20,2 | 242452980 |
Удмуртская Республика | 22,7 | 68816592 |
Чувашская Республика | 18,5 | 49761216 |
Кировская область | 25,9 | 66695209,2 |
Нижегородская область | 17,5 | 200127387,6 |
Оренбургская область | 32,4 | 100524992,4 |
Пензенская область | 15,4 | 58950672 |
Пермская область * | 27,0 | 209680923,6 |
Коми-Пермяцкий автономный округ | 45,4 | 3713354,4 |
Самарская область | 7,4 | 277131585,6 |
Саратовская область | 22,3 | 126753360 |
Ульяновская область | 14,2 | 60046008 |
Курганская область | 27,1 | 46431787,2 |
Свердловская область | 22,2 | 354592780,8 |
Тюменская область* | 70,6 | 219525381,6 |
Ханты-Мансийский автономный округ - Югра | 33,4 | 261763454,4 |
Ямало-Ненецкий автономный округ | 42,5 | 116604858 |
Челябинская область | 20,8 | 206711582,4 |
Республика Алтай | 39,5 | 8329658,4 |
Республика Бурятия | 27,5 | 54605167,2 |
Республика Тыва | 46,9 | 12307075,2 |
Республика Хакасия | 34,3 | 28936904,4 |
Алтайский край | 13,4 | 108352717,2 |
Красноярский край* | 23,2 | 220950054 |
Таймырский (Долгано-Ненецкий) автономный округ | 54,3 | 5267386,8 |
Эвенкийский автономный округ | 60,6 | 1811224,8 |
Иркутская область* | 23,3 | 163607767,2 |
Усть-Ордынский Бурятский автономный округ | 57,7 | 2916648 |
Кемеровская область | 26,5 | 212353382,4 |
Новосибирская область | 0,2 | 159376021,2 |
Омская область | 25,9 | 134092786,8 |
Томская область | 23,2 | 80856968,4 |
Читинская область* | 28,1 | 62226236,4 |
Агинский Бурятский автономный округ | 38,2 | 3664045,2 |
Республика Саха (Якутия) | 28,8 | 109702881,6 |
Приморский край | 15,7 | 133027860 |
Хабаровский край | 26,9 | 129327297,6 |
Амурская область | 25,3 | 50371178,4 |
Камчатская область* | 41,2 | 32658213,6 |
Корякский автономный округ | 59,4 | 2882966,4 |
Магаданская область | 40 | 20261882,4 |
Сахалинская область | 29,7 | 61256464,8 |
Еврейская автономная область | 28,8 | 11342316 |
Чукотский автономный округ | 37,3 | 9386083,2 |
Приложение Б
X`j | | | | |
4,5 | 113,0 | 2554,3 | -57733,29402 | 1304903,657 |
13,5 | 217,6 | 2960,3 | -40267,47683 | 547729,2018 |
22,5 | 147,3 | 677,8 | -3119,371009 | 14356,19612 |
31,5 | 79,2 | 348,1 | 1530,937227 | 6732,644396 |
40,5 | 107,2 | 1436,0 | 19239,03948 | 257759,4039 |
49,5 | 44,8 | 1003,3 | 22472,00651 | 503321,8731 |
58,5 | 125,6 | 3943,3 | 123809,6881 | 3887342,822 |
67,5 | 121,2 | 4895,9 | 197784,4088 | 7990040,605 |
| | | | |
955,8 | 17819,1 | 263715,9383 | 14512186,4 |
Приложение В
Регион | Показатель |
Республика Дагестан | 19 |
Тамбовская область | 24,6 |
Республика Марий Эл | 18,7 |
Республика Коми | 27,6 |
Чукотский автономный округ | 37,3 |
Рязанская область | 14,4 |
Владимирская область | 28,6 |
Нижегородская область | 17,5 |
Амурская область | 25,3 |
Кировская область | 25,9 |
Республика Северная Осетия - Алания | 40,7 |
Омская область | 25,9 |
Кемеровская область | 26,5 |
Ханты-Мансийский автономный округ - Юг | 33,4 |
Республика Бурятия | 27,5 |
Республика Адыгея | 25,3 |
Республика Мордовия | 32,9 |
Краснодарский край | 4,8 |
Челябинская область | 20,8 |
Тульская область | 25,5 |
Ставропольский край | 6,9 |
Усть-Ордынский Бурятский автономный окр | 57,7 |
Республика Татарстан | 20,2 |
Архангельская область * | 32,61787489 |
Саратовская область | 22,3 |
Республика Саха (Якутия) | 28,8 |
Кабардино-Балкарская Республика | 24,8 |
Новгородская область | 17,6 |
Мурманская область | 20,5 |
Чувашская Республика | 18,5 |
Пермская область * | 26,96930302 |
Республика Ингушетия | 63,1 |
Агинский Бурятский автономный округ | 38,2 |
Ярославская область | 34,9 |
Ямало-Ненецкий автономный округ | 42,5 |
Республика Хакасия | 34,3 |
Таймырский (Долгано-Ненецкий) автономный округ | 54,3 |
Тверская область | 11,6 |
г. Москва | 13,8 |
Магаданская область | 40 |
Калужская область | 11,4 |
Эвенкийский автономный округ | 60,6 |
Республика Калмыкия | 40 |
Ростовская область | 17,5 |
Орловская область | 17,6 |
Ивановская область | 22,2 |
Республика Алтай | 39,5 |
Оренбургская область | 32,4 |
Республика Башкортостан | 17,6 |
Алтайский край | 13,4 |
Приморский край | 15,7 |
Курская область | 27,4 |
Ульяновская область | 14,2 |
Брянская область | 20,4 |
Приложение Г
Регион | Показатель |
Ставропольский край | 6,9 |
Республика Северная Осетия - Алания | 40,7 |
Ленинградская область | 25,9 |
Еврейская автономная область | 28,8 |
Иркутская область* | 23,30824003 |
Челябинская область | 20,8 |
Краснодарский край | 4,8 |
Республика Тыва | 46,9 |
Республика Ингушетия | 63,1 |
Астраханская область | 26,9 |
Корякский автономный округ | 59,4 |
Орловская область | 17,6 |
Курганская область | 27,1 |
Республика Дагестан | 19 |
Московская область | 0,9 |
Ярославская область | 34,9 |
Костромская область | 28,5 |
Магаданская область | 40 |
Кировская область | 25,9 |
Республика Мордовия | 32,9 |
Сахалинская область | 29,7 |
Республика Коми | 27,6 |
Республика Калмыкия | 40 |
Карачаево-Черкесская Республика | 27,8 |
Литература
Лазарева Г. В., Богданчикова М. Ю. Статистика / Учебное пособие по выполнению курсового проекта. - Челябинск, 2003.Российский статистический ежегодник: Официальное издание. –М.: Госкомстат, 2005.
Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник/Под ред. чл-корр РАН И.И.Елисеевой. – М.: Финансы и статистика, 1995.