Реферат Методы сглаживания и выравнивания динамических рядов 2
Работа добавлена на сайт bukvasha.net: 2015-10-28Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
от 25%
договор
I
. ВВЕДЕНИЕ
Работа экономиста любой специальности неизбежно связана со сбором, разработкой и анализом статистических материалов. Нередко экономисту самому приходится проводить статистические разработки. Поэтому изучение науки статистики при подготовке специалистов имеет большое значение в системе высшего экономического образования.
Статистика – это сложная и многогранная наука. С точки зрения преподавания ее в высшей школе она включает в себя целый ряд учебных дисциплин. Это – общая теория статистики, экономическая статистика и целая серия отраслевых статистик: промышленная, сельскохозяйственная, торговая, транспортная и т.д. Каждый экономист должен уметь читать статистические цифры и пользоваться ими в своей работе, обосновывать цифрами свои предложения, уметь статистические цифры анализировать. Экономист-аналитик должен в совершенстве владеть методами экономико-математического анализа.
Итак, статистика – это цифры живые, красноречивые. Однако это определение исходит из итогов статистической работы, результатом которой являются статистические цифры.
Статистикой часто называют сам процесс статистической работы – сбор массовых первичных данных, их обработку и анализ, а людей, которые этим занимаются, называют статистиками. В настоящее время статистика является важной отраслью практической деятельности, в которой участвуют много специалистов. Чтобы охарактеризовать, например, как растет продукция промышленности, необходимо каждой фабрике повседневно учитывать произведенные изделия. Данные учета нужно сводить в итоги по группам предприятий, отраслям производства, всей промышленности в целом. Эта работа проводится систематически, с подведением месячных, квартальных, годовых итогов.
В данной курсовой работе мной рассматриваются основные методы сглаживания и выравнивания динамических рядов.
На развитие явления во времени оказывают влияние факторы, различные по характеру и силе воздействия. Одни из них оказывают практически постоянное воздействие и формируют в рядах динамики определенную тенденцию развития. Воздействие же других факторов может быть кратковременным или носить случайный характер.
Поэтому при анализе динамики речь идет не просто о тенденции развития, а об основной тенденции, достаточно стабильной (устойчивой) на протяжении изученного этапа развития.
Задача состоит в том, чтобы выявить общую тенденцию в изменении уровней ряда, освобожденную от действия различных случайных факторов. С этой целью ряды динамики подвергаются обработке методами укрупнения интервалов, скользящей средней и аналитического выравнивания.
В процессе выполнения практической и аналитической частей курсовой работы я использовала для удобства, быстроты и проверки ручных вычислений табличный редакторе Excel.
Microsoft Excel является прикладной программой, предназначенной для работы с таблицами данных, преимущественно числовых.
Табличный процессор позволяет обрабатывать входящие в таблицы данные, а не только представлять их в электронной форме. Вычисления в таблицах Excel осуществляются при помощи формул. Формула может содержать числовые константы, ссылки на ячейки и функции Excel, соединённые знаками математических операций. Формулы применяются для описания связи между значениями, хранящимися в различных ячейках. Расчет по заданным формулам выполняется автоматически. Изменение содержимого какой – либо одной ячейки приводит к пересчету значений всех ячеек, которые с ней связаны формульными отношениями, а при обновлении каких-либо частных данных обновление всей таблицы происходит автоматически. Формула гарантирует, что при последующем редактировании таблицы не нарушит её целостность и правильность производимых в ней вычислений.
II
. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ
Одной из важнейших задач статистики является изучение изменений анализируемых показателей во времени, т.е. их динамика. Эта задача решается при помощи анализа рядов динамики (или временных рядов).
Ряд динамики (или динамический ряд) представляет собой ряд расположенных в хронологической последовательности числовых значений статистического показателя, характеризующих изменение общественных явлений во времени.
В каждом ряду динамики имеются два основных элемента: время t и конкретное значение показателя (уровень ряда) y.
Уровни ряда – это показатели, числовые значения которых составляют динамический ряд. Время – это моменты или периоды, к которым относятся уровни.
Построение и анализ рядов динамики позволяют выявить и измерить закономерности развития общественных явлений во времени. Эти закономерности не проявляются четко на каждом конкретном уровне, а лишь в тенденции, в достаточно длительной динамике. На основную закономерность динамики накладываются другие, прежде всего случайные, иногда сезонные влияния. Выявление основной тенденции в изменении уровней, именуемой трендом, является одной из главных задач анализа рядов динамики.
По времени, отраженному в динамических рядах, они разделяются на моментные и интервальные.
Моментным называется ряд динамики, уровни которого характеризуют состояние явления на определенные даты (моменты времени).
Примером моментного ряда могут служить следующие данные о численности населения.
Численность постоянного населения (на конец года), млн.чел.
Таблица 1
1970 г. | 1980г. | 1990г. | 1991г. | 1993 г. | 1994г. | 1995 г. |
130,6 | 138,8 | 148,2 | 148,3 | 148,0 | 147,9 | 147,6 |
Этот ряд характеризует динамику численности населения России в 1970-1995 гг.
Поскольку в каждом последующем уровне содержится полностью или частично значение предыдущего уровня, суммировать уровни моментного ряда не следует, так как это приводит к повторному счету.
Интервальным (периодическим) рядом динамики называется такой ряд, уровни которого характеризуют размер явления за конкретный период времени (год, квартал, месяц). Примером такого ряда могут служить данные о динамике добычи нефти в РФ.
Добыча нефти в Российской Федерации, млн.т.
Таблица 2
1990 г. | 1991 г. | 1992 г. | 1993 г. | 1994 г. | 1995 г. |
516 | 462 | 399 | 354 | 318 | 307 |
Этот ряд характеризует снижение уровня добычи нефти в России.
Значения уровня интервального ряда в отличие от уровней моментного ряда не содержатся в предыдущих или последующих показателях, их можно просуммировать, что позволяет получить ряды динамики более укрупненных периодов. Например, суммирование уровней добычи нефти за каждый год по данным, приведенным выше, позволяет определить ее добычу за все шесть лет в целом и в среднем за год.
Интервальный ряд, где последовательные уровни могут суммироваться, можно представить как ряд с нарастающими итогами. При построении таких рядов производится последовательное суммирование смежных уровней. Этим достигается суммарное обобщение результата развития изучаемого периода (месяца, квартала, года).
Одной из важнейших задач статистики является определение в рядах динамики общей тенденции развития явления.
В некоторых случаях закономерность изменения явления, общая тенденция его развития явно и отчетливо отражается уровнями динамического ряда (уровни на изучаемом периоде непрерывно растут или непрерывно снижаются).
К основным правилам формирования динамических (в том числе и временных) рядов относятся:
· периодизация динамики – это процесс выделения однородных этапов развития
· однокачественность отдельных уровней ряда
· сравнимость уровней ряда (должны быть одинаковые единицы измерения, единая методика расчета, одинаковый круг объектов и др.)
· последовательность и непрерывность во времени уровней ряда.
Временные ряды могут быть представлены в виде трех основных способов:
1. Табличный способ представления
Таблица 3
1986 | 1987 | 1988 | 1989 | 1990 | 1991 | 1992 | 1993 | 1994 | 1995 |
15,4 | 14 | 17,6 | 15,4 | 10,9 | 17,5 | 15 | 18,5 | 14,2 | 14,9 |
где ti – моменты t
yi – уровень ряда, характеризует значение изученного показателя на момент времени ti
.
2. Графический способ, когда с помощью прямоугольной системы координат откладываются точки (ti
;
yi).
Рис. 1 Фактический уровень урожайности 1986-1995 гг.
Геометрический способ представления имеет преимущество перед табличным своей наглядностью и с помощью эмпирической ломаной мы можем увидеть тенденцию развития изучаемого признака, а также визуально установить (хоть и приблизительно) ту линию, которая максимально приближена к опытным данным, т.е. сглаживает опытные точки или иначе может установить закономерность развития изучаемого признака, устранив субъективные ошибки, зависящие от производителя (аналитика) и составить аналитическую модель.
3. Аналитический способ, т.е. в виде зависимости, которая характеризует зависимость между изучаемым признаком и временным параметром y
=
f
(
t
).
Для анализа данного временного ряда используется совокупность методов в зависимости от цели анализа.
1 направление: поверхностное изучение закономерностей развития того или другого показателя. Используются различные числовые характеристики: абсолютный прирост, темп роста, темпы прироста, абсолютный размер 1% прироста и др. Используются средине величины: среднегодовой уровень, среднегодовой темп роста, среднегодовой темп прироста, коэффициент сезонности, сезонные колебания, сезонная волна.
2 направление: более глубокое изучение закономерностей развития показателя. Используется компонентный анализ, который представляет из себя разложение данного временного ряда на конечное число соответствующих. Любой экономический процесс может быть представлен хотя бы одним из нижеуказанных компонент.
Наиболее часто встречающимися, на которые можно разложить временной ряд, являются следующие:
U
(
t
) – характеризует устойчивые систематические изменения уровней ряда, т.е. тренд
K
(
t
) – нестрого периодические циклические колебания
V
(
t
) – строго периодические колебания (сезонные).
E
(
t
) – случайная компонента (несистематические колебания, которые возникают от случая.
Однако часто приходится встречаться с такими рядами динамики, в которых уровни ряда претерпевают самые различные изменения (то возрастают, то убывают) и общая тенденция развития неясна.
На развитие явления во времени оказывают влияние факторы, различные по характеру и силе воздействия. Одни из них оказывают практически постоянное воздействие и формируют в рядах динамики определенную тенденцию развития. Воздействие же других факторов может быть кратковременным или носить случайный характер.
Поэтому при анализе динамики речь идет не просто о тенденции развития, а об основной тенденции, достаточно стабильной (устойчивой) на протяжении изученного этапа развития.
Основной тенденцией развития (трендом) называется плавное и устойчивое изменения уровня явления во времени, свободное от случайных колебаний.
Задача состоит в том, чтобы выявить общую тенденцию в изменении уровней ряда, освобожденную от действия различных случайных факторов. С этой целью ряды динамики подвергаются обработке методами укрупнения интервалов, скользящей средней и аналитического выравнивания.
Одним из наиболее простых методов изучения основной тенденции в рядах динамики является укрупнение интервалов. Он основан на укрупнении периодов времени, к которым относятся уровни ряда динамики (одновременно уменьшается количество интервалов). Например, ряд ежесуточного выпуска продукции заменяется рядом месячного выпуска продукции и т. д. Средняя, исчисленная по укрупненным интервалам, позволяет выявлять направление и характер (ускорение или замедление роста) основной тенденции развития.
Рассмотрим применение метода укрупнения интервалов на ежемесячных данных о выпуске продукции на предприятии в 1996 г. (табл. 4).
Объем производства продукции предприятия (по месяцам) в сопоставимых целях, млрд.руб.
Таблица 4
Месяц | Объем производства |
Январь | 5,1 |
Февраль | 5,4 |
Март | 5,2 |
Апрель | 5,3 |
Май | 5,6 |
Июнь | 5,8 |
Июль | 5,6 |
Август | 5,9 |
Сентябрь | 6,1 |
Октябрь | 6,0 |
Ноябрь | 5,9 |
Декабрь | 6,2 |
Различные направления изменений уровней ряда по отдельным месяцам затрудняют выводы об основной тенденции производства. Если соответствующие месячные уровни объединить в квартальные и вычислить среднемесячный выпуск продукции по кварталам (табл. 5) , т. е. укрупнить интервалы, то решение задачи упрощается.
Объем производства продукции предприятия (по кварталам) в сопоставимых ценах, млрд.руб.
Таблица 5
Квартал | За квартал | В среднем за месяц |
I | 15.7 | 5.23 |
II | 16.7 | 5.57 |
III | 17.6 | 5.87 |
IV | 18.1 | 6.03 |
После укрупнения интервалов основная тенденция роста производства стала очевидной:
5,23< 5,57< 5,87< 6,03 млрд руб.
Выявление основной тенденции может осуществляться также методом скользящей (подвижной) средней. Сущность его заключается в том, что исчисляется средний уровень из определенного числа, обычно нечетного (3,5,7 и т. д. ), первых по счету уровней ряда, затем – из такого же числа уровней, но начиная со второго по счету, далее – начиная с третьего и т. д. Таким образом, средняя как бы «скользит» по ряду динамики, передвигаясь на один срок.
Расчет скользящей средней по данным об урожайности зерновых культур приведен в табл.6
Исходные данные и результаты расчета скользящей средней, ц/га
Таблица 6
Год | Фактический уровень урожайности | Скользящая средняя | |
| трехлетняя | пятилетняя | |
1986 | 15,4 | - | - |
1987 | 14 | (15,4+14,0+17,6) / 3 = 15,7 | - |
1988 | 17,6 | (14,0+17,6+15,4) / 3 =15,7 | 14,7 |
1989 | 15,4 | (17,6+15,4+10,9) / 3 =14,6 | 15,1 |
1990 | 10,9 | 14,6 | 15,2 |
1991 | 17,5 | 14,5 | 17,1 |
1992 | 15 | 17 | 16,8 |
1993 | 18,5 | 15,9 | 17,6 |
1994 | 14,2 | 15,9 | - |
1995 | 14,9 | - | - |
| | | |
Итого ∑ y = 153,4 |
Сглаженный ряд урожайности по трехлетиям короче фактического на один член ряда в начале и в конце, по пятилетиям – на два члена в начале и конце ряда. Он меньше, чем фактический подвержен колебаниям из–за случайных причин и четче, в виде некоторой плавной линии на графике (рис. 2), выражает основную тенденцию роста урожайности за изучаемый период, связанную с действием долговременно существующих причин и условий развития.
Рис. 2 Динамика уровня урожайности
Недостатком сглаживания ряда является укорачивание сглаженного ряда по сравнению с фактическим, а следовательно, потеря информации.
Рассмотренные приемы сглаживания динамических рядов (укрупнение интервалов и метод скользящей средней) дают возможность определить лишь общую тенденцию развития явления, более или менее освобожденную от случайных и волнообразных колебаний. Однако получить обобщенную статистическую модель тренда посредством этих методов нельзя.
Для того, чтобы дать количественную модель, выражающую основную тенденцию изменения уровней динамического ряда во времени, используется аналитическое выравнивание ряда динамики.
Основным содержанием метода аналитического выравнивания в рядах динамики является то, что общая тенденция развития рассчитывается как функция времени:
yt
=
f
(
t
),
где yt – уровни динамического ряда, вычисленные по соответствующему аналитическому уравнению на момент времени t
.
Определение теоретических (расчетных) уровней yt производится на основе так называемой адекватной математической модели, которая наилучшим образом отображает (аппромиксирует) основную тенденцию ряда динамики.
Выбор типа модели зависит от цели исследования и должен быть основан на теоретическом анализе, выявляющем характер развития явления, а также на графическом изображении ряда динамики (линейной диаграмме).
Например, простейшими моделями (формулами), выражающими тенденцию развития, являются:
линейная функция – прямая yt
= а0 + а1
t
,
где а0, а1 – параметры уравнения;
t – время;
показательная функция yt
= а0 а1t,;
степенная функция – кривая второго порядка (парабола)
yt
= а0 + а1
t
+ а2
t
2
.
В тех случаях, когда требуется особо точное изучение тенденции развития (например, модели тренда для прогнозирования), при выборе вида адекватной функции можно использовать специальные критерии математической статистики.
Расчет параметров функции обычно производится методом наименьших квадратов, в котором в качестве решения принимается точка минимума суммы квадратов отклонений между теоретическими и эмпирическими уровнями:
∑ (
yt
–
yi
)2 →
min
где yt – выравненные (расчетные) уровни;
yi – фактические уровни.
Параметры уравнения а
i
, удовлетворяющие этому условию, могут быть найдены решением системы нормальных уравнений. На основе найденного уравнения тренда вычисляются выравненные уровни. Таким образом, выравнивание ряда динамики заключается в замене фактических уровней yi плавно изменяющимися уровнями yt, наилучшим образом аппроксимирующими статистические данные.
Выравнивание по прямой используется, как правило, в тех случаях, когда абсолютные приросты практически постоянны, т.е. когда уровни изменяются в арифметической прогрессии (или близко к ней).
Выравнивание по показательной функции используется в тех случаях, когда ряд отражает развитие в геометрической прогрессии, т.е. когда цепные коэффициенты роста практически постоянны.
Рассмотрим «технику» выравнивания ряда динамики по прямой: yt
= а0 + а1t. Параметры а0 ,
а1 согласно методу наименьших квадратов, находятся решением следующей системы нормальных уравнений, полученной путем алгебраического преобразования условия (1.1):
а0
n
+ а1
∑
t
=
∑
y
; (1.1)
а0
∑
t
+ а1
∑
t
2
=
∑
yt
,
где y – фактические (эмпирические) уровни ряда;
t
– время (порядковый номер периода или момента времени).
Расчет параметров значительно упрощается, если за начало отсчета времени (t
=0) принять центральный интервал (момент).
При нечетном числе уровней (например, 6) значения t – условного обозначения времени будет таким (это равнозначно измерению времени не в годах, а в полугодиях):
1990 г. 1991 г. 1992 г. 1993 г. 1994 г. 1995 г.
-5 -3 -1 +1 +3 +5
При нечетном числе уровней (например,7) значения устанавливаются по-другому:
1989 г. 1990 г. 1991 г. 1992 г. 1993 г. 1994 г. 1995 г.
-3 -2 -1 0 +1 +2 +3
В обоих случаях ∑
t
= 0, так что система нормальных уравнений (1.1) принимает вид:
∑
y
=
а0
n
(1.2)
∑
yt
=
а1
∑
t
2
Из первого уравнения а0=∑
y
/
n (1.3)
Из второго уравнения а1= ∑
yt
/ ∑
t
2 (1.4)
Проиллюстрируем на примере урожайности зерновых культур (см. табл.6, расчетные значения – табл.7) выравнивание ряда динамики по прямой.
Для выравнивания данного ряда используем линейную трендовую модель – уравнение прямой: yt
= а0 + а1
t . В нашем примере n
= 10 – четное число.
Параметры а0 и а1 искомого уравнения прямой исчислим по формулам (1.3) и (1.4).
Таблица 7
Выравнивание по прямой ряда динамики урожайности зерновых культур
Год | y | t | t2 | y*t | yt | yi - yt | (yi - yt)2 |
| | | | | | | |
1986 | 15,4 | -9 | 81 | -138,6 | 15,15 | 0,25 | 0,062 |
1987 | 14 | -7 | 49 | -98 | 15,19 | -1,19 | 1,423 |
1988 | 17,6 | -5 | 25 | -88 | 15,24 | 2,37 | 5,593 |
1989 | 15,4 | -3 | 9 | -46,2 | 15,28 | 0,12 | 0,015 |
1990 | 10,9 | -1 | 1 | -10,9 | 15,32 | -4,42 | 19,528 |
1991 | 17,5 | 1 | 1 | 17,5 | 15,36 | 2,14 | 4,575 |
1992 | 15 | 3 | 9 | 45 | 15,40 | -0,40 | 0,162 |
1993 | 18,5 | 5 | 25 | 92,5 | 15,45 | 3,06 | 9,333 |
1994 | 14,2 | 7 | 49 | 99,4 | 15,49 | -1,29 | 1,656 |
1995 | 14,9 | 9 | 81 | 134,1 | 15,53 | -0,63 | 0,396 |
| | | | | | | |
∑ | 153,4 | 0 | 330 | 6,8 | 153,40 | 0 | 42,744 |
Из табл.7 находим
∑
yt = 153,4 ∑ y
*
t = 6,8 ∑ t
2 = 330,
откуда а0 = 153.4 / 10 = 15.34; а1 = 6,8 / 330 = 0,021.
Уравнение прямой, представляющее собой трендовую модель искомой функции, будет иметь вид: yt
= 15,34 + 0,021
t .
Подставляя в данное уравнение последовательно значения t
, равные -9, -7, -5, -3, -1, +1, +3, +5, +7, +9, находим выравненные уровни yt .
Если расчеты выполнены правильно, то ∑ y
= ∑
yt . В нашем примере ∑ y
= ∑
yt = 153,4. Следовательно, значения уровней ряда найдены верно.
Полученное уравнение показывает, что несмотря на значительные колебания в отдельные годы, наблюдается тенденция увеличения урожайности: с 1986 по 1995 гг. урожайность зерновых культур в среднем возросла на а1 =0,021 ц/га в год.
Фактические и расчетные значения урожайности зерновых культур представим в виде графика (рис.3)
Рис.3. Уровни урожайности зерновых культур (сглаженные)
Соединив точки, построенные по фактическим данным, получим ломаную линию, на основании которой затруднительно вынести суждение о характере общей тенденции в изменении урожайности.
Тенденция роста урожайности зерновых культур в изучаемом периоде отчетливо проявляется в результате построения выравненной прямой yt
= 15,34 + 0,021
t
.
III
. ПРАКТИЧЕСКАЯ ЧАСТЬ
Задание 1
Динамика отпуска электроэнергии за пределы РФ за 1990-2000 гг. характеризуется следующими данными:
Таблица 8
Год | Отпущено электроэнергии, млрд квт.час |
1990 | 43,4 |
1991 | 47,2 |
1992 | 44,0 |
1993 | 43,4 |
1994 | 41,7 |
1995 | 38,0 |
1996 | 31,8 |
1997 | 26,8 |
1998 | 26,4 |
1999 | 22,5 |
2000 | 22,9 |
Итого | 388,1 |
Выявить основную тенденцию отпуска электроэнергии за пределы РФ за 1990-2000 гг.:
1) методом трехлетней скользящей средней;
2) методом аналитического выравнивания;
3) изобразить графически фактические и выравненные значения.
Алгоритм решения задачи:
1)
Метод трехлетней скользящей средней
Исчисляем средний уровень из 11 первых по счету уровней ряда. Для этого используем формулу средней арифметической:
Y ср = y1 + y2 +… + yn / n
где y1 ;y2; yn – индивидуальные значения варьирующего признака;
n – число единиц совокупности.
В нашем примере трехлетняя скользящая средняя, поэтому n = 3.
Y2 ср = y1 + y2 + y3 / 3 = 43,4 + 47,2 + 44,0 / 3 = 44,87
Y3 ср = y2 + y3 + y4 / 3 = 47,2 +44,0 + 43,4 / 3 = 44,87
Y4 ср = y3 + y4 + y5 / 3 = 44,0 + 43,4 + 41,7 / 3 = 43,03
Y5 ср = y4 + y5 + y6 / 3 =43,4 + 41,7 + 38,0 / 3 = 41,03
Y6 ср = y5 + y6 + y7 / 3 = 41,7 + 38,0 + 31,8 / 3 = 37,17
Y7 ср = y6 + y7 + y8 / 3 = 38,0 + 31,8 + 26,8 / 3 = 32,2
Y8 ср = y7 + y8 + y9 / 3 = 31,8 + 26,8 + 26,4 / 3 = 28,33
Y9 ср = y8 + y9 + y10 / 3 = 26,8 + 26,4 + 22,5 / 3 = 25,23
Y10 ср = y9 + y10 + y11 / 3 = 26,4 + 22,5 + 22,9 / 3 = 23,93
В результате обработки ряда мы видим, что появилась тенденция к существенному уменьшению потребления электроэнергии (в 1990 году расход составил 43,4 млрд.квт.час, в 2000 году – 22,9). Графически эта тенденция выглядит так: