Контрольная работа по Эконометрике 3
Работа добавлена на сайт bukvasha.net: 2015-10-25Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего
от 25%

Подписываем
договор
Вариант №3.
Задача №1.
Территории федерального округа | Валовой региональный продукт, млрд. руб., Y | Среднегодовая численность занятых в экономике, млн. чел., X |
1. Респ. Адыгея | 5,1 | 0,157 |
2. Респ. Дагестан | 13,0 | 0,758 |
3. Респ. Ингушетия | 2,0 | 0,056 |
4. Кабардино-Балкарская Респ. | 10,5 | 0,287 |
5. Респ. Калмыкия | 2,1 | 0,119 |
6. Карачаево-Черкесская Респ. | 4,3 | 0,138 |
7. Респ. Северная Осетия – Алания | 7,6 | 0,220 |
8. Краснодарский край | 109,1 | 2,033 |
9. Ставропольский край | 43,4 | 1,008 |
10. Астраханская обл. | 18,9 | 0,422 |
11. Волгоградская обл. | 50,0 | 1,147 |
12. Ростовская обл. | 69,0 | 1,812 |
Итого, S | 335 | 8,157 |
Средняя | 27,917 | 0,6798 |
Среднее квадратическое отклонение , s | 32,20 | 0,6550 |
Дисперсия , D | 1036,87 | 0,4290 |
По территориям Южного федерального округа приводятся статистические данные за 2000 год:
Таблица №1
Задание:
1. Расположите территории по возрастанию фактора X. Сформулируйте рабочую гипотезу о возможной связи Y и X.
2. Постройте поле корреляции и сформулируйте гипотезу о возможной форме и направлении связи.
3. Рассчитайте параметры а1 и а0 парной линейной функции
4. Оцените тесноту связи с помощью показателей корреляции (ryx и ηylnx) и детерминации (r
2yx и η
2ylnx), проанализируйте их значения.
5. Надёжность уравнений в целом оцените через F -критерий Фишера для уровня значимости a=0,05.
6. На основе оценочных характеристик выберите лучшее уравнение регрессии и поясните свой выбор.
7. По лучшему уравнению регрессии рассчитайте теоретические значения результата (
8. Рассчитайте прогнозное значение результата
9. Рассчитайте интегральную и предельную ошибки прогноза (для a=0,05), определите доверительный интервал прогноза (
Решение:
1.Предварительный анализ исходных данных выявил наличие одной территории(Краснодарский край) с аномальными значениями признаков. Эта территория исключена из дальнейшего анализа. Расположим территории по возрастанию фактора X.
Территория федерального округа Среднегодовая численность занятых в экономике, млн. чел., X факт. Валовой региональный продукт, млрд. руб., Y
Таблица №2
Территории федерального округа | Среднегодовая численность занятых млн. чел., X | Валовый региональный продукт млрд. руб., Y |
1. Респ. Ингушетия | 0.056 | 2.0 |
2. Респ.Калмыкия | 0.119 | 2.1 |
3. Карачаево-Черкесская республика | 0.138 | 4.3 |
4. Респ. Адыгея | 0.157 | 5.1 |
5. Респ. Северная Осетия-Алтания | 0.220 | 7.6 |
6. Кабардино-Балканская Респ. | 0.287 | 10.5 |
7. Астраханкая обл. | 0.422 | 18.9 |
8. Респ. Дагестан | 0.758 | 13.0 |
9. Ставропольский край | 1.008 | 43.4 |
10. Волгоградская обл. | 1.147 | 50.0 |
11. Ростовская обл. | 1.812 | 69.0 |
Итого | 8.157 | 335 |
Средняя | 0.6798 | 27.917 |
Среднее квадратическое отклонение , s | 0.6550 | 32.20 |
Дисперсия , D | 0.4290 | 1036.87 |
2. Обычно моделирование начинается в построения уравнения прямой: , отражающей линейную форму зависимости результата Y от фактора X.
3. Расчёт неизвестных параметров уравнения выполним методом наименьших квадратов (МНК), построив систему нормальных уравнений и решая её, относительно неизвестных а0 и а1. Для расчёта используем значения определителей второго порядка Δ, Δа0 и Δа1. Расчётные процедуры представим в разработочной таблице, в которую, кроме значений Y и X, войдут X2, X*Y, а также их итоговые значения, средние, сигмы и дисперсии для Y и X. ( см. табл.3)
Таблица №3
№ | | | | | | | | |
А | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
1 | 0,056 | 2,0 | 0,003 | 0,112 | 0,725 | 1,275 | 1, 626 | 6, 209 |
2 | 0, 119 | 2,1 | 0,014 | 0,250 | 3,218 | -1,118 | 1,249 | 5,442 |
3 | 0,138 | 4,3 | 0,019 | 0,593 | 3,969 | 0,331 | 0,109 | 1,610 |
4 | 0,157 | 5,1 | 0,025 | 0,801 | 4,721 | 0,379 | 0,144 | 1,845 |
5 | 0,22 | 7,6 | 0,048 | 1,672 | 7,214 | 0,386 | 0,149 | 1,881 |
6 | 0,287 | 10,5 | 0,082 | 3,014 | 9,865 | 0,365 | 0,404 | 3,094 |
7 | 0,442 | 18,9 | 0,178 | 7,976 | 15,206 | 3,694 | 13,089 | 17,475 |
8 | 0,758 | 13,0 | 0,575 | 9,854 | 28,500 | -15,506 | 240,243 | 75,475 |
9 | 1,008 | 43,4 | 1,016 | 43,747 | 38,391 | 5,009 | 25,089 | 24,396 |
10 | 1,147 | 50,0 | 1,316 | 57,350 | 43,891 | 6,109 | 37,324 | 29,749 |
11 | 1,812 | 69,0 | 3,283 | 125,028 | 70,202 | -1,202 | 1,444 | 5,851 |
Итого | 6,214 | 225,900 | 6,559 | 250,397 | 121,2 | 0,000 | 321,427 | 173,536 |
Средняя | 0,557 | 20,556 | — | — | — | — | — | 15,776 |
Сигма | 0,535 | 21,852 | — | — | — | — | — | — |
Дисперсия, D | 0,286 | 477,502 | — | — | — | — | — | — |
Δ= | 34,650 | — | — | — | — | — | — | — |
Δа0= | -51,654 | | -1,491 | — | — | — | — | — |
Δа1= | 1370,950 | | 39,565 | — | — | — | — | — |
Расчёт определителя системы выполним по формуле:
Расчёт определителя свободного члена уравнения выполним по формуле:
Расчёт определителя коэффициента регрессии выполним по формуле:
4. Расчёт параметров уравнения регрессии даёт следующие результаты:
В конечном счёте, получаем теоретическое уравнение регрессии следующего вида:
В уравнении коэффициент регрессии а1 = 39,565 означает, что при увеличении среднегодовой численности занятых в экономике на 1 млн. чел. (от своей средней) валовой региональный продукт возрастёт на 39,565 млрд. руб. (от своей средней).
Свободный член уравнения а0 = -1,491 оценивает влияние прочих факторов, оказывающих воздействие на валовой региональный продукт.
Относительную оценку силы связи даёт общий (средний) коэффициент эластичности:
5. Относительную оценку силы связи даёт общий (средний) коэффициент эластичности:
В нашем случае, когда рассматривается линейная зависимость, расчётная формула преобразуется к виду:
Это означает, что при изменении среднегодовой численности занятых в экономике на 1% от своей средней валовой региональный продукт увеличивается на 1,073 процента от своей средней.
6. Для оценки тесноты связи рассчитаем линейный коэффициент парной корреляции:
Коэффициент корреляции, равный 0,9687, показывает, что выявлена весьма тесная зависимость между среднегодовой численностью занятых в экономике и валовым региональным продуктом. Коэффициент детерминации, равный 0,9384, устанавливает, что вариация валового регионального продукта на 93,84% из 100% предопределена вариацией среднегодовой численности занятых в экономике; роль прочих факторов, влияющих на розничный товарооборот, определяется в 6,16%, что является сравнительно небольшой величиной.
7. Для оценки статистической надёжности выявленной зависимости дохода от доли занятых рассчитаем фактическое значение F-критерия Фишера – Fфактич. и сравним его с табличным значением – Fтабл.. По результатам сравнения примем решения по нулевой гипотезе , то есть, либо примем, либо отклоним её с вероятностью допустить ошибку, которая не превысит 5% (или с уровнем значимости α=0,05).
В нашем случае,
Где k -число факторов в уравнении; n - число изучаемых объектов. Фактическое значение критерия показывает, что факторная вариация результата в 137 раза больше остаточной вариации, сформировавшейся под влиянием случайных причин. Очевидно, что подобные различия не могут быть случайными, а являются результатом систематического взаимодействия оборота розничной торговли и общей суммы доходов населения. Для обоснованного вывода сравним полученный результат с табличным значением критерия: при степенях свободы d.f.1
=k=1 и d.f.
2
=n-k-1=11-1-1=9 и уровне значимости α=0,05.
В силу того, что нулевую гипотезу о статистической не значимости выявленной зависимости валового регионального продукта от среднегодовой численности занятых в экономике и её параметрах можно отклонить с фактической вероятностью допустить ошибку значительно меньшей, чем традиционные 5%.
Определим теоретические значения результата Y
теор
. Для этого в полученное уравнение последовательно подставим фактические значения фактора X и выполним расчёт.
Например,
теор. и X
факт. строится теоретическая линия регрессии, которая пересечётся с эмпирической регрессией в нескольких точках. См. график 1.
9. Построим теоретическую линю регрессии, которая пересечётся с эмпирической регрессией в нескольких точках.
В нашем случае, скорректированная ошибка аппроксимации составляет 15,776%. Она указывает на невысокое качество построенной линейной модели и ограничивает её использование для выполнения точных прогнозных расчётов даже при условии сравнительно небольшого изменения фактора X (относительно его среднего значения
).
Зависимость ВРП от численности занятых
График№1
Оценку качества модели дадим с помощью скорректированной средней ошибки аппроксимации:
В нашем случае, скорректированная ошибка аппроксимации составляет 15,776%. Она указывает на невысокое качество построенной линейной модели и ограничивает её использование для выполнения точных прогнозных расчётов даже при условии сравнительно небольшого изменения фактора X (относительно его среднего значения ).
Построение логарифмической функции предполагает предварительное выполнение процедуры линеаризации исходных переменных. В данном случае, для преобразования нелинейной функции в линейную введём новую переменную, которая линейно связана с результатом. Следовательно, для определения параметров модели будут использованы традиционные расчётные приёмы, основанные на значениях определителей второго порядка.
Построение логарифмической функции предполагает предварительное выполнение процедуры линеаризации исходных переменных. В данном случае, для преобразования нелинейной функции
Таблица№4
№ | | | | | | | | | |
А | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
1 | 0,056 | -2,882 | 2,000 | 8,308 | -5,765 | -12,249 | 14,249 | 203,023 | 69,382 |
2 | 0,119 | -2,129 | 2,100 | 4,531 | -4,470 | 1,550 | 0,550 | 0,303 | 2,680 |
3 | 0,138 | -1,981 | 4,300 | 3,922 | -8,516 | 4,261 | 0,039 | 0,001 | 0,188 |
4 | 0,157 | -1, 852 | 5,100 | 3,428 | -9,443 | 6,623 | -1,523 | 2,318 | 7,414 |
5 | 0,220 | -1,514 | 7,600 | 2,293 | -11,507 | 12,799 | -5,199 | 27,025 | 25,314 |
6 | 0,287 | -1,248 | 10,500 | 1,558 | -13,107 | 17,665 | -7,165 | 51,341 | 234,890 |
7 | 0,422 | -0,863 | 18,900 | 0,744 | -16,306 | 24,722 | -5,822 | 33,901 | 28,352 |
8 | 0,758 | -0,277 | 13,000 | 0,077 | -3,602 | 35,444 | -22,444 | 503,720 | 109,288 |
9 | 1,008 | 0,008 | 43,400 | 0,000 | 0,346 | 40,662 | 2,738 | 7,499 | 13,335 |
10 | 1,147 | 0,137 | 50,000 | 0,019 | 6,857 | 43,026 | 6,974 | 48,632 | 33,958 |
11 | 1,812 | 0,594 | 69,000 | 0,353 | 41,016 | 51,397 | 17,603 | 309,860 | 85,715 |
Итого | 6,124 | -12,006 | 225,900 | 25,234 | -24,497 | 225,900 | 0,000 | 1187,624 | 410,517 |
Средняя | 0,557 | -1,091 | 20,536 | — | — | — | — | 2,9 | 10,5 |
Сигма | 0,535 | 1,050 | 21,852 | ||||||
Дисперсия, D | 0,286 | 1,103 | 477,502 |
Расчёт определителей второго порядка даёт следующие результаты:
Отсюда получаем параметры уравнения:
Полученное уравнение имеет вид:
Оценочные показатели позволяют сделать вывод, что линейно-логарифмическая функция описывает изучаемую связь хуже, чем линейная модель: оценка тесноты выявленной связи ρ=0,8798 (сравните с 0,7741), скорректированная средняя ошибка аппроксимации здесь выше и составляет 37,32%, то есть возможности использования для прогноза данной модели более ограничены.
Заключительным этапом решения данной задачи является выполнение прогноза и его оценка.
Если прогнозное значение фактора составит 1,023 от среднего уровня, то есть
Xпрогнозн.= 1,023*0,557=0,569, тогда прогнозное значение результата сформируется на уровне: Yпрогнозн. =39,565-1,491*0,569=38,715 (млрд. руб.).
Рассчитаем интегральную ошибку прогноза -
Ошибка положения регрессии составит: 0,012 (млрд. руб.).
Интегральная ошибка прогноза составит: 5,976 (млрд. руб.).
Предельная ошибка прогноза, которая не будет превышена в 95% возможных реализаций прогноза, составит:
Это означает, что фактическая реализация прогноза будет находиться в доверительном интервале .
Верхняя граница доверительного интервала составит
Нижняя граница доверительного интервала составит:
Относительная величина различий значений верхней и нижней границ составит:
Задача№2.
Производится анализ значений социально-экономических показателей по территориям Северо-Западного федерального округа РФ за 2000 год..
Y – оборот розничной торговли, млрд. руб.;
X
1 – кредиты, предоставленные в 2000 году предприятиям, организациям, банкам и физическим лицам, млрд. руб.;
X
2 – доля лиц в высшим и незаконченным высшим образованием среди занятых, %;
X
3 – годовой доход всего населения, млрд. руб.
Требуется изучить влияние указанных факторов на стоимость валового регионального продукта.
Предварительный анализ исходных данных по 10 территориям выявил наличие двух территорий (г. Санкт-Петербург и Вологодская обл.) с аномальными значениями признаков. Эти территории должны быть исключены из дальнейшего анализа. Значения приводимых показателей рассчитаны без учёта указанных двух аномальных единиц.
При обработке исходных данных получены следующие значения:
А) - линейных коэффициентов парной корреляции, средних и средних квадратических отклонений -σ:
N
=8.
| Y | X1 | X2 | X3 |
Y | 1 | 0,2461 | 0,0117 | 0,9313 |
X1 | 0,2461 | 1 | 0,8779 | 0,0123 |
X2 | 0,8779 | 0,8897 | 1 | -0,2041 |
X3 | 0,9313 | 0,0123 | -0,2041 | 1 |
Средняя | 13,64 | 0,2134 | 22,29 | 24,69 |
| 4,250 | 0,1596 | 2,520 | 9,628 |
уровня (
Б) - коэффициентов частной корреляции
| Y | X1 | X2 | X3 |
Y | 1 | 0,3734 | -0,0388 | 0,9473 |
X1 | 0,3734 | 1 | 0,8483 | -0,2322 |
X2 | -0,0388 | 0,8483 | 1 | -0,1070 |
X3 | 0,9473 | -0,2322 | -0,1070 | 1 |
Задание:
1. По значениям линейных коэффициентов парной и частной корреляции выберите неколлинеарные факторы и рассчитайте для них коэффициенты частной корреляции. Произведите окончательный отбор информативных факторов во множественную регрессионную модель.
2. Выполните расчёт бета коэффициентов (b) и постройте с их помощью уравнение множественной регрессии в стандартизованном масштабе. Проанализируйте с помощью бета коэффициентов (b) силу связи каждого фактора с результатом и выявите сильно и слабо влияющие факторы.
3. По значениям b-коэффициентов рассчитайте параметры уравнения в естественной форме (a
1
,
a
2 и a
0). Проанализируйте их значения. Сравнительную оценку силы связи факторов дайте с помощью общих (средних) коэффициентов эластичности -
4. Оцените тесноту множественной связи с помощью R и R
2, а статистическую значимость уравнения и тесноту выявленной связи - через F -критерий Фишера (для уровня значимости a=0,05).
5. Рассчитайте прогнозное значение результата, предполагая, что прогнозные значения факторов составят 108,5 процента от их среднего уровня.
6. Основные выводы оформите аналитической запиской.
Решение:
1.Представленные в условии задачи значения линейных коэффициентов парной корреляции позволяют установить, что оборот розничной торговли Y более тесно связан с годовым доходом всего населения X
3
(
X
2
(
X
1
. Поэтому, в силу небольшой информативности фактора, предполагаем, что его можно исключить из дальнейшего анализа. Проверим наши предположения с помощью анализа матрицы коэффициентов частной корреляции. Очевидно, что наиболее тесная связь результата Y с годовым доходом всего населения (
(
1 и с X
3, а также для Y c X
2 и X
3.
Расчёты частных коэффициентов корреляции выполним по следующим формулам:
Как видим, факторы X
₁
и
X
₃
, действительно, тесно связаны с результатом, и между собой сильно взаимодействуют.
Расчёт аналогичных показателей по следующей паре факторов приводит к иным результатам:
В данном случае, межфакторное взаимодействие оценивается как заметное (
2. При построении двухфакторной регрессионной модели воспользуемся для упрощения расчётов методом стандартизованных переменных. В этом случае, исходное уравнение приобретает вид:
В результате получено уравнение в стандартизованном масштабе:
Параметры данного уравнения представляют собой относительные оценки силы влияния каждого из факторов на результат. При увеличении первого фактора на одну сигму -pea
(от своей средней) оборот розничной торговли увеличивается на 0,235 своей сигмы (
); с увеличением второго фактора на результат увеличивается на 0,928
. Сравнивая b-коэффициентов, определяем, какой из признаков влияет на результат сильнее, а какой – слабее. В данном случае, увеличение розничного товарооборота происходит, прежде всего, под влиянием третьего фактора и в меньшей степени – в результате увеличения первого фактора.3. Используя значения - коэффициентов, можно рассчитать параметров уравнения в естественной форме:
В конечном счёте, имеем уравнение:
С увеличением первого фактора на 1 единицу результат увеличивается на 6,258 млрд. руб., с увеличением третьего фактора на 1 единицу увеличивается на 0,409 млрд. руб.
Но так как признаки-факторы измеряются в разных единицах, сравнивать значения их коэффициентов регрессии не следует. Точную оценку силы связи факторов с результатом дают коэффициенты эластичности и β - коэффициенты.
4. Для сравнительной оценки силы связи выполним расчёт средних коэффициентов эластичности. С их помощью можно определить, на сколько процентов изменяется результат при изменении фактора на 1% (от своего среднего значения). В нашем случае, расчёт показал, что первого фактора на розничный товарооборот оказалось менее сильным по сравнению с влиянием третьего фактора: с ростом первого фактора на 1% розничный товарооборот увеличивается на 0,098%, а при увеличении третьего фактора на 1% розничный товарооборот уменьшается на 0,74%. Различия в силе влияния весьма значительны: первый фактор влияет на результат в семь с лишним раз слабее, чем третий. Поэтому регулирование величины розничного товарооборота через третий фактор будет более результативным, чем через первый.
6. Тесноту выявленной зависимости розничного товарооборота от инвестиций в экономику региона и от численности населения оценивают множественный коэффициент корреляции и детерминации. Расчёт коэффициента корреляции выполним, используя известные значения линейных коэффициентов парной корреляции и β – коэффициентов:
Как показали расчёты, установлена весьма тесная зависимость розничного товарооборота от первого и третьего фактора. Это означает, что 92,2% вариации розничного товарооборота определены вариацией данных факторов. Оставшиеся 7,8% вариации результата сформировались под влиянием прочих причин, роль которых незначительна.
7. Оценка статистической значимости или надёжности установленной формы зависимости, её параметров, оценок её силы и тесноты является важным этапом анализа результатов. Для выполнения оценки формулируется нулевая гипотеза, которая рассматривает предположение о случайной природе полученных результатов. То есть
В нашем случае, когда рассматривается зависимость результата от двух факторов, расчёт выглядит следующим образом:
Фактическое значение критерия показывает, что детерминация, сформированная под воздействием двух изучаемых факторов, почти в 30 раз больше, чем детерминация, связанная с действием прочих причин. Очевидно, что подобное соотношение случайно сформироваться не может, а является результатом влияния существенных, систематических факторов.
Для принятия обоснованного решения Fфактич. сравнивается с Fтабл., которое формируется случайно и зависит степеней свободы факторной (d.f.1 = k) и остаточной (d.f.2 = n-k-1) дисперсий, а также от уровня значимости α=0,05. В нашем примере, где d.f.1=k= 2 и d.f.2=n-k-1 = 8-2-1=5 при α=0,05 Fтабл = 5,79. В силу того, что Fфактич. =29,551> Fтабл. = 5,79, можно с высокой степенью надёжности отклонить нулевую гипотезу, а в качестве альтернативы – согласиться с утверждением, что проверяемые параметры множественной регрессионной модели неслучайны, что коэффициенты уравнения и показатели тесноты связи не являются случайными величинами.
8. Техническая часть прогнозных расчётов по уравнению множественной регрессии сравнительно проста. Достаточно определить прогнозные значения каждого факторного признака
После подстановки в уравнение получаем следующий результат:
Если кредиты, предоставленные в 2000 году предприятиям, организациям, банкам и физическим лицам возрастут до 0,232 млрд. руб., а годовой доход всего населения составит 26,789 млрд. руб., тогда следует ожидать, что розничный товарооборот возрастёт до 14,615 млрд. руб., то есть увеличится на 7,2% от своего среднего уровня.
Задача №3.
Для проверки рабочих гипотез (№1 и №2) о связи социально-экономических показателей в регионе используется статистическая информация за 2000 год по территориям Центрального федерального округа.
Y
1 – среднегодовая стоимость основных фондов в экономике, млрд. руб.;
Y
2 – стоимость валового регионального продукта, млрд. руб.;
X
1 – инвестиции прошлого, 1999, года в основной капитал, млрд. руб.;
X
2
– кредиты прошлого, 1999, года, предоставленные предприятиям, организациям, банкам и физическим лицам, млрд. руб.
X
3 – среднегодовая численность занятых в экономике, млн. чел.
Рабочие гипотезы:
Предварительный анализ исходных данных по 18 территориям выявил наличие трёх территорий (г. Москва, Московская обл., Воронежская обл.) с аномальными значениями признаков. Эти единицы должны быть исключены из дальнейшего анализа. Значения приводимых показателей рассчитаны без учёта указанных аномальных единиц.
При обработке исходных данных получены следующие значения линейных коэффициентов парной корреляции, средних и средних квадратических отклонений -σ:
N
=15.
Для проверки рабочей гипотезы №1. Для проверки рабочей гипотезы №2.
| Y1 | X1 | X2 | | Y2 | | X3 |
Y1 | 1 | 0,6631 | 0,7477 | Y2 | 1 | 0,7863 | 0,7337 |
X1 | 0,6631 | 1 | 0,4747 | | 0,7863 | 1 | 0,6177 |
X2 | 0,7477 | 0,4747 | 1 | X3 | 0,7337 | 0,6177 | 1 |
Средняя | 115,83 | 0,1615 | 3,75 | Средняя | 23,77 | 115,83 | 0,570 |
| 30,0303 | 0,1400 | 1,6836 | | 7,2743 | 30,0303 | 0,1160 |
Задание:
1. Составьте систему уравнений в соответствии с выдвинутыми рабочими гипотезами.
2. Определите вид уравнений и системы.
3. На основе приведённых в условии значений матриц коэффициентов парной корреляции, средних и средних квадратических отклонений:
- определите бета коэффициенты (b) и постройте уравнения множественной регрессии в стандартизованном масштабе;
- дайте сравнительную оценку силы влияния факторов на результат;
- рассчитайте параметры a
1
,
a
2 и a
0
уравнений множественной регрессии в естественной форме;
- с помощью коэффициентов парной корреляции и b коэффициентов рассчитайте для каждого уравнения линейный коэффициент множественной корреляции (R) и детерминации (R
2);
- оцените с помощью F-критерия Фишера статистическую надёжность выявленных связей.
4. Выводы оформите краткой аналитической запиской.
Решение:
1.В соответствии с выдвинутыми рабочими гипотезами о связи признаков составим систему уравнений. Коэффициенты при эндогенных переменных обозначим через b , коэффициенты при экзогенных переменных - через a. Каждый коэффициент имеет двойную индексацию: первый индекс – номер уравнения, второй – индивидуальный номер признака. Тогда:
2. Особенность данной системы в том, что в первом уравнении факторы представлены перечнем традиционных экзогенных переменных, значения которых формируются вне данной системы уравнений. Во втором уравнении в состав факторов входит эндогенная переменная Y1, значения которой формируются в условиях данной системы, а именно, в предыдущем уравнении. Системы уравнений, в которых переменные первоначально формируются как результаты, а в дальнейшем выступают в качестве факторов, называются рекурсивными. Именно с подобной системой уравнений имеем дело в данной задаче.
3. Выполним расчёт b-коэффициентов и построим уравнения множественной регрсии в стандартизованном масштабе. Для уравнения №1:
По полученным результатам построено уравнение в стандартизованном виде:
По данным первого уравнения сделаем вывод, что фактор (
влияет на результат - среднегодовую
(
стоимость основных фондов в экономике слабее, чем второй фактор
(
, т.к.
Второе уравнение можно построить на основе следующих результатов:
Второе уравнение в стандартизованной форме имеет вид:
Из второго уравнения очевидно, что на Y2 – стоимость валового регионального продукта среднегодовая стоимость основных фондов в экономике оказывает более сильное влияние, чем третий фактор.
4. Расчёт параметров уравнения регрессии в естественной форме даёт следующие результаты:
По полученным результатам построено уравнение №1 в естественной форме:
Параметры уравнения №2 рассчитываются аналогичным образом. Но главная отличительная особенность их расчёта в том, что в качестве одного из факторов выступают не фактические значения
, а его теоретические значения
Указанным способом рассчитаны параметры рекурсивного уравнения:
По полученным результатам построено уравнение №2 в естественной форме:
Представим результаты построения уравнений в виде рекурсивной системы:
Значения коэффициентов регрессии каждого из уравнений могут быть использованы для анализа силы влияния каждого из факторов на результат. Но для сравнительной оценки силы влияния факторов необходимо использовать либо значения - коэффициентов, либо средних коэффициентов эластичности -
5. Для каждого из уравнений системы рассчитаем показатели корреляции и детерминации.
В первом уравнении факторы
и
объясняют 82,56% вариации среднегодовой стоимости основных фондов в экономике, а 17,44% его вариации определяется влиянием прочих факторов.
Во втором уравнении переменные
и
объясняют 84,72% стоимости валового регионального продукта, а 15,28% изменений зависят от прочих факторов
. Обе регрессионные модели выявляют тесную связь результата с переменными факторного комплекса.
6.Оценим существенность выявленных зависимостей. Для этого сформулируем нулевые гипотезы о статистической незначимости построенных моделей и выявленных ими зависимостей:
Для проверки нулевых гипотез используется F-критерий Фишера. Выполняется расчёт его фактических значений, которые сравниваются с табличными значениями критерия. По результата сравнения принимается решение относительно нулевой гипотезы. В нашей задаче:
Табличные значения F-критерия формируются под влиянием случайных причин и зависят от трёх условий: а) от числа степеней свободы факторной дисперсии -
В рассматриваемой задаче для и
Задача №4.
Предлагается изучить взаимосвязи социально-экономических показателей региона за период.
Y
1
- удельный вес занятых в экономике среди всего населения региона, %
Y
2 - среднемесячная заработная плата 1-го занятого в народном хозяйстве региона, тыс. руб.
Y
3 - среднемесячный душевой доход населения региона, тыс. руб.
X
1 – средний возраст населения региона, лет
X
2 - доля безработных среди экономически активного населения, %
X
3 - стоимость продукции и услуг в среднем на 1-го занятого в народном хозяйстве регина, тыс. руб.
X
4 - инвестиции текущего года в народное хозяйство региона, млрд. руб.
X
5 - среднемесячный размер назначенной пенсии, тыс. руб.
Приводится система рабочих гипотез, справедливость которые необходимо проверить:
Задание:
1. На основе рабочих гипотез постройте систему структурных уравнений и проведите их идентификацию;
2. Укажите, при каких условиях может быть найдено решение каждого из уравнений и системы в целом. Дайте обоснование возможных вариантов подобных решений и аргументируйте выбор оптимального варианта рабочих гипотез;
3. Опишите методы, с помощью которых будет найдено решение уравнений (косвенный МНК, двухшаговый МНК).
Решение:
1. В соответствии с предложенными рабочими гипотезами построим график, отображающий связи каждой из представленных переменных с другими переменными. Отличительной особенностью уравнений системы является наличие прямых и обратных зависимостей между переменными Y1, Y2 и Y3. Указанная особенность характерна для так называемых структурных уравнений. В состав структурных уравнений входят: а) эндогенные переменные (Yj), значения которых формируется в условиях данной системы признаков и их взаимозависимостей и б) экзогенные переменные (xm), значения которых формируются вне данной системы признаков и условий, но сами экзогенные переменные участвуют во взаимосвязях данной системы и оказывают влияние на эндогенные переменные. Коэффициенты при эндогенных переменных обозначаются через
В нашей задаче система уравнений для описания выдвигаемых рабочих гипотез будет иметь следующий вид:
2.Выполним идентификацию каждого структурного уравнения и всей системы для ответа на вопрос – имеют ли решения каждое из уравнений и система в целом. Воспользуемся счётным правилом, по которому в каждом уравнении системы необходимо сравнить HY - число эндогенных переменных в данном уравнении и Dx - число отсутствующих в уравнении экзогенных переменных из общего для всей системы их перечня. Для удобства анализа представим результаты в таблице.
Результаты идентификации структурных уравнений и всей системы.
Номер уравнения | Число эндогенных переменных в уравнении, H | Число экзогенных переменных из общего их списка, отсутствующих в уравнении, D | Сравнение параметров H и D +1 | Решение об идентификации уравнения |
1 | 3 | 3 | 3<3+1 | Сверхидентифицировано |
2 | 3 | 2 | 3 = 2+1 | Точно идентифицировано |
3 | 3 | 1 | 3 > 1+1 | Неидентифицировано |
Вся система уравнений в целом | Неидентифицирована |
3. В том случае, когда хотя бы одно из уравнений не имеет решения, система в целом также не имеет решения. Если подобный результат нас не устраивает, необходимо внести коррективы в исходные рабочие гипотезы и отредактировать их таким образом, чтобы идентификация была возможна.
4. Теоретический анализ содержания взаимосвязи, отражённой в уравнении № 3, позволяет рассмотреть варианты возможной корректировки. Во-первых, из правой части может быть исключёна одна из экзогенных переменных. Скорее всего, ею может оказаться x4, так как по своему экономическому смыслу она менее тесно связана со среднемесячным душевым доходом населения региона.
Во-вторых, возможна корректировка путём исключения из правой части уравнения эндогенной переменной Y2.
При корректировке рабочей гипотезы путём удаления x3 уравнение №1 становится точно идентифицированным, а вся система – сверхидентифицированной.
5. Для поиска решений сверхидентифицированной системы уравнений применяются: а) косвенный метод наименьших квадратов (КМНК) для решения точно идентифицированных уравнений и б) двухшаговый МНК (ДМНК) для поиска решений сверхидентифицированных уравнений.
Задача №5.
По территориям Сибирского и Уральского федеральных округов России имеются данные о следующих показателях за 2000 год:
Y
1 – стоимость валового регионального продукта, млрд. руб.
Y
2 - розничный товарооборот, млрд. руб.
X
1 – основные фонды в экономике, млрд. руб.
X
2 - инвестиции в основной капитал, млрд. руб.
X
3- среднедушевые денежные расходы за месяц, тыс. руб.
Изучения связи социально-экономических показателей предполагает проверку следующих рабочих гипотез:
Для их проверки выполнена обработка фактических данных и получена следующая система приведённых уравнений:
Задание:
1. Постройте систему структурных уравнений и проведите её идентификацию;
2. Проанализируйте результаты решения приведённых уравнений;
3. Используя результаты построения приведённых уравнений, рассчитайте параметры структурных уравнений (косвенный МНК); проанализируйте результаты;
4. Укажите, каким образом можно применить полученные результаты для прогнозирования эндогенных переменных
Решение:
1. Построение системы структурных уравнений выполняется в соответствии с рабочими гипотезами:
2.В соответствии со счётным правилом оба уравнения и система в целом являются точно идентифицированными и это означает, что они имеют единственное решение, которое может быть получено косвенным МНК (КМНК).
Номер уравнения | Число эндогенных переменных в уравнении, H | Число экзогенных переменных из общего их списка, отсутствующих в уравнении, D | Сравнение параметров H и D +1 | Решение об идентификации уравнения |
1 | 2 | 1 | 2 = 1+1 | точно идентифицировано |
2 | 2 | 1 | 2 = 1+1 | точно идентифицировано |
Система уравнений в целом | точно идентифицирована |
3. Процедура КМНК состоит в том, чтобы путём преобразования результатов решения приведённых уравнений получить искомые структурные уравнения. Используемый приём подстановок обеспечивает получение точных результатов только в том случае, если выполняемые преобразования точны и безошибочны. Чтобы получить первое структурное уравнение из первого, приведённого необходимо отсутствующий в структурном уравнении признак выразить через Y2, используя результаты второго приведённого уравнения. То есть:
После подстановки значения в первое приведённое уравнение и преобразования подобных членов, получаем следующий результат:
Как видим, полученный результат соответствует исходной рабочей гипотезе. Анализ показывает, что стоимость ВРП находится в прямой зависимости от розничного товарооборота, от размера инвестиций в экономику и от уровня среднедушевых расходов населения за месяц. Указанные переменные объясняют 94,4% вариации результата, а характеристики установленной зависимости являются статистически значимыми и надёжными, так как
Следовательно, есть основания для отклонения нулевой гипотезы о случайной природе выявленной зависимости.Аналогично выполняем преобразования для определения параметров второго структурного уравнения. Выразим отсутствующий в уравнении
После подстановки значения во второе приведённое уравнение и преобразования подобных членов, получаем следующий результат:
Уравнение описывает линейную зависимость розничного товарооборота от стоимости ВРП, основных фондов в экономике, от уровня среднедушевых расходов населения за месяц. Данный перечень переменных объясняет 96,3% вариации оборота розничной торговли, а соотношение
позволяет отклонить нулевую гипотезу о случайной природе выявленной зависимости.
4. Для выполнения прогнозных расчётов
Задача №6.
Имеются сведения о среднем размере земельного участка крестьянского (фермерского) хозяйства – Nt, га, за период с 1993 по 2001 год (на конец года) в Российской Федерации.
Годы | Nt | Годы | Nt |
1993 | 42 | 1998 | 54 |
1994 | 44 | 1999 | 62 |
1995 | 47 | 2000 | 67 |
1996 | 48 | 2001 | 75 |
1997 | 50 | | |
Задание:
1. Постройте график фактических уровней динамического ряда - Nt
2. Рассчитайте параметры уравнения линейного тренда
3. Оцените полученные результаты:
- с помощью показателей тесноты связи ( r и r2 );
- значимость модели тренда (F -критерий);
- качество модели через корректированную среднюю ошибку аппроксимации
4. Выполните прогноз до 2003 года, рассчитайте ошибки прогноза, доверительный интервал прогноза и оцените его точность.
5. Проанализируйте полученные результаты.
Решение:
1.Общее представление о форме основной тенденции в уровнях ряда даёт график их фактических значений. Для его построения введём дополнительные обозначения для комплекса систематически действующих факторов, который по традиции обозначим через t и условно отождествим с течением времени.
2. Параметры рассчитаем с помощью определителей второго порядка, используя формулы, Расчёт определителя системы выполним по формуле:
Расчёт определителя свободного члена уравнения выполним по формуле:
Расчёт определителя коэффициента регрессии выполним по формуле:
3.Для оценки тесноты связи рассчитаем линейный коэффициент парной корреляции:
Таблица№ 1.
Годы | Nt | t | t2 | Nt*t | Nt расч . | DNt | (dNt)2 | |
А | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
1993 | 42 | 1 | 1 | 42 | 38,533 | 3,467 | 12,018 | 6,380 |
1994 | 44 | 2 | 4 | 88 | 42,483 | 1,517 | 2,300 | 2,791 |
1995 | 47 | 3 | 9 | 141 | 46,433 | 0,567 | 0,321 | 1,043 |
1996 | 48 | 4 | 16 | 192 | 50,383 | -2,383 | 5,680 | 4,387 |
1997 | 50 | 5 | 25 | 250 | 54,333 | -4,333 | ,778 | 7,975 |
1998 | 54 | 6 | 36 | 324 | 58,283 | -4,283 | 18,347 | 7,883 |
1999 | 62 | 7 | 49 | 434 | 62,233 | -0,233 | 0,054 | 0,429 |
2000 | 67 | 8 | 64 | 536 | 66,183 | 0,817 | 0,667 | 1,503 |
2001 | 75 | 9 | 81 | 675 | 70,133 | 4,867 | 23,684 | 8,957 |
Итого | 489 | 45 | 285 | 2682 | 489,000 | 0,000 | 81,850 | 41,350 |
Средняя | 54,333 | 5 | — | — | — | — | — | 4,594 |
Сигма | 10,635 | 2,582 | — | — | — | — | — | — |
Дисперсия, D | 113,111 | 6,667 | — | — | — | — | — | — |
Средняя ошибка аппроксимации
Фактическое значение F-критерия и сравнение с 5,59 его табличного значения позволяет сделать вывод о высокой степени надёжности уравнения тренда.
Для дополнительной проверки качества тренда выполним расчёт коэффициента корреляции отклонений фактических уровней от рассчитанных по уравнению тренда. Если будет установлено отсутствие связи отклонений, это укажет на их случайную природу, то есть на то, что тренд выбран, верно, что он полностью исключил основную тенденцию из фактических уровней ряда и что он сформировал случайный значения отклонений.
Выполним расчёт в таблице. Поместим во второй графе фактические отклонения от тренда , для удобства расчёта обозначим их через Y. В соседней графе поместим эти же отклонения, но, сместив их относительно первой строки, на один год вниз; обозначим их через и рассмотрим в качестве фактора X. Линейный коэффициент корреляции отклонений рассчитаем по формуле:
Используем значения определителей второго порядка для расчёта коэффициента регрессии с1, который отражает силу связи отклонений
Отсюда
В данном случае выявлена заметная связь, существенность которой подтверждает сравнение фактического и табличного значений F- критерия:
Таблица №2
| | | | |
| 3,47 | — | — | — |
1 | 1,52 | 3,47 | 5,26 | 12,02 |
2 | 0,57 | 1,52 | 0,86 | 2,30 |
3 | -2,38 | 0,57 | -1,35 | 0,32 |
4 | -4,33 | -2,38 | 10,33 | 5,68 |
5 | -4,28 | -4,33 | 18,56 | 18,77 |
6 | -0,23 | -4,28 | 1,00 | 18,34 |
7 | 0,82 | 0,23 | -0,19 | 0,05 |
8 | 4,87 | 0,82 | 3,98 | 0,67 |
Итого | -3,46 | -4,86 | 38,44 | 58,16 |
Средняя | -0,49 | -0,69 | — | — |
Сигма | 3,13 | 2,81 | — | — |
4. При выполнении прогнозов на 2002 и 2003 годы подставим в уравнение прогнозные значения фактора, 10, 11, что позволяет получить прогнозные значения о среднем размере земельного участка крестьянского (фермерского) хозяйства: 24,38га, 23,36га.
Рассчитаем ошибки прогноза, доверительный интервал прогноза и оценим его точность.
Рассчитаем интегральную ошибку прогноза -
Ошибка положения регрессии составит:
Интегральная ошибка прогноза составит:
Предельная ошибка прогноза, которая не будет превышена в 95% возможных реализаций прогноза, составит:
Это означает, что фактическая реализация прогноза будет находиться в доверительном интервале
Верхняя граница доверительного интервала составит:
Нижняя граница доверительного интервала составит:
Задача №7.
Данные о стоимости экспорта (
В уровнях рядов выявлены линейные тренды:
для экспорта -
По указанным трендам произведено выравнивание каждого ряда, то есть рассчитаны теоретические значения их уровней:
Годы | Экспорт ( ) | Импорт ( | ||
E факт. | = | G факт. . | | |
1991 | 60,2 | 57,5 | 93,3 | 82,3 |
1992 | 64,3 | 64,4 | 99,8 | 89,6 |
1993 | 59,6 | 71,4 | 78,6 | 97,0 |
1994 | 73,3 | 78,3 | 92,5 | 104,3 |
1995 | 91,7 | 85,3 | 115,0 | 111,7 |
1996 | 102,0 | 92,3 | 121,8 | 119,0 |
1997 | 104,1 | 99,2 | 122,7 | 126,4 |
1998 | 109,2 | 106,2 | 133,1 | 133,7 |
1999 | 110,0 | 113,1 | 144,0 | 141,1 |
2000 | 113,3 | 120,1 | 152,6 | 148,4 |
Предварительная обработка исходной информации привела к следующим результатам:
| Et | Pt | t |
Et | 1 | 0,5387 | 0,6468 |
Pt | 0,5387 | 1 | 0,2454 |
t | 0,6468 | 0,2454 | 1 |
Итого | 887,7 | 1153,4 | 55 |
Средняя | 88,8 | 115,3 | 5,5 |
| 20,961 | 22,847 | 2,872 |
Задание:
1. Для изучения связи рядов рассчитайте отклонения фактических значений каждого ряда от теоретических (
2. Для оценки тесноты связи рассчитайте:
- линейный коэффициент парной корреляции отклонений от линии тренда:
- уровней рядов:
- коэффициент частной корреляции уровней:
3. Постройте уравнение множественной регрессии с участием временной составляющей:
4. Проанализируйте полученные результаты.
Решение.
1. Изучение связи рядов выполним двумя способами, сравним их результаты и выберем из них правильный. Для оценки тесноты связи рядов через величины отклонений от оптимального тренда рассчитаем значения отклонений:
Годы | E факт. | | G факт. | | | | | | |
1991 | 60,2 | 57,5 | 93,3 | 82,3 | 2,7 | 11,0 | 29,7 | 7,3 | 121,0 |
1992 | 64,3 | 64,4 | 99,8 | 89,6 | 0,7 | 10,2 | 7,14 | 0,5 | 104,0 |
1993 | 59,6 | 71,4 | 78,6 | 97,0 | -11,8 | -18,4 | 217,1 | 139,2 | 338,6 |
1994 | 73,3 | 78,3 | 92,5 | 104,3 | -5,0 | -11,8 | 59 | 25,0 | 139,0 |
1995 | 91,7 | 85,3 | 115,0 | 111,7 | 6,4 | 3,3 | 21,1 | 41,0 | 10,9 |
1996 | 102,0 | 92,3 | 121,8 | 119,0 | 9,7 | 2,8 | 27,2 | 94,1 | 7,8 |
1997 | 104,1 | 99,2 | 122,7 | 126,4 | 4,9 | -3,7 | -18,1 | 24,0 | 327,6 |
1998 | 109,2 | 106,2 | 133,1 | 133,7 | 3,0 | -0,6 | -8,7 | 9,0 | 75,7 |
1999 | 110,0 | 113,1 | 144,0 | 141,1 | -3,1 | 2,9 | -9,0 | 9,6 | 81,0 |
2000 | 113,3 | 120,1 | 152,6 | 148,4 | -6,8 | 4,2 | -28,6 | 46,2 | 818,0 |
Итого | 887,7 | — | 1153,4 | — | 0,7 | -0,1 | 296,8 | 395,9 | 2023,6 |
Средняя | 88,8 | — | 115,3 | — | 0,1 | 0,0 | — | 39,6 | 202,4 |
Сигма | 21,0 | — | 22,8 | — | 6,3 | 8,7 | — | — | — |
D | 439,4 | — | 522,0 | — | 39,6 | 76,2 | — | — | — |
Выполним расчёт коэффициента корреляции отклонений от трендов через коэффициент регрессии отклонений с1,
В силу того, что свободный член уравнения регрессии отклонений равен нулю, вид уравнения будет отличаться от традиционного:
Выявлена тесная связь отклонений от трендов, которая означает, что на 58% вариация размеров отклонений по импорту детерминирует изменения по экспорту, а на 42% вариация размеров отклонений происходит под влиянием прочих факторов.
Второй вариант оценки связи двух рядов основан на традиционной оценке корреляции их уровней:
Данный подход к решению задачи предполагает традиционный расчёт определителей уравнения регрессии уровней, нахождение коэффициента регрессии а1 и далее с помощью
Расчёт определителей дал следующие результаты:
Значения параметров регрессии:
Коэффициенты тесноты связи уровней составят:
Годы | | | | | |
1991 | 60,2 | 93,3 | 3624,04 | 8704,89 | 5616,66 |
1992 | 64,3 | 99,8 | 4134,49 | 9960,04 | 6417,14 |
1993 | 59,6 | 78,6 | 3552,16 | 6177,96 | 4684,56 |
1994 | 73,3 | 92,5 | 5372,89 | 8556,25 | 6780,25 |
1995 | 91,7 | 115,0 | 8408,89 | 13225,00 | 10545,50 |
1996 | 102,0 | 121,8 | 10404,00 | 14835,24 | 12423,60 |
1997 | 104,1 | 122,7 | 10836,81 | 15055,29 | 12773,07 |
1998 | 109,2 | 133,1 | 11924,64 | 17715,61 | 14534,52 |
1999 | 110,0 | 144,0 | 12100,00 | 20736,00 | 15840,00 |
2000 | 113,3 | 152,6 | 12836,89 | 13286,76 | 17289,58 |
Итого | 887,7 | 1153,4 | 83194,81 | 128253,04 | 106904,88 |
Средняя | 88,8 | 115,3 | | | |
Сигма | 21,0 | 22,8 | | | |
D | 439,4 | 522,0 | | | |
2. Однако, делать подобный вывод было бы глубоко ошибочно потому, что в уровнях и одного, и другого рядов выявлены устойчивые, статистически значимые линейные тренды. В подобных условиях выявленное взаимодействие уровней не является причинной зависимостью, а представляет собой ложную связь, вызванную наличием трендов схожей линейной формы. В силу того, что оба тренда сформированы под влиянием разного комплекса факторов, схожесть их формы могут создавать иллюзию связи рядов. Подобные соображения позволяют отказаться от результатов изучения связи уровней, содержащих тренд. В подобной ситуации пристального внимания заслуживает связь случайных отклонений от трендов. Именно этот подход позволяет выявить и количественно оценить истинную связь рядов.
В действительности связь рядов существует, оценивается она как тесная; то есть, в ней экспорт на 58% детерминирован вариацией импорта. Фактический F-критерий равен 0,050. Это больше табличного (F
табл
.=5,32), что доказывает надёжность и значимость истинной связи рядов.
3. Для формализованного представления подобных зависимостей и использования моделей связи динамических рядов в прогнозных расчётах предлагается построить множественную регрессионную модель связи рядов, включая в неё в качестве обязательной составляющей фактор времени t. Речь идёт о построении модели следующего вида:
Истинную силу и направление связи рядов отразит коэффициент регрессии а1 , а тесноту их связи оценит частный коэффициент корреляции:
Используем для расчёта параметров множественной регрессии матрицу парных коэффициентов корреляции, представленную в исходных данных.
Для построения уравнения в стандартизованном масштабе:
Получено следующее уравнение:
Его параметры позволяют сделать вывод о том, что влияния импорта на экспорт почти в четыре раза сильнее, чем влияние систематических факторов, формирующих линейный тренд:
По значениям
Уравнение имеет вид:
) экспорт увеличивается в среднем за год на 2,65 млрд. $.
Оценку тесноты связи рядов, очищенную от влияния комплекса систематических факторов, даёт частный коэффициент корреляции:
Как видим, получены результаты, совпадающие с оценками тесноты связи по отклонениям от лучших трендов, которыми, в данном случае, являются линейные тренды.
Использование динамической модели в прогнозе заключается в подстановке в её правую часть прогнозных значений фактора Z и фактора t. То есть,