Шпаргалка Шпаргалки по Экономики
Работа добавлена на сайт bukvasha.net: 2015-10-29Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего
от 25%

Подписываем
договор
1.
2.
Анализ линейной стат-кой связи экономических данных, корреляция, вычисление коэф-в корреляции. Проверка значимости коэф-в парной корреляции.
Большинство эконом. объектов находятся во всеохватывающей взаимосвязи. Наилучшим аппаратом явл-ся аппарат корреляционно-регрессионного анализа. Существует 2 вида зависимостей между эконом. переменными: 1) функциональная; 2) стохастическая (вероятностная). При функц-ой связи – каждому значению одной величины ставят в соответствие опр. значение другой. Такие встречаются редко. Как правило, по значению одной величины можно предсказать с опр. вероятностью значение другой (или найти мат. ожидание). Эта связь называется вероятностной, иногда применяют название «корреляционная зависимость». Между понятиями «корреляция» и «регрессия» существует связь и в то же время они различны. Корреляция позволяет установить тесноту и направление связи между переменными (коэф-ми корреляции). Регрессия определяет форму зависимости, функцию связи (модель регрессии). Корр. анализ предназначен для изучения характера связи между случ. переменными. Задачи корр. анализа: 1.оценка тесноты связи; 2. опр-е направления связи; 3. выбор ведущих факторов; 4. опр-е ранее неизвестных причинных связей. Виды корреляции: 1. по числу переменных: частная, парная и множественная; 2. по виду связей: линейная и нелинейная; 3. по направлению связи: прямая и обратная. Для решения задач корр. анализа применяются 3 коэф-та корреляции: 1. парный, 2. множественный, 3. частный.
Коэф-т парной линейной корреляции:
Коэффициент множественной корреляции. Корреляционная матрица не дает ответов на все вопросы, интересующие нас, для данной совокупности переменных. Возникают 2 дополнительные задачи: 1) как связана интересующая нас величина со всей совокупностью имеющихся факторов; 2) какой будет связь двух переменных при фиксировании или исключении влияния др. переменных. Для решения 1-ой задачи применяют коэф-т множественной корреляции:
Коэффициент частной корреляции. Этот коэф-т предназначен для оценки тесноты связи между 2-мя переменными при фиксировании или исключении влияния др. переменных.
3.
Статистическая зависимость случайных переменных. Ковариация.
Для оценки параметров парной регрессии применяется МНК, который позволяет подобрать параметры уравнения так, чтобы соответственные точки графиков фактических и расчетных значений показателя находились на min расстоянии друг от друга. Требуется определить min функции:
4.
Типы экономических данных, используемые в эконометрических исследованиях.
1) Временные ряды. Временными рядами называют ряды динамики, у которых в качестве признака упорядочения используется время. Они состоят из последовательных значений (уровней) показателя, характеризующего состояние процесса в определенные, как правило, равноотстоящие друг от друга моменты времени, причем каждый экономический показатель представлен в большинстве случаев лишь одним временным рядом.
2) Пространственные данные – данные по одной и той же величине в один и тот же период времени, но взятые в пространственно разделенных объектах: 1. курс «евро» сегодня в различных обменных пунктах; 2. %-ые ставки в различных банках; 3. объемы производства по различным предприятиям одной отрасли; 4. месячные товарообороты в различных магазинах.
5.
Классификация эконометрических моделей.
Эконометрическая модель – образ экономического объекта, примерно воссоздаваемый с помощью математического языка.
Классификация:
1. модели временных рядов:
1.1. трендовые модели: кривые роста, адаптивные модели;
1.2. сезонные модели;
1.3. тренд сезонные модели;
2. регрессионные модели:
2.1. парные;
2.2. множественные;
2.3. линейные;
2.4. нелинейные;
3. системы одновременных уравнений (СОУ):
3.1.рекурсивные;
3.2.независимые;
3.3.взаимозависимые.
5. Основные этапы построения эконометрических моделей.
Парная линейная модель регрессии. Оценка параметров регрессионного уравнения. Для оценки параметров парной регрессии применяется МНК, который позволяет подобрать параметры уравнения так, чтобы соответственные точки графиков фактических и расчетных значений показателя находились на min расстоянии друг от друга. Требуется определить min функции:
Вариация ил дисперсия.
Модель множественной регрессии. Оценка параметров.
(1) yi=a0+a1xi1+a2xi2+…+amxim+ei
Запишем уравнение (1) в матричном виде (2) – y=aX+e;
6. Линейная модель парной регрессии. Оценка параметров с помощью МНК.
Если в построении модели участвует 1 независимый фактор и линейная независимая функция – парная линейная модель регрессии
Основную информацию для анализа качества регрессионного уравнения можно получить из ряда остатков. Иногда только по одному графику остатков можно судить о качестве аппроксимации. Остатки модели должны обладать опр. свойствами: несмещенность, состоятельность, эффективность. На практике проверка этих свойств сводится к проверке 5 предпосылок МНК: 1.случайный характер остатков (критерий поворотных точек), 2.независимость уровней в ряде остатков (d-критерий Дарбина-Уотсона), 3.соответствие ряда остатков нормальному закону распределения(RS-критерий), 4.равенство 0 мат. ожидания остатков, 5.гомоскедастичность остатков.
1.Свойство случайности проверяется с помощью критерия поворотных точек или критерия пиков. Уровень в ряде остатков называется поворотной точкой, если он одновременно больше или одновременно меньше 2-ух соседних с ним уровней. Точкам поворота приписывают значения 1, остальным – 0. Свойство случайности выполняется, если количество поворотных точек
2.Для проверки свойства независимости (отсутствие автокорреляции) уровней в ряде остатков используют d-критерий Дарбина-Уотсона. В начале рассчитывают величину d по формуле:
3.Для проверки соответствия ряда остатков нормальному закону распределения используют RS-критерий: RS =(Emax-Emin)/SE. Emax и Emin- соотв. наибольшее и наименьшее значения уровней в ряде остатков. SE- СКО. Если значение RS попадает в табличный интервал, то ряд остатков распределен по норм. закону.
5.Гомоскедастичность – постоянство дисперсии остатков по отношению к фактическим значениям фактора или показателя. Остатки называются гомоскедастичными, если они сосредоточены в виде горизонтальной полосы около оси xi, в противном случае остатки называют гетероскедастичными. Для исследования гомоскедастичности применяются различные тесты. Один из них называется тест Голдфельда-Квандта: 1) Упорядочение значений показателя у по степени возрастания фактора х. 2) Из упорядоченной совокупности убирают несколько «с» центральных значений:
7. Оценка существенности параметров линейной регрессии.
Проверка значимости параметров проводится на основе t-критерия Стьюдента. Вначале рассчитывают стандартную ошибку модели Se.
8. Оценка параметров множественной регрессии МНК. Свойства оценок МНК.
Оценка качества модели множественной регрессии. Этот этап схож с процедурой проверки качества парной модели. Основную информацию получают из ряда остатков. Также проверяют 5 предпосылок МНК, но в случае 5 предпосылки (проверка гомоскедастичности) будут некоторые отличия. График остатков в случае множественной модели регрессии будет иметь несколько иной вид. По оси абсцисс можно отложить фактические данные показателя у. Для тестирования на гомоскедастичность можно применить тест Голдфельда-Квандта. Отличие будет только на 1 шаге: фактические данные факторов следует упорядочить по возрастанию показателя у. Для каждой совокупности строят модель множественной регрессии. Коэф-т детерминации в случае множ. регрессии также будет универсальной характеристикой качества, т.к. позволяет оценить точность модели, качество в целом, удачность выбора фактора. Однако, когда число факторов больше 1, коэф-т детерминации меняется. Поэтому определяют
Проверка 5 предпосылок МНК: 1.случайный характер остатков (критерий поворотных точек), 2.независимость уровней в ряде остатков (d-критерий Дарбина-Уотсона), 3.соответствие ряда остатков нормальному закону распределения(RS-критерий), 4.равенство 0 мат. ожидания остатков, 5.гомоскедастичность остатков.
1.Свойство случайности проверяется с помощью критерия поворотных точек или критерия пиков. Уровень в ряде остатков называется поворотной точкой, если он одновременно больше или одновременно меньше 2-ух соседних с ним уровней. Точкам поворота приписывают значения 1, остальным – 0. Свойство случайности выполняется, если количество поворотных точек
2.Для проверки свойства независимости (отсутствие автокорреляции) уровней в ряде остатков используют d-критерий Дарбина-Уотсона. В начале рассчитывают величину d по формуле:
3.Для проверки соответствия ряда остатков нормальному закону распределения используют RS-критерий: RS =(Emax-Emin)/SE. Emax и Emin- соотв. наибольшее и наименьшее значения уровней в ряде остатков. SE- СКО. Если значение RS попадает в табличный интервал, то ряд остатков распределен по норм. закону.
9. Многомерный стат. анализ. Задачи классификации объектов: кластерный анализ, дискриминантный анализ.
МСА – одно из направлений развития одномерной статистики. В наст. вр. в условиях рыночной экономики методы многомерного анализа актуальны, т.к. соответствуют многовариантному подходу. В МСА выделяют 3 группы методов: 1. факторный анализ, 2. кластерный анализ, 3. дискриминантный анализ. Кластерный анализ предполагает классификацию объектов по нескольким признакам одновременно. Имеет широкое распространение при изучении массовых явлений. При этом строятся научно обоснованные классификации. Заранее неизвестно, сколько будет кластеров и какого объема. После кластеризации для каждого класса опр-ют кластерные профили, они позволяют установить, какая характеристика явл-ся преобладающей в группе объектов 1-го класса. Дискриминантный анализ – та же кластеризация, но объекты распределяются по уже существующим классам.
10. Регрессионные модели с переменной структурой (фиктивные переменные).
При построении регрессионного уравнения используются факторы, являющиеся количественными характеристиками. Иногда требуется ввести в модель регрессии некий качественный фактор. Это могут быть разного рода атрибутивные признаки (пол, образование, принадлежность к какому-либо региону и т.д.). чтобы ввести такие переменные в уравнение, их нужно преобразовать в количественные. Пусть у – цена квартиры, х - общая площадь квартиры, тогда общий вид регрессионного уравнения примет вид, у=а0+а1х. Сконструируем фиктивную переменную, означающую принадлежность квартиры к центральным или периферическим частям города.
11. Измерение тесноты связи между показателями. Мультиколлинеарность и способы ее устранения.
Пусть в исследовании используется совокупность переменных у1, х1, х2,…, хm. Для каждой пары можно рассчитать коэф-ты парной линейной корреляции. В результате, получиться матрица коэф-в парной корреляции:
Одним из условий регрессионной модели явл-ся предположение о линейной независимости объясняющих переменных, т.е. решение задачи возможно лишь тогда, когда столбцы и строки матрицы исходных данных линейно независимы. Для экон. показателей это условие выполняется не всегда. Линейная или близкая к ней связь между факторами называется мультиколлинеарностью и приводит к линейной зависимости нормальных уравнений, что делает вычисление параметров либо невозможными, либо затрудняет содержательную интерпретацию параметров модели. Считают явление мультик-ти в исходных данных установленным, если коэф-т парной корреляции между 2-мя переменными больше 0,8. Чтобы избавиться от мультик-ти, в модель включают лишь один из линейно связанных между собой факторов, причем тот, который в большей степени связан с зависимой переменной. В качестве критерия мультик-ти может быть принято соблюдение следующих неравенств: ryxi>rxixk, ryxk>rxixk, rxixk<0,8. если приведенные неравенства (или хотя бы одно из них) не выполняется, то в модель включают тот фактор, который наиболее тесно связан с у.
12. Модель множественной регрессии. Технология разработки прогнозов на ПЭВМ с использованием спец. программ стат. обработки данных.
Модель парной регрессии устанавливает зависимость интересующей нас величины только от 1-го фактора. В экономике эта ситуация абстрактная. На показатель влияет целая совокупность факторов. Если использовать линейную математическую функцию, то в этом случае модель множественной регрессии примет вид yi=a0+a1xi1+a2xi2+a3xi3+…+amxim+ei. Каждый из параметров модели аi показывает, на сколько меняется исследуемая величина у при изменении соответствующего фактора на 1 единицу. Эта модель универсальна в том смысле, что позволяет установить зависимость показателя, как от всей совокупности факторов, так и от каждого из них в отдельности. Эта модель применяется при изучении проблем спроса, функции доходности акции, функции издержек производства, функции прибыли и т.д.
Основные этапы анализа и прогнозирования: 1. выбор системы ведущих факторов для исследования; 2. построение модели, т.е. оценка ее параметров; 3. проверка стат. значимости уравнения регрессии и его параметров; 4. оценка качественных характеристик модели, т.е. проверка предпосылок МНК; 5. определения влияния отдельных факторов на исследуемую величину; 6. экономический прогноз.
Для определения прогнозных оценок факторов можно воспользоваться кривыми роста (экстаполяционными моделями). Построить лучшую кривую роста можно либо с помощью пакета «Олимп», либо с помощью MS Excel «Мастера диаграмм».
13. Многомерный стат. анализ. Задачи снижения размерности: факторный, компонентный анализ.
МСА – одно из направлений развития одномерной статистики. В наст. вр. в условиях рыночной экономики методы многомерного анализа актуальны, т.к. соответствуют многовариантному подходу. В МСА выделяют 3 группы методов: 1. факторный анализ, 2. кластерный анализ, 3. дискриминантный анализ. Факторный анализ предназначен для выявления в данной совокупности латентных (неявных) признаков, характеризующих систему. Экономическая система описывается большим числомпоказателей, что неудобно для анализа. За счет вращения этих показателей (опр. линейных комбинаций) исходная совокупность данных сокращается за счет замены ее главными факторами. Задачи: 1. отыскание скрытых, но объективно существующих закономерностей; 2. сжатие информации; 3. выделение главных факторов; 4. построение регрессионных моделей.
14. Измерение тесноты связи между показателями. Анализ матрицы коэффициентов парной корреляции.
Коэф-т парной линейной корреляции:
Пусть в исследовании используется совокупность переменных у1, х1, х2,…, хm. Для каждой пары можно рассчитать коэф-ты парной линейной корреляции. В результате, получиться матрица коэф-в парной корреляции:
16. Оценка влияния факторов на зависимую переменную (коэф-ты эластичности, бета коэф-ты).
Коэф-ты корреляции также как и коэф-ты регрессии позволяют определить влияние факторов на показатели, но они не распределяют факторы по степени влияния. Для решения этой задачи используются 3 специальных коэф-та: 1. коэф-т эластичности; 2.
1.
2.
3.
17. Обобщенный МНК.
При нарушении гомоскедастичности рекомендуется традиционный МНК заменять обобщенным МНК. Обобщенный МНК применяется к преобразованным данным и позволяет получать оценки, которые обладают не только свойством несмещенности, но и имеют меньшие выборочные дисперсии.
Предположим, что среднее значение остаточных величин равно нулю. А вот дисперсия их не остается неизменной для разных значений фактора, а пропорциональна величине Кi, т.е.
При этом предполагается, что
В общем виде для уравнения
В ней остаточные величины гетероскедастичны. Предполагая в них отсутствие автокорреляции, можно перейти к уравнению с гомоскедастичными остатками, поделив все переменные, зафиксированные в ходе i-ого наблюдения на
Иными словами, от регрессии у по х мы перейдем к регрессии на новых переменных:
Уравнение регрессии примет вид:
По отношению к обычной регрессии уравнение с новыми, преобразованными переменными представляет собой взвешенную регрессию, в которой переменные у и х взяты с весами
Оценка параметров нового уравнения с преобразованными переменными приводит к взвешенному МНК, для которого необходимо минимизировать сумму квадратов отклонений вида:
Соответственно получим следующую систему нормальных уравнений:
При обычном применении МНК к уравнению линейной регрессии для переменных в отклонениях от средних уровней коэф-т регрессии b определяется по формуле:
Как видим, при использовании обобщенного МНК с целью корректировки гетероскедастичности коэф-т регрессии b представляет собой взвешенную величину по отношению к обычному МНК с весами 1/К.
18. Анализ и прогнозирование экономических объектов с помощью модели множественной регрессии.
Основные этапы анализа и прогнозирования:
1,выбор системы ведущих факторов для исследования;
2,построение модели, т.е. оценка ее параметров;
3,проверка стат. значимости уравнения регрессии и его параметров;
4,оценка качественных характеристик модели, т.е. проверка предпосылок МНК;
5,определения влияния отдельных факторов на исследуемую величину;
6,экономический прогноз.
7,Выбор системы ведущих факторов для исследования.
При построении системы факторов необходимо соблюдать следующие условия: 1) должны быть количественно измеримы; 2) теоретически обоснованы; 3) линейно независимы друг от друга; 4) одна модель не должна включать в себя совокупный фактор и факторы его образующие; 5) тесно связаны между собой. Для реализации 5-го требования строят матрицу коэф-в парной корреляции. На основании этой матрицы выбирают те факторы, связь которых с величиной наиболее тесная. Затем проверяют наличие мультиколлинеарности (МК) факторов. Два фактора МК, если
2. Оценка параметров.
(2) yi=a0+a1xi1+a2xi2+…+amxim+ei
Запишем уравнение (1) в матричном виде (2) – y=aX+e;
3. Оценка качественных характеристик модели.
Оценка значимости уравнения множественной регрессии проводится в полном соответствии с процедурой, применимой к парной модели, т.е. на основе F-критерия Фишера. Для оценки значимости параметров применяют t-критерий Стьюдента:
Если
4. Оценка качества модели.
Этот этап схож с процедурой проверки качества парной модели. Основную информацию получают из ряда остатков. Также проверяют 5 предпосылок МНК, но в случае 5 предпосылки (проверка гомоскедастичности) будут некоторые отличия. График остатков в случае множественной модели регрессии будет иметь несколько иной вид. По оси абсцисс можно отложить фактические данные показателя у. Для тестирования на гомоскедастичность можно применить тест Голдфельда-Квандта. Отличие будет только на 1 шаге: фактические данные факторов следует упорядочить по возрастанию показателя у. Для каждой совокупности строят модель множественной регрессии. Коэф-т детерминации в случае множ. регрессии также будет универсальной характеристикой качества, т.к. позволяет оценить точность модели, качество в целом, удачность выбора фактора. Однако, когда число факторов больше 1, коэф-т детерминации меняется. Поэтому определяют
Проверка 5 предпосылок МНК: 1.случайный характер остатков (критерий поворотных точек), 2.независимость уровней в ряде остатков (d-критерий Дарбина-Уотсона), 3.соответствие ряда остатков нормальному закону распределения(RS-критерий), 4.равенство 0 мат. ожидания остатков, 5.гомоскедастичность остатков.
1.Свойство случайности проверяется с помощью критерия поворотных точек или критерия пиков. Уровень в ряде остатков называется поворотной точкой, если он одновременно больше или одновременно меньше 2-ух соседних с ним уровней. Точкам поворота приписывают значения 1, остальным – 0. Свойство случайности выполняется, если количество поворотных точек
2.Для проверки свойства независимости (отсутствие автокорреляции) уровней в ряде остатков используют d-критерий Дарбина-Уотсона. В начале рассчитывают величину d по формуле:
3.Для проверки соответствия ряда остатков нормальному закону распределения используют RS-критерий: RS =(Emax-Emin)/SE. Emax и Emin- соотв. наибольшее и наименьшее значения уровней в ряде остатков. SE- СКО. Если значение RS попадает в табличный интервал, то ряд остатков распределен по норм. закону.
5. Оценка влияния отдельных факторов на исследуемую величину.
Коэф-ты корреляции также как и коэф-ты регрессии позволяют определить влияние факторов на показатели, но они не распределяют факторы по степени влияния. Для решения этой задачи используются 3 специальных коэф-та: 1. коэф-т эластичности; 2.
1.
2.
3.
6. Прогнозирование.
1.Прогноз факторов либо моделями экстраполяции, либо по заданному правилу (xjпр.);
2.Точечный прогноз показателя:
Нижняя граница: упр-U; верхняя граница: упр+U.
19. Системы линейных одновременных уравнений (СОУ). Взаимозависимые и рекурсивные системы.
Регрессионное уравнение устанавливает зависимость одной величины от совокупности факторов. Как правило, нас может интересовать целый ряд величин у1, у2, у3…, которые зависят как от факторов, так и между собой. Для отображения такой паутины взаимосвязей используются системы уравнений. Они бывают 3 видов: 1. системы независимых уравнений; 2. рекурсивные системы; 3. системы взаимозависимых уравнений.
Рекурсивные системы:
Первое уравнение в таких системах является моделью множественной регрессии. В каждом последующем будут содержаться как все независимые факторы, так и зависимые переменные, оцененные ранее (предопределенные). Такие системы могут использоваться для анализа производительности труда и фондоотдачи.
Системы взаимозависимых уравнений:
20. Оценка качества модели парной регрессии. Коэф-т детерминации.
Основную информацию для анализа качества регрессионного уравнения можно получить из ряда остатков. Иногда только по одному графику остатков можно судить о качестве аппроксимации. Остатки модели должны обладать опр. свойствами: несмещенность, состоятельность, эффективность. На практике проверка этих свойств сводится к проверке 5 предпосылок МНК: 1.случайный характер остатков (критерий поворотных точек), 2.независимость уровней в ряде остатков (d-критерий Дарбина-Уотсона), 3.соответствие ряда остатков нормальному закону распределения(RS-критерий), 4.равенство 0 мат. ожидания остатков, 5.гомоскедастичность остатков.
1.Свойство случайности проверяется с помощью критерия поворотных точек или критерия пиков. Уровень в ряде остатков называется поворотной точкой, если он одновременно больше или одновременно меньше 2-ух соседних с ним уровней. Точкам поворота приписывают значения 1, остальным – 0. Свойство случайности выполняется, если количество поворотных точек
2.Для проверки свойства независимости (отсутствие автокорреляции) уровней в ряде остатков используют d-критерий Дарбина-Уотсона. В начале рассчитывают величину d по формуле:
3.Для проверки соответствия ряда остатков нормальному закону распределения используют RS-критерий: RS =(Emax-Emin)/SE. Emax и Emin- соотв. наибольшее и наименьшее значения уровней в ряде остатков. SE- СКО. Если значение RS попадает в табличный интервал, то ряд остатков распределен по норм. закону.
5.Гомоскедастичность – постоянство дисперсии остатков по отношению к фактическим значениям фактора или показателя. Остатки называются гомоскедастичными, если они сосредоточены в виде горизонтальной полосы около оси xi, в противном случае остатки называют гетероскедастичными. Для исследования гомоскедастичности применяются различные тесты. Один из них называется тест Голдфельда-Квандта: 1) Упорядочение значений показателя у по степени возрастания фактора х. 2) Из упорядоченной совокупности убирают несколько «с» центральных значений:
Коэф-т детерминации:
21. Предпосылки МНК.
Основную информацию для анализа качества регрессионного уравнения можно получить из ряда остатков. Иногда только по одному графику остатков можно судить о качестве аппроксимации. Остатки модели должны обладать опр. свойствами: несмещенность, состоятельность, эффективность. На практике проверка этих свойств сводится к проверке 5 предпосылок МНК: 1.случайный характер остатков (критерий поворотных точек), 2.независимость уровней в ряде остатков (d-критерий Дарбина-Уотсона), 3.соответствие ряда остатков нормальному закону распределения(RS-критерий), 4.равенство 0 мат. ожидания остатков, 5.гомоскедастичность остатков.
1.Свойство случайности проверяется с помощью критерия поворотных точек или критерия пиков. Уровень в ряде остатков называется поворотной точкой, если он одновременно больше или одновременно меньше 2-ух соседних с ним уровней. Точкам поворота приписывают значения 1, остальным – 0. Свойство случайности выполняется, если количество поворотных точек
2.Для проверки свойства независимости (отсутствие автокорреляции) уровней в ряде остатков используют d-критерий Дарбина-Уотсона. В начале рассчитывают величину d по формуле:
3.Для проверки соответствия ряда остатков нормальному закону распределения используют RS-критерий: RS =(Emax-Emin)/SE. Emax и Emin- соотв. наибольшее и наименьшее значения уровней в ряде остатков. SE- СКО. Если значение RS попадает в табличный интервал, то ряд остатков распределен по норм. закону.
5.Гомоскедастичность – постоянство дисперсии остатков по отношению к фактическим значениям фактора или показателя. Остатки называются гомоскедастичными, если они сосредоточены в виде горизонтальной полосы около оси xi, в противном случае остатки называют гетероскедастичными. Для исследования гомоскедастичности применяются различные тесты. Один из них называется тест Голдфельда-Квандта: 1) Упорядочение значений показателя у по степени возрастания фактора х. 2) Из упорядоченной совокупности убирают несколько «с» центральных значений:
22. Отбор факторов при построении множественной регрессии. Мультиколлинеарность.
При построении системы факторов необходимо соблюдать следующие условия: 1) должны быть количественно измеримы; 2) теоретически обоснованы; 3) линейно независимы друг от друга; 4) одна модель не должна включать в себя совокупный фактор и факторы его образующие; 5) тесно связаны между собой. Для реализации 5-го требования строят матрицу коэф-в парной корреляции. На основании этой матрицы выбирают те факторы, связь которых с величиной наиболее тесная. Затем проверяют наличие мультиколлинеарности (МК) факторов. Два фактора МК, если
23. Модель множественной регрессии. Построение системы показателей-факторов.
Модель парной регрессии устанавливает зависимость интересующей нас величины только от 1-го фактора. В экономике эта ситуация абстрактная. На показатель влияет целая совокупность факторов. Если использовать линейную математическую функцию, то в этом случае модель множественной регрессии примет вид yi=a0+a1xi1+a2xi2+a3xi3+…+amxim+ei. Каждый из параметров модели аi показывает, на сколько меняется исследуемая величина у при изменении соответствующего фактора на 1 единицу. Эта модель универсальна в том смысле, что позволяет установить зависимость показателя, как от всей совокупности факторов, так и от каждого из них в отдельности. Эта модель применяется при изучении проблем спроса, функции доходности акции, функции издержек производства, функции прибыли и т.д.
Построение системы показателей-факторов. При построении системы факторов необходимо соблюдать следующие условия: 1) должны быть количественно измеримы; 2) теоретически обоснованы; 3) линейно независимы друг от друга; 4) одна модель не должна включать в себя совокупный фактор и факторы его образующие; 5) тесно связаны между собой. Для реализации 5-го требования строят матрицу коэф-в парной корреляции. На основании этой матрицы выбирают те факторы, связь которых с величиной наиболее тесная. Затем проверяют наличие мультиколлинеарности (МК) факторов. Два фактора МК, если
24. Модель множественной регрессии. Выбор вида модели и оценка ее параметров.
Модель парной регрессии устанавливает зависимость интересующей нас величины только от 1-го фактора. В экономике эта ситуация абстрактная. На показатель влияет целая совокупность факторов. Если использовать линейную математическую функцию, то в этом случае модель множественной регрессии примет вид yi=a0+a1xi1+a2xi2+a3xi3+…+amxim+ei. Каждый из параметров модели аi показывает, на сколько меняется исследуемая величина у при изменении соответствующего фактора на 1 единицу. Эта модель универсальна в том смысле, что позволяет установить зависимость показателя, как от всей совокупности факторов, так и от каждого из них в отдельности. Эта модель применяется при изучении проблем спроса, функции доходности акции, функции издержек производства, функции прибыли и т.д.
Оценка параметров: (1) yi=a0+a1xi1+a2xi2+…+amxim+ei
Запишем уравнение (1) в матричном виде (2) – y=aX+e;
25. Проверка качества многофакторных регрессионных моделей.
Оценка параметров:
(1) yi=a0+a1xi1+a2xi2+…+amxim+ei
Запишем уравнение (1) в матричном виде (2) – y=aX+e;
Оценка качества модели:
Этот этап схож с процедурой проверки качества парной модели. Основную информацию получают из ряда остатков. Также проверяют 5 предпосылок МНК, но в случае 5 предпосылки (проверка гомоскедастичности) будут некоторые отличия. График остатков в случае множественной модели регрессии будет иметь несколько иной вид. По оси абсцисс можно отложить фактические данные показателя у. Для тестирования на гомоскедастичность можно применить тест Голдфельда-Квандта. Отличие будет только на 1 шаге: фактические данные факторов следует упорядочить по возрастанию показателя у. Для каждой совокупности строят модель множественной регрессии. Коэф-т детерминации в случае множ. регрессии также будет универсальной характеристикой качества, т.к. позволяет оценить точность модели, качество в целом, удачность выбора фактора. Однако, когда число факторов больше 1, коэф-т детерминации меняется. Поэтому определяют
Проверка 5 предпосылок МНК: 1.случайный характер остатков (критерий поворотных точек), 2.независимость уровней в ряде остатков (d-критерий Дарбина-Уотсона), 3.соответствие ряда остатков нормальному закону распределения(RS-критерий), 4.равенство 0 мат. ожидания остатков, 5.гомоскедастичность остатков.
1.Свойство случайности проверяется с помощью критерия поворотных точек или критерия пиков. Уровень в ряде остатков называется поворотной точкой, если он одновременно больше или одновременно меньше 2-ух соседних с ним уровней. Точкам поворота приписывают значения 1, остальным – 0. Свойство случайности выполняется, если количество поворотных точек
2.Для проверки свойства независимости (отсутствие автокорреляции) уровней в ряде остатков используют d-критерий Дарбина-Уотсона. В начале рассчитывают величину d по формуле:
3.Для проверки соответствия ряда остатков нормальному закону распределения используют RS-критерий: RS =(Emax-Emin)/SE. Emax и Emin- соотв. наибольшее и наименьшее значения уровней в ряде остатков. SE- СКО. Если значение RS попадает в табличный интервал, то ряд остатков распределен по норм. закону.
26. Множественная корреляция. Частная корреляция.
Коэффициент множественной корреляции. Корреляционная матрица не дает ответов на все вопросы, интересующие нас, для данной совокупности переменных. Возникают 2 дополнительные задачи: 1) как связана интересующая нас величина со всей совокупностью имеющихся факторов; 2) какой будет связь двух переменных при фиксировании или исключении влияния др. переменных. Для решения 1-ой задачи применяют коэф-т множественной корреляции:
- определитель матрицы коэф-ов парной корреляции, Rjj – алгебраическое дополнение к элементу этой матрицы, стоящей на пересечении j-ой строки и j-ого столбца. Практическую зависимость имеет R2 – коэф-т детерминации, показывает, какая доля случайных колебаний одной величины обусловлена случайными колебаниями другой величины. Свойства: 1) R2 принадлежит интервалу (0;1); 2)
- связь тесная.
Коэффициент частной корреляции. Этот коэф-т предназначен для оценки тесноты связи между 2-мя переменными при фиксировании или исключении влияния др. переменных.
, Rxy – алгебраическое дополнение к элементу корреляционной матрицы, стоящему на пересечении строки х и столбца у. Аналогично Rxx, Ryy. Свойства rxy аналогичны свойствам rx,y.
27. Нелинейная регрессия. Нелинейные модели и их линеаризация.
y=f(x) – общий вид. Если в качестве f использовать нелинейную математическую зависимость, то получиться нелинейная модель парной регрессии. Различают 2 класса нелинейных моделей:
1. модели нелинейные относительно фактора, но линейные относительно параметров:
*полиномиальные: у=а0+а1х+а2х2+а3х3+…. Для перехода к линейной функции применяют простую замену переменных (х1=х2, х2=х3), у=а0+а1х+а2х1+а3х2…
*гиперболические: у=а0+а1/х, (х1=1/х); у=а0+а1х1.
2. степенную модель: у=ахв;
3. показательную: у=авх;
4. экспоненциальную: у=кеа+вх.
Модели являются нелинейными как относительно фактора, так и относительно параметра. Для их линеаризации использую процедуру логарифмирования. Таким образом, общая схема оценивания нелинейных моделей следующая:
1,линеаризация функции (простой заменой или логарифмированием);
2,оценка параметров линейной модели МНК;
3,обратный переход к исходному виду модели.
28. Интервалы прогноза по линейному уравнению парной регрессии.
Прогноз по регрессионной модели включает в себя следующие этапы:
прогноз фактора. Для получения прогнозных оценок фактора можно использовать правило опр. в условии или один из экстраполяционных методов. Методы экстраполяции (кривые роста) можно применять, если исходные данные в виде временных рядов.
2,точечный прогноз показателя:
.
3,построение доверительного интервала:
Se – СКО,
.
Нижняя граница: упр-U, верхняя граница: упр+U.
29. Функциональные и корреляционные связи между признаками. Измерение тесноты связи.
При построении системы факторов необходимо соблюдать следующие условия: 1) должны быть количественно измеримы; 2) теоретически обоснованы; 3) линейно независимы друг от друга; 4) одна модель не должна включать в себя совокупный фактор и факторы его образующие; 5) тесно связаны между собой. Для реализации 5-го требования строят матрицу коэф-в парной корреляции. На основании этой матрицы выбирают те факторы, связь которых с величиной наиболее тесная. Затем проверяют наличие мультиколлинеарности (МК) факторов. Два фактора МК, если
. МК факторы нельзя включать в одну модель, нужно выбрать один из них или заменить оба совокупной функцией.
. Эта матрица симметрична относительно главной диагонали, т.е. состоит из двух одинаковых треугольников. Она позволяет выбрать факторы наиболее тесно связанные с интересующей нас величиной, а также установить связь между самими факторами. Как правило, в регрессионной модели нельзя включать факторы, тесно связанные между собой.
Коэф-т парной линейной корреляции:
. Свойства: 1) rx,y находится в инт-ле (-1;1); 2) rx,y>0 – связь прямая, rx,y<0 – связь обратная; 3)
- связь тесная,
- связь слабая. Для оценки стат. значимости коэф-та парной корреляции применяют t-критерий Стьюдента:
n – количество данных в имеющихся совокупностях. Если tтабл<t, то коэф-т корреляции можно считать статистически значимым.
30. Проверка значимости уравнения регрессии.
а) Проверка значимости уравнения. Для проверки применяют F-критерий Фишера:
, k – число факторов уравнения. Если Fтабл<F, то уравнение считается статистически значимым. Fтабл=F(0,05; k; n-k-1).
Значимость регрессионного уравнения является проверкой качества уравнения. Показывает, что рассчитанные значения хорошо приближают фактические и что фактор в модели выбран правильно.
б) Проверка значимости параметров проводится на основе t-критерия Стьюдента. Вначале рассчитывают стандартную ошибку модели Se.
. Затем определяют стандартные ошибки каждого параметра уравнения:
. Если tтабл<
, то соотв. параметр уравнения считают статистически значимым tтабл=t(
;n-k-1). Замечание: используя t-критерий можно опр-ть интервальные оценки для параметров регрессионного уравнения:
.
31. Проверка выполнения предпосылок МНК. Обнаружение гетероскедастичности.
Основную информацию для анализа качества регрессионного уравнения можно получить из ряда остатков. Иногда только по одному графику остатков можно судить о качестве аппроксимации. Остатки модели должны обладать опр. свойствами: несмещенность, состоятельность, эффективность. На практике проверка этих свойств сводится к проверке 5 предпосылок МНК: 1.случайный характер остатков (критерий поворотных точек), 2.независимость уровней в ряде остатков (d-критерий Дарбина-Уотсона), 3.соответствие ряда остатков нормальному закону распределения(RS-критерий), 4.равенство 0 мат. ожидания остатков, 5.гомоскедастичность остатков.
1.Свойство случайности проверяется с помощью критерия поворотных точек или критерия пиков. Уровень в ряде остатков называется поворотной точкой, если он одновременно больше или одновременно меньше 2-ух соседних с ним уровней. Точкам поворота приписывают значения 1, остальным – 0. Свойство случайности выполняется, если количество поворотных точек
справа означает, что от выражения внутри них нужно взять целую часть. n – количество уровней в ряде.
2.Для проверки свойства независимости (отсутствие автокорреляции) уровней в ряде остатков используют d-критерий Дарбина-Уотсона. В начале рассчитывают величину d по формуле:
. Для этого критерия задаются 2 таблич. границы d1 и d2.
3.Для проверки соответствия ряда остатков нормальному закону распределения используют RS-критерий: RS =(Emax-Emin)/SE. Emax и Emin- соотв. наибольшее и наименьшее значения уровней в ряде остатков. SE- СКО. Если значение RS попадает в табличный интервал, то ряд остатков распределен по норм. закону.
5.Гомоскедастичность – постоянство дисперсии остатков по отношению к фактическим значениям фактора или показателя. Остатки называются гомоскедастичными, если они сосредоточены в виде горизонтальной полосы около оси xi, в противном случае остатки называют гетероскедастичными. Для исследования гомоскедастичности применяются различные тесты. Один из них называется тест Голдфельда-Квандта: 1) Упорядочение значений показателя у по степени возрастания фактора х. 2) Из упорядоченной совокупности убирают несколько «с» центральных значений:
, р – число оцениваемых в модели параметров. В результате, получается 2 совокупности данных, в одной из них значения фактора будет наименьшими, а в другой – наибольшими. 3) Для каждой совокупности строят модель регрессии, по которой находят остатки:
. Пусть S1 – большая сумма квадратов ошибок, а S2 – меньшая. 4) Определим отношение
. 5) Полученное значение R сравнивают с табличным значением F-критерия Фишера. Если Fтабл<R, то предпосылка о гомоскедастичности нарушена. Чем больше R по отношению к Fтабл, тем более нарушена данная предпосылка.
.
Коэффициент множественной корреляции. Корреляционная матрица не дает ответов на все вопросы, интересующие нас, для данной совокупности переменных. Возникают 2 дополнительные задачи: 1) как связана интересующая нас величина со всей совокупностью имеющихся факторов; 2) какой будет связь двух переменных при фиксировании или исключении влияния др. переменных. Для решения 1-ой задачи применяют коэф-т множественной корреляции:
Коэффициент частной корреляции. Этот коэф-т предназначен для оценки тесноты связи между 2-мя переменными при фиксировании или исключении влияния др. переменных.
27. Нелинейная регрессия. Нелинейные модели и их линеаризация.
y=f(x) – общий вид. Если в качестве f использовать нелинейную математическую зависимость, то получиться нелинейная модель парной регрессии. Различают 2 класса нелинейных моделей:
1. модели нелинейные относительно фактора, но линейные относительно параметров:
*полиномиальные: у=а0+а1х+а2х2+а3х3+…. Для перехода к линейной функции применяют простую замену переменных (х1=х2, х2=х3), у=а0+а1х+а2х1+а3х2…
*гиперболические: у=а0+а1/х, (х1=1/х); у=а0+а1х1.
2. степенную модель: у=ахв;
3. показательную: у=авх;
4. экспоненциальную: у=кеа+вх.
Модели являются нелинейными как относительно фактора, так и относительно параметра. Для их линеаризации использую процедуру логарифмирования. Таким образом, общая схема оценивания нелинейных моделей следующая:
1,линеаризация функции (простой заменой или логарифмированием);
2,оценка параметров линейной модели МНК;
3,обратный переход к исходному виду модели.
28. Интервалы прогноза по линейному уравнению парной регрессии.
Прогноз по регрессионной модели включает в себя следующие этапы:
прогноз фактора. Для получения прогнозных оценок фактора можно использовать правило опр. в условии или один из экстраполяционных методов. Методы экстраполяции (кривые роста) можно применять, если исходные данные в виде временных рядов.
2,точечный прогноз показателя:
3,построение доверительного интервала:
Se – СКО,
Нижняя граница: упр-U, верхняя граница: упр+U.
29. Функциональные и корреляционные связи между признаками. Измерение тесноты связи.
При построении системы факторов необходимо соблюдать следующие условия: 1) должны быть количественно измеримы; 2) теоретически обоснованы; 3) линейно независимы друг от друга; 4) одна модель не должна включать в себя совокупный фактор и факторы его образующие; 5) тесно связаны между собой. Для реализации 5-го требования строят матрицу коэф-в парной корреляции. На основании этой матрицы выбирают те факторы, связь которых с величиной наиболее тесная. Затем проверяют наличие мультиколлинеарности (МК) факторов. Два фактора МК, если
Коэф-т парной линейной корреляции:
30. Проверка значимости уравнения регрессии.
а) Проверка значимости уравнения. Для проверки применяют F-критерий Фишера:
Значимость регрессионного уравнения является проверкой качества уравнения. Показывает, что рассчитанные значения хорошо приближают фактические и что фактор в модели выбран правильно.
б) Проверка значимости параметров проводится на основе t-критерия Стьюдента. Вначале рассчитывают стандартную ошибку модели Se.
31. Проверка выполнения предпосылок МНК. Обнаружение гетероскедастичности.
Основную информацию для анализа качества регрессионного уравнения можно получить из ряда остатков. Иногда только по одному графику остатков можно судить о качестве аппроксимации. Остатки модели должны обладать опр. свойствами: несмещенность, состоятельность, эффективность. На практике проверка этих свойств сводится к проверке 5 предпосылок МНК: 1.случайный характер остатков (критерий поворотных точек), 2.независимость уровней в ряде остатков (d-критерий Дарбина-Уотсона), 3.соответствие ряда остатков нормальному закону распределения(RS-критерий), 4.равенство 0 мат. ожидания остатков, 5.гомоскедастичность остатков.
1.Свойство случайности проверяется с помощью критерия поворотных точек или критерия пиков. Уровень в ряде остатков называется поворотной точкой, если он одновременно больше или одновременно меньше 2-ух соседних с ним уровней. Точкам поворота приписывают значения 1, остальным – 0. Свойство случайности выполняется, если количество поворотных точек
2.Для проверки свойства независимости (отсутствие автокорреляции) уровней в ряде остатков используют d-критерий Дарбина-Уотсона. В начале рассчитывают величину d по формуле:
3.Для проверки соответствия ряда остатков нормальному закону распределения используют RS-критерий: RS =(Emax-Emin)/SE. Emax и Emin- соотв. наибольшее и наименьшее значения уровней в ряде остатков. SE- СКО. Если значение RS попадает в табличный интервал, то ряд остатков распределен по норм. закону.
5.Гомоскедастичность – постоянство дисперсии остатков по отношению к фактическим значениям фактора или показателя. Остатки называются гомоскедастичными, если они сосредоточены в виде горизонтальной полосы около оси xi, в противном случае остатки называют гетероскедастичными. Для исследования гомоскедастичности применяются различные тесты. Один из них называется тест Голдфельда-Квандта: 1) Упорядочение значений показателя у по степени возрастания фактора х. 2) Из упорядоченной совокупности убирают несколько «с» центральных значений: