Реферат

Реферат Основы корреляционного анализа

Работа добавлена на сайт bukvasha.net: 2015-10-28

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 15.3.2025





Содержание

Основы корреляционного анализа

Задание 1

Задание 2

Задание 3
Основы корреляционного анализа

Корреляционный анализ, разработанный К.Пирсоном и Дж.Юлом, является одним из методов статистического анализа взаимозависимости нескольких признаков - компонент слу­чайного вектора x. Основная задача корреляционного анализа состоит в оценке степени зави­симости между случайными величинами. Степень линейной зависимости между количест­венными переменными характеризуется с помощью парных, частных и множественных ко­эффициентов корреляции и детерминации.

Парный коэффициент корреляции характеризует тесноту линейной зависимости между двумя переменными на фоне действия всех остальных показателей, входящих в модель. Частный коэффициент корреляции характеризует тесноту линейной зависимости между двумя переменными при исключении влияния всех остальных показателей, входя­щих в модель. Данные коэффициенты корреляции изменяются в пределах от -1 до +1, при­чем чем ближе коэффициент корреляции к +1, тем сильнее зависимость между перемен­ными. Если коэффициент корреляции больше 0, то связь положительная, а если меньше нуля - отрицательная.

Множественный коэффициент корреляции характеризует тесноту линейной связи между одной переменной (результативной) и остальными, входящими в модель; изменя­ется в пределах от 0 до 1. Квадрат множественного коэффициента корреляции называется множественным коэффициентом детерминации. Он характеризует долю дисперсии одной переменной (результативной), обусловленной влиянием всех остальных переменных (ар­гументов), входящих в модель.

Исходной для анализа является матрица:



размерности (n x k), i строка которой характеризует i наблюдение (объект) по всем k-м показателям (/=1, 2, ..., k).

В корреляционном анализе матрицу X рассматривают как выборку объема n из k-мерной генеральной совокупности, подчиняющейся k-мерному нормальному закону рас­пределения.

По выборке определяют оценки параметров генеральной совокупности, а именно: вектор средних (х ), вектор средне-квадратических отклонений s и корреляционную мат­рицу (R) порядка (k*k):


Матрица R является симметричной и положительно определенной:



где - значение i-го наблюдения j-го фактора; Гц - выборочный парный коэффи­циент корреляции, характеризует тесноту линейной связи между показателями xj и x/. При этом г-/ является оценкой генерального парного коэффициента корреляции.

Кроме того, находятся точечные оценки частных и множественных коэффициентов корреляции любого порядка. Например, частный коэффициент корреляции (к-2)-го поряд­ка между факторами и  равен:



где - алгебраическое дополнение элемента корреляционной матрицы R. При

этом где M- - минор, определитель матрицы, получаемой из матрицы R путем вычеркивания  j-й строки и l-го столбца.

Множественный коэффициент корреляции (к-1)-го порядка фактора (результатив­ного признака) X1 определяется по формуле:



где- определитель матрицы R.
Задание 1


По данным n=10 машиностроительных предприятий методами корреляционного анализа исследуется взаимосвязь между следующими показателями: X1 - рентабельность (%); Х2 - премии и вознаграждения на одного работника (млн.руб.); X3 - фондоотдача.



п/п

X1

Х2

X3

1

13,26

1,23

1,45

2

10,16

1,04

1,30

3

13,72

1,80

1,37

4

12,82

0,43

1,65

5

10,63

0,88

1,91

6

9,12

0,57

1,68

7

25,83

1,72

1,94

8

23,39

1,70

1,89

9

10,05

0,60

2,06



Требуется:

а) рассчитать вектора средних и среднеквадратнческих отклонений, матрицу пар­ных коэффициентов корреляции

б) проверить при α=0,05 значимость парного коэффициента корреляции ρ12 и найти его интервальную оценку с доверительной вероятностью γ=0,95;

в)  по корреляционной матрице R рассчитать частный коэффициент корреляции ;

г) проверить при α=0,05 значимость частного коэффициента корреляции ρ12/3 и определить его интервальную оценку при γ=0,95;

д) по корреляционной матрице R вычислить оценку множественного коэффициента корреляции  и при α=0,05 проверить гипотезу Н0: .
Решение:

а) рассчитаем вектора средних и средне – квадратических отклонений, матрицу парных коэффициентов корреляции .



Расчет представлен в таблице 1.

В результате получим:



б) проверим при  значимость парного коэффициента корреляции .

Найдем

Здесь  для парного коэффициента корреляции.

Так как , то гипотеза  отвергается, т.е. предположение о его равенстве нулю отвергается, противоречит наблюдениям, но  мало. Найдем интервальную оценку для  при .

По таблице преобразования Фишера для  будет иметь .

По таблице нормального распределения из условия найдем .

Тогда

Откуда

По таблице Z – преобразования для  и  найдем интервальную оценку для :



Полученная интервальная оценка подтверждает вывод о не значимости парного коэффициента корреляции , т.к. ноль находится внутри доверительного интервала.

в) рассчитываем частный коэффициент корреляции :



где

г) проверим при значимость частного коэффициента корреляции  и определим его интервальную оценку при .

Найдем

, значит, отвергаем гипотезу о равенстве  нулю.

По таблице преобразования Фишера для  будем иметь .

Тогда

Откуда

По таблице Z – преобразования для  и  найдем интервальную оценку для :



Интервальная оценка подтверждает вывод о значимости частного коэффициента корреляции.

д) вычисляем оценку множественного коэффициента корреляции .



где

Проверим гипотезу



Критическое значение по таблице F – распределения



Так как , то гипотеза  отвергается, то есть множественный коэффициент корреляции не равен нулю .

Таблица 1



Задание 2

На основании данных о темпе прироста (%) внутреннего национального продукта (У) и промышленного производства (Х), десяти развитых стран мира за 1992 г., приведенных в таблице и предположения, что генеральное уравнение регрессии имеет вид: ŷ = b0 +b1х.

Страны

У

Х

Япония

США

Германия

Франция

Италия

Великобритания

Канада

Австралия

Нидерланды

3,5

3,1

2,2

2,7

2,7

1,6

3,1

1,8

2,3

4,3

4,6

2,0

3,1

3,0

1,4

3,4

2,6

2,4

Требуется:

а) определить оценки вектора b и остаточной дисперсии Y2 ;

б) при α=0,05 проверить значимость уравнении регрессии;

в) при α=0,05 проверить значимость коэффициентов уравнения;

г) с доверительной вероятностью γ=0,9 построить интервальные оценки β0 и β1;

д) с доверительной вероятностью γ=0,9 построить интервальные оценки уравнения регрессии в точках, определяемых вектором начальных условий


Решение:

Определим вектор оценок в коэффициентов регрессии





Найдем обратную матрицу



Вектор оценок коэффициентов регрессии равен



Оценка уравнения регрессии будет иметь вид:



Определим вектор модельных значений результативного показателя



Тогда

Наименьшая оценка остаточной дисперсии



Оценка среднего квадратического отклонения



б) при  проверим значимость уравнения регрессии.



где                                          (расчет в таблице 2)

По таблице F – распределения для  находим . Так как , то уравнение является значимым.

Найдем оценку ковариационной матрицы вектора :



Отсюда получаем несмещенные оценки дисперсий и среднеквадратических отклонений коэффициентов регрессии:



в) проверим при значимость коэффициентов уравнения регрессии.




Так как  и , то коэффициенты регрессии  и  значимо отличаются от нуля.

г) с доверительной вероятностью  построим интервальные оценки  и



По таблице t – распределения при вероятности  и числа степеней свободы

 находим

Таким образом,

 откуда

 откуда

д) с доверительной вероятностью  построим интервальные оценки уравнения регрессии в точках, определяемых вектором начальных условий

Для точки :

 Для точки :

Таблица 2


Задание 3

По иерархическому агломеративному алгоритму провести классификацию n=4 хозяйств, работа которых характеризуется показателями объема реализованной продукции: х1 – растениеводства и х2 – животноводства с одного гектара пашни (млн.руб/га). Построить дендрограмму.



1

2

3

4



10

7

1

9



14

9

3

7

Для этого:

а) в качестве расстояния между объектами принять обычное евклидово расстояние, а расстояние между кластерами измерять по принципу «средней связи»;

б) в качестве расстояния между объектами принять взвешенное евклидово расстояние с «весами» ω1=0,1, ω2=0,9, а расстояние между кластерами измерять по принципу «дальнего соседа»;

в) в качестве расстояния между объектами принять обычное евклидово расстояние, а расстояние между кластерами измерять по принципу «центра тяжести».

Решение:

а) Проведем классификацию на основе обычного евклидова расстояния и принципа «среды связи».

Находим матрицу расстояний, используя формулу





Из матрицы видно, что объекты 2 и 4 наиболее близки  и поэтому объединим их в один кластер. После объединения имеем три кластера .

Расстояние от кластера  до остальных кластеров объединим по принципу «средней связи».



Тогда матрица расстояний имеет вид:



Объединим как наиболее близкие кластеры  и  и определим расстояние от  до

 на котором все 4 объекта объединились в один кластер. Построим дендрограмму.



Анализ рисунка показывает, что целесообразным является разбиения на 2 кластера  и .

б) Проведем классификацию на основе взвешенного евклидова расстояния с весами ,  и принципа «дальнего соседа».

Найдем взвешенное евклидово расстояние между объектами.





Объединим в кластер наиболее близкие объекты 2 и 4 . Найдем расстояние между кластером  и остальными объектами

Получим матрицу расстояний



Объединим в кластер наиболее близкие объекты  и  .

 - расстояние, на котором все 4 объекта объединились в один кластер.



в) Классификация на основе обычного евклидова расстояния и принципа «центра тяжести». Матрица  остается такой же как в пункте а).

Объединим в кластер  характеризуется вектором .



Матрица расстояний примет вид:



Образуем кластер .

Определим вектор средних

Найдем расстояние между  и

на котором все объекты объединяются в один кластер.

Строим дендрограмму.



Как видно из рисунка, результат классификации совпал  с результатом в случае а).



1. Реферат Принципы государственной службы 2
2. Доклад на тему Тмутаракань Истоки присутствия на Кавказе
3. Реферат История России от древнейших времен до начала XX века
4. Курсовая на тему Адаптация к физическим нагрузкам и резервные возможности организма Стадии адаптации
5. Реферат КОНСТИТУЦИОННЫЙ СТАТУС ГЛАВЫ ГОСУДАРСТВА
6. Научная работа на тему Духовное развитие
7. Реферат на тему К вопросу о жанрово-стилевой квалификации книги АН Бенуа История русской живописи в XIX веке
8. Реферат на тему Drugs And Welfare Essay Research Paper A
9. Реферат Расчет систем газоснабжения района города
10. Реферат Совершенствование деятельности коммерческих банков на рынке ценных бумаг