Реферат

Реферат Основы корреляционного анализа

Работа добавлена на сайт bukvasha.net: 2015-10-28

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 26.2.2025





Содержание

Основы корреляционного анализа

Задание 1

Задание 2

Задание 3
Основы корреляционного анализа

Корреляционный анализ, разработанный К.Пирсоном и Дж.Юлом, является одним из методов статистического анализа взаимозависимости нескольких признаков - компонент слу­чайного вектора x. Основная задача корреляционного анализа состоит в оценке степени зави­симости между случайными величинами. Степень линейной зависимости между количест­венными переменными характеризуется с помощью парных, частных и множественных ко­эффициентов корреляции и детерминации.

Парный коэффициент корреляции характеризует тесноту линейной зависимости между двумя переменными на фоне действия всех остальных показателей, входящих в модель. Частный коэффициент корреляции характеризует тесноту линейной зависимости между двумя переменными при исключении влияния всех остальных показателей, входя­щих в модель. Данные коэффициенты корреляции изменяются в пределах от -1 до +1, при­чем чем ближе коэффициент корреляции к +1, тем сильнее зависимость между перемен­ными. Если коэффициент корреляции больше 0, то связь положительная, а если меньше нуля - отрицательная.

Множественный коэффициент корреляции характеризует тесноту линейной связи между одной переменной (результативной) и остальными, входящими в модель; изменя­ется в пределах от 0 до 1. Квадрат множественного коэффициента корреляции называется множественным коэффициентом детерминации. Он характеризует долю дисперсии одной переменной (результативной), обусловленной влиянием всех остальных переменных (ар­гументов), входящих в модель.

Исходной для анализа является матрица:



размерности (n x k), i строка которой характеризует i наблюдение (объект) по всем k-м показателям (/=1, 2, ..., k).

В корреляционном анализе матрицу X рассматривают как выборку объема n из k-мерной генеральной совокупности, подчиняющейся k-мерному нормальному закону рас­пределения.

По выборке определяют оценки параметров генеральной совокупности, а именно: вектор средних (х ), вектор средне-квадратических отклонений s и корреляционную мат­рицу (R) порядка (k*k):


Матрица R является симметричной и положительно определенной:



где - значение i-го наблюдения j-го фактора; Гц - выборочный парный коэффи­циент корреляции, характеризует тесноту линейной связи между показателями xj и x/. При этом г-/ является оценкой генерального парного коэффициента корреляции.

Кроме того, находятся точечные оценки частных и множественных коэффициентов корреляции любого порядка. Например, частный коэффициент корреляции (к-2)-го поряд­ка между факторами и  равен:



где - алгебраическое дополнение элемента корреляционной матрицы R. При

этом где M- - минор, определитель матрицы, получаемой из матрицы R путем вычеркивания  j-й строки и l-го столбца.

Множественный коэффициент корреляции (к-1)-го порядка фактора (результатив­ного признака) X1 определяется по формуле:



где- определитель матрицы R.
Задание 1


По данным n=10 машиностроительных предприятий методами корреляционного анализа исследуется взаимосвязь между следующими показателями: X1 - рентабельность (%); Х2 - премии и вознаграждения на одного работника (млн.руб.); X3 - фондоотдача.



п/п

X1

Х2

X3

1

13,26

1,23

1,45

2

10,16

1,04

1,30

3

13,72

1,80

1,37

4

12,82

0,43

1,65

5

10,63

0,88

1,91

6

9,12

0,57

1,68

7

25,83

1,72

1,94

8

23,39

1,70

1,89

9

10,05

0,60

2,06



Требуется:

а) рассчитать вектора средних и среднеквадратнческих отклонений, матрицу пар­ных коэффициентов корреляции

б) проверить при α=0,05 значимость парного коэффициента корреляции ρ12 и найти его интервальную оценку с доверительной вероятностью γ=0,95;

в)  по корреляционной матрице R рассчитать частный коэффициент корреляции ;

г) проверить при α=0,05 значимость частного коэффициента корреляции ρ12/3 и определить его интервальную оценку при γ=0,95;

д) по корреляционной матрице R вычислить оценку множественного коэффициента корреляции  и при α=0,05 проверить гипотезу Н0: .
Решение:

а) рассчитаем вектора средних и средне – квадратических отклонений, матрицу парных коэффициентов корреляции .



Расчет представлен в таблице 1.

В результате получим:



б) проверим при  значимость парного коэффициента корреляции .

Найдем

Здесь  для парного коэффициента корреляции.

Так как , то гипотеза  отвергается, т.е. предположение о его равенстве нулю отвергается, противоречит наблюдениям, но  мало. Найдем интервальную оценку для  при .

По таблице преобразования Фишера для  будет иметь .

По таблице нормального распределения из условия найдем .

Тогда

Откуда

По таблице Z – преобразования для  и  найдем интервальную оценку для :



Полученная интервальная оценка подтверждает вывод о не значимости парного коэффициента корреляции , т.к. ноль находится внутри доверительного интервала.

в) рассчитываем частный коэффициент корреляции :



где

г) проверим при значимость частного коэффициента корреляции  и определим его интервальную оценку при .

Найдем

, значит, отвергаем гипотезу о равенстве  нулю.

По таблице преобразования Фишера для  будем иметь .

Тогда

Откуда

По таблице Z – преобразования для  и  найдем интервальную оценку для :



Интервальная оценка подтверждает вывод о значимости частного коэффициента корреляции.

д) вычисляем оценку множественного коэффициента корреляции .



где

Проверим гипотезу



Критическое значение по таблице F – распределения



Так как , то гипотеза  отвергается, то есть множественный коэффициент корреляции не равен нулю .

Таблица 1



Задание 2

На основании данных о темпе прироста (%) внутреннего национального продукта (У) и промышленного производства (Х), десяти развитых стран мира за 1992 г., приведенных в таблице и предположения, что генеральное уравнение регрессии имеет вид: ŷ = b0 +b1х.

Страны

У

Х

Япония

США

Германия

Франция

Италия

Великобритания

Канада

Австралия

Нидерланды

3,5

3,1

2,2

2,7

2,7

1,6

3,1

1,8

2,3

4,3

4,6

2,0

3,1

3,0

1,4

3,4

2,6

2,4

Требуется:

а) определить оценки вектора b и остаточной дисперсии Y2 ;

б) при α=0,05 проверить значимость уравнении регрессии;

в) при α=0,05 проверить значимость коэффициентов уравнения;

г) с доверительной вероятностью γ=0,9 построить интервальные оценки β0 и β1;

д) с доверительной вероятностью γ=0,9 построить интервальные оценки уравнения регрессии в точках, определяемых вектором начальных условий


Решение:

Определим вектор оценок в коэффициентов регрессии





Найдем обратную матрицу



Вектор оценок коэффициентов регрессии равен



Оценка уравнения регрессии будет иметь вид:



Определим вектор модельных значений результативного показателя



Тогда

Наименьшая оценка остаточной дисперсии



Оценка среднего квадратического отклонения



б) при  проверим значимость уравнения регрессии.



где                                          (расчет в таблице 2)

По таблице F – распределения для  находим . Так как , то уравнение является значимым.

Найдем оценку ковариационной матрицы вектора :



Отсюда получаем несмещенные оценки дисперсий и среднеквадратических отклонений коэффициентов регрессии:



в) проверим при значимость коэффициентов уравнения регрессии.




Так как  и , то коэффициенты регрессии  и  значимо отличаются от нуля.

г) с доверительной вероятностью  построим интервальные оценки  и



По таблице t – распределения при вероятности  и числа степеней свободы

 находим

Таким образом,

 откуда

 откуда

д) с доверительной вероятностью  построим интервальные оценки уравнения регрессии в точках, определяемых вектором начальных условий

Для точки :

 Для точки :

Таблица 2


Задание 3

По иерархическому агломеративному алгоритму провести классификацию n=4 хозяйств, работа которых характеризуется показателями объема реализованной продукции: х1 – растениеводства и х2 – животноводства с одного гектара пашни (млн.руб/га). Построить дендрограмму.



1

2

3

4



10

7

1

9



14

9

3

7

Для этого:

а) в качестве расстояния между объектами принять обычное евклидово расстояние, а расстояние между кластерами измерять по принципу «средней связи»;

б) в качестве расстояния между объектами принять взвешенное евклидово расстояние с «весами» ω1=0,1, ω2=0,9, а расстояние между кластерами измерять по принципу «дальнего соседа»;

в) в качестве расстояния между объектами принять обычное евклидово расстояние, а расстояние между кластерами измерять по принципу «центра тяжести».

Решение:

а) Проведем классификацию на основе обычного евклидова расстояния и принципа «среды связи».

Находим матрицу расстояний, используя формулу





Из матрицы видно, что объекты 2 и 4 наиболее близки  и поэтому объединим их в один кластер. После объединения имеем три кластера .

Расстояние от кластера  до остальных кластеров объединим по принципу «средней связи».



Тогда матрица расстояний имеет вид:



Объединим как наиболее близкие кластеры  и  и определим расстояние от  до

 на котором все 4 объекта объединились в один кластер. Построим дендрограмму.



Анализ рисунка показывает, что целесообразным является разбиения на 2 кластера  и .

б) Проведем классификацию на основе взвешенного евклидова расстояния с весами ,  и принципа «дальнего соседа».

Найдем взвешенное евклидово расстояние между объектами.





Объединим в кластер наиболее близкие объекты 2 и 4 . Найдем расстояние между кластером  и остальными объектами

Получим матрицу расстояний



Объединим в кластер наиболее близкие объекты  и  .

 - расстояние, на котором все 4 объекта объединились в один кластер.



в) Классификация на основе обычного евклидова расстояния и принципа «центра тяжести». Матрица  остается такой же как в пункте а).

Объединим в кластер  характеризуется вектором .



Матрица расстояний примет вид:



Образуем кластер .

Определим вектор средних

Найдем расстояние между  и

на котором все объекты объединяются в один кластер.

Строим дендрограмму.



Как видно из рисунка, результат классификации совпал  с результатом в случае а).



1. Контрольная работа на тему Вычисление теплового эффекта реакций
2. Реферат Нетрадиционные возобновимые источники энергии
3. Реферат на тему Проблемы устойчивого развития цивилизации XX века
4. Лабораторная работа на тему Статистика населения Красноярского края
5. Презентация на тему Кровь ее состав и функции
6. Диплом Удосконалення формування розподілу прибутку підприємства при зовнішньоекономічній діяльності
7. Реферат Роль золотого стандарта в мировой валютной системе на протяжении 19-20 веков
8. Курсовая Глобальні проблеми сучасності 2
9. Реферат на тему Монашеские и полумонашеские ордена в РКЦ Состояния совершенства
10. Реферат на тему Qin Shihuang Essay Research Paper Many cultures