Реферат Основы корреляционного анализа
Работа добавлена на сайт bukvasha.net: 2015-10-28Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего
от 25%

Подписываем
договор
Содержание
Основы корреляционного анализа
Задание 1
Задание 2
Задание 3
Основы корреляционного анализа
Корреляционный анализ, разработанный К.Пирсоном и Дж.Юлом, является одним из методов статистического анализа взаимозависимости нескольких признаков - компонент случайного вектора x. Основная задача корреляционного анализа состоит в оценке степени зависимости между случайными величинами. Степень линейной зависимости между количественными переменными характеризуется с помощью парных, частных и множественных коэффициентов корреляции и детерминации.
Парный коэффициент корреляции характеризует тесноту линейной зависимости между двумя переменными на фоне действия всех остальных показателей, входящих в модель. Частный коэффициент корреляции характеризует тесноту линейной зависимости между двумя переменными при исключении влияния всех остальных показателей, входящих в модель. Данные коэффициенты корреляции изменяются в пределах от -1 до +1, причем чем ближе коэффициент корреляции к +1, тем сильнее зависимость между переменными. Если коэффициент корреляции больше 0, то связь положительная, а если меньше нуля - отрицательная.
Множественный коэффициент корреляции характеризует тесноту линейной связи между одной переменной (результативной) и остальными, входящими в модель; изменяется в пределах от 0 до 1. Квадрат множественного коэффициента корреляции называется множественным коэффициентом детерминации. Он характеризует долю дисперсии одной переменной (результативной), обусловленной влиянием всех остальных переменных (аргументов), входящих в модель.
Исходной для анализа является матрица:
размерности (n x k), i-я строка которой характеризует i-е наблюдение (объект) по всем k-м показателям (/=1, 2, ..., k).
В корреляционном анализе матрицу X рассматривают как выборку объема n из k-мерной генеральной совокупности, подчиняющейся k-мерному нормальному закону распределения.
По выборке определяют оценки параметров генеральной совокупности, а именно: вектор средних (х ), вектор средне-квадратических отклонений s и корреляционную матрицу (R) порядка (k*k):
Матрица R является симметричной
где
Кроме того, находятся точечные оценки частных и множественных коэффициентов корреляции любого порядка. Например, частный коэффициент корреляции (к-2)-го порядка между факторами
где
этом
Множественный коэффициент корреляции (к-1)-го порядка фактора (результативного признака) X1 определяется по формуле:
где
Задание 1
По данным n=10 машиностроительных предприятий методами корреляционного анализа исследуется взаимосвязь между следующими показателями: X1 - рентабельность (%); Х2 - премии и вознаграждения на одного работника (млн.руб.); X3 - фондоотдача.
№ п/п | X1 | Х2 | X3 |
1 | 13,26 | 1,23 | 1,45 |
2 | 10,16 | 1,04 | 1,30 |
3 | 13,72 | 1,80 | 1,37 |
4 | 12,82 | 0,43 | 1,65 |
5 | 10,63 | 0,88 | 1,91 |
6 | 9,12 | 0,57 | 1,68 |
7 | 25,83 | 1,72 | 1,94 |
8 | 23,39 | 1,70 | 1,89 |
9 | 10,05 | 0,60 | 2,06 |
Требуется:
а) рассчитать вектора средних и среднеквадратнческих отклонений, матрицу парных коэффициентов корреляции
б) проверить при α=0,05 значимость парного коэффициента корреляции ρ12 и найти его интервальную оценку с доверительной вероятностью γ=0,95;
в) по корреляционной матрице R рассчитать частный коэффициент корреляции
г) проверить при α=0,05 значимость частного коэффициента корреляции ρ12/3 и определить его интервальную оценку при γ=0,95;
д) по корреляционной матрице R вычислить оценку множественного коэффициента корреляции
Решение:
а) рассчитаем вектора средних и средне – квадратических отклонений, матрицу парных коэффициентов корреляции
Расчет представлен в таблице 1.
В результате получим:
б) проверим при
Найдем
Здесь
Так как
По таблице преобразования Фишера для
По таблице нормального распределения из условия
Тогда
Откуда
По таблице Z – преобразования для
Полученная интервальная оценка подтверждает вывод о не значимости парного коэффициента корреляции
в) рассчитываем частный коэффициент корреляции
где
г) проверим при
Найдем
По таблице преобразования Фишера для
Тогда
Откуда
По таблице Z – преобразования для
Интервальная оценка подтверждает вывод о значимости частного коэффициента корреляции.
д) вычисляем оценку множественного коэффициента корреляции
где
Проверим гипотезу
Критическое значение по таблице F – распределения
Так как
Таблица 1
Задание 2
На основании данных о темпе прироста (%) внутреннего национального продукта (У) и промышленного производства (Х), десяти развитых стран мира за
Страны | У | Х |
Япония США Германия Франция Италия Великобритания Канада Австралия Нидерланды | 3,5 3,1 2,2 2,7 2,7 1,6 3,1 1,8 2,3 | 4,3 4,6 2,0 3,1 3,0 1,4 3,4 2,6 2,4 |
Требуется:
а) определить оценки вектора b и остаточной дисперсии Y2 ;
б) при α=0,05 проверить значимость уравнении регрессии;
в) при α=0,05 проверить значимость коэффициентов уравнения;
г) с доверительной вероятностью γ=0,9 построить интервальные оценки β0 и β1;
д) с доверительной вероятностью γ=0,9 построить интервальные оценки уравнения регрессии в точках, определяемых вектором начальных условий
Решение:
Определим вектор оценок в коэффициентов регрессии
Найдем обратную матрицу
Вектор оценок коэффициентов регрессии равен
Оценка уравнения регрессии будет иметь вид:
Определим вектор модельных значений результативного показателя
Тогда
Наименьшая оценка остаточной дисперсии
Оценка среднего квадратического отклонения
б) при
где
По таблице F – распределения для
Найдем оценку ковариационной матрицы вектора
Отсюда получаем несмещенные оценки дисперсий и среднеквадратических отклонений коэффициентов регрессии:
в) проверим при
Так как
г) с доверительной вероятностью
По таблице t – распределения при вероятности
Таким образом,
д) с доверительной вероятностью
Для точки
Задание 3
По иерархическому агломеративному алгоритму провести классификацию n=4 хозяйств, работа которых характеризуется показателями объема реализованной продукции: х1 – растениеводства и х2 – животноводства с одного гектара пашни (млн.руб/га). Построить дендрограмму.
| 1 | 2 | 3 | 4 |
| 10 | 7 | 1 | 9 |
| 14 | 9 | 3 | 7 |
Для этого:
а) в качестве расстояния между объектами принять обычное евклидово расстояние, а расстояние между кластерами измерять по принципу «средней связи»;
б) в качестве расстояния между объектами принять взвешенное евклидово расстояние с «весами» ω1=0,1, ω2=0,9, а расстояние между кластерами измерять по принципу «дальнего соседа»;
в) в качестве расстояния между объектами принять обычное евклидово расстояние, а расстояние между кластерами измерять по принципу «центра тяжести».
Решение:
а) Проведем классификацию на основе обычного евклидова расстояния и принципа «среды связи».
Находим матрицу расстояний, используя формулу
Из матрицы видно, что объекты 2 и 4 наиболее близки
Расстояние от кластера
Тогда матрица расстояний имеет вид:
Объединим как наиболее близкие
Анализ рисунка показывает, что целесообразным является разбиения на 2 кластера
б) Проведем классификацию на основе взвешенного евклидова расстояния с весами
Найдем взвешенное евклидово расстояние между объектами.
Объединим в кластер наиболее близкие объекты 2 и 4
Получим матрицу расстояний
Объединим в кластер наиболее близкие объекты
в) Классификация на основе обычного евклидова расстояния и принципа «центра тяжести». Матрица
Объединим в кластер
Матрица расстояний примет вид:
Образуем кластер
Определим вектор средних
Найдем расстояние между
Строим дендрограмму.
Как видно из рисунка, результат классификации совпал с результатом в случае а).