Контрольная работа Расчет показателей корреляционного, дисперсионного анализа
Работа добавлена на сайт bukvasha.net: 2015-10-25Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
от 25%
договор
Задача 1. Корреляционный анализ
Исследовано функционирование некоторого предприятия торговли в течение n месяцев. Необходимо проанализировать наличие предполагаемой зависимости между: расходами предприятия на рекламу и продвижение товаров на рынок , (в тыс. грн); расходами на обучение и повышение квалификации персонала Yi, (в тыс. грн.); объемом товарооборота предприятия торговли Ui, (в млн. грн.); прибылью предприятия Zi, (в тыс. грн.).
X | Y | U | Z |
82 | 101 | 48 | 34 |
100 | 106 | 52 | 24 |
85 | 66 | 51 | 36 |
85 | 80 | 47 | 33 |
102 | 71 | 49 | 23 |
102 | 80 | 54 | 24 |
85 | 119 | 46 | 35 |
88 | 66 | 49 | 30 |
90 | 84 | 50 | 30 |
84 | 94 | 46 | 33 |
83 | 73 | 47 | 32 |
87 | 59 | 47 | 31 |
102 | 79 | 52 | 24 |
80 | 116 | 44 | 36 |
80 | 103 | 48 | 33 |
96 | 76 | 52 | 27 |
95 | 89 | 52 | 27 |
81 | 66 | 45 | 34 |
Провести предварительный анализ (описательную статистику) исследуемых компонентов многомерной случайной величины
Для всех пар случайных величин построить диаграммы рассеивания (корреляционные поля).
Рассчитать матрицу выборочных парных коэффициентов корреляции. Сделать выводы о степени тесноты и тенденции связи между парами компонентов исследуемого многомерного признака в терминах решаемой прикладной задачи.
Проверить гипотезу об отсутствии корреляционной связи между двумя компонентами случайной величины (X,Z).
Построить доверительные интервалы для двух парных коэффициентов корреляции при р=0.95 (X,Z;Y,Z).
Исключив из рассмотрения случайную величину, не зависящую от других, для оставшихся случайных величин рассчитать матрицу частных коэффициентов корреляции.
Рассчитать парные ранговые коэффициенты корреляции Спирмена и Кендалла для двух компонентов многомерной случайной величины (U,Y).
Рассчитать корреляционные отношения между случайными величинами, для которых можно предположить наличие нелинейной связи.
Рассчитать коэффициент конкордации для трех случайных величин, между которыми на основе проведенного анализа можно предположить наличие статистической связи.
Проверить гипотезу о статистической значимости исследуемой множественной связи.
В терминах решаемой прикладной задачи дать содержательную интерпретацию результатов для каждого из пунктов.
РЕШЕНИЕ
1. Построим диаграммы рассеивания
2. Рассчитаем матрицу выборочных парных коэффициентов корреляции при помощи пакета анализа программы Excel:
| Δ U | Δ X | Δ Y |
Δ U | 1 | | |
Δ X | 0,80766 | 1 | |
Δ Y | -0,3689 | -0,19614 | 1 |
Анализ полученных коэффициентов парной корреляции показывает, что зависимая переменная, т.е. объем товарооборота предприятия торговли имеет сильную прямую связь с расходами предприятия на рекламу и продвижение товаров на рынок (0,4≤0,81≤1) и слабую обратную связь с расходами на обучение и повышение квалификации персонала (0,37≤0,4). Мультиколлинеарность отсутствует, т.к. коэффициент парной корреляции равен -0,196, что не превышает значения 0,7-0,8.
| Δ Z | Δ X | Δ Y |
Δ Z | 1 | | |
Δ X | -0,95998 | 1 | |
Δ Y | 0,215933 | -0,19614 | 1 |
Анализ полученных коэффициентов парной корреляции показывает, что зависимая переменная, т.е. прибыль предприятия торговли имеет сильную обратную связь с расходами предприятия на рекламу и продвижение товаров на рынок (0,4≤0,96≤1) и слабую прямую связь с расходами на обучение и повышение квалификации персонала (0,22≤0,4). Мультиколлинеарность отсутствует, т.к. коэффициент парной корреляции равен -0,196, что не превышает значения 0,7-0,8.
3. Проверить гипотезу об отсутствии корреляционной связи между двумя компонентами случайной величины (X,Z):
В предыдущем пункте проверка гипотезы об отсутствии корреляционной связи между расходами предприятия на рекламу и продвижение товаров на рынок и прибылью предприятия была опровергнута, т.к. проверка коэффициентов парной корреляции показывает, что зависимая переменная, т.е. прибыль предприятия торговли имеет сильную обратную связь с расходами предприятия на рекламу и продвижение товаров на рынок (0,4≤0,96≤1).
4. Построить доверительные интервалы для двух парных коэффициентов корреляции при р=0.95 (X,Z;Y,Z)
Полагая доверительную вероятность р = 0,95 т. е. вероятность, с которой гарантируются результаты, равной 0,95, находим соответствующее ей значение критерия Стьюдента t, равное 2,1009. Воспользовавшись формулой средней квадратической ошибки, где вместо р возьмем рассчитанный выборочный коэффициент корреляции r, получим значение для средней квадратической ошибки X,Z: р = 0,95; r = - 0,96
Поскольку tσr= 2,1009 х 0,018 = 0,0388 верхняя и нижняя границы равны соответственно -0,9212 и -0,9988. Другими словами, с вероятностью 0,95 коэффициент корреляции данной совокупности находится в пределах от -0,9212 до -0,9988. Y,Z: р = 0,95; r = 0,216
Поскольку tσr= 2,1009 х 0,22 = 0,47 верхняя и нижняя границы равны соответственно 0,69 и -0,25. Другими словами, с вероятностью 0,95 коэффициент корреляции данной совокупности находится в пределах от -0,25 до 0,69.
6. Рассчитать парные ранговые коэффициенты корреляции Спирмена и Кендалла для двух компонентов многомерной случайной величины (U,Y).
Запишем ранги:
U | 48 | 52 | 51 | 47 | 49 | 54 | 46 | 49 | 50 | 46 | 47 | 47 | 52 | 44 | 48 | 52 | 52 | 45 |
№ Z | 11 | 5 | 6 | 14 | 9 | 1 | 16 | 8 | 7 | 15 | 13 | 12 | 4 | 18 | 10 | 3 | 2 | 17 |
№ X | 15 | 4 | 12 | 11 | 3 | 2 | 10 | 8 | 7 | 13 | 14 | 9 | 1 | 18 | 17 | 5 | 6 | 16 |
| -4 | 1 | -6 | 3 | 6 | -1 | 6 | 0 | 0 | 2 | -1 | 3 | 3 | 0 | -7 | -2 | -4 | 1 |
| 16 | 1 | 36 | 9 | 36 | 1 | 36 | 0 | 0 | 4 | 1 | 9 | 9 | 0 | 49 | 4 | 16 | 1 |
Σ= 228
Тогда критерий Спирмена равен:
r = 0,765, это больше табличного значения критерия, значит корреляция достоверно отличается от 0.
Критерий Кендалла:
r = 4*153/(18*17) – 1 = -0,5
Значит между объемом товарооборота предприятия торговли и расходами предприятия на рекламу и продвижение товаров на рынок существует обратная средней тесноты связь.
Y | 101 | 106 | 66 | 80 | 71 | 80 | 119 | 66 | 84 | 94 | 73 | 59 | 79 | 116 | 103 | 76 | 89 | 66 |
Z | 4 | 15 | 1 | 6 | 18 | 16 | 3 | 11 | 12 | 7 | 9 | 10 | 17 | 2 | 8 | 13 | 14 | 5 |
X | 15 | 4 | 10 | 11 | 1 | 2 | 12 | 8 | 7 | 13 | 14 | 9 | 3 | 17 | 18 | 5 | 6 | 16 |
| -11 | 11 | -9 | -5 | 17 | 14 | -9 | 3 | 5 | -6 | -5 | 1 | 14 | -15 | -10 | 8 | 8 | -11 |
| 121 | 121 | 81 | 25 | 289 | 196 | 81 | 9 | 25 | 36 | 25 | 1 | 196 | 225 | 100 | 64 | 64 | 121 |
Σ= 1780
Тогда критерий Спирмена равен:
r = -0,837, это значит корреляция недостоверна. Значит между объемом товарооборота предприятия торговли и расходами на обучение и повышение квалификации персонала не существует связи.
7. Рассчитаем корреляционные отношения между случайными величинами, для которых можно предположить наличие нелинейной связи: расходами предприятия на рекламу и продвижение товаров на рынок и объемом товарооборота предприятия торговли; расходами предприятия на рекламу и продвижение товаров на рынок и прибылью предприятия.
Коэффициенты корреляции:
Rxu = 0,8
Rxz = -0,96
8. Рассчитаем коэффициент конкордации для расходов предприятия на рекламу и продвижение товаров на рынок, объемом товарооборота предприятия торговли и продвижение товаров на рынок и прибылью предприятия, между которыми на основе проведенного анализа можно предположить наличие статистической связи
W = 0.88 – значит согласованность показателей стремиться к полной.
После проведении анализа можно сделать следующие выводы:
- объем товарооборота предприятия торговли имеет сильную прямую связь с расходами предприятия на рекламу и продвижение товаров на рынок (0,4≤0,81≤1) и слабую обратную связь с расходами на обучение и повышение квалификации персонала (0,37≤0,4);
- . прибыль предприятия торговли имеет сильную обратную связь с расходами предприятия на рекламу и продвижение товаров на рынок (0,4≤0,96≤1) и слабую прямую связь с расходами на обучение и повышение квалификации персонала (0,22≤0,4);
- между объемом товарооборота предприятия торговли и расходами предприятия на рекламу и продвижение товаров на рынок существует обратная средней тесноты связь;
- Rxu = 0,8 корреляция между расходами предприятия на рекламу и продвижение товаров на рынок и объемом товарооборота предприятия торговли;
Rxz = -0,96 корреляция расходами предприятия на рекламу и продвижение товаров на рынок и прибылью предприятия.
Задача 2. Однофакторный дисперсионный анализ
При уровне значимости a=0.05 определите статистическую достоверность влияния фактора А на динамику величины Х.
№ испытания | A1 | A2 | A3 | A4 |
1 | 2 | 2 | 6 | 7 |
2 | 0 | 13 | 8 | 11 |
3 | 14 | 13 | 10 | 2 |
4 | 11 | 5 | 9 | 5 |
5 | 1 | 12 | 4 | 6 |
6 | 7 | 4 | | 8 |
РЕШЕНИЕ
Число выборок m=6, значения во всех выборках n=22
№ испытания | A1 | A2 | A3 | A4 | Σ | n |
1 | 2 | 2 | 6 | 7 | 17 | 4 |
2 | 0 | 13 | 8 | 11 | 32 | 3 |
3 | 14 | 13 | 10 | 2 | 39 | 4 |
4 | 11 | 5 | 9 | 5 | 30 | 4 |
5 | 1 | 12 | 4 | 6 | 23 | 4 |
6 | 7 | 4 | | 8 | 19 | 3 |
Выборочное среднее:
Сумма квадратов отклонений выборочных средних от общего среднего (сумма квадратов отклонений между группами):
Сумма квадратов отклонений наблюдаемых значений от выборочной средней (сумма квадратов отклонений внутри групп):
Общая сумма квадратов отклонений наблюдаемых значений от общего среднего
№ | А ср. | А ср.2 | А ср.2 * n |
1 | 4,25 | 18,0625 | 72,25 |
2 | 10,66667 | 113,7778 | 341,3333 |
3 | 9,75 | 95,0625 | 380,25 |
4 | 7,5 | 56,25 | 225 |
5 | 5,75 | 33,0625 | 132,25 |
6 | 6,333333 | 40,11111 | 120,3333 |
Σ | 7,272727 | | 1271,417 |
Тогда Q = 330,36
Q1 = 107,18
Q2 = Q – Q1 = 222,58
В качестве критерия необходимо воспользоваться критерием Фишера:
F = 1,549
Табличное значение критерия Фишера для заданном уровне значимости 0,05 равен 3,8564.
Так как расчетное значение критерия Фишера меньше табличного, нет оснований считать, что независимый фактор оказывает влияние на разброс средних значений.
Задача 3. Двухфакторный дисперсионный анализ
При уровне значимости a=0.05 определите статистическую достоверность влияния фактора А и фактора В на динамику величины Х.
B1 | B2 | B3 | B4 | |
A1 | 3 | 3 | 12 | 20 |
A2 | 7 | 10 | 18 | 7 |
A3 | 7 | 15 | 6 | 17 |
A4 | 5 | 18 | 0 | 18 |
A5 | 8 | 10 | 8 | 9 |
РЕШЕНИЕ
При двухфакторном дисперсионном анализе изучается влияние, которое оказывают два качественных признака (факторы A и B ) на некоторый количественный результат (отклик). Весьма типична ситуация, когда второй фактор (фактор B) является мешающим: он включается в рассмотрение по той причине, что мешает обнаружить и оценить влияние фактора A.
Пусть фактор A имеет k уровней A1, ..., Ak , а фактор B - n уровней B1,...,Bn . Предполагается, что измеряемая величина x есть результат действия факторов A и B и случайной составляющей e :
Принимается аддитивная и независимая модель действия факторов:
причем
,
Последние два условия всегда можно выполнить смещением величин aj и bi и изменением величины c; величины aj и bi называются вкладами факторов.
Проведем двухфакторный дисперсионный анализ при помощи пакета анализа программы Excel:
ИТОГИ | Счет | Сумма | Среднее | Дисперсия |
A1 | 4 | 38 | 9,5 | 67 |
A2 | 4 | 42 | 10,5 | 27 |
A3 | 4 | 45 | 11,25 | 30,91666667 |
A4 | 4 | 41 | 10,25 | 84,25 |
A5 | 4 | 35 | 8,75 | 0,916666667 |
| | | | |
B1 | 5 | 30 | 6 | 4 |
B2 | 5 | 56 | 11,2 | 32,7 |
B3 | 5 | 44 | 8,8 | 45,2 |
B4 | 5 | 71 | 14,2 | 33,7 |