Реферат Елементи дисперсійного аналізу і теорії кореляції
Работа добавлена на сайт bukvasha.net: 2015-10-28Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего
от 25%

Подписываем
договор
ЕЛЕМЕНТИ ДИСПЕРСІЙНОГО АНАЛІЗУ
І ТЕОРІЇ КОРЕЛЯЦІЇ
Вступ
У більшості розділів математичної статистики передбачається, що кожний із усіх численних компонентів (факторів), які визначають характер поведінки випадкової величини, вносить у формування її значення дуже малий неконтрольований внесок, більш-менш однаковий за потужністю. На відміну від них у дисперсійному аналізі та у теорії кореляції досліджуються випадки наявності серед цих факторів величин, що є домінуючими у тій чи у іншій ступені аж впритул до необхідності їх інтерпретації як також випадкових величин і з'ясування їхнього взаємозв'язку з основною випадковою величиною.
1 Сутність і задачі дисперсійного аналізу. Однофакторний дисперсійний аналіз
Нехай є
Введемо наступні основні обмеження, що накладаються на розглянуту модель:
– випадкові величини
– дисперсії у групах є рівними між собою, тобто
– вибірки, що організовані з
Будь-яке значення випадкової величини
де:
Модель (1) відображає те, що у формуванні значення
де
Цю величину, подібну до (2), можна назвати дисперсією фактора
Порівнюючи цю факторну дисперсію з дисперсією випадкової компоненти, що називають дисперсією відтворюваності
Якщо факторна дисперсія і дисперсія відтворюваності розрізняються значущо, то слід визнати вплив досліджуваного фактора на результати випробування, а якщо вони розрізняються суттєво, то роблять статистичний висновок про те, що вплив фактора є несуттєвим.
При цьому вивчати вплив фактора
Таким чином, за нульову гіпотезу, що буде перевірятися за допомогою дисперсійного аналізу, висувається статистична гіпотеза про рівність математичних сподівань по рівнях фактора
проти альтернативної гіпотези
Припустимо, що для кожного з
Обчислимо середнє
Таблиця 1
Номер випробування | Рівень фактора | |||||
| | ... | | ... | | |
1 | | | ... | | | |
2 | | | ... | | | |
| | | | | | ... |
| | | ... | | ... | |
| | | | | | ... |
| | | ... | | ... | |
| | | ... | | ... | |
Повну суму квадратів відхилень усіх значень від загальної середньої, при обчисленні якої спільно врахуються факторна та випадкова компоненти, можна розкласти на суму двох складових, що подають ці фактори роздільно
Для перетворення цих сум у відповідні дисперсії необхідно їх поділити на відповідні кількості ступенів волі, результати чого представлено в табл. 2, яку називають таблицею однофакторного дисперсійного аналізу.
Таблица 2
Компонента | Сума квадратів | Число ступенів волі | Дисперсія |
Факторна | | | |
Залишкова | | | |
Повна | | | |
Для того, щоб перевірити тепер нульову гіпотезу про рівність математичних сподівань за рівнями фактора
Для цього проведемо розрахунок статистики критерію
і порівняємо її з критичною точкою при рівні значущості
Якщо
то нульову гіпотезу приймають, тобто при заданому рівні значущості
Якщо
то вплив фактора
Отже, метод дисперсійного аналізу складається в перевірці нульової гіпотези про рівність групових середніх нормальних сукупностей з однаковими дисперсіями. Для цього досить перевірити за критерієм
2 Поняття про кореляцію і регресію
Оцінка залежності між випадковими величинами та поява можливості прогнозувати при цьому значення однієї випадкової величини за значеннями іншої випадкової величини є важливою проблемою статистичного аналізу.
2.1 Функціональна, статистична і кореляційна залежності
Дві випадкові величини можуть бути незалежними або пов'язаними між собою визначеною функціональною залежністю, або залежністю особливого типу, що називається статистичною (стохастичною).
Статистичною називають залежність, при якій зміна однієї з випадкових величин спричиняє зміну розподілу іншої випадкової величини. Статистична залежність виявляється зокрема в тому, що при зміні однієї з величин змінюється середнє значення іншої; при цьому статистичну залежність називають кореляційною.
Прикладом такої кореляційної залежності є зв'язок між внесеними в землю добривами і отриманим врожаєм зерна. Відомо, що твердого функціонального зв'язку між цими величинами немає у зв'язку з впливом безлічі випадкових факторів (опади, температура повітря й ін.). Однак досвід свідчить, що зміна кількості внесених добрив змінює середню врожайність.
2.2 Умовне математичне сподівання, коефіцієнт кореляції і регресія двовимірної випадкової величини в теорії ймовірностей
У теорії ймовірностей при описі системи двох випадкових величин
де
– рівняння регресії
Аналогічно визначаються умовне математичне сподівання випадкової величини
Функції
де
Функцію
приймає найменше можливе значення. При цьому функцію
У теорії ймовірностей доведено, що лінійна середня квадратична регресія
де
Можна показати, що кореляційний момент
Коефіцієнт
називають коефіцієнтом регресії
називають прямою середньоквадратичної регресії
При підстановці знайдених значень
Цю величину називають залишковою дисперсією випадкової величини
Аналогічний вигляд має і пряма середньоквадратичної регресії
Очевидно, що обидві прямі регресії (12) і (13) проходять через спільну точку
Таким чином, значення кута між прямими регресії (12) і (13) характеризує тісноту зв’язку між випадковими величинами: чим менше кут, тим більш тісною є зв’язок.
2.3 Умовне середнє і вибіркова регресія
У математичній статистиці вводять вибіркові оцінки умовного математичного сподівання і регресії. У якості оцінки умовного математичного сподівання
Умовним середнім
Також як і умовне математичне сподівання
2.4 Визначення параметрів вибіркового рівняння прямої лінії середньоквадратичної регресії за незгрупованих даних
Нехай під час дослідження кількісних ознак (
Кутовий коефіцієнт
Підберемо параметри
де
Підставивши значення
Дорівнявши нулю частинні похідні
де
звідкіля остаточно знаходимо
Аналогічно визначається вибіркове рівняння прямої лінії регресії
2.5 Знаходження параметрів вибіркового рівняння прямої лінії середньоквадратичної регресії за згрупованими даними
При великій кількості спостережень одне й те ж саме значення
Приклад такої таблиці приведено нижче (табл. 3).
Таблиця 3
| | ||||
10 | 20 | 30 | 40 | | |
0,4 | 5 | – | 7 | 14 | 26 |
0,6 | – | 2 | 6 | 4 | 12 |
0,8 | 3 | 19 | – | – | 22 |
| 8 | 21 | 13 | 18 | |
У першому рядку цієї таблиці дано перелік значень (10; 20; 30; 40) ознаки
В останньому стовпчикові записані суми частот рядків. В останньому рядку записані суми частот стовпчиків. У нижньому правому куті таблиці, поміщена сума всіх частот (загальна кількість всіх спостережень
У випадку згрупованих даних з урахуванням очевидних співвідношень
систему рівнянь (20) можна переписати у виправленому вигляді
З рішення цієї системи (
Шляхом нескладних перетворень його можна переписати у вигляді
де
– вибірковий коефіцієнт кореляції.
Вибірковий коефіцієнт кореляції. Як відомо з теорії ймовірностей, якщо величини
Вибірковий коефіцієнт кореляції
3 Поняття про криволінійну кореляцію
Раніше ми обмежилися лінійним наближенням функцій регресії, рівнянь регресії, відповідно і кореляційного зв'язку. Однак теорію можна узагальнити і на наступні наближення.
Нехай дані спостережень над кількісними ознаками
Таблиця 4
| | |||
10 | 20 | 30 | | |
15 | 4 | 28 | 6 | 38 |
25 | 6 | – | 6 | 12 |
| 10 | 28 | 12 | |
| 21 | 15 | 20 | |
До першої групи відносяться ті 10 значень
Умовні середні тепер можна назвати груповими середніми: групова середня першої групи
групова середня другої групи
для третьої групи
Оскільки всі значення ознаки
Можна показати, що, якщо між величинами
якщо ж вони пов'язані кореляційною залежністю, то
Вибіркове кореляційне відношення. Для оцінки ступені тісноти лінійного кореляційного зв'язку між ознаками у вибірці застосовується вибірковий коефіцієнт кореляції (21). У разі нелінійного кореляційного зв'язку з тою ж метою вводяться нові узагальнені характеристики:
Вони визначаються за формулами:
Размещено на Allbest.ru