Реферат Теория вероятности и математическая статистика 4
Работа добавлена на сайт bukvasha.net: 2015-10-28Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
![](https://bukvasha.net/assets/images/emoji__ok.png)
Предоплата всего
от 25%
![](https://bukvasha.net/assets/images/emoji__signature.png)
Подписываем
договор
Министерство образования Республики Беларусь
Белорусский государственный экономический университет
Бобруйский филиал
Кафедра высшей математики и информатики
Ковальчук В.М.
ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Опорный конспект
Для студентов экономических специальностей
г. Бобруйск 2004
Лекция 1
.
Предмет теории вероятностей. Случайные события и вероятности событий
Предметом теории вероятностей является анализ явлений, наблюдения над которыми не всегда приводят к одним и тем же исходам и в то же время обладающим некоторой статистической регулярностью, которая проявляется в статистической устойчивости частот исходов.
Статистическая устойчивость частот делает весьма правдоподобной гипотезу о возможности количественной оценки случайности того или иного события, появляющегося в результате эксперимента. Как правило, эксперимент предпринимается для изучения некоторых свойств интересующих нас экономического процесса или явления. При этом производится построение математической модели эксперимента, которое включает описание:
Возможных исходов;
Класса рассматриваемых событий;
Вероятностей наступления этих событий.
Современная теория вероятностей основана на аксиоматическом подходе Колмогорова, позволяющим охватить все классические разделы теории вероятностей и дать основу для развития ее новых разделов, вызванных запросами практики.
Одной из важных сфер приложения теории вероятностей является экономика, так как при исследовании и прогнозировании экономических показателей используется эконометрика, опирающаяся на теорию вероятностей. Практическое значение вероятностных методов состоит в том, что они позволяют по известным характеристикам простых случайных явлений прогнозировать характеристики более сложных явлений.
.
Случайные события. Вероятность.
Пространством элементарных событий называют множество взаимоисключающих исходов эксперимента такое, что каждый интересующий результат эксперимента может быть однозначно описан с помощью элементов этого множества. Элементы называются элементарными событиями и обозначаются .
Событием называют любое подмножество элементов из . Событие произойдет, если произойдет какое-либо из элементарных событий . Пустое множество называется невозможным событием.
Суммой двух событий и называется событие + , состоящее из элементарных событий, принадлежащих хотя бы одному из событий или .
Произведением двух событий и называется событие , состоящих из элементарных событий, принадлежащих одновременно и .
Противоположным событием событию называют событие , состоящее из элементарных событий, не принадлежащих .
Разностью двух событий и называют событие \, состоящее из элементарных событий, которые входят в событие .
События и называются несовместными , если у них нет общих элементарных событий.
Пусть F - поле событий для данного эксперимента. Вероятностью P(A) называется числовая функция, определенная на всех F и удовлетворяющая трем условиям (аксиомам вероятностей):
P(A) 0;
P()=1;
Для любой конечной или бесконечной последовательности наблюдаемых событийтаких, что
при
Существует 4 способа задания вероятности:
Классический способ задания вероятности
При данном способе пространство элементарных событий является конечным, и все элементарные события равновероятны. Тогда вероятность события определяется равенством
где
Геометрический способ задания вероятности
При данном способе пространство элементарных событий является бесконечным, но все элементарные события, входящие в это пространство, являются равновозможными.
Если отождествлять пространство элементарных событий с некоторой замкнутой областью пространства из
где
Это длина ( если рассматривается пространство
площадь (если рассматривается пространство
объем ( если рассматривается пространство
Дискретный способ задания вероятности
При данном способе пространство элементарных событий является бесконечным счетным. Числовая неотрицательная функция Р определяется таким образом, чтобы вероятность каждого элементарного события была равна некоторому числу
Статистический способ задания вероятности
При данном способе рассматривается случайный эксперимент для которого построить пространство элементарных событий невозможно. Тогда эксперимент проводится
На практике, при вычислениях вероятностей в классической схеме часто приходиться пользоваться формулами комбинаторики (соединений). Каждая из комбинаторных формул определяет общее число элементарных событий в некотором эксперименте, состоящем в выборе наудачу
а) без возращения элементов (это значит, что отбираются либо сразу все
б) с возвращением (выбор осуществляется поэлементно с обязательным возвращением отобранного элемента на каждом шаге и тщательном перемешиванием исходного множества перед следующим выбором).
В результате получаются различные постановки эксперимента по выбору наудачу
1. Перестановки. Возьмем
Символ
2. Размещения. Будем составлять из
Замечание. Перестановки можно считать частным случаем размещений (именно размещениями из
Сочетания. Изразличных элементов будем составлять множества по
элементов, имеющих различный состав. Полученная при этом комбинации элементов называются сочетаниями из
элементов по
. Общее число различных между собой сочетаний обозначается
и вычисляется по следующим формулам:
или
Лекция №2 Свойства вероятностей. Условная вероятность. Теоремы сложения и умножения вероятностей.
Пусть для некоторого случайного эксперимента построено пространство элементарных событий
Если событияобразуют полную группу событий, то вероятность объединения этих событий равна единице:
Вероятность противоположного события:
Если событиевлечет за собой событие
, то вероятность события
не превосходит вероятность события
, т.е.
Пусть
Теорема сложения:
Пусть событие
Теорема умножения :
Вероятность произведения событий
2.2. Формула полной вероятности. Формула Бейеса ( теорема гипотез)
Пусть случайный эксперимент можно описать событиями
Теорема: Вероятность любого события
вероятность события
Пусть случайный эксперимент можно описать попарно несовместными событиями
Теорема: Пусть событие
Которые описывают случайный эксперимент. Если в результате реализации
эксперимента произошло событие
следующим формулам :
Лекция №3 -5 Случайные величины. Функции распределения случайных величин
3.1. Дискретные случайные величины
Случайная величина , обозначаемая
конечное либо счетное множество значений, т.е. множество
Законом распределения дискретной случайной величины называется совокупность пар
чисел
которыми она принимает эти значения, причем
Зная закон распределения случайной величины, можно вычислить функцию распределения:
где суммирование распространяется на все значения индекса
Математическим ожиданием
Модой дискретной случайной величины, обозначаемой
Медианой случайной величины
Дисперсией случайной величины называется математическое ожидание квадрата ее отклонения:
Дисперсия дискретной случайной величины вычисляется по формуле:
Средним квадратическим отклонением (стандартом) случайной величины
Начальным моментом порядка
Для дискретной случайной величины
Центральным моментом порядка
Для дискретной случайной величины
Биноминальным называют закон распределения дискретной случайной величины
Наивероятнейшее число
Если число испытаний велико, а вероятность появления события
где
Математическое ожидание и дисперсия случайной величины, распределенной по закону Пуассона:
Геометрическое распределение возникает в том случае, когда производится серия испытаний до первого появившегося события
| 1 | 2 | 3 | … | | … |
| | | | … | | … |
Вероятность появления события
Математическое ожидание и дисперсия случайной величины, распределенной по геометрическому закону, соответственно равны:
Гипергеометрический закон распределения используется при проверке качества продукции. Проверяется
где
Закон распределения дискретной случайной величины
Если
| 0 | 1 | 2 | … | |
| | | | | |
Если
| 0 | 1 | ….. | |
| | | | |
Функция гипергеометрического распределения имеет вид
Гипергеометрический закон стремится к биноминальному закону распределению, если
3.2. Непрерывные случайны величины.
Случайная величина
интегрируемая по Риману функция
что при всех
случайной величины
Плотностью распределения вероятностей
называют предел, если он существует, отношения вероятности попадания случайной величины
Х на отрезок
последний стремится к 0, т.е.
Свойства плотности распределения вероятностей:
Функция распределения случайной величины
переменной
меньше некоторого фиксированного числа
Математическое ожидание и дисперсия случайной величины :
Модой непрерывной случайной величины
определяемое точка максимума плотности распределения вероятностей
Медианой непрерывной случайной величины
Удовлетворяющее условию
Начальный момент
Центральный момент
Коэффициент асимметрии или «скошенности» распределения
Коэффициент эксцесса или островершинности распределения
Случайная величина
случайной величины
нормированной (стандартизованной) случайной величиной.
3.3. Законы распределения непрерывной случайной величины
Равномерное распределение: Пусть плотность вероятности равна нулю всюду, кроме отрезка
Функция равномерного распределения задается формулой:
Математическое ожидание, дисперсия и среднее квадратическое отклонение соответственно равны:
Показательное распределение. Показательным (экспоненциальным) называют распределение вероятностей непрерывной случайной величины
, которое описывается функцией плотности вероятности:
где
Функция распределения случайной величины, распределенной по показательному закону, имеет вид:
Математическое ожидание
Лекция №6. Нормальное распределение.
Распределение с непрерывной случайной величины называется нормальным, если плотность распределения ее описывается формулой:
где
Функция распределения случайной величины Х, распределенной по нормальному закону:
Полученный интеграл нельзя выразить через элементарные функции, но его можно вычислить через специальную функцию:
называемую нормальной функцией распределения (функцией Лапласа). Эта функция неубывающая, непрерывная слева и
Центральные моменты случайной величины с нормальным законом распределения вычисляются через следующие рекуррентные соотношения:
поскольку
Коэффициенты ассиметрии и эксцесса для нормального закона распределения равны нулю:
так как они характеризуют скошенность и крутизну исследуемового закона распределения по сравнению с нормальным.
Вероятность попадания случайной величины
или
Вероятность заданного отклонения вычисляется по формуле:
Интервалом практически возможных значений случайной величины
Лекция 7-8. Предельные теоремы и законы больших чисел
Все законы вероятности получены из практики, то есть из наблюдений за массовыми случайными явлениями. Массовые случайные явления проявляются в статистической совокупности.
Было замечено, что при определенных условиях массовые случайные явления порождают величину неслучайную, которая подчиняется вполне определенным закономерностям. Все полученные соответствующие теоремы и образуют теоремы закона больших чисел, в которых приведены условия, когда среднее значение случайных величин стремится к величине не случайной. Таким образом, закон больших чисел – это совокупность теорем, в которых приведены условия, при которых последовательность случайных величин подчиняется определенным закономерностям, то есть стремится к величине неслучайной.
Неравенство Чебышева:
Теорема: Вероятность того, что случайная величина
ожидания на величину не меньше
положительное действительное число:
Теорема Чебышева (закон больших чисел).
Теорема: Если
конечное математические ожидания и ограниченные дисперсии
средние арифметические наблюденных значений случайных величин сходиться по
вероятности к среднему арифметическому их математических ожиданий:
Закон больших чисел справедлив и для зависимых случайных величин, то есть справедлива
теорема Маркова:
Теорема: : Если для случайных величин
сходится по вероятности к среднему арифметическому их математических ожиданий:
Теоремы Бернулли : Если производится
события в
события в каждом испытании:
Теорема Пуассона: Пусть производится
увеличении числа испытаний относительная частота появления события
сходится по вероятности к среднему арифметическому вероятности
появления события в различных испытаниях:
Теорема Лендеберга-Леви: Пусть
величины с математическим ожиданием
распределения нормируемой случайной величины
закону распределения с плотностью распределения вероятностей равной
Это центральная предельная теорема для одинаково распределенных случайных независимых величин.
Теорема Ляпунова: Если
математические ожидания
моменты третьего порядка, удовлетворяющие условиям:
то закон распределения величины
распределения с плотностью распределения вероятности
Эта теорема имеет большое практическое значение, так как, используя ее, можно вычислить вероятность того, что сумма независимых случайных величин принимает значение, принадлежащее интервалу. Условие
Рассмотрим дискретную случайную величину
Если случайная величина
Теорема Мавра -Лапласа (локальная): Пусть производится
некоторое событие
Локальная теорема используется при больших значениях
Теорема Муавра- Лапласа (интегральная): Пусть производится
в каждом из которых событие может появиться с вероятностью
справедливо соотношение:
Из предельного равенства теоремы следует формула:
Отсюда вытекают следующие соотношения:
В отличии от теорем Бернулли и Пуассона последние две формулы более точную оценку
вероятности отклонений частоты появления событий от его математического ожидания и
частости события от вероятности появления события в каждом испытании.
Двумерные случайные величины.
Совокупность случайных величин
величину
случайных величин
Функция распределения системы двух случайных величин
функция переменных
Используя функцию распределения, можно найти вероятность попадания случайной точки в
бесконечную полуполосу
Дискретной называют двухмерную величину, составляющие которой дискретны.
Законом распределения двумерной дискретной случайной величины называется множество
всевозможных значений
соответствующих им вероятностей
Непрерывной называют двумерную величину, составляющие которой непрерывны.
Функция
величины
когда обе стороны прямоугольника стремятся к нулю, называется плотностью распределения
вероятностей:
Зная плотность распределения, можно найти функцию распределения по формуле:
Вероятность попадания случайной точки
Вероятность того, что случайная величина
случайная величина
Начальным моментом порядка
ожидание произведений
случайные величины, то
Если
Центральным моментом порядка
ожидание произведений
Если составляющие величины являются дискретными, то
Если составляющие величины являются непрерывными, то
Условным математическим ожиданием
выражение вида:
Корреляционным моментом независимых случайных величин
двумерную случайную величину
отклонений этих величин:
Корреляционный момент двух независимых случайных величин
двумерную случайную величину
Коэффициентом корреляции
двумерную случайную величину
произведению средних квадратических отклонений этих величин:
Коэффициент корреляции удовлетворяет условию
зависимости между
некоррелированными.
Уравнения
Лекция №9.Случайные функции. Цепи Марков. Пуассоновский поток событий
Пусть
Если
Значение случайной функции
X
0 t 0 t t
Реализация Семейство реализаций
При зафиксированном значении аргумента t случайная функция X(t) превращается в случайную величину- сечение случайной функции или процесса. Тогда X(t) в данный момент времени t определяется плотностью распределения f(x ; t). Однако одномерные законы распределения и их числовые характеристики, вычисленные для одного момента времени ( для одного сечения семейства реализаций) не могут оценивать характер изменения процесса во времени. Для этой цели используют характеристики связи между ординатами, взятыми в различные моменты времени. Наиболее полно эти связи характеризуются многомерной плотностью распределения
Математическим ожиданием случайной функцией
и является средней траекторией для всех возможных реализаций.
Дисперсией случайной функции
и характеризующей возможный разброс реализаций случайной функции относительно средней траектории.
Корреляционной функцией случайной функции
Корреляционная функция характеризует степень зависимости между сечениями случайной функции, относящихся к различным
Корреляционная функция является симметричной функцией своих аргументов, а ее ординаты по абсолютному значению не могут быть больше произведений среднеквадратичных отклонений в моменты времени
Процесс считается стационарным, если его многомерная плотность распределения не изменяется при сдвиге соответствующих моментов времени на любую величину. В рамках корреляционной теории , процесс считается стационарным, если его ковариационная функция
Корреляционная функция стационарного процесса по модулю не превосходит дисперсию:
Стационарный процесс у которого корреляционная функция стремится к нулю
Марковскими случайными процессами называют такие процесса, у которых плотность совместного распределения произвольных двух сечений полностью определяют характер процессов, т.е. дальнейшее поведение процесса зависит только от значений, принятых процессом в настоящий момент времени , и не зависит от ранее принятых.
Марковский случайный процесс, в котором сама функция принимает счетное множество возможных состояний (дискретные состояния)
Вероятность того, что дискретная цепь Маркова в момент времени
Дискретные цепи Маркова однозначно определяются либо матрицей переходов
или графом состояний
Р12 Р23 Р34
Вектором вероятностей (безусловной вероятностью) состояния цепи Маркова называют вероятности
где -
Вектор вероятностей состояния однородной цепи Маркова после
Если в цепи Маркова
Учитывая, что
Для непрерывных цепей Маркова возможности перехода из состояния
Если
Для непрерывных цепей Маркова вектор вероятностей состояния есть функция времени и определяется путем решения системы дифференциальных уравнений, которые составляются по графу состояния цепи Маркова по следующим правилам :
в левой части каждого уравнения стоят производные по времени вероятностей состояния цепи;
правая часть этих уравнений содержит столько членов, сколько переходов (стрелок на графе) связанно с данным состоянием;
каждый член правой части уравнений равен произведению плотности вероятностей перехода , соответствующей данной стрелки графа состояния, умноженной на вероятность того состояния из которого исходит стрелка;
каждый член правой части уравнений имеет знак «минус», если стрелка графа состояния входит в данное состояния и знак «плюс», если стрелка выходит из данного состояния.
Например: Имеем граф состояния однородной непрерывной цепи ркова:
X1
Для этого графа составляем систему уравнений по вышеуказанным правилам:
Учитывая, что
В случае, когда нас интересую вероятности состояния непрерывных цепей Маркова по истечению длительного промежутка времени (установившейся процесс
Переход из состояния в состояние в непрерывных цепях Маркова происходит вод воздействием потока событий.
Потоком событий называется последовательность однородных событий, следующих одно за другим в какие-то случайные моменты времени.
Поток событий называю простейшим или стационарным Пуассоновским, если он стационарен, ординарен и без последействия.
Поток называется стационарным, если вероятность попадания события на участок временизависит только от длины этого участка и не зависит от места расположения этого участка на оси времени.
Поток называют потоком без последействия, если для любых непересекающихся участков времени число событий, попадающих на один из них, не зависит от числа событий на другом участке.
Поток событий называют ординарным, если вероятность попадания на элементарный участок двух и более событий пренебрежительно мала по сравнению с вероятностью попадания на этот участок одного события.
Плотностью вероятностей перехода
В Пуассоновском потоке событий число событий, попадающих на любой участок времени
Промежутки времени
с математическим ожиданием
Лекция №10. Предмет математической статистики. Генеральная и выборочная совокупности. Вариационные ряды и их характеристики
Математическая статистика – раздел высшей математики, изучающий методы сбора, систематизации и обработки результатов случайных массовых явлений с целью выявления существующих закономерностей.
Вся подлежащая изучению совокупность объектов наблюдений называют генеральной совокупностью. Иными словами, совокупность всех возможных, всех мыслимых, значений исследуемой случайной величины. Понятие генеральной совокупности аналогично понятию случайной величины (закону распределения, вероятностному пространству).
Та часть объектов, которая отобрана для непосредственного изучения из генеральной совокупности, называется выборочной совокупностью или выборкой. Число объектов в генеральной или в выборочной совокупности называют их объемом
Основная форма представления выборочной совокупности – вариационные ряды. Вариационный ряд – это ранжированные в порядке возрастания или убывания ряд вариантов с соответствующими им весами (частотами и частостями). Различные значения признака (случайной величины
Частости и частоты еще называют весами.
Кроме частости и частоты используют понятие накопленной частости и частоты, которые обозначают
Если варианты не отличаются друг от друга меньше определенного значения- то такой ряд называют дискретным.
Если варианты отличаются друг от друга на сколь угодно малую величину, то такой ряд называют непрерывным.
Для построения непрерывного вариационного ряда рекомендуемое число интервалов
где
Графически вариационные ряды изображают в виде полигона и гистограммы.
Полигон существуют для дискретного вариационного ряда в виде зависимости
Зависимость между
Вариационные ряды характеризуются показателями средних значений и вариации. К средним значениям относят:
- средняя арифметическая
где
- средней степенной
При
при
при
при
Перечисленные средние относят к аналитическим. Кроме них в статистическом анализе применяют структурные или порядковые средние. К ним относят медиану и моду.
Медианой вариационного ряда называется значение признака, приходящееся на середину ранжированного ряда наблюдений.
Для дискретного вариационного ряда с нечетным числом членов медиана равна серединному варианту, а для ряда с четным числом членов – полусумме двух серединных вариантов. Приближенно медиану можно найти с помощью кумуляты как значение признака, для которого
Модой вариационного ряда называют вариант, которому соответствует наибольшая частота.
К показателям вариации вариационных рядов относят:
- вариационный размах
- выборочная (эмпирическая) дисперсия
- среднее квадратическое отклонение
-
коэффициент вариации
Лекция 11. Связь между генеральной и выборочной совокупностью.
Понятие генеральной совокупности в определенном смысле аналогично понятию случайной величины (закону распределения, вероятностному пространству). Выборку можно рассматривать, как некий эмпирический аналог генеральной совокупности.
Средние арифметические распределения признака в генеральной и выборочной совокупностях называются соответственно генеральной и выборочной средними.
Дисперсии этих распределений называют генеральной и выборочной дисперсиями.
Отношение числа элементов
В случае бесконечной генеральной совокупности (
Сущность выборочного метода состоит в том, чтобы по некоторой части генеральной совокупности (по выборке) выносить суждение о свойствах генеральной совокупности в целом.
Чтобы по данным выборки можно было достоверно судить о генеральной совокупности, выборочная совокупность должна быть отобрана случайно (т.е. по схеме случая или «урн»). При случайном отборе используют два способа образования выборки:
Повторный отбор, когда каждый элемент, отобранный и обследованный, возвращается в общую совокупность и может быть повторно отобран;
Бесповторный отбор, когда отобранный элемент не возвращается в общую совокупность.
Оценкой
В качестве оценок параметров генеральной совокупности желательно использовать оценки, удовлетворяющие одновременно требованиям несмещенности, состоятельности и эффективности.
Оценка
Требование несмещенности гарантирует отсутствие систематических ошибок при оценивании.
Оценка
Оценка
Оценки
Согласно методу моментов, определенное количество выборочных моментов (начальных
Основы метода наибольшего правдоподобия составляют функции правдоподобия, выражающая плотность вероятности совместного появления результатов выборки
Согласно метода наибольшего правдоподобия в качестве оценки неизвестного параметра
Метод наименьших квадратов предусматривает определение оценки из условий минимизации квадратов отклонений выборочных данных
Точечная и интервальная оценка.
Оценка неизвестного параметра
Выборочная доля
а для бесповторной:
Выборочная средняя
а для бесповторной:
Выборочная дисперсия
Не смещенной и состоятельной оценкой генеральной дисперсии
Интервальной оценкой параметра
Наиболее часто доверительный интервал выбирают симметричным относительно параметра
где
При заданной доверительной вероятности
где
Интервальные оценки (доверительные интервалы) для генеральной средней и генеральной доли равны:
где
Для повторного отбора:
Для бесповторного отбора:
Предельные ошибки и необходимый объем выборки (Повторный и бесповторный отбор)
Для определения необходимого объема выборки
и для бесповторного отбора:
Необходимый объем выборки для оценки генеральной доли
И для бесповторного отбора:
Лекция №12. Проверка статистических гипотез.
Статистической гипотезой называется любое предположение о виде или параметрах генеральной совокупности, проверяемое по выборке.
Различают простую и сложную статистические гипотезы. Простая гипотеза, в отличие от сложной, полностью определяет теоретическую функцию распределения наблюдаемой случайной величины.
Проверяемую гипотезу обычно называют нулевой
Правило, по которому принимается или отвергается
Суть проверки статистической гипотезы заключается в том, что используется специальная составленная выборочная характеристика (критерий)
Область допустимых значений(область принятия гипотезы
, когда
);
Критическая область(область отбрасывания гипотезы
, когда
).
При таком подходе возможны четыре случая (см. табл.):
Гипотеза | Принимается | Отвергается |
Верна | Правильное решение | Ошибка 1-го рода |
Неверна | Ошибка 2-го рода | Правильное решение |
Таким образом, вероятность
Вероятность допустить ошибку 2-ого рода обозначают
При фиксированном объеме выборке невозможно одновременное уменьшение ошибок 1-ого и 2-ого рода. Критическая область
Правосторонняя, выбирается из соотношения:;
Левосторонняя:;
Двухсторонняя:.
Критерии проверки гипотез называю параметрическими, если известен закон распределения генеральной совокупности, что задает определенное распределение критерия. При неизвестном законе распределения генеральной совокупности, то критерии называют непараметрическими.
По своему прикладному содержанию. Статистические гипотезы подразделяются на несколько основных типов:
О равенстве числовых характеристики генеральных совокупностей;
О числовых значениях параметров;
О законе распределения;
Об однородности выборок (т.е. о принадлежности их одной и той же генеральной совокупности).
Проверка гипотез о равенстве средних значений при известной и неизвестной дисперсии.
Имеются две генеральные совокупности
Поскольку
При выполнении гипотезы
Если фактически наблюдаемое значение критерия
Если
При неизвестных генеральных дисперсиях
Однако лучшей оценкой дисперсии разности независимых выборочных средних
В этом случае критерий вычисляем по выражению:
Доказано, что в случае критерий
При этом сохраняется тоже правило принятия гипотезы: гипотеза
В случае невозможности наложения допущения о равенстве генеральных дисперсий задача не имеет точного решения (пока) – это проблема Беренса-Фишера.
Рассмотренные критерии можно применять для исключения грубых ошибок при проведении наблюдений.
Например, если в ряде наблюдений
где
Проверка гипотезы о равенстве дисперсий двух нормальных генеральных совокупностей.
Проверка гипотезы
Доказано, что при справедливости гипотезы
Поэтому, выбрав необходимый уровень значимости
Если
Лекция№13.Проверка статистических гипотез о законе распределения генеральной совокупности
Проверку гипотезы
Существует несколько критериев согласия:
Критерий согласия
В наиболее часто используемом на практике критерии
где
Доказано, что при справедливости гипотезы
Методика применения критерия
1. Разбиваем всю область наблюдаемых выборочных значений
Умножив полученные вероятности на объем выборки
2.Для выбранного уровня значимости
3. Если фактически наблюдаемое значение
Следует отметить, что критерий
Критерий согласия Колмогорова
Критерий Колмогорова применяется в тех случаях, когда заранее известен не только вид распределения, но и числовые характеристики распределения. В этом критерии в качестве меры расхождения между теоретическими и эмпирическими распределениями рассматривают максимальное значение абсолютной величины разности между эмпирической функцией распределения
называемое статистикой критерия Колмогорова.
Доказано, что какова бы ни была функция распределения
Задавая уровень значимости
Методика применения критерия Колмогорова следующая:
Строятся эмпирическая функция распределенияи предполагаемая теоретическая функция распределения
.
Определяется мера расхождения между теоретическим и эмпирическим распределениеми вычисляется величина :
При заданном уровне значимости, сравнивается вычисленное значение
с критическим
. Если
, то гипотеза
отвергается. Если
, то считают, что гипотеза
не противоречит опытным данным.
Следует отметить, что на практике часто не известны параметры законов распределения генеральных совокупностей. Использование в этом случае критерий Колмогорова, заменяя неизвестные характеристики оценками, дает завышенное значение вероятности
Если гипотеза не удовлетворяет условиям критерия Колмогорова, то ее можно отбросить;
Если же гипотеза по критерию Колмогорова не противоречит опытным данным, то необходима дополнительная проверка другими критериями, например,- Пирсона.
Лекция №14. Основные понятия дисперсионного анализа
Дисперсионный анализ – статистический метод оценки влияния различных факторов на результаты эксперимента. Суть анализа заключается в разложении общей вариации случайной величины на независимые слагаемые, каждое из которых характеризует влияние того или иного фактора или их взаимодействие. Факторами обычно называют внешние условия, влияющие на эксперимент.
По числу факторов, влияние которых исследуется, различают:
Однофакторный дисперсионный анализ;
Двухфакторный дисперсионный анализ;
Многофакторный дисперсионный анализ.
Для проведения дисперсионного анализа необходимо соблюдение следующих условий: результаты наблюдений должны быть независимыми случайными величинами с нормальным законом распределения с одинаковой дисперсией.
Однофакторный дисперсионный анализ
Однофакторная дисперсионная модель имеет вид:
Где
Под уровнем фактора понимается некоторая его мера или состояние, например номер партии детали, количество вносимых удобрений и т.п.
Проверим существенность влияния № партий изделий на их качество. Пусть имеется
Если полагать, что элементы строк матрицы наблюдений – это численные значения (реализации) случайных величин
Предположим, что для каждой
называемая группой средней для
Очевидно, что оценкой
Оценкой общего среднего
Рассмотрим сумму квадратов отклонений
Или
где
В разложении общей суммы квадратов отклонений
где
Доказано, что, если влияние всех уровней фактора
При правильности нулевой гипотезы
Если
При
Кроме того, по величине отношения
Для упрощения расчетов сумм квадратов
Понятие о двухфакторном дисперсионном анализе
Двухфакторная дисперсионная модель имеет вид:
где
Например, в условиях предыдущей задачи о качестве различных
- партия изделия;
- станок.
Все имеющиеся данные представим в виде таблицы, в которой по строкам – уровни
| |
| |
Групповые средние находятся по формулам:
В ячейке –
По строке –
По столбцу –
Выявление связи между случайными переменными и оценка ее тесноты;
Установление формы и изучение зависимости между случайными переменными.
Коэффициент корреляции лежит в пределах:;
Если все значения переменных увеличить (уменьшить) на одно и то же число или в одно и то же число раз, по величина коэффициента корреляции не изменится.
Прикорреляционная связь представляет линейную функциональную зависимость.
Прикорреляционная линейная связь отсутствует.
Полиноминальная;
Гиперболическая;
Степенноеи т.п.
Мацкевич И.П., Свирид Г.П. Высшая математика. Теория вероятностей и математическая статистика. - Мн.: Высшая школа, 1993.
Лихолетов И.И., Мацкевич И.П. Руководство к решению задач по высшей математики с основами математической статистики и теории вероятностей. - Мн.: Высшая школа, 1976.
Булдык Г.М. Теория вероятностей и математическая статистика. - Мн.: Высшая школа, 1989.
Венцель Е.С. Теория вероятностей. - М.: Наука, 1969.
Кремер Н.Ш. Теория вероятностей и математическая статистика. - М.: ЮНИТИ-ДАНА,2000.-543 с.
Свирид Г.П.,Черторицкий Ю.Н.,Шевченко Л.И. Теория вероятностей и математическая статистика. Контрольные задания и методические рекомендации к ним для студентов экономических специальностей.-Мн.: БГЭУ,1998.
Булдык Г.М., Ковальчук В.М. Теория вероятностей и математическая статистика. Практикум. Часть 1.- Мн.: БГЭУ, 1999.-54 с.
Гороховик С.Я. Рыбалтовский И.В. Система случайных величин. Индивидуальные задания по теории вероятностей для студентов всех специальностей. – Мн.:БГЭУ,2000. – 18с.
Общая средняя:
Далее рассчитываются
Для оценки влияния факторов
и сравнивают эти значения с соответствующим критическим значением, определяемым, при заданном уровне значимости
Автоматизированный дисперсионный анализ возможен с помощью табличного процессора Excel.Для этого в опции Сервис находим пакет анализа данных (см. рис.)
- Лекция№15. Корреляционно – регрессионный анализ
В естественных науках различают функциональную и статистическую зависимости. Под функциональной понимают такую зависимость, когда значению одной переменной соответствует вполне определенное значение другой переменной. Под статистической (вероятностной или стохастической) понимают такую зависимость, когда одна переменная влияет на закон распределения другой. Наибольший интерес для практики представляют вероятностные зависимости в виде закономерностей изменения средних значений (условного математического ожидания) одной случайной величины при условии, что другая принимает определенные значения. Такие вероятностные зависимости получили название корреляционных. Корреляционной зависимостью между двумя переменными величинами называется функциональная зависимость между значениями одной из них и условным математическим ожиданием другой.
Простейшая корреляционная зависимость может быть представлена в виде уравнения регрессии:
Для отыскания такого уравнения регрессии, строго говоря, необходимо знать закон распределения двумерной случайной величины
где
Величина
Из свойства коэффициента корреляции следует, что
В практике статистических исследований нам не известны законы распределения генеральных совокупностей, располагаем лишь выборкой пар значений
Основной метод нахождения неизвестных параметров уравнений регрессии в статистических исследованиях является метод наименьших квадратов. Суть этого метода в том, что неизвестные параметры уравнений регрессии выбираются таким образом, чтобы сумма квадратов отклонений эмпирических групповых средних
где
где
Линейная корреляционная зависимость и прямые регрессии
Линейную корреляционную зависимость между переменными
неизвестные параметры которых находим методом наименьших квадратов.
Например, для
на основании необходимого условия экстремума функции двух переменных
После преобразований получаем систему нормальных уравнений для определения параметров линейной регрессии:
где соответствующие средние определяются по формулам:
Подставляя значения
где коэффициент
Решая систему нормальных уравнений, найдем
где
Уравнение регрессии
Рассуждая аналогично находят уравнение регрессии
Сравнение уравнения регрессии, полученные методом наименьших квадратов, с уравнением регрессии двумерной случайной величины с нормальным законом распределения показывает их идентичность. Поэтому для оценки линейного уравнения регрессии генеральных совокупностей
Необходимо заменить параметры
Свойства выборочного (статистического) коэффициента корреляции
Для оценки тесноты связи между переменными
Если данные не сгруппированы в виде корреляционной таблицы и представляют
Между коэффициентом корреляции
Основные свойства коэффициента корреляции (при достаточно большом объеме выборке
При оценке тесноты связи между переменными
Имеет
Понятие о нелинейной регрессии, индекс корреляции и коэффициент детерминации
В экономических приложениях часто возникает необходимость выражать корреляционную зависимость в виде нелинейных уравнений регрессии, поскольку линейные зависимости приводят к большим ошибкам. Выбор вида нелинейной регрессии называется спецификацией или этапом параметризации модели и осуществляется методами визуального оценивания точек корреляционного поля, анализа сути наблюдаемых экономических процессов и т.п. Наиболее часто в экономических исследованиях используют следующие виды нелинейной регрессии:
Для определения неизвестных параметров выбранного уравнения регрессии используется метод наименьших квадратов.
При нелинейной регрессии для оценки тесноты связи между переменными используют не коэффициент корреляции
Индекс корреляции
где
Коэффициент детерминации, равный квадрату индекса корреляции, показывает долю общей вариации зависимой переменной, обусловленной регрессией или изменчивостью объясняющей переменной:
Чем ближе
При парной линейной регрессии индекс корреляции
Табличный процессор Excel так же позволяет проводит автоматизированный корреляционно- регрессионный анализ. Для этого в опции Сервис находим пакет анализа данных (см. рис.)
Литература