Реферат Ошибки выборочного отбора
Работа добавлена на сайт bukvasha.net: 2015-10-28Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
от 25%
договор
1.3. Ошибки выборочного отбора
Разность между показателями выборочной и генеральной совокупности называется ошибкой выборки. Ошибки выборки подразделяются на ошибки регистрации и ошибки репрезентативности.
Ошибки регистрации возникают из-за неправильных или неточных сведений. Источниками таких ошибок могут быть непонимание существа вопроса, невнимательность регистратора, пропуск или повторный счет некоторых единиц совокупности, описки при заполнении формуляров и т.д.
Среди ошибок регистрации выделяются систематические, обусловленные причинами, действующими в каком-то одном направлении и искажающими результаты работы (например, округление цифр, тяготение к полным пятеркам, десяткам и т.д.), и случайные,проявляющиеся в различных направлениях, уравновешивающие друг друга и лишь изредка дающие заметный суммарный итог.
Расхождение между значениями изучаемого признака выборочной и генеральных совокупностей является ошибкой репрезентативности (представи-тельности). Она может быть случайной и систематической. Случайная возникает в силу того, что выборочное статистическое наблюдение является несплошным наблюдением, и выборка недостаточно точно воспроизводит (репрезентирует) генеральную совокупность.
Систематические ошибка репрезентативности возникают из-за неправильного, тенденциозного отбора единиц, при котором нарушается основной принцип научно организованной выборки - принцип случайности.
При определении величины репрезентативной ошибки предполагается, что ошибка регистрации равна нулю. Определение ошибки производится по формулам ошибки выборочной доли и ошибки выборочной средней. Систематическая ошибка репрезентативности возникает вследствие нарушения правил отбора единиц генеральной совокупности, в частности принципа беспристрастного, непреднамеренного отбора. Систематическая ошибка может привести к полной непригодности результатов наблюдений.
Рассмотрим на примере, насколько отличаются выборочные и генеральные показатели по данным об успеваемости студентов (две 10%-е выборки):
Оценка | Число студентов, чел | ||
| Генеральная совокупность | Первая выборка | Вторая выборка |
2 3 4 5 | 100 300 520 80 | 9 27 54 10 | 12 29 52 7 |
Итого | 1000 | 100 | 100 |
Средний балл для генеральной совокупности
по первой выборке
по второй выборке
Доля студентов, получивших оценки "4" и "5":
по генеральной совокупности
по первой выборке
по второй выборке
Разность между показателями выборочной и генеральной совокупности является случайной ошибкой репрезентативности (ошибкой выборки).
Ошибки репрезентативности:
Как видно из расчетов, выборочная средняя и выборочная доля являются случайными величинами, которые могут принимать различные значения в зависимости от того, какие единицы совокупности попали в выборку.
1.3.1. Ошибка выборочной средней
Ошибка выборочной средней представляет собой расхождение (разность) между выборочной средней и генеральной средней , возникающее вследствие несплошного выборочного характера наблюдения. Величина ошибки выборочной средней определяется как предел отклонения от , гарантируемый с заданной вероятностью:
где – гарантийный коэффициент, зависящий от вероятности , с которой гарантируется невыход разности за пределы ; – средняя ошибка выборочной средней.
Значения гарантийного коэффициента и соответствующие им вероятности приведены в табл.4.1. Обычно вероятность принимается равной 0,9545 или 0,9973, а при этом равно соответственно 2 и 3.
Таблица 4.1
Значения гарантийного коэффициента
| | | | | |
1,00 1,10 1,20 1,30 1,40 1,50 1,60 | 0,6827 0,7287 0,7699 0,8064 0,8385 0,8664 0,8904 | 1,70 1,80 1,90 2,00 2,10 2,20 2,30 | 0,9109 0,9281 0,9426 0,9545 0,9643 0,9722 0,9786 | 2,40 2,50 2,60 2,70 2,80 2,90 3,00 | 0,9836 0,9876 0,9907 0,9931 0,9949 0,9963 0,9973 |
Н.В.Смирнов, И.В.Дунин-Барковский. Курс теории вероятностей и математической статистики для технических приложений. - М.: Наука, 1965. 512 с.
Стр.173
Средняя ошибка определяется как среднее квадратическое отклонение средней величины в генеральной совокупности (средней генеральной)
В математической статистике доказывается, что величина средней квадратической стандартной ошибки простой случайной повторной выборки может быть определена по формуле
где - дисперсия признака в генеральной совокупности.
Дисперсия суммы независимых величин равна сумме дисперсий слагаемых
Если все величины
Xi
имеют одинаковую дисперсию, то
Тогда дисперсия средней
Тогда средняя ошибка при определении средней
Между дисперсиями в генеральной и выборочной совокупностях существует следующее соотношение:
где – дисперсия признака в выборке.
Если n достаточно велико, то близко к единице и дисперсию в генеральной совокупности можно заменить на дисперсию в выборке.
Тогда средняя ошибка средней в генеральной совокупности может быть как среднее квадратическое отклонение средней величины в выборочной совокупности (средней выборочной)
Средняя ошибка выборочной средней
Значения средней ошибки выборки определяются по формуле
где – дисперсия в генеральной совокупности.
Между дисперсиями в генеральной и выборочной совокупностях существует следующее соотношение:
где – дисперсия в выборке.
Если n достаточно велико, то близко к единице и дисперсию в генеральной совокупности можно заменить на дисперсию в выборке.
При повторном отборе средняя ошибка определяется следующим образом:
где – средняя величина дисперсии количественного признака , которая рассчитывается по формуле средней арифметической невзвешенной
или средней арифметической взвешенной
где fi – статистический вес.
Формулы расчета средней ошибки выборочной средней для различных, наиболее часто используемых способов отбора выборочной совокупности приведены в табл.4.2.
Таблица 4.2
Формулы расчета средних ошибок выборочной доли
и выборочной средней
Метод отбора выборки | Средняя ошибка | |
| выборочной доли | выборочной средней |
Механический или собственно–случайный повторный отбор | | |
Механический или собственно–случайный бесповторный отбор | | |
Серийный отбор при повторном отборе равновеликих серий | | |
Серийный отбор при бесповторном отборе равновеликих серий | | |
Типический отбор при повторном случайном отборе внутри групп, пропорциональном объему групп | | |
Типический отбор при бесповторном случайном отборе внутри групп, пропорциональном объему групп | | |
где N – численность генеральной совокупности;
– межсерийная дисперсия выборочной доли;
r – число отобранных серий;
R – число серий в генеральной совокупности;
– средняя из групповых дисперсий выборочной доли;
– дисперсия признака x в выборке;
– межсерийная дисперсия выборочных средних;
– средняя из групповых дисперсий выборочной средней.
При бесповторном оборе с каждой отобранной единицей или серией вероятность отбора оставшихся единиц или серий повышается, при этом средняя ошибка выборочной средней уменьшается по сравнению с повторным отбором и имеет следующий вид:
для механического или собственно случайного бесповторного отбора
При достаточно большом объеме совокупности
N можно воспользоваться формулой
для серийного бесповторного отбора равновеликих серий
При достаточно большом числе серий в генеральной совокупности
R можно воспользоваться формулой
для типического отбора с бесповторным случайном отборе внутри групп, пропорциональном объему групп
.
Межсерийная дисперсия выборочных средних и средняя из выборочных дисперсий типических групп вычисляются следующим образом:
где – среднее значение показателя в
j – й серии;
– дисперсия признака x в
j – й типической группе;
n
j
– число единиц в
j –й типической группе.
И.Г.Венецкий, В.И.Венецкая. Основные математико-статистические понятия и формулы в экономическом анализе. - М.: Статистика, 1974. 279 с.
Средние ошибки выборки при типическом методе отбора, пропорциональном объему групп и колеблемости признака в группе приведены в табл.3
Таблица 3
Формулы расчета средних ошибок выборочной средней
и выборочной доли при типическом методе отбора
Метод отбора выборки | Средняя ошибка | |
| выборочной доли | выборочной средней |
повторный случайный отбор внутри групп, непропорциональный объему групп | | |
бесповторный случайный отбор внутри групп, непропорциональный объему групп | | |
повторный случайный отбор внутри групп, пропорциональный колеблемости признака в группах | | |
бесповторный случайный отбор внутри групп, пропорциональный колеблемости признака в группах | | |
где N
j – число единиц в
j –й типической группе;
n
j
– число отобранных единиц в
j –й типической группе;
– выборочная дисперсия признака x в
j – й типической группе
(дисперсия признака в выборке из j – й типической группы);
– выборочная дисперсия доли в
j – й типической группе
(дисперсия доли в выборке из j – й типической группы);
– среднее квадратическое отклонение признака x в выборке из
j – й типической группе;
Средние ошибки выборки при комбинированной выборке с равновеликими сериями приведены в табл.4
Таблица 4
Формулы расчета средних ошибок выборки при комбинированной
выборке с равновеликими сериями
Метод отбора выборки | Средняя ошибка | |
| выборочной доли | выборочной средней |
повтор-ный отбор серий | | |
бесповторный отбор серий | | |
где - общее число единиц в отобранных сериях ( );
n - выбранное число единиц, подвергающихся обследованию, из отобранных
серий.
При многоступенчатом отборе на каждой ступени отбора может быть найдена своя средняя ошибка. При отборе, например, крупных групп из генеральной совокупности средняя ошибка выборки - ; при отборе мелких групп из крупных средняя ошибка выборки - ; при отборе отдельных единиц совокупности из мелких групп средняя ошибка выборки - . Если численность групп одинаковая, то средняя ошибка, как для средней, так и для доли, трехступенчатого отбора может быть определена по формуле
Предельная ошибка выражается следующим образом:
и зависит от вариации изучаемого признака в генеральной совокупности, объема и доли выборки, способа отбора единиц из генеральной совокупности и от величины вероятности, с которой гарантируются результаты выборочного наблюдения.
Средняя величина количественного признака в генеральной совокупности определяется с у четом предельной ошибки выборочной средней
Иногда для определения размеров предельной ошибки величина определяется из эмпирической формулы (И.Г.Венецкий, В.И.Венецкая. Основные математико-статистические понятия и формулы в экономическом анализе. - М.: Статистика, 1974. 279 с. - стр.188)
1.3.2. Ошибка выборочной доли
Выборочная доля представляет собой отношение числа единиц, обладающих данным признаком или данным его значением ( m ) к общему числу единиц выборочной совокупности ( n )
(Эту статистическую характеристику не следует путать с долей выборки, являющейся отношением числа единиц выборочной совокупности к числу единиц генеральной совокупности).
Ошибка выборочной доли представляет собой расхождение (разность) между долей в выборочной совокупности ( w ) и долей в генеральной совокупности ( p ), возникающее вследствие несплошного характера наблюдения. Величина ошибки выборочной доли определяется как предел отклонения w от p , гарантируемый с заданной вероятностью:
где – гарантийный коэффициент, зависящий от вероятности , с которой гарантируется невыход разности w –p за пределы ; – средняя ошибка выборочной доли.
Средняя ошибка выборочной доли определяется по формуле
Или, как было доказано выше,
где – дисперсия доли в генеральной совокупности (дисперсия генеральной доли);
– дисперсия доли в выборке (дисперсия выборочной доли).
Приведенная формула средней ошибки выборочной доли применяется при повторном отборе.
Для определения дисперсии альтернативного признака допустим, что общее число единиц совокупности равно
n . Число единиц, обладающих данным признаком -
f , тогда число единиц, не обладающих данным признаком, равно n
-
f . Ряд распределения качественного (альтернативного) признака
Значение переменной | Частота повторений |
1 0 | f n-f |
Итого | n |
Средняя арифметическая такого ряда равна:
то есть равна относительной частолте (частости) появления данного признака, которую можно обозначить через p , тогда
Таким образом, доля единиц, обладающих данным признаком равна p ; соответственно доля единиц, не обладающих данным признаком, равна q ;
p
+
q
=1. Тогда дисперсия альтернативного признака определяется по формуле
Для показателя доли альтернативного признака в выборке (выборочной доли) дисперсия определяется по формуле
При бесповторном отборе численность генеральной совокупности сокращается, поэтому дисперсия умножается на коэффициент Формулы расчета средних ошибок выборочной доли для различных способов отбора единиц из генеральной совокупности приведены в табл. 4.2; 3 и 4.
Дисперсии в формулах расчета средних ошибок выборочной доли в табл.4.2. рассчитываются следующим образом:
– межсерийная дисперсия выборочной доли
где w
j – выборочная доля в j
–й серии;
– средняя величина доли во всех сериях;
– средняя из групповых дисперсий
где wj – выборочная доля в j –й типической группе;
nj – число единиц в j –й типической группе;
k – число типических групп.
Для случая, когда доля (частость) даже приблизительно неизвестна, можно произвести "грубый" расчет средней ошибки выборки для доли, используя в расчете максимальную величину дисперсии доли, равную 0,25. Тогда для
повторного отбора
бесповторного отбора
Предельное значение ошибки выборочной доли определяется по следующей формуле:
Величина средней ошибки выборочной доли зависит от доли изучаемого признака в генеральной совокупности, числа наблюдений и способа отбора единиц из генеральной совокупности для наблюдения, а величина предельной ошибки зависит еще и от величины вероятности , с которой гарантируются результаты выборочного наблюдения.
Распространение выборочных данных на генеральную совокупность производится с учетом доверительных интервалов. Доля альтернативного признака в генеральной совокупности равна
Пример
Сущность процесса случайного отбора и основные свойства простой повторной выборки можно показать на условном примере.
Генеральная совокупность состоит из трех единиц (
N = 3 ), например
Порядковый номер рабочего | 1 | 2 | 3 | 4 |
Тарифный разряд, xi | 3 | 4 | 4 | 5 |
Генеральная средняя
разряд;
генеральная дисперсия
доля рабочих в генеральной совокупности, имеющих 4 тарифный разряд
Задача. Определить параметры генеральной совокупности ( средний разряд, дисперсию и долю рабочих с тарифным разрядом, равным 4) по результатам проведения простой случайной повторной выборки объемом 2 единицы (
n = 2 ).
В данном примере с одинаковой степенью вероятности могла бы появиться любая из 16 возможных комбинаций единиц, то есть любая из 16 возможных выборок. Результаты 16 выборок приведены в табл. 1
Таблица 1
Номер выборки | Номера единиц, входящих в выборку | Значения признака по данным выборки | Выборочная средняя | Отклонение выборочной средней от генеральной средней | Выбо- рочная доля |
1 | 1; 1 | 3; 3 | 3,0 | -1,0 | 0,0 |
2 | 1; 2 | 3; 4 | 3,5 | -0,5 | 0,5 |
3 | 1; 3 | 3; 4 | 3,5 | -0,5 | 0,5 |
4 | 1; 4 | 3; 5 | 4,0 | 0,0 | 0,0 |
5 | 2; 1 | 4; 3 | 3,5 | -0,5 | 0,5 |
6 | 2; 2 | 4; 4 | 4,0 | 0,0 | 1,0 |
7 | 2; 3 | 4; 4 | 4,0 | 0,0 | 1,0 |
8 | 2; 4 | 4; 5 | 4,5 | +0,5 | 0,5 |
9 | 3; 1 | 4; 3 | 3,5 | -0,5 | 0,5 |
10 | 3; 2 | 4; 4 | 4,0 | 0,0 | 1,0 |
11 | 3; 3 | 4; 4 | 4,0 | 0,0 | 1,0 |
12 | 3; 4 | 4; 5 | 4,5 | +0,5 | 0,5 |
13 | 4; 1 | 5; 3 | 4,0 | 0,0 | 0,0 |
14 | 4; 2 | 5; 4 | 4,5 | +0,5 | 0,5 |
15 | 4; 3 | 5; 4 | 4,5 | +0,5 | 0,5 |
16 | 4; 4 | 5; 5 | 5,0 | +1,0 | 0,0 |
Возможные варианты значений выборочных средних и отклонения их от генеральной средней представлены в виде ряда распределения (табл.2)
Таблица 2
Выборочные средние разряды рабочих | Число выборок с данной выборочной средней fj | Отклонение выборочной средней от генеральной средней | Вероятность появления данного значения выборочной средней (или величины отклонения выборочной средней от генеральной) |
3,0 | 1 | -1,0 | 0,0625 |
3,5 | 4 | -0,5 | 0,2500 |
4,0 | 6 | 0,0 | 0,3750 |
4,5 | 4 | +0,5 | 0,2500 |
5,0 | 1 | +1,0 | 0,0625 |
Итого | 16 | | 1,0000 |
В распределении величин выборочных средних и их отклонений наблюдаются определенные закономерности.
1. Из возможных результатов случайной повторной выборки наиболее вероятны такие, при которых величина выборочной средней будет близка к величине генеральной средней. Таким образом, чем больше величина случайной ошибки выборки, тем менее вероятно появление такой ошибки.
2. В примере не встречаются ошибки больше единицы по абсолютной величине, т.е. всегда существует предел расхождений между выборочной и генеральной средней.
По данным табл.2, где представлены все возможные варианты выборочных средних и их отклонения от генеральной средней, определяется величина стандартной ошибки выборки
Однако на практике исследователь оперирует данными какой-то одной конкретной выборки, а поэтому указанным способом определить стандартную ошибку средней невозможно.
Среднюю ошибку можно определить по формуле, используя величину дисперсии в генеральной совокупности (в данном примере генеральная дисперсия признака равна 0,5)
Распределение выборочной доли представлено в табл.3
Таблица 3
Выборочная доля | Число выборок с данной выборочной долей fj | Отклонение выборочной доли от генеральной | ||
0,0 | 4 | -0,5 | 0,0 | 1,0 |
0,5 | 8 | 0,0 | 4,0 | 0,0 |
1,0 | 4 | +0,5 | 4,0 | 1,0 |
Итого | 16 | | 8,0 | 2,0 |
В среднем для всех возможных вариантов выборок величина выборочной доли совпадает с долей признака в генеральной совокупности
Средняя квадратическая ошибка доли в генеральной совокупности
Среднюю квадратическую ошибку доли в генеральной совокупности можно определить, используя долю признака в генерального совокупности ( p = 0,5),
В формулы средних ошибок выборки
;
входят дисперсии признака и доли в генеральной совокупности, величины которых, как правило, при проведении выборочного наблюдения неизвестны. Поэтому для расчета средних ошибок выборки приходится использовать выборочные дисперсии в качестве оценки генеральной совокупности.