Реферат

Реферат Описательные статистики

Работа добавлена на сайт bukvasha.net: 2015-10-28

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 17.2.2025





Описательные статистики
Содержание
Введение……………………………………………………………………3

1. Описательная статистика……………………………………………….5

2. Среднее (Мх)…………………………………………………………….7

3. Дисперсия (D)…………………………………………………………..10

4. Стандартное отклонение (σ)…………………………………………..11

5. Медиана (Ме)…………………………………………………………..12

6. Мода (Мо)……………………………………………………………....14

Заключение………………………………………………………………..16

Практическое задание…………………………………………………….17

Список литературы……………………………………………………….19



Введение
Окружающий нас мир насыщен информацией – разнообразные потоки данных окружают нас, захватывая в поле своего действия, лишая правильного восприятия действительности. Не будет преувеличением сказать, что информация становится частью действительности и нашего сознания.

Без адекватных технологий анализа информации (данных) человек оказывается беспомощным в жестокой информационной среде. Статистика позволяет компактно описать данные, понять их структуру, провести классификацию, увидеть закономерности в хаосе случайных явлений.

Широкому внедрению методов анализа данных в 60-х и 70-х годах нашего века немало способствовало появление компьютеров, а начиная с 80-х годов — персональных компьютеров. Статистические программные пакеты сделали методы анализа данных более доступными и наглядными. Теперь уже не требуется вручную выполнять трудоемкие расчеты по сложным формулам, строить вручную сложные диаграммы и графики — всю эту черновую работу взял на себя компьютер, а исследователю осталась главным образом творческая работа: постановка задач исследования, выбор методов психологического исследования и грамотная интерпретация результатов. [1]

Математическая статистика исходит из предположения, что наблюдаемая изменчивость окружающего мира имеет два источника:

- действие известных причин и факторов. Они порождают изменчивость, закономерно объяснимую.

- действие случайных причин и факторов. Большинство природных и общественных явлений обнаруживают изменчивость, которая не может быть целиком объяснена закономерными причинами. В таком случае прибегают к концепции случайной изменчивости. Выражение «случайный» в данном контексте означает «подчиняющийся законам теории вероятности».

Статистический подход – это выявление закономерной изменчивости на фоне случайных факторов и причин. Методы математической статистики позволяют оценить параметры имеющихся закономерностей, проверить те или иные гипотезы об этих закономерностях. [1]

Целью работы является изучение описательных статистик.

Задачи:

1.                 Изучить предназначение описательной статистики;

2.                 Раскрыть сущность таких описательных статистик как мода, медиана, среднее значение, дисперсия, стандартное отклонение.

Аппарат математической статистики является изумительным по мощности и гибкости инструментом для отсеивания закономерностей от случайностей. Психологу-исследователю обязательно необходимо накапливать информацию об окружающем мире, пытаясь выделить закономерности из случайностей.




1. Описательная статистика
Первый раздел математической статистики – описательная статистика – предназначен для представления данных в удобном виде и описания информации в терминах математической статистики и теории вероятностей.

Основной величиной в статистических измерениях является единица статистической совокупности (например, любой из критериев оценки качества педагога-исследователя). Единица статистической совокупности характеризуется набором признаков или параметров. Значения каждого параметра или признака могут быть различными и в целом образовывать ряд случайных значений x1, х2, …, хn. [3]

Переменная (variable) -  это параметр измерения, который можно контролировать или которым можно манипулировать в исследовании. Так как значения переменных не постоянны, нужно научиться описывать их изменчивость.

Для этого придуманы описательные или дескриптивные статистики: минимум, максимум, среднее, дисперсия, стандартное отклонение, медиана, квартили, мода.

Относительное значение параметра - это отношение числа объектов, имеющих этот показатель, к величине выборки. Выражается относительным числом или в процентах (процентное значение).

Пример: Успеваемость в классе = числу положительных итоговых отметок, деленному на число всех учащихся класса. Умножение этого значения на 100 дает успеваемость в процентах. 25/100=25%

Удельное значение данного признака - это расчетная величина, показывающая количество объектов с данным показателем, которое содержалось бы в условной выборке, состоящей из 10, или 100, 1000 и т. д. объектов.

Пример. Для сравнения уровня правонарушений в разных регионах берется удельная величина - количество правонарушений на 1000 человек (N) [3]

Минимум и максимум — это минимальное и максимальное значения переменной.


2. Среднее (Мх)
Исходным пунктом становления теории средних величин явилось исследование пропорций школой Пифагора. При этом не проводилось строгого различия между понятиями средней величины и пропорции. Значительный толчок развитию теории пропорций с арифметической точки зрения был дан греческими математиками – Никомахом Герасским (конец I – начало II в. н.э.) и Паппом Александрийским (III в. н.э.). Первым этапом развития понятия средней является этап, когда средняя стала считаться центральным членом непрерывной пропорции. Но понятие средней как центрального значения прогрессии не дает возможности вывести понятие средней по отношению к последовательности n членов, независимо от того, в каком порядке они следуют друг за другом. Для этой цели необходимо прибегнуть к формальному обобщению средних. Следующий этап – переход от непрерывных пропорций к прогрессиям – арифметической, геометрической и гармонической. [1]

В истории статистики впервые широкое употребление средних величин связано с именем английского ученого У. Петти. У. Петти один из первых пытался придать средней величине статистический смысл, связав ее с экономическими категориями. Но описания понятия средней величины, его выделения Петти не произвел. Родоначальником теории средних величин принято считать А. Кетле. Он одним из первых начал последовательно разрабатывать теорию средних величин, пытаясь подвести под нее математическую базу. А. Кетле выделял два вида средних величин – собственно средние и средние арифметические. Собственно средние представляют вещь, число, действительно существующие. Собственно средние или средние статистические должны выводиться из явлений однокачественных, одинаковых по своему внутреннему значению. Средние арифметические – числа, дающие возможно близкое представление о многих числах, различных, хотя и однородных. [2]

Каждый из видов средней может выступать либо в форме простой, либо в форме взвешенной средней. Правильность выбора формы средней вытекает из материальной природы объекта исследования. Формулы простых средних применяются в случае, если индивидуальные значения усредняемого признака не повторяются. Когда в практических исследованиях отдельные значения изучаемого признака встречаются несколько раз у единиц исследуемой совокупности, тогда частота повторений индивидуальных значений признака присутствует в расчетных формулах степенных средних. В этом случае они называются формулами взвешенных средних.

Иерархия средних значений:

среднее значение функции — понятие, определяемое многими способами.

Более конкретно, но на основе произвольных функций, определяются средние Колмогорова для набора чисел.

среднее степенное — частный случай средних Колмогорова при φ(x) = xα. Средние различных степеней связывает между собой неравенство о средних. Наиболее распространённые частные случаи:

среднее арифметическое (α = 1);

среднее квадратическое (α = 2);

среднее гармоническое (α = − 1);

по непрерывности при  доопределяется среднее геометрическое, которое также является Колмогоровским средним при φ(x) = logx

среднее взвешенное — обобщение средней величины на случай произвольной линейной комбинации.

среднее хронологическое — обобщает значения признака для одной и той же единицы или совокупности в целом, изменяющихся во времени.

среднее логарифмическое, определяемое по формуле ā=(a1-a2)/ln(a1/a2), используется в теплотехнике
Среднее (оценка среднего, выборочное среднее) — сумма значений переменной, деленная на n (число значений переменной). Если вы имеете значения Х(1), ..., X(N), то формула для выборочного среднего имеет вид:

`х =    

Пример: Наблюдение посещаемости четырех внеклассных мероприятий в экспериментальном (20 учащихся) и контрольном (30) классах дали значения (соответственно): 18, 20, 20, 18 и 15, 23, 10, 28. Среднее значение посещаемости в обоих классах получается одинаковое - 19. Однако видно, что в контрольном классе этот показатель подчинен воздействию каких-то специфических факторов. [5]

Выборочное среднее является той точкой, сумма отклонений наблюдений от которой равна 0. Формально это записывается следующим образом:

(`х  - х1) + (`х  - х2) + ... + (`х  - хn) =0

Для оценки степени разброса (отклонения) какого-то показателя от его среднего значения, наряду с максимальным и минимальным значениями, используются понятия дисперсии и стандартного отклонения. [5]


3. Дисперсия (D)
Дисперсия выборки или выборочная дисперсия (от английского variance) – это мера изменчивости переменной. Термин впервые введен  Фишером в 1918 году. Выборочная дисперсия вычисляется по формуле:
s2 =   
где `х  — выборочное среднее,

N — число наблюдений в выборке.

Дисперсия меняется от нуля до бесконечности. Крайнее значение 0 означает отсутствие изменчивости, когда значения переменной постоянны. [4]


4. Стандартное отклонение (σ)

 

Стандартное отклонение, среднее квадратическое отклонение (от английского standard deviation) вычисляется как корень квадратный из дисперсии. Чем выше дисперсия или стандартное отклонение, тем сильнее разбросаны значения переменной относительно среднего.

Пример: Для предыдущего случая имеем



Классы







Экспериментальный



19

1

1

контрольный

19

48,5

8



Это означает, что в одном классе посещаемость высокая, стабильная, а в другом - отличается непостоянством. [3]


5. Медиана (Ме)
Медианой (англ. median) называется значение исследуемого признака, справа и слева от которого находится одинаковое число упорядоченных элементов выборки. Если объем выборки – четное число, то медианой является среднее арифметическое двух центральных членов. Другими словами медиана разбивает выборку на две равные части. Также, как и среднее арифметическое, медиана дает общее представление о том, где находится центр выборки. В некоторых случаях медиана более удобна, чем среднее. Определение медианы было впервые использовано Гальтоном в 1882 г. [2]

Медиана разбивает выборку на две равные части. Половина значений переменной лежит ниже медианы, половина — выше. Медиана дает общее представление о том, где сосредоточены значения переменной, иными словами, где находится ее центр. В некоторых случаях, например при описании доходов населения, медиана более удобна, чем среднее.

Рассмотрим способы определения медианы при различных значениях N.  Для нахождения медианы измерения записывают в ряд по возрастанию значений. Если число измерений N нечетное, то медиана численно равна значению этого ряда, стоящему точно в середине, или на (N+1)/2 месте. Например, медиана пяти измерений: 10, 17, 21, 24, 25 – равна 21 – значению, стоящему на третьем месте (N+1)/2=(5+1)/2=3.

Если число измерений четное, то медиана численно равна среднему арифметическому значений ряда, стоящих в середине, или на N/2 и N/2+1 местах. Например, медиана восьми измерений: 5, 5, 6, 7, 8, 8, 9, 9 – равна 7,5 (7+8)/2=7,5 – среднему арифметическому значений ряда, стоящих на четвертом и пятом местах (N/2=8/2=4 и N/2+1=4+1=5). [4]

Квартили представляют собой значения, которые делят две половины выборки (разбитые медианой) еще раз пополам (от слова кварта — четверть).

Различают верхнюю квартиль, которая больше медианы и делит пополам верхнюю часть выборки (значения переменной больше медианы), и нижнюю квартиль, которая меньше медианы и делит пополам нижнюю часть выборки.

Нижнюю квартиль часто обозначают символом 25%, это означает, что 25% значений переменной меньше нижней квартили.

Верхнюю квартиль часто обозначают символом 75%, это означает, что 75% значений переменной меньше верхней квартили.

Таким образом, три точки — нижняя квартиль, медиана и верхняя квартиль - делят выборку на 4 равные части.

¼ наблюдений лежит между минимальным значением и нижней квартилью, ¼ - между нижней квартилью и медианой, ¼ - между медианой и верхней квартилью, ¼ - между верхней квартилью и максимальным значением выборки. [3]


6. Мода (Мо)
Мода (англ. mode) представляет собой наиболее часто встречающееся значение переменной (иными словами, наиболее «модное» значение переменной). Сложность состоит в том, что редкая выборка имеет единственную моду. Если в выборке несколько мод, то говорят, что она мультимодальна или многомодальна (имеет два или более «пика»). Таким образом можно сказать, что мода характеризует не только положение выборки, но отчасти и форму ее распределения.

Мода представляет собой максимально часто встречающееся значение переменной (иными словами, наиболее «модное» значение переменной), например, популярная передача на телевидении, модный цвет платья или марка автомобиля и т. д, Сложность в том, что редкая совокупность имеет единственную моду. (Например: 2, 6, 6, 8, 9, 9, 9, 10 – мода = 9).

Если распределение имеет несколько мод, то говорят, что оно мультимодально или многомодально (имеет два или более «пика»). [1]

Ассиметрия – это свойство распределения выборки, которое характеризует несимметричность распределения СВ. На практике симметричные распределения встречаются редко и чтобы выявить и оценить степень асимметрии, вводят следующую меру:


Асимметрия бывает положительной и отрицательной. Положительная сдвигается влево, а отрицательная – вправо. [5]

         Эксцесс – это мера крутости кривой распределения.

            Эксцесс равен:



Кривая распределения может быть островершинной, плосковершинной, средне вершинной. Эти четыре момента составляют набор особенностей распределения при анализе данных. Для нормального распределения А=0, Е=0. [5]


Заключение
Описательные статистики дают нам возможность оценить характер распределения данных в изучаемой выборке. На основании этой оценки мы можем принять решение о том, какие критерии надлежит использовать в дальнейшей работе – например, при сравнении выборок. Описательные статистики являются основой построения статистических графиков и диаграмм – например, диаграмм размаха, т.е. являются предварительным этапом в проведении визуального анализа данных. Таким образом, можно отнести их к категории разведочных методов анализа данных.


Практическое задание
Провести кластерный анализ качеств личности

                                                               Agglomeration Schedule

 

 

 

Stage

Cluster Combined

Coefficients

Stage Cluster First Appears

Next Stage
Cluster 1
Cluster 2
Cluster 1
Cluster 2
1

2

6

,000

0

0

5

2

4

5

,000

0

0

3

3

1

4

,000

0

2

4

4

1

3

,000

3

0

5

5

1

2

1,000

4

1

0



                                                                Vertical Icicle

 

Number of clusters

Case
Интеллегентный
 

Интелект

 

Ответственный

 

Отзывчивый

 

Веселый

 

Добрый

1

X

X

X

X

X

X

X

X

X

X

X

2

X

X

X

 

X

X

X

X

X

X

X

3

X

X

X

 

X

 

X

X

X

X

X

4

X

X

X

 

X

 

X

X

X

 

X

5

X

X

X

 

X

 

X

 

X

 

X



         Кластерный анализ применяется, чтобы облегчить задачу классификации людей по большому количеству признаков.

Используем метод древовидной классификации. Метод древовидной классификации – это пошаговый метод разбиения выборки на отдельные группы. Анализ полученных данных позволил нам разделить выборку на два кластера. В первый вошли такие качества как интеллект, интеллигентность.

Второй кластер составили качества: веселый, добрый, отзывчивый, ответственный.




Список литературы
1.                 Гмурман В.Е. Теория вероятностей и математическая статистика: Учеб. Пособие для вузов/В.Е. Гмурман. – 9-е изд., стер. – М.:Высш. шк., 2003. – 188 с.

2.                 Годфруа Ж. Что такое психология. — М., 1992. – 288с

3.                 Оценка качества подготовки будущих учителей. – Тула: Изд-во Тул. гос. пед. ун-та, 2002. – 140 с.

4.                 Наследов А. Д. Математические методы психологического исследования. Анализ и интерпретация данных. - СПб.: Речь,  2004 – 392с.

5.                 Сидоренко Е. В. Методы математической обработки в психологии. -СПб., 2001 – 350 с.


1. Реферат УСТАВ МУНИЦИПАЛЬНОГО ОБРАЗОВАНИЯ И ПРАКТИКА ЕГО РЕАЛИЗАЦИИ
2. Реферат Особенности и специфика рекламной деятельности на предприятиях индустрии гостеприимства
3. Реферат Реформы Петра I в области социальной сферы
4. Курсовая Техніка з точки зору філософії
5. Реферат на тему Butterflies Essay Research Paper BUTTERFLIES
6. Реферат Кандидатский по философии 2004 года г Орел
7. Реферат Технологии переработки твёрдых бытовых отходов
8. Отчет по практике на тему Ведение больных в хирургическом отделении
9. Контрольная работа Классификация и качество мяса Маркировка консервов
10. Реферат Пожарная безопасность установки первичной перегонки нефти