Реферат

Реферат Прогнозирование результатов учебы студентов с помощью методов ИИ

Работа добавлена на сайт bukvasha.net: 2015-10-28

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 23.11.2024



Оглавление

1.    ВВЕДЕНИЕ. 3

2.    ТЕОРЕТИЧЕСКАЯ ЧАСТЬ. 4

2.1.     История развития. 4

2.2.     Основные понятия. 5

2.3.     Основные задачи. 6

2.4.     Пакет Квазар. 8

2.4.1.     Подготовка данных для пакета КВАЗАР. 8

2.4.2.     Структура входного файла. 8

2.4.3.     Методические рекомендации по решению задач с помощью пакета КВАЗАР. 9

2.4.4.     Формирование обучающей и проверочной выборок. 10

2.4.5.     Задачи классификации, диагностики и прогнозирования. 11

3.     ПРАКТИЧЕСКАЯ ЧАСТЬ. 12

4.     ЗАКЛЮЧЕНИЕ. 13

5.     ЛИТЕРАТУРА.. 24



1.    ВВЕДЕНИЕ


Распознавание образов представляет собой раздел кибернетики, связанный с моделированием некоторых творческих аспектов мыслительной деятельности чело­века, таких, в частности, как способность узнавать (клас­сифицировать) предметы и явления окружающего мира, формировать новые понятия и т. д. Методы распозна­вания образов получают широкое распространение как при решении чисто «человеческих» задач, таких, как распознавание зрительных, речевых и слуховых об­разов, так и для задач, нетривиальных для человека. Чаще всего эти задачи связаны с обработкой ряда из­мерений (параметров), зависимость между которыми неизвестна и число которых достигает десятка и более. К числу таких задач относятся, в частности, задачи технической и медицинской диагностики, некоторые задачи прогнозирования. Наибольшую трудность при их решении составляет, по-видимому, форма представления информации в виде чисел, которая неудобна и непривычна для человека

Целью данной курсовой работы является прогнозирование результатов учебы студентов с помощью методов ИИ. Для достижения цели необходимо решить следующие задачи:

·                    Изучить теоретический материал по данной теме;

·                    Собрать данные и проанализировать их с помощью программы «КВАЗАР»;

·                    Составить прогноз об успеваемости студентов.

Входными данными являются результаты тестирований студентов и материалы практического занятия на данную тему задания.

2. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ

2.1.   История развития.


Распознавание образов представляет собой раздел кибернетики, связанный с моделированием некоторых творческих аспектов мыслительной деятельности чело­века, таких, в частности, как способность узнавать (клас­сифицировать) предметы и явления окружающего мира, формировать новые понятия и т.д. 

Методы распозна­вания образов получают широкое распространение как при решении чисто «человеческих» задач, таких, как распознавание зрительных, речевых и слуховых об­разов, так и для задач, нетривиальных для человека. Чаще всего эти задачи связаны с обработкой ряда из­мерений (параметров), зависимость между которыми неизвестна и число которых достигает десятка и более. Наибольшую трудность при их решении составляет, по-видимому, форма представ­ления информации в виде чисел, которая неудобна и непривычна для человека.

На начальном этапе работы над проблемой распознавания было потрачено много усилий на попытки построить процесс распознавания, используя понятие «образ». Они сводились, сознавая условность классификаций, к следующим направлениям:

1.            Изучение образа как такового с целью выяснить, что представляют собой образы разных типов, какова их структура;

2.            Построение системы распознавания на основе имитации способностей человека.

В первом подходе основной массив составили работы, авторы которых считали, что процесс решения плохо формализованных задач на ЭВМ должен моделировать основные аспекты процесса мышления. Представители второго подхода исходили из посылки, что, несмотря на отсутствие модели того, как человек решает задачу, и несмотря на отсутствие адекватной математической модели реальной ситуации, можно, опираясь на здравый смысл, строить алгоритмы, которые реализуют нужный процесс преобразования информации. К середине 1970-х годов сформировались параметрические семейства алгоритмов, которые принято называть моделями алгоритмов распознавания. Решение практических задач свелось к «настройке параметров», т.е. к решению проблемы выбора значений параметров, выделяющих из семейства оптимальный для данной задачи алгоритм. В настоящее время сформировались общие для обоих подходов задачи и принципы их решения.

2.2.   Основные понятия.


Распознавание образов, научное направление, связанное с разработкой принципов и построением систем, предназначенных для определения принадлежности данного объекта к одному из заранее выделенных классов объектов. Под объектами в Р. о. понимают различные предметы, явления, процессы, ситуации, сигналы. Каждый объект описывается совокупностью основных характеристик (признаков, свойств) Х =(x1, ..., x i , ..., x n), где i-я координата вектора Х определяет значения i характеристики, и дополнительной характеристикой S, которая указывает на принадлежность объекта к некоторому классу (образу).

Одним из основных понятий в теории распознавания является образ. Образ (класс) – множество всех объектов, сходных друг с другом в каком-либо фиксированном отношении. Распознать объект или образ объекта – значит указать, к какому образу он относится. Методы распозна­вания образов получают широкое распространение как при решении чисто «человеческих» задач, таких, как распознавание зрительных, речевых и слуховых об­разов, так и для задач, нетривиальных для человека. Чаще всего эти задачи связаны с обработкой ряда из­мерений (параметров), зависимость между которыми неизвестна и число которых достигает десятка и более. Наибольшую трудность при их решении составляет, по-видимому, форма представ­ления информации в виде чисел, которая неудобна и непривычна для человека. Распознавание объекта производится при по­мощи решающего правила, которое может быть получено на этапе обучения, предшествую­щем распознаванию. Решающее правило может пред­ставлять собой некоторую разделяющую (дискриминантную) функцию или систему дискриминантных функций (в случае числа образов k>2). Обучающая выборка — это множество объ­ектов, которыми образы представлены при обучении, т. е. это объединение некоторых подмножеств рассмат­риваемых образов. Экзаменующая (прове­рочная) выборка — множество объектов, на которых  проверяются  результаты  обучения.

Признак — описание того или иного свойства объекта. Признаки могут быть как количественными, так и качественными. При решении задачи распозна­вания имеют дело не непосредственно с реальными объектами, а с векторами из Rn, моделирующими эти объекты. При этом каждая компонента моделирующего вектора представляет собой значение соответствующего признака. В геометрической интерпретации образ отож­дествляется с областью многомерного пространства при­знаков, каждая точка которой соответствует конкретной реализации этого образа.

2.3.   Основные задачи.


Одна из основных задач Р. о. - выбор правила (решающей функции) D, в соответствии с которым по значению контрольной реализации Х устанавливается её принадлежность к одному из образов, т. е. указываются "наиболее правдоподобные" значения характеристики S для данного Х. Выбор решающей функции D требуется произвести так, чтобы стоимость самого распознающего устройства, его эксплуатации и потерь, связанных с ошибками распознавания, была минимальной. Примером задачи Р. о. этого типа может служить задача различения нефтеносных и водоносных пластов по косвенным геофизическим данным. По этим характеристикам сравнительно легко обнаружить пласты, насыщенные жидкостью. Значительно сложнее определить, наполнены они нефтью или водой. Требуется найти правило использования информации, содержащейся в геофизических характеристиках, для отнесения каждого насыщенного жидкостью пласта к одному из двух классов - водоносному или нефтеносному. При решении этой задачи в обучающую выборку включают геофизические данные вскрытых пластов.

В соответ­ствии с большинством классификаций можно выделить три наиболее распространенных типа задач распозна­вания образов:

1.     Задачи обучения по прецедентам, называемые также задачами «обучения с учителем», или дискриминантного анализа:

Имеется множество объектов (ситуаций) и множество возможных ответов (откликов, реакций). Существует некоторая зависимость между ответами и объектами, но она не известна. Известна только конечная совокупность прецедентов — пар «объект, ответ», называемая обучающей выборкой. На основе этих данных требуется восстановить зависимость, то есть построить алгоритм, способный для любого объекта выдать достаточно точный ответ. Для измерения точности ответов определённым образом вводится функционал качества;

2.     Задачи таксономии (автоматической классификации, кластер - анализа):

Предположим, что известны n1 наблюдений из генеральной совокупности A1, n2 наблюдений из генеральной совокупности А2 и т.д., nm наблюдений из генеральной совокупности Am, m³ 2. Дана также выборка z = (z1, ..., z). Задача Р. о. состоит в определении, какой из генеральных совокупностей A j, j = 1, 2,..., m ,  принадлежит выборка z. При этом обычно принимается предположение о том, что распределения P (Ї) совокупностей A j принадлежат некоторому семейству {P (Q, ’)} распределений, зависящих от векторного параметра Q, так что P j (’) = Р (Q j,Ї), где Q j неизвестны.

Если заданы потери L i j, которые несёт наблюдатель, относя выборку 2 к совокупности (образу) A j, когда она на самом деле принадлежит A i, то сформулированная задача может рассматриваться и решаться с помощью методов теории статистических игр [стратегией природы здесь является набор (Q1, ..., Q m, j), где j указывает номер совокупности, к которой относится z]. В этом случае возможно отыскание оптимальных "решающих функций", минимизирующих в том или ином смысле потери наблюдателя;

3.            Задачи выбора информативных признаков из за­данной системы описания объектов.

Успех в решении задачи распознавания образов зависит в значительной мере от того, насколько удачно выбраны признаки Х. Исходный набор характеристик часто бывает очень большим. В то же время приемлемое правило должно быть основано на использовании небольшого числа признаков, наиболее важных для отличения одного образа от другого. Так, в задачах медицинской диагностики важно определить, какие симптомы и их сочетания (синдромы) следует использовать при постановке диагноза данного заболевания. Поэтому проблема выбора информативных признаков - важная составная часть проблемы распознавания образов.

2.4.        Пакет Квазар.

2.4.1.  Подготовка данных для пакета КВАЗАР.


Файл данных обычно бывает подготовлен в символьном виде массива – матрица “ объект  - признаки”. При решении задачи обучения по прецедентам (фактам) в входном файле должен соблюдаться следующий порядок векторов – объектов:

1.                 векторы известной принадлежности, представленные на обучение (из них пакет автоматически или на основе указаний пользователя может сформировать обучающую и проверочные выборки); при этом сначала следуют векторы 1 класса – образа, затем второго и т.д.;

2.                 векторы, предъявленные для рабочего распознавания (при наличии)

Работая с пакетом КВАЗАР, нумеровать векторы не следует. Номер вектора определяется его местом в файле  (массиве) обрабатываемых данных.

2.4.2.   Структура входного файла.


Каждая запись – объект  n”- мерный вектор состоит из признаков вещественных чисел, которые разделяются пробелом или запятой, в конце описания вектора ставится символ “;”. Набор следующего вектора  новая запись, т.е. новая строка. В начале вектора можно указывать имена векторов, которые отделяются от признаков символом “:”.

Данные должны быть набраны в “DOS” кодировке в любом редакторе, например БЛОКНОТ шрифт Terminal. Имя файла должно состоять из 8 латинских символов – “ группа и ваш номер по списку”. Тип файла обязательно должен быть DAT и записан для удобства работы в каталог DATA пакета КВАЗАР.

Пример:

Файл -  I1601001.dat, I16010 – группа, 01- ваш номер по списку.

ИМЯ : 2  2  9  1. 1. 6. 1. 2.;

3. 9. 8. 7. 6. 5. 3. 2.;

0. 0. 7. 9. 0. 8. 7. 8.;

3. 4. 6. 7. 5. 6. 9. 6.;

2.4.3.   Методические рекомендации по решению задач с помощью пакета КВАЗАР.


1. Получить пароль у преподавателя  и загрузить пакет - KVAZAR.exe

2. Набрать имя сеанса - “ группа и ваш номер по списку”  Пример - I1601001

3. Подготовленные ваши данные анализируются средствами пакета. Если в данных обнаружены будут ошибки в этом случае будут выданы соответствующие диагностические сообщения, например:

В строке n неразрешенный символ x, K-й вводимый вектор содержит чисел вместо . В строке десятичная точка не на месте, в строке число не содержит десятичной точки, и т.д.

Устранив ошибки, выявленные программой ввода, можно повторно обратиться к пакету с тем же заданием. Поскольку программа ввода осуществляет лишь самый простой контроль. состоящий в основном в выявлении синтаксических ошибок и проверки длины векторов рекомендуется перед работой с пакетом еще раз проверить входные данные.

2.4.4.       Формирование обучающей и проверочной выборок.


Задача формирования обучающей и проверочной выборок тесно связана с задачей обучения по преце­дентам и обусловлена ею. Действительно, для качест­венного (с точки зрения пригодности результатов для практического использования) решения задачи обучения по прецедентам необходимо производить оценку качества дискриминантных функций, получаемых в результате обучения. С этой целью можно, например, распознать с помощью полученной дискриминантной функции некоторое количество векторов из проверочной выборки, классификация которых априори известна, но которые не участвовали в обучении. На практике проверочную выборку формируют в лучшем случае исходя из каких-либо практических соображений на основе чисто визуального анализа всей имеющейся совокупности векторов, а чаще — случайным образом. При этом в проверочную выборку могут оказаться включенными векторы из областей признакового пространства, не представленных в обучающей выборке, что, естественно, может повлечь плохое качество обучения распознаванию векторов из этой области. В предлагается воспользоваться для формирования обучающей и проверочной выборок результатами таксономии множества объектов, представленных для обучения. Данный подход позволяет получать достаточно прецедентные (т. е. отражающие основные особенности описания объектов) обучающие и проверочные выборки.

В пакете имеются три различные возможности формирования названных выборок:

1) по результатам таксономии,

2)     случайным образом,

3)     по указанию пользователя.

2.4.5.       Задачи классификации, диагностики и прогнозирования.


Под диагностикой состояния системы понимается его классификация, т.е. отнесение его к одному из известных классов- образов. Часто возникают вопросы относительно числа и состава признаков, необходимых для описания классифицируемых объектов, количества классов-образов, критериев решения задачи обучения и т. д. К сожалению, на эти вопросы трудно ответить однозначно, не зная конкретной задачи. Тем не менее, некоторые рекомендации можно привести.

Так при решении задач медицинской диагностики выбирают 10-50 признаков (на первом этапе)  В их число должны входить доступные учеты и измерению признаки, имеющие прямое или косвенное отношение к природе рассматриваемого явления,  по мнению специалистов.

Выбранная система может оказаться избыточной или содержать малоинформативные признаки, поэтому в пакете КВАЗАР предусмотрена возможность оценки информативности и отбора признаков.

Что касается объема обучающей выборки, то желательно, чтобы число входящих в неё векторов, по крайней мере, в 3-5 раз (некоторые авторы рекомендуют в 10 и более) превосходило число существенных признаков.

3.               ПРАКТИЧЕСКАЯ ЧАСТЬ


Исходными данными для анализа являются результаты тестирования студентов. Результаты тестов формируются в файл в формате .dat, где номер вектора – это порядковый номер студента, а признаки – это тесты.

3.1.   Описание входных данных.

Файл данных обычно бывает подготовлен в символьном виде массива – матрица “ объект  - признаки”. При решении задачи обучения по прецедентам (фактам) в входном файле должен соблюдаться следующий порядок векторов – объектов:

1.     векторы известной принадлежности, представленные на обучение (из них пакет автоматически или на основе указаний пользователя может сформировать обучающую и проверочные выборки); при этом сначала следуют векторы 1 класса – образа, затем второго и т.д.;

2.     векторы, предъявленные для рабочего распознавания (при наличии)

Работая с пакетом КВАЗАР, нумеровать векторы не следует. Номер вектора определяется его местом в файле  (массиве) обрабатываемых данных.

Каждая запись – объект  n”- мерный вектор состоит из признаков вещественных чисел, которые разделяются пробелом или запятой, в конце описания вектора ставится символ “;”. Набор следующего вектора  новая запись, т.е. новая строка. В начале вектора можно указывать имена векторов, которые отделяются от признаков символом “:”.

Данные должны быть набраны в “DOS” кодировке в любом редакторе, например БЛОКНОТ шрифт Terminal. Имя файла должно состоять из 8 латинских символов – “ группа и ваш номер по списку”. Тип файла обязательно должен быть DAT и записан для удобства работы в каталог DATA пакета КВАЗАР.

Пример:

Файл -  I1601001.dat, I16010 – группа, 01- ваш номер по списку.

ИМЯ : 2  2  9  1. 1. 6. 1. 2.;

3. 9. 8. 7. 6. 5. 3. 2.;

0. 0. 7. 9. 0. 8. 7. 8.;

3. 4. 6. 7. 5. 6. 9. 6.;
3.3.1.    Первый поток студентов.

В таблице, представленной ниже, даны результаты тестирования студентов из групп ИТ-190101,ВИ-190102,ВИ-190301 за 2008-2009г.



Фамилия

Имя

МК1

МК2

О/M

МК3

МК4

МК5

ВА

МК6

МК7

МК8

АГ

МК9

МК10

СУМ

1

Пипкина

Алёна

100

88

346

100

50

75

88

75

75

25

88

75

100

1284

2

Зиганурова

Лилия

100

38

385

75

100

100

76

19

50

50

56

75

50

1174

3

Конев

Антон

100

88

423

75

100

25

39

100

0

25

81

75

0

1131

4

Соколова

Евгения

38

50

423

75

100

75

75

0

75

0

56

75

50

1092

5

Демин

Михаил

46

13

385

75

75

50

50

38

75

50

25

50

50

981

6

Сайсанова

Елена

85

0

346

50

100

25

49

0

0

25

52

75

75

881

7

Задорожный

Антон

31

25

353

75

100

75

51

50

0

0

69

0

50

878

8

Быковский

Михаил

54

25

365

50

50

75

29

25

50

25

69

50

0

867

9

Алфутов

Сергей

38

0

321

100

75

25

59

25

25

0

69

25

75

837

10

Назаров

Михаил

15

13

385

50

50

50

35

0

50

25

59

50

50

832

11

Высоцкий

Вячеслав

69

13

308

0

100

25

34

50

0

0

69

75

75

817

12

Хизматулин

Владимир

69

0

308

75

100

50

38

0

25

0

63

75

0

803

13

Ибрашова

Мария

100

0

269

75

75

75

54

0

0

50

27

25

50

800

14

Медведев

Сергей

54

38

308

50

75

25

66

0

0

25

53

50

50

793

15

Аббасов

Анар

31

13

308

25

100

0

22

0

25

25

81

75

75

779

16

Шитов

Артём

38

38

360

75

50

50

25

0

0

25

73

25

0

760

17

Луговцов

Михаил

0

0

192

50

100

50

62

0

50

25

44

75

75

723

18

Раскатов

Павел

54

0

160

75

75

0

47

0

25

25

81

75

100

717

19

Приходько

Андрей

15

13

256

75

25

50

39

13

25

0

47

75

75

707

20

Раёва

Алина

15

0

192

50

75

0

57

50

0

25

53

75

75

668

21

Рыжков

Никита

38

0

256

75

25

25

44

0

50

0

69

25

50

658

22

Бакланов

Михаил

23

38

231

50

75

25

37

0

50

0

50

25

50

654

23

Алёхина

Анастасия

0

25

359

0

75

25

17

50

0

0

66

25

0

641

24

Коршунова

Евгения

0

13

192

50

75

50

37

0

25

25

67

25

75

634

25

Дементьева

Ксения

31

13

192

50

100

0

25

0

0

25

72

50

75

632

26

Горбунов

Александр

46

25

212

50

25

25

62

0

25

0

63

50

50

632

27

Телятников

Владимир

69

13

288

25

100

50

0

31

0

0

41

0

0

617

28

Пермякова

Наталья

15

0

192

50

50

0

40

63

0

0

69

75

50

604

29

Гатауллина

Динара

23

0

192

50

50

75

29

19

25

0

33

25

75

596

30

Гладких

Иван

23

0

295

25

25

50

31

0

25

0

44

50

0

568

31

Мустафин

Юрий

54

13

231

50

0

25

34

0

50

0

69

0

0

525

32

Дзядук

Иван

85

13

0

50

75

75

35

38

25

0

44

50

25

514

33

Чекасина

Екатерина

23

38

237

25

0

25

29

0

0

0

52

25

50

504

34

Китов

Данила

31

25

69

0

100

75

42

13

25

0

69

25

25

498

35

Сидорова

Дарья

23

0

308

25

50

25

20

0

0

25

19

0

0

494

36

Болотов

Валентин

0

0

186

75

0

50

39

25

25

0

41

0

50

491

37

Гильмуллина

Лилия

31

13

199

75

25

0

0

13

0

25

31

25

25

461

38

Ветлужских

Михаил

0

0

115

75

50

0

41

0

50

0

44

50

25

450

39

Антропов

Андрей

46

50

0

75

75

50

36

0

25

0

44

0

25

426

40

Ярош

Диана

23

0

173

0

50

0

14

0

0

0

39

50

75

424

41

Корчемкина

Дарья

38

0

160

50

75

0

6

0

0

0

33

50

0

412

42

Иванов

Михаил

46

0

167

50

0

0

0

0

0

0

69

50

0

382

43

Дунаева

Анна

54

0

154

25

50

0

12

19

0

0

42

0

25

380

44

Зотов

Кирилл

23

0

154

75

25

0

37

0

25

0

0

25

0

364

45

Строков

Михаил

85

38

0

50

0

0

28

0

50

25

16

0

25

316

46

Мышаков

Роман

62

13

135

0

0

0

17

0

25

0

27

0

25

302

47

Пеганов

Александр

15

13

135

0

25

50

4

0

0

0

31

0

25

298

48

Усс

Павел

38

0

30

75

50

0

12

0

50

0

16

0

0

271

49

Чеботаев

Юрий

0

0

0

75

50

0

23

0

0

0

13

0

25

185

50

Бульц

Регина

0

0

0

100

0

0

0

0

0

0

0

0

0

100

51

Колосов

Александр

23

0

0

0

0

0

0

0

25

0

0

0

0

48

АНАЛИЗ ИНФОРМАТИВННОСТИ ПРИЗНАКОВ

Информационные веса признаков (в относит. единицах):

-------------------------------------------------------------------------------

Признак :    12     5      3      14     10     13     11     7      6      4 

-------------------------------------------------------------------------------

Инф. вес:  1.000  0.936  0.891  0.707  0.672  0.598  0.551  0.493  0.243  0.143

-------------------------------------------------------------------------------

-------------------------------------------------------------------------------

Признак :    2      9      1      8 

-------------------------------------------------------------------------------

Инф. вес:  0.075  0.052  0.025  0.000

-------------------------------------------------------------------------------


Вывод: В результате исследования информативности признаков было выявлено, что наиболее существенными признаками являются тесты № 12, 5 и 3.

ТАКСОНОМИЯ МНОЖЕСТВА ПРИЗНАКОВ

Параметры алгоритма таксономии устанавливаются автоматически. Для этого выполняется расчет макс. и мин. (по модулю) значений. коэффициента парной корреляции. В результате выполнены следующие назначения:

начальное пороговое значение коэф-та парной корреляции (по модулю) - 0.848

конечное пороговое значение коэф-та парной корреляции (по модулю) - 0.013

шаг изменения порогового значения                                            0.083

Таксономия при RO =  0.848

Все таксоны единичные.

Таксономия при RO =  0.764

*Таксон  1:   3, 14.

Остальные таксоны единичные.

Таксономия при RO =  0.681

*Таксон  1:   3,  7, 14.

Остальные таксоны единичные.

Таксономия при RO =  0.597

*Таксон  1:   3,  5,  7, 11, 12, 14.

Остальные таксоны единичные.

Таксономия при RO =  0.514

*Таксон  1:   2,  3,  5,  6,  7, 10, 11, 12, 13, 14.

Остальные таксоны единичные.

Таксономия при RO =  0.430

Все признаки  вошли в один таксон.


R0

МУВ

Устойчивость

0.764

3,14

неустойчивый

0.681

3,7,14

неустойчивый

0.597

3,5,7,11,12,14

неустойчивый

0,514

2,3,5,6,7,10,11,12,13,14

неустойчивый



Всего таксонов – 4

ρ = 78 %

По шкале интеллектуальных задач (ШИЗ) хорошо, т.к. 0,78 > 0,75 и 0,78 < 0,95.

Вывод: по результатам таксономии выявлено, что наиболее общие свойства и признаков 3, 14.


3.3.2.         Второй поток студентов.


В таблице, представленной ниже, даны результаты тестирования студентов из групп ИТ-18011,ВИ-18013,ВИ-18031 за 2008-2009г.





Фамилия

Имя

МК1

МК2

МК3

МК4

Прил.диф. исч.

МК5

МК6

МК7

МК8

Интегр.

МК12

Рег12

Рег13

МК13

МК14

ДУ

Сум

1

Байрамлы

Абдулла

0

0

25

50

25

25

25

17

0

25

70

0

0

0

25

0

287

2

Бачаев

Иван

25

0

25

25

21

0

0

0

0

38

50

0

0

0

 

0

183

3

Бездомова

Анна

0

75

75

25

188

50

25

50

0

 0

0

0

0

25

0

6

518

4

Беляева

Анастасия

0

100

 

50

234

38

30

50

0

0

50

0

0

75

63

167

856

5

Герасименко

Алена

25

71

25

25

131

 0

30

83

0

94

25

0

0

38

25

50

622

6

Добрых

Александр

50

 0

25

50

35

38

0

33

25

31

25

0

0

25

0

6

343

7

Иванов

Владимир

0

0

0

50

34

50

 0

 0

0

0

0

0

0

0

0

 0

134

8

Искорцева

Елена

0

0

100

75

100

38

25

50

25

0



0

 0

25

25

50

513

9

Киселев

Максим

0

100

 0

0

9

0

0

0

0

0

0

0

0

0

0

0

109

10

Козионов

Илья

0

50

0

0

19

50

0

25

 0

25

50

0

 0

25

0

0

244

11

Кузнецов

Александр

0

0

0

0

6

25

0

25

0

0

 0

 0

0

0

0

0

56

12

Нещерецкая

Ольга

50

38

25

0

96

38

0

100

0

156

25

0

0

0

25

111

663

13

Парищук

Иван

25

0

25

75

28

0

0

0

0

0

50

0

 0

0

0

0

203

14

Першин

Михаил

0

21

50

50

34

25

30

17

0

44

0





0

25

13

309

15

Петрова

Марина

0

50

50

75

138

13

5

0



44

0

0

0

0

25

44

443

16

Помехина

Ангелина

50

0

75

25

163

63

40

58

0

113

25

0

0

100

25

111

847

17

Родионов

Роман

0

25

 0

75

41

13

40

75

0

44

0

0

0

25

25

0

362

18

Самсонова

Эмилия

50

58

75

75

266

38

5

33

0

188

30

0



75

63

139

1094

19

Семагин

Артем

25

13

 0

 0

169

38

30

17

0

94

35

0

0

25

13

89

546

20

Тузин

Мирослав

25

0

0

75

22

0

0

0

0

0

25

0

0

13

0

17

176

21

Швецов

Артем

 

25

25

100

79

75

0

0

0

0

100

0

0

0

25

0

429

22

Батурин

Олег

25

50

25

50

24

38

25

50

25

25

50

0

 0

25

0

50

461

23

Белкина

Анна

25

50

75

25

250

38

5

75

25

63

50

0

0

63

50

167

959

24

Бухрякова

Светлана

50

8

0

0

88

13

0

58

0

38

 0

0

0

25

25

0

304

25

Ванчугов

Александр

25

38

0

0

16

13

0

0

 0

0

0

0

0

0

0

 0

91

26

Веретенникова

Екатерина

25

50

75

25

263

38

15

100

25

188

50

0

 0

63

38

306

1258

27

Годонюк

Дмитрий

50

38

75

50

40

50

30

38

25

25

 0

0

0

25

0

22

467

28

Демин

Алексей

0

0

0

25

13

50

0

58

25

0

0

0

 0

0

0

11

182

29

Костромина

Юлия

25

 

50

0

38

0

0

8

 0

19

0

0

0



0

0

140

30

Лейчук

Диана

75

50

50

50

484

50

75

75

0

375

50

0

0

75

63

167

1639

31

Локтеев

Илья

 0

13

0

50

21

13

0

0

0

6

0

0

0

0

0

0

102

32

Николаева

Дарья

0

25

0

0

18

13

5

25

0

13

0

0

0

0

25

11

134

33

Пряничникова

Евгения

25

0

0

50

28

0

25

25

0

0

 0

0

0

0

0

0

153

34

Разумова

Виктория

0

46

75

50

125

25

0

75

0

25

50

0

0

25

25

22

543

35

Фролова

Наталья

0

50

50

50

358

63

40

25

25

250

35

0

0

50

25

222

1243

36

Шевченко

Кристина

0

8

 

50

38

0

15

50

0

6

0

0

0

25

44

23

259

37

Базинская

Татьяна

0

 

25

25

0

0

0

0

0

0



0

0

13

0

6

68

38

Вешкурова

Кристина

25

38

0

75

24

13

5

33

0

25

50

0

0

0

0

50

337

39

Габдрахманова

Альбина

0

0

 

25

25

13

0

0

0

6

45

0

0

50

25

44

233

40

Горенко

Ольга

25

 

50

50

309

38

65

75

25

313

0



0

38

25

306

1317

41

Здобнова

Екатерина

0

25

75

25

15

0

15

33

0

38

0

0

0

25

0

19

269

42

Кащук

Юлия

25

25

25

50

54

0

0

0

0

63

5

0

0

0

38

67

351

43

Клепинин

Алексей

0

25

0

50

113

13

15

50

0

19

50

0

 0

0

38

11

382

44

Кобзарева

Дарья

0

 0

0

 0

 0

0

0

0

0

6

0

0

0

0

0

00

6

45

Козий

Екатерина

0

0

25

75

11



0

0



0

0

0

0

0

50

11

173

46

Масленников

Павел

0

0

0

50

119

13

30

50

0

25

50

0

0

50

25

111

522

47

Никифорова

Елена

25

25

50

50

113

0

0

75

25

75

50

0

0

0

25

67

579

48

Пузаков

Антон

0

50

25

75

84

0

30

0

0

25

60

 0

0

75

13

67

504

49

Путилова

Ирина

0

8

25

75

3

0

5

50

0

0

25

0

0

25

13

17

246

50

Русинов

Александр

0

0

50

50

20

25

15

0

0

25

0

0

0

50

19

17

270

51

Рычков

Антон

0

46

50

50

23

13

30

8

0

0

75

0

0

25

0

33

353

АНАЛИЗ ИНФОРМАТИВННОСТИ ПРИЗНАКОВ

Информационные веса признаков (в относит. единицах):

-------------------------------------------------------------------------------

Признак :    15     6      5      3      14     12     8      2      10     9 

-------------------------------------------------------------------------------

Инф. вес:  1.000  0.959  0.838  0.807  0.764  0.754  0.741  0.693  0.620  0.484

-------------------------------------------------------------------------------

-------------------------------------------------------------------------------

Признак :    13     7      11     1      4 

-------------------------------------------------------------------------------

Инф. вес:  0.472  0.417  0.292  0.251  0.000

-------------------------------------------------------------------------------


Вывод: В результате исследования информативности признаков было выявлено, что наиболее существенными признаками являются тесты № 15, 6 и 5.

ТАКСОНОМИЯ МНОЖЕСТВА ПРИЗНАКОВ

В результате выполнены следующие назначения:

начальное пороговое значение коэф-та парной корреляции (по модулю) - 0.955

конечное пороговое значение коэф-та парной корреляции (по модулю) -  0.003

шаг изменения порогового значения                                                     0.095

Таксономия при RO =  0.955

Все таксоны единичные.

Таксономия при RO =  0.860

*Таксон  1:   5, 10, 14, 15.

Остальные таксоны единичные.

Таксономия при RO =  0.765

*Таксон  1:   5, 10, 14, 15.

Остальные таксоны единичные.

Таксономия при RO =  0.669

*Таксон  1:   5, 10, 14, 15.

Остальные таксоны единичные.

Таксономия при RO =  0.574

*Таксон  1:   5,  7, 10, 12, 13, 14, 15.

Остальные таксоны единичные.

Таксономия при RO =  0.479

*Таксон  1:   3,  5,  6,  7,  8,  9, 10, 12, 13, 14, 15.

Остальные таксоны единичные.

Таксономия при RO =  0.384

*Таксон  1:   1,  3,  5,  6,  7,  8,  9, 10, 12, 13, 14, 15.

Остальные таксоны единичные.

Таксономия при RO =  0.288

*Таксон  1:   1,  2,  3,  5,  6,  7,  8,  9, 10, 12, 13, 14, 15.

Остальные таксоны единичные.

Таксономия при RO =  0.193

Все признаки  вошли в один таксон.

R0

МУВ

Устойчивость

0.860

5,10,14,15

устойчивый

0.765

5,10,14,15

0.669

5,10,14,15

0,574

5,7,10,12,13,14,15

неустойчивый

0,479

3,5,6,7,8,9,10,12,13,14,15

неустойчивый

0,384

1,3,5,6,7,8,9,10,12,13,14,15

неустойчивый

0,288

1,2,3,5,6,7,8,9,10,12,13,14,15

неустойчивый

Всего таксонов – 7

ρ = 81 %

По шкале интеллектуальных задач (ШИЗ) хорошо, т.к. 0,81 > 0,75 и 0,81 < 0,95.

Вывод: по результатам таксономии выявлено, что наиболее общие свойства и признаков 5, 10, 14, 15.
3.
3.3. Третий поток студентов.

В таблице, представленной ниже, даны результаты тестирования студентов из групп ИТ-28011,ВИ-28013,ВИ-28031 за 2008-2009г.



Фамилия

Имя

МК1

МК2

ФНП

МК3

МК4

МК5

МК6

МК7

ИПФ

МК8

МК9

МК10

МК11

ВА

МК12

МК13

Сум

1

Лейчук

Диана

50

38

190

67

38

50

75

50

315

75

75

42

71

445

58

17

1656

2

Шевякова

Зоя

25

75

246

47

50

75

50

100

266

75

75

100

96

225

33

50

1589

3

Фролова

Наталья

50

0

216

50

0

75

75

25

367

25

  0

50

75

300

25

25

1358

4

Нещерецкая

Ольга

13

50

215

60

38

25

25

25

233

75

0

50

67

414

25

25

1340

5

Горенко

Ольга

42

0

310

68

25

0

75

75

219

50

75

50

43

178

71

25

1305

6

Помехина

Ангелина

4

100

308

67

50

50

50

0

140

50

25

42

50

255

58

8

1257

7

Веретенникова

Екатерина

8

50

184

42

50

25

0

50

149

25

50

38

50

316

100

0

1137

8

Самсонова

Эмилия

50

38

192

80

50

25

0

25

150

25

0

0

64

300

25

0

1024

9

Масленников

Павел

8

0

92

50

25

13

25

75

80

25

0

50

75

241

92

75

925

10

Беляева

Анастасия

13

25

154

80

25

25

25

0

186

25

25

38

58

178

50

8

915

11

Добрых

Александр

33

63

215

42

75

0

0

0

117

50

0

92

71

55

33

0

846

12

Герасименко

Алена

17

13

69

17

25

63

25

0

67

25

25

13

25

219

75

25

701

13

Белкина

Анна

0

25

16

60

25

25

25

25

123

50

0

38

21

141

58

8

640

14

Рычков

Антон

17

0

108

13

0

0

0

33

37

25

0

25

44

202

75

8

587

15

Ястребинский

Василий

4

25

69

0

25

21

25

0

42

50

25

50

25

190

0

0

550

16

Кащук

Юлия

17

0

152

25

0

25

25

0

50

50

0

31

21

81

33

0

511

17

Петрова

Марина

25

25

115

0

0

0

25

63

100

25

0

13

0

84

0

25

500

18

Искорцева

Елена

0

13

38

38

0

38

0

21

35

0

50

38

42

128

58

0

498

19

Никифорова

Елена

25

0

45

25

25

25

50

0

77

25

 

13

46

47

50

8

461

20

Шугалия

Кирилл

33

13

62

8

0

8

25

0

57

50

25

33

50

74

0

0

439

21

Семагин

Артем

25

25

31

0

0

38

0

0

33

50

0

63

46

48

50

8

417

22

Пузаков

Антон

0

25

46

0

0

46

25

0

38

0

0

75

25

90

33

0

403

23

Локтеев

Илья

 0

0

23

0

0

0

0

 0

14

0

0

13

50

156

100

33

390

24

Батурин

Олег

17

0

30

33

0

38

0

0

37

50

25

13

0

63

50

0

354

25

Чащин

Сергей

13

0

31

0

25

46

25

25

54

0

0

38

17

36

25

0

333

26

Сергеев

Денис

8

0

92

50

0

0

0

0

39

0

25

13

25

81

0

0

333

27

Клепинин

Алексей

25

0

62

17

0

0



0

15

 0

0

8

43

50

58

50

328

28

Родионов

Роман

0

38

38

17

0

0

0

 0

11

50

0

42

46

17

42

13

312

29

Бездомова

Анна

13

0

31

13

0

13

0

13

62

0

0

17

25

44

83

0

311

30

Соловьев

Евгений

17

0

31

42

25

13

0

0

38

0

0

25

50

37

25

0

302

31

Разумова

Виктория

33

0

31

42

0

 

25

21

65

0

13

0

14

31

0

8

283

32

Бухрякова

Светлана

25

0

23

5

0

25

0

0

73

0

0

6

17

19

75

8

276

33

Шевченко

Кристина

0

0

45

33

0

0

25

0

63

0

25

8

50

25

0

0

275

34

Путилова

Ирина

0

0

23

13

0

0

25

0

22

25

50

31

0

32

33

8

262

35

Здобнова

Екатерина

8

0

31

13

0

0

0

25

30

0

0

6

 0

104

25

0

243

36

Тузин

Мирослав

38

0

23

17

0

38

0

25

0

0

25

0

0

44

8

0

217

37

Годонюк

Дмитрий

38

0

 

43

0

0

25

0

26

0

6

31

21

0

0

21

211

38

Швецов

Артем

50

0

0

0

0

25

 0

25

33

0

50

0

0

0

0

0

183

39

Байрамлы

Абдулла

0

0

15

17

0

13

0

25

14

0

25

25

17

31

0

0

182

40

Габдрахманова

Альбина

25

0

23

0

0

13

0

0

47

0

0

8

25

 0

8

0

149

41

Першин

Михаил

17

0

23

0

0

0

0

0

9

25

0

0

17

21

25

0

136

42

Русинов

Александр

0

0

8

25

0

0

0

0

29

0

0

0

14

24

0

25

125

43

Тормышова

Виктория

0

0

0

0

0

0

0

 0

0

0

25

0

17

60

0

0

102

44

Бачаев

Иван

8

0

0

17

0

0

0

13

0

0

25

0

0

 0

33

0

96

45

Кобзарева

Дарья

8

0

8

0

0

0

 0

0

3

50

 0

8

0

12

0

0

90



АНАЛИЗ ИНФОРМАТИВННОСТИ ПРИЗНАКОВ

Информационные веса признаков (в относит. единицах):

-------------------------------------------------------------------------------

Признак :    17     10     14     3      13     12     7      9      5      15

-------------------------------------------------------------------------------

Инф. вес:  1.000  0.940  0.877  0.873  0.761  0.684  0.664  0.577  0.568  0.566

-------------------------------------------------------------------------------

-------------------------------------------------------------------------------

Признак :    2      6      4      8      16     1      11

-------------------------------------------------------------------------------

Инф. вес:  0.528  0.519  0.512  0.279  0.125  0.015  0.000

-------------------------------------------------------------------------------

Вывод: В результате исследования информативности признаков было выявлено, что наиболее существенными признаками являются тесты № 17, 10 и 14.

ТАКСОНОМИЯ МНОЖЕСТВА ПРИЗНАКОВ

Параметры алгоритма таксономии устанавливаются автоматически. Для этого выполняется расчет макс. и мин. (по модулю) значений коэффициента парной корреляции. В результате выполнены следующие назначения:

начальное пороговое значение коэф-та парной корреляции (по модулю) - 0.912

конечное пороговое значение коэф-та парной корреляции (по модулю) -  0.007

шаг изменения порогового значения                                                     0.091

Таксономия при RO =  0.912

Все таксоны единичные.

Таксономия при RO =  0.821

*Таксон  1:   3,  9, 14, 17.

Остальные таксоны единичные.

Таксономия при RO =  0.731

*Таксон  1:   2,  5.

*Таксон  2:   3,  7,  9, 13, 14, 17.

Остальные таксоны единичные.

Таксономия при RO =  0.640

*Таксон  1:   2,  3,  4,  5,  7,  9, 10, 13, 14, 17.

Остальные таксоны единичные.

Таксономия при RO =  0.550

*Таксон  1:   2,  3,  4,  5,  6,  7,  8,  9, 10, 12, 13, 14, 17.

Остальные таксоны единичные.

Таксономия при RO =  0.459

*Таксон  1:   1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 16,

             17.

Остальные таксоны единичные.

Таксономия при RO =  0.369

Все признаки  вошли в один таксон.

R0

МУВ

Устойчивость

0.821

3,9,14,17

неустойчивый

0.731

3,7,9,13,14,17

неустойчивый

0.640

2,3,4,5,7,9,10,13,14,17

неустойчивый

0,550

2,3,4,5,6,7,8,9,10,12,13,14,17

неустойчивый

0,459

1,2,3,4,5,6,7,8,9,10,11,12,13,14,16

неустойчивый

Всего таксонов – 5

ρ = 76 %

По шкале интеллектуальных задач (ШИЗ) хорошо, т.к. 0,76 > 0,75 и 0,76 < 0,95.

Вывод: по результатам таксономии выявлено, что наиболее общие свойства и признаков 3,9, 14, 17.

3.    ЗАКЛЮЧЕНИЕ


В ходе выполнения работы были собранны и проанализированы данные об успеваемости студентов при помощи пакета «КВАЗАР».

Выявив наиболее существенные тесты по трем потокам, мы получили следующие результаты:

·        В потоке студентов из групп ИТ-190101,ВИ-190102,ВИ-190301 наиболее существенными тестами оказались тесты № 12, 5 и 3.

·        В потоке студентов из групп ИТ-18011,ВИ-18013,ВИ-18031 наиболее существенными тестами оказались тесты № 15, 6 и 5.

·        В потоке студентов из групп ИТ-28011,ВИ-28013,ВИ-28031 наиболее существенными тестами оказались тесты № 12, 5 и 3.

Также по результатам таксономии можно сделать следующие выводы:

·        Общие свойства имеют признаки 3, 14, т.к. тест № 3 является существенным, то можно сделать вывод, что тест № 14 можно также отнести в группу существенных признаков.

·        Общие свойства имеют признаки 5, 10, 14, 15, т.к. тесты № 5 и 15 является существенным, то можно сделать вывод, что тесты № 10 и 14 можно также отнести в группу существенных признаков.

·        Общие свойства имеют признаки 3,9, 14, 17, т.к. тест № 3 является существенным, то можно сделать вывод, что тесты № 9, 14 и 17 можно также отнести в группу существенных признаков.

По результатам анализа можно сделать вывод, что студенты, имеющие неудовлетворительные результаты по информативным признакам, могут быть в скором времени отчислены.

В общем можно сделать вывод, что тест № 5 является наиболее существенным, среди всех потоков.

Во всех трех потоках студентов мы получили оценку «хорошо» по шкале интеллектуальных задач (ШИЗ), следовательно, можно сделать вывод, что с помощью методов ИИ можно прогнозировать результаты успеваемости студентов.

4.    ЛИТЕРАТУРА


1.     Горелик, Александр Леопольдович. Методы распознавания: Учеб. пособие для вузов / А. Л. Горелик, В. А. Скрипкин. - 3-е изд., перераб. и доп. - М.: Высшая школа, 1989. - 232 с.

2.     Генкин, Виталий Леонидович. Системы распознавания автоматизированных производств / В.Л. Генкин, И.Л. Ерош, Э.С. Москалев. - Л.: Машиностроение, 1988. - 246с.

3.     Яблонский, Феликс Максимович. Средства отображения информации: Учеб. для вузов по специальности "Пром. электроника" / Ф. М. Яблонский, Ю. В. Троицкий. - М.: Высшая школа, 1985. - 200 с.: ил.; 22 см. - Библиогр.: с. 196 (23 назв.). - Предм. указ.: с. 198-199.

4.     Гольдштейн С. Л. Введение в системологию и системотехнику / Ин-т развития регион. образов., подгот. и переподгот. пед. работников. - Екатеринбург: Б. и., 1994. - 198с. Гоппа, Валерий Денисович. Введение в алгебраическую теорию информации / В. Д. Гоппа. - М.: Наука. "Физ.-мат.лит.", 1995. - 108 с.: ил.; 22 см. - Библиогр.: с. 108

5.     Век радио: Перспективные пути развития антенных систем космической связи, теории управления и распознавания образов: Сб. науч. тр. / Под ред. Н.И. Черных; Редкол.: А.Ф. Богомолов, Н.Н. Красовский, В.Г. Лабунец и др. ; УрО РАН, Ин-т математики и механики. - Екатеринбург: Б. и., 1996. - 296с.

6.     Бухалев, Вадим Алексеевич. Распознавание, оценивание и управление в системах со случайной скачкообразной структурой. - М.: Наука. Физматлит, 1996. - 288с.

7.     Загоруйко, Николай Григорьевич. Прикладные методы анализа данных и знаний. - Новосибирск: Изд-во Ин-та математики, 1999. - 270 с.

8.     Пестряков, Владимир Борисович. Индивидуальное прогнозирование состояния РЭА с использованием теории распознания образов: Учеб. пособие. - Куйбышев: КуАИ, 1980. - 88 с.

1. Курсовая Производство ассортимент и товароведная оценка сливочного масла
2. Реферат на тему ArabIsraeli Wars Essay Research Paper Since the
3. Реферат на тему Преподобный Нил Сорский
4. Реферат Управление трудовыми противоречиями в коллективе на примере гостиницы Националь
5. Курсовая Требования, предъявляемые к менеджеру
6. Реферат Бредовский поход
7. Реферат Резервы снижения комплексных расходов
8. Статья на тему О проблемах идентичности
9. Реферат Понятие характера 3
10. Реферат Стратеги розвитку України