Реферат

Реферат Здоровый образ жизни граждан РФ - реальность

Работа добавлена на сайт bukvasha.net: 2015-10-28

Поможем написать учебную работу

Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.

Предоплата всего

от 25%

Подписываем

договор

Выберите тип работы:

Скидка 25% при заказе до 11.11.2024




Кафедра № 32
ПРАКТИЧЕСКАЯ РАБОТА

по специальности

297900 - Управление информационно-аналитической деятельностью (ФСО России)
Дисциплина: «Информационные технологии в системах управления

и обработке информации»
Контент-анализ текстов на тему:

"Здоровый образ жизни граждан РФ - реальность".



Задачей данной работы является контент-анализ текстов из коллекции Internet (российских и зарубежных) с использованием поисковых технологий и программ анализа текстов по теме (гипотезе): «Здоровый образ жизни граждан РФ - реальность».

К отбираемым сообщениям (материалам) предъявлялись следующие требования:

·        сообщения должны соответствовать указанной теме;

·        сообщения должны быть актуальными (датированы 2009-2011 гг.)

Поиск проводился через наиболее популярные поисковые машины Яндекс (www.yandex.ru) и Google (www.google.com).

Исходя из первичного анализа найденных текстов по запросу "Здоровый образ граждан РФ" мы получили большое количество нерелевантных документов. В связи с чем, запросы для поиска были изменены и оптимизированы. Использованы синонимы, специальный язык запросов поисковых систем. Например, для поисковой системы Google запрос выглядел следующим образом: (~Россия) or (~"Российская Федерация") ~здоровье граждан (~реальность or ~миф) ~можно ли быть здоровым (~сегодня or ~завтра).

Среди найденных статей было отобрано 10 сообщений для проведения анализа (представлены в папке "Статьи").
Реферирование документов

Реферирование документов производилось с помощью программы "SSSummarizer 4.0". Рефераты некоторых текстов, для сравнения, были подготовлены также программой Microsoft Word.

Настройки программы SSSummalizer представлены на рис. 1. В связи с небольшим объемом исходных текстов, установлены параметры реферата в 6 предложений.



Рис. 1 Настройки программы SSSummalizer

Рефераты, подготовленные программой SSSummarizer не подвергались ручной правке и представлены в том виде, в котором они сделаны программой (папка "Рефераты"). Один из рефератов, подготовленных в программе SSSummarizer, представлен на рисунке 2.


Рис. 2 Реферат, подготовленный SSSummalizer
Также реферирование текстов было проведено с помощью программы Text Analist, один из результатов представлен на рисунке 3.


Рис. 3 Реферат, подготовленный Text Analist
Частотный анализ

С помощью программы Textans был проведен частотный анализ слови словосочетаний, встречающихся в выбранных статьях. Для анализа использовались такие кодовые слова как:

- здоровый образ граждан РФ;

- реальность;

- миф



Рис. 4 Частотный анализ

Проведенный частотный анализ 10 статей показал, что словосочетание «Здоровый образ жизни граждан РФ»  встречается 78 раз; слово «реальность» - встречается 55 раз; слово миф – 19 раз.
Рубрицирование коллекции документов

Для обработки большого объема сообщений, а точнее выбора сообщений определенной тематики, удобно провести классификацию документов. Это необходимо для того, чтобы сузить спектр возможных значений. Такие методы, как правило, носят статистический характер и применяются в технологии классификации текстов.

Программа классификации текстов Rubryx, которую предполагается использовать, отличается следующими технологическими решениями:

·       Классификация осуществляется на основе тематического словаря, созданного заранее в специальном формате, который содержит однословные, двусловные и трехсловные термины.

·       Для эффективной классификации необходимо участие эксперта, который подбирает образцы текстов для каждой рубрики (3-5 образцов). В нашем случае 1 эксперт.

·       На основании отобранных образцов автоматически формируется микрословарь для каждой рубрики, который уже в дальнейшем служит основным критерием отбора текстов для этой рубрики.

·       При классификации текстов на основании совпадения терминов из микрословаря и лексики документа расчитывается коэффициент родства документа и текущей рубрики.

·       Эксперт делает опытный прогон для определения порога, при превышении которого документ автоматически причисляется к текущей рубрике.

·       После настройки рубрикатора, микрословарей и порога осуществляется автоматическая классификация и формируется отчет о результатах работы.

Таким образом, при использовании технологии Rubryx существенно сокращается объем ручной работы. Использование словосочетаний значительно повышает надежность классификации даже на небольших документах. Этот эффект объясняется практически отсутствием многозначности у словосочетаний.

В рамках нашей работы воспользуемся представленным выше алгоритмом и проанализируем имеющиеся тексты.

Исходя из предварительного анализа первичных документов, видно, что основными темами публикаций последнего времени являются статьи в основе своей отражающие реальность здорового образа жизни. Более того, основная тематика статей направлена на подтверждение гипотезы о реальности здорового образа жизни. Авторы некоторых статей задаются вопросом о реальности или нереальности ЗОЖ и пытаются провести параллели.  Поэтому создадим рубрики, и проведем обучение программы на эталонных документах по этим темам (рис. 3).


Рис. 3 Рубрики в программе Rubryx



Вывод

Анализ публикаций в целом доказывает первоначально выдвинутую гипотезу.

 Проведенный контент-анализ статей позволяет сделать следующие выводы:

1. Статьи о здоровом образе граждан РФ превалируют среди статей о здоровом образе жизни всех жителей планеты. Статьи написаны простым, понятным языком, доступным широкой аудитории. В статьях активно используются иллюстративные материалы (фотографии, рисунки).

2. Материалы, публикуемые в газете, имеют однобокую тематическую направленность. Подробно освещаются такие темы как здоровье миф или реальность, как быть здоровым, возможно ли в современном мире остаться здоровым.

3. Большинство материалов газеты имеют фактографическую и позитивную направленность. С положительной стороны показана деятельность по сохранению своего здоровья и здоровья все нации. Большинство негативных материалов посвящено бездействию государства в отношении ЗОЖ своих граждан. Однако таких статей слишком мало. При этом доля проблемных аспектов невелика, что свидетельствует о некоторой неконструктивности критики.

Таким образом, проведенная проверка гипотезы исследования показывает, что, несмотря на вышеупомянутые недочеты, ЗОЖ граждан РФ в современном мире - реальность.



1. Реферат Расчеты с персоналом по оплате труда
2. Реферат Видавнича діяльність Комп ютерні видавничі системи
3. Реферат на тему Prostate Cancer Essay Research Paper Moiz BhinderwalaClass
4. Диплом на тему Використання проблемних ситуацій на уроках Основи здоровя у початковій школі
5. Биография Шукшин В. М.
6. Реферат Бронхиальная астма и ее профилактика
7. Сочинение на тему Чернышевский н. г. - Нравственные искания русской интеллигенции в 19 веке
8. Реферат Рынок труда и ценообразование на труд
9. Реферат на тему Hemingway
10. Реферат Структурные уровни организации материи Микро макро мега миры