Диплом на тему Статистический анализ связи
Работа добавлена на сайт bukvasha.net: 2014-10-30Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
от 25%
договор
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
МЕЖДУНАРОДНЫЙ ИНСТИТУТ ФИНАНСОВ, УПРАВЛЕНИЯ И БИЗНЕСА
КАФЕДРА ЭКОНОМИКИ И УПРАВЛЕНИЯ СОБСТВЕННОСТЬЮ
Курсовая работа
По дисциплине: Статистика
На тему: Статистический анализ связи
Выполнила студентка группы
25ИМ702
Серёгина М. М.
Научный руководитель
Панфилов С.А.
Тюмень 2008
Содержание
Введение
1. Теоретическое обоснование связи между показателями. Определение методологии исследования связи
2. Исследование вариационного ряда
3. Исследование связи. Проверка статистической значимости
Заключение
Список литературы
Приложение №1
Приложение №2
Приложение №3
Приложение №4
Приложение №5
Приложение №6
Приложение №7
Приложение №8
Введение
Для исследования статистической связи взяли два показателя:
1. Среднедушевые денежные доходы населения в месяц по субъектам Российской Федерации за 2004 год, руб.
2. Число собственных легковых автомобилей на 1000 человек населения по субъектам Российской Федерации на конец 2006 года, шт.
Эти показатели вызывают интерес для изучения, так как в последнее время можно заметить резкий рост количества покупаемых автомобилей в России. Вместе с тем происходит и постепенное увеличение доходов населения. Таким образом, выбранные показатели являются актуальными. Поэтому поставлена цель, выявить закономерность между этими фактами, если она существует, объяснить ее. Если же никакой связи обнаружено не будет, то возникнет необходимость разобраться в причинах.
Объектом исследования в нашей работе являются показатели среднедушевых доходов населения и числа собственных легковых автомобилей. Предметом исследования – взаимосвязь этих показателей.
Цель проводимого исследования – выявить между показателями зависимость и объяснить ее, либо объяснить ее отсутствие.
В соответствии с целью перед нами ставятся следующие задачи:
1. Сделать предположение о наличии связи между показателями, объяснить это теоретически;
2. Исследовать вариационный ряд, рассчитать его числовые характеристики;
3. Исследовать взаимосвязь показателей, составить модель парной линейной регрессии, проверить ее значимость;
4. Сделать соответствующие выводы и объяснить полученные результаты.
Данная курсовая работа состоит из трех глав, введения и заключения. В первой главе теоретическое обоснование предположения о наличии связи. Во второй исследуем вариационный ряд и находим его числовые характеристики. В третьей главе решаем вопрос о наличии связи между показателями и делаем выводы.
1. Теоретическое обоснование связи между показателями и методологии исследования связи
Доходы населения - сумма денежных средств и материальных благ, полученных или произведенных домашними хозяйствами за определенный промежуток времени. Денежные доходы населения включают оплату труда, доходы от предпринимательской деятельности, пенсии, стипендии, различные пособия, доходы от собственности в виде процентов, дивиденды, ренту, средства от продажи ценных бумаг, недвижимости, продукции сельского хозяйства, различных изделий, а также доходы от различных услуг, оказанных на стороне. С ростом благосостояния населения его потребности постепенно увеличиваются, происходит переход от базовых потребностей и не требующих больших затрат для удовлетворения к все более «дорогостоящим», например, обзавестись личным автомобилем. К тому же при увеличении доходов населения повышается уровень жизни. Поэтому приобретение нового автомобиля может быть необходимо для поддержания статуса, некого стандарта.
Предположим, что выбранные показатели – доходы населения и число собственных легковых автомобилей связаны между собой. При наличии такой связи факторным признаком будет именно доходы населения, а число автомобилей – результативным, так как при увеличении доходов у людей появляется больше возможностей приобрести автомобиль. Так как перед такой покупкой нужно сделать некие накопления и для этого нужно некоторое время, поэтому возьмем для исследования данные по доходам населения за 2004 год, а число автомобилей – на конец 2006 года. Таким образом, исследование взаимосвязи будет более корректным.
Методология исследования связи: 1) Анализ факторного признака – доходов населения. 2) Нахождение среднего значение и отклонение вариант признака от средней величины, вычисление среднего линейного и квадратического отклонения, дисперсии, коэффициента вариации, а так же указывается смысл рассчитываемых показателей.
3) Применение показателя корреляции рангов, построение модели парной линейной регрессии, проверка качества полученного уравнения с помощью коэффициента детерминации и F-статистики и t-статистики. После расчета можно делать выводы о наличии или отсутствии связи.
2. Исследование вариационного ряда
Произведем механическую выборку из имеющихся данных по 87 субъектам Российской Федерации. Для этого из генеральной совокупности сначала исключим города федерального значения: Москву и Санкт-Петербург, так как показатели по этим субъектам сильно отличаются от остальных и будут оказывать большое влияние на общие характеристики совокупности. Далее выбираем каждое четвертое значение и включаем его в выборочную совокупность. Таким образом, получаем таблицу с данными по 21 субъекту Российской Федерации. Ранжируем полученный вариационный ряд по факторному признаку – среднедушевому денежному доходу населения (Приложение №2).
Произведем группировку. В качестве группировочного признака примем факторный признак – среднедушевой доход населения. Для удобства последующих расчетов и применения, полученных в ходе группировки данных используем равные закрытые интервалы.
Найдем число интервалов (групп) по формуле:
1 + 3,322 * lg (n),
где n – объем выборочной совокупности;
1 + 3,322 * lg (21) = 5,39241.
Округлив полученное значение, имеем число групп = 6.
Разбиваем выборочную совокупность на 6 интервалов. Для этого необходимо найти величину i интервала:
QUOTE ,
где r – размах вариации, n – число групп, которое необходимо организовать.
Размах вариации найдем по формуле:
QUOTE ;
QUOTE 16211,5-2923,8;
QUOTE 13287,7.
Теперь вычисляем величину интервала:
i = 2214,616667
Используя найденные данные, разбиваем выборочную совокупность на 6 групп и считаем кол-во субъектов попавшие в каждый интервал.
Вариационный ряд распределения
Изобразим интервальный вариационный ряд графически. На оси абсцисс отложим интервалы значений признака, а на оси ординат – соответствующие частоты. Полученная фигура называется гистограммой распределения.
Составляем группировочную таблицу, где распределяем все субъекты по группам согласно величине дохода населения в месяц (Приложение №2). По этой таблице находим средние и общие значения для каждой группы и всей совокупности в целом (Приложение №3). Получаем значение среднего дохода на 1 субъект и среднее количество собственных легковых автомобилей на 1 субъект. То есть:
QUOTE = 7637,87143
QUOTE 164,44762
Так же можно сказать, что для Российской Федерации в 2004 году был характерен среднедушевой доход в размере от 5138,416667 руб. до 7353,033334 руб., так как именно в этой группе больше всего субъектов – 13, что составляет около 62 % от всей выборочной совокупности.
Этот факт дает основание считать, что именно во втором интервале находится мода, то есть наиболее часто повторяющееся значение признака. Рассчитаем моду по формуле:
QUOTE ,
Где QUOTE - нижняя граница модального интервала,
QUOTE - величина модального интервала,
QUOTE - частота модального интервала,
QUOTE - частота интервала, предшествующего модальному,
QUOTE - частота интервала, следующего за модальным.
M0 = 6298,45397
Вычислим теперь медиану, то есть варианту, которая расположена в середине вариационного ряда. Ее удобнее находить не по интервальному ряду, а по дискретному, то есть без группировки. Так как дискретный ряд состоит из 21 субъекта, то есть число членов нечетное, то медианой является варианта, расположенная в середине упорядоченного, то есть ранжированного ряда. Таким образом:
QUOTE 6706,9 руб.
Можно сделать вывод, что ровно в половине исследуемых субъектов (10) в 2004 году среднедушевой доход населения был меньше, чем 4909,5 руб., и в то же время, ровно в половине субъектов (10) она была больше этого значения.
Для того, чтобы дать обобщенную характеристику отклонений значений величины дохода населения от средней, вычислим среднее линейное отклонение. Для этого используем уже найденное нами значение среднего дохода населения на 1 субъект QUOTE , определим отклонение каждой из 21 вариант от средней, рассчитаем абсолютную сумму величин отклонений (Приложение №4).
Теперь подставим найденные значения в формулу:
Где QUOTE - абсолютная сумма величин отклонений,
QUOTE - общее число значений.
И вычислим среднее линейное отклонение:
QUOTE 2148,31156 руб.
Следовательно, каждое значение среднедушевого дохода населения для 1 из субъектов РФ в среднем отклоняется от средней величины на 2148,31156 руб.
Основными обобщающими показателями вариации в статистике являются дисперсия и среднее квадратическое отклонение. Дисперсия представляет собой среднее арифметическое квадратов отклонений каждого значения признака от общей средней и вычисляется по формуле:
Где QUOTE - сумма квадратов отклонений признака,
QUOTE - общее число значений.
Используя расчетную таблицу (Приложение №4), вычислим дисперсию для дохода населения:
QUOTE 8933139,1 QUOTE
Для сопоставления найденной величины со значениями признака целесообразно рассчитать среднее квадратическое отклонение.
QUOTE ;
QUOTE =2988,83574.
Среднее квадратическое отклонение дает обобщающую характеристику колеблемости всех значений совокупности, наиболее же распространенным показателем колеблемости, используемым для оценки типичности средних величин, является коэффициент вариации.
Используя формулу:
Вычислим коэффициент вариации для значений дохода населения:
QUOTE 39,13179 %.
Так как найденный коэффициент вариации V<40%, то нельзя сказать, что колеблемость признака в изучаемой совокупности большая. Однако то, что полученное значение близко к 40, свидетельствует о довольно сильной колеблемости значений среднедушевого дохода населения по различным субъектам Российской Федерации.
3. Исследование связи. Проверка статистической значимости
Изучив характеристики факторного признака – среднедушевого дохода населения по субъектам РФ за 2004 год, приступим к изучению корреляционной связи между этим показателем и количеством собственных легковых автомобилей по субъектам РФ в 2006 году. При этом мы проверим предположение о возможности существования такой связи и, если она присутствует, установим количественные оценки тесноты этой связи, то есть степень влияния дохода населения на количество собственных автомобилей.
Для начала воспользуемся одним из самых простых методов оценки тесноты и формы связи – с помощью показателя корреляции рангов.
В ранжированном ряду (Приложение №1) каждому из значений денежных дохода населения и количества легковых автомобилей присвоим ранги от 1 до 21, показывающие увеличение значений (Приложение №5).
Теперь найдем разницу между рангами денежных доходов и количества автомобилей для каждого субъекта соответственно и квадраты этих разниц (Приложение №6). Полученное значение суммы квадратов разницы рангов равно 940, оно значительно больше нуля. Поэтому сразу отвергаем гипотезу о наличии прямой связи между доходом и количеством собственных автомобилей. Гипотезу об обратной связи тоже придется отвергнуть, так как в пяти случаях разница рангов равна 0, следовательно, значение квадрата разности не максимально. В итоге можем сделать предположение, что связь вовсе отсутствует. Для того, чтобы это проверить, построим регрессионную модель, наиболее простой формой которой является модель парной линейной регрессии:
QUOTE ,
Где QUOTE - математическое ожидание значения количества собственных легковых автомобилей,
а - константа, отражающая постоянное влияние факторов,
QUOTE - коэффициент регрессии, характеризующий величину, на которую изменяется значение количества собственных легковых автомобилей при изменении заработной платы,
QUOTE - величина дохода.
Для нахождения коэффициентов а и QUOTE составляем вспомогательную расчетную таблицу (Приложение №7).
Далее вычисляем коэффициент QUOTE по формуле:
QUOTE ;
QUOTE 0,004075271;
И константу а:
QUOTE ;
QUOTE 133,3212222
Таким образом, получили уравнение модели:
QUOTE = 133,32122+0,00408*x
На основании данного уравнения можно сказать, что при изменении денежного дохода на 1 единицу, количество собственных автомобилей изменяется на 0,00408, что является очень маленькой и незначительной величиной.
Теперь проверим качество линейного уравнения регрессии с помощью коэффициента детерминации QUOTE . С его помощью мы выявим степень вариации числа собственных автомобилей, определяемую вариацией значений дохода населения.
Коэффициент детерминации рассчитывается по формуле:
QUOTE ;
QUOTE ;
QUOTE =0,052442977
Полученное значение меньше 0,3. На основании этого можно сказать, что связь между показателями отсутствует. Вариация количества собственных автомобилей лишь приблизительно на 1% определяется вариацией значений дохода населения. Однако значение коэффициента детерминации может быть случайным и являться результатом совпадений, поэтому необходимо провести проверку статистической значимости уравнения в целом и отдельных его параметров с помощью F- и t-статистики.
F-статистика характеризует статистическую значимость уравнения в целом и рассчитывается по формуле:
QUOTE ;
F=4,38
По таблице критических точек распределения Фишера-Снедекора при уровне значимости QUOTE и числах степеней свободы k1=1 и k2 =(n-2) =19 находим Ft QUOTE = 4,38.Так как QUOTE , то найденное уравнение регрессии, устанавливающее зависимость доходов и количества личных автомобилей, не значимо.
Однако проверим все же на статистическую значимость и отдельные параметры уравнения, то есть a и b. Для этого рассчитаем сначала стандартные ошибки для параметров:
QUOTE ;
QUOTE 32,5949381
QUOTE
QUOTE =0,0039741.
А теперь вычислим t-статистику:
QUOTE ;
QUOTE 4,090243147;
QUOTE ;
QUOTE 1,025457739;
По таблице распределения Стьюдента для числа степеней свободы
n-2=19 находим значение tтабл= 2,093.
Теперь сравниваем полученные значения t-статистики с табличным значением.
QUOTE > QUOTE , значит параметр а является статистически значимым.
QUOTE < QUOTE , значит параметр b статистической значимости не имеет.
Несмотря на то, что параметр а значим, в целом модель статистической значимости не имеет, а это говорит об отсутствии связи между доходом населения и числом собственных легковых автомобилей. Значит, уравнение модели нельзя использовать для статистических расчетов и прогнозов, поскольку связи нет, следовательно, отразить зависимость показателей оно не может, что видно на графике (Приложение №8). Здесь точками показаны исходные данные для 21 субъекта Российской Федерации, а линия – это графическое представление уравнения регрессии.
Остается разобраться в причинах отсутствии связи между, казалось бы, на первый взгляд, взаимосвязанными показателями как денежный доход населения и количество покупаемых автомобилей. Это может быть вызвано рядом причин: влияние дохода на приобретение автомобиля является не основным, а косвенным фактором. Так как не было учтено влияние других социально-экономических факторов. Так же сыграла роль нестабильная экономическая ситуация в стране, неуверенность в сохранении тенденции роста дохода так же могут вынуждать людей быть более осторожными и не совершать дорогих покупок. Так же имеет место быть недавний скачок в росте числа приобретаемых населением автомобилей, который может быть связан с доступностью потребительских кредитов, что позволяет покупать автомобили все большему числу людей, несмотря на их доход.
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
ТЮМЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
МЕЖДУНАРОДНЫЙ ИНСТИТУТ ФИНАНСОВ, УПРАВЛЕНИЯ И БИЗНЕСА
КАФЕДРА ЭКОНОМИКИ И УПРАВЛЕНИЯ СОБСТВЕННОСТЬЮ
Курсовая работа
По дисциплине: Статистика
На тему: Статистический анализ связи
Выполнила студентка группы
25ИМ702
Серёгина М. М.
Научный руководитель
Панфилов С.А.
Тюмень 2008
Содержание
Введение
1. Теоретическое обоснование связи между показателями. Определение методологии исследования связи
2. Исследование вариационного ряда
3. Исследование связи. Проверка статистической значимости
Заключение
Список литературы
Приложение №1
Приложение №2
Приложение №3
Приложение №4
Приложение №5
Приложение №6
Приложение №7
Приложение №8
Введение
Для исследования статистической связи взяли два показателя:
1. Среднедушевые денежные доходы населения в месяц по субъектам Российской Федерации за 2004 год, руб.
2. Число собственных легковых автомобилей на 1000 человек населения по субъектам Российской Федерации на конец 2006 года, шт.
Эти показатели вызывают интерес для изучения, так как в последнее время можно заметить резкий рост количества покупаемых автомобилей в России. Вместе с тем происходит и постепенное увеличение доходов населения. Таким образом, выбранные показатели являются актуальными. Поэтому поставлена цель, выявить закономерность между этими фактами, если она существует, объяснить ее. Если же никакой связи обнаружено не будет, то возникнет необходимость разобраться в причинах.
Объектом исследования в нашей работе являются показатели среднедушевых доходов населения и числа собственных легковых автомобилей. Предметом исследования – взаимосвязь этих показателей.
Цель проводимого исследования – выявить между показателями зависимость и объяснить ее, либо объяснить ее отсутствие.
В соответствии с целью перед нами ставятся следующие задачи:
1. Сделать предположение о наличии связи между показателями, объяснить это теоретически;
2. Исследовать вариационный ряд, рассчитать его числовые характеристики;
3. Исследовать взаимосвязь показателей, составить модель парной линейной регрессии, проверить ее значимость;
4. Сделать соответствующие выводы и объяснить полученные результаты.
Данная курсовая работа состоит из трех глав, введения и заключения. В первой главе теоретическое обоснование предположения о наличии связи. Во второй исследуем вариационный ряд и находим его числовые характеристики. В третьей главе решаем вопрос о наличии связи между показателями и делаем выводы.
1. Теоретическое обоснование связи между показателями и методологии исследования связи
Доходы населения - сумма денежных средств и материальных благ, полученных или произведенных домашними хозяйствами за определенный промежуток времени. Денежные доходы населения включают оплату труда, доходы от предпринимательской деятельности, пенсии, стипендии, различные пособия, доходы от собственности в виде процентов, дивиденды, ренту, средства от продажи ценных бумаг, недвижимости, продукции сельского хозяйства, различных изделий, а также доходы от различных услуг, оказанных на стороне. С ростом благосостояния населения его потребности постепенно увеличиваются, происходит переход от базовых потребностей и не требующих больших затрат для удовлетворения к все более «дорогостоящим», например, обзавестись личным автомобилем. К тому же при увеличении доходов населения повышается уровень жизни. Поэтому приобретение нового автомобиля может быть необходимо для поддержания статуса, некого стандарта.
Предположим, что выбранные показатели – доходы населения и число собственных легковых автомобилей связаны между собой. При наличии такой связи факторным признаком будет именно доходы населения, а число автомобилей – результативным, так как при увеличении доходов у людей появляется больше возможностей приобрести автомобиль. Так как перед такой покупкой нужно сделать некие накопления и для этого нужно некоторое время, поэтому возьмем для исследования данные по доходам населения за 2004 год, а число автомобилей – на конец 2006 года. Таким образом, исследование взаимосвязи будет более корректным.
Методология исследования связи: 1) Анализ факторного признака – доходов населения. 2) Нахождение среднего значение и отклонение вариант признака от средней величины, вычисление среднего линейного и квадратического отклонения, дисперсии, коэффициента вариации, а так же указывается смысл рассчитываемых показателей.
3) Применение показателя корреляции рангов, построение модели парной линейной регрессии, проверка качества полученного уравнения с помощью коэффициента детерминации и F-статистики и t-статистики. После расчета можно делать выводы о наличии или отсутствии связи.
2. Исследование вариационного ряда
Произведем механическую выборку из имеющихся данных по 87 субъектам Российской Федерации. Для этого из генеральной совокупности сначала исключим города федерального значения: Москву и Санкт-Петербург, так как показатели по этим субъектам сильно отличаются от остальных и будут оказывать большое влияние на общие характеристики совокупности. Далее выбираем каждое четвертое значение и включаем его в выборочную совокупность. Таким образом, получаем таблицу с данными по 21 субъекту Российской Федерации. Ранжируем полученный вариационный ряд по факторному признаку – среднедушевому денежному доходу населения (Приложение №2).
Произведем группировку. В качестве группировочного признака примем факторный признак – среднедушевой доход населения. Для удобства последующих расчетов и применения, полученных в ходе группировки данных используем равные закрытые интервалы.
Найдем число интервалов (групп) по формуле:
1 + 3,322 * lg (n),
где n – объем выборочной совокупности;
1 + 3,322 * lg (21) = 5,39241.
Округлив полученное значение, имеем число групп = 6.
Разбиваем выборочную совокупность на 6 интервалов. Для этого необходимо найти величину i интервала:
QUOTE
где r – размах вариации, n – число групп, которое необходимо организовать.
Размах вариации найдем по формуле:
QUOTE
QUOTE
QUOTE
Теперь вычисляем величину интервала:
i = 2214,616667
Используя найденные данные, разбиваем выборочную совокупность на 6 групп и считаем кол-во субъектов попавшие в каждый интервал.
Вариационный ряд распределения
№ группы | Интервал | Количество субъектов в группе | |
1 | 2923,8 | 5138,41667 | 2 |
2 | 5138,4167 | 7353,03333 | 13 |
3 | 7353,0333 | 9567,65 | 3 |
4 | 9567,65 | 11782,2667 | 0 |
5 | 11782,267 | 13996,8833 | 2 |
6 | 13996,883 | 16211,5 | 1 |
Всего | 21 |
Изобразим интервальный вариационный ряд графически. На оси абсцисс отложим интервалы значений признака, а на оси ординат – соответствующие частоты. Полученная фигура называется гистограммой распределения.
Составляем группировочную таблицу, где распределяем все субъекты по группам согласно величине дохода населения в месяц (Приложение №2). По этой таблице находим средние и общие значения для каждой группы и всей совокупности в целом (Приложение №3). Получаем значение среднего дохода на 1 субъект и среднее количество собственных легковых автомобилей на 1 субъект. То есть:
QUOTE
QUOTE
Так же можно сказать, что для Российской Федерации в 2004 году был характерен среднедушевой доход в размере от 5138,416667 руб. до 7353,033334 руб., так как именно в этой группе больше всего субъектов – 13, что составляет около 62 % от всей выборочной совокупности.
Этот факт дает основание считать, что именно во втором интервале находится мода, то есть наиболее часто повторяющееся значение признака. Рассчитаем моду по формуле:
QUOTE
Где QUOTE
QUOTE
QUOTE
QUOTE
QUOTE
M0 = 6298,45397
Вычислим теперь медиану, то есть варианту, которая расположена в середине вариационного ряда. Ее удобнее находить не по интервальному ряду, а по дискретному, то есть без группировки. Так как дискретный ряд состоит из 21 субъекта, то есть число членов нечетное, то медианой является варианта, расположенная в середине упорядоченного, то есть ранжированного ряда. Таким образом:
QUOTE
Можно сделать вывод, что ровно в половине исследуемых субъектов (10) в 2004 году среднедушевой доход населения был меньше, чем 4909,5 руб., и в то же время, ровно в половине субъектов (10) она была больше этого значения.
Для того, чтобы дать обобщенную характеристику отклонений значений величины дохода населения от средней, вычислим среднее линейное отклонение. Для этого используем уже найденное нами значение среднего дохода населения на 1 субъект QUOTE
Теперь подставим найденные значения в формулу:
Где QUOTE
QUOTE
И вычислим среднее линейное отклонение:
QUOTE
Следовательно, каждое значение среднедушевого дохода населения для 1 из субъектов РФ в среднем отклоняется от средней величины на 2148,31156 руб.
Основными обобщающими показателями вариации в статистике являются дисперсия и среднее квадратическое отклонение. Дисперсия представляет собой среднее арифметическое квадратов отклонений каждого значения признака от общей средней и вычисляется по формуле:
Где QUOTE
QUOTE
Используя расчетную таблицу (Приложение №4), вычислим дисперсию для дохода населения:
QUOTE
Для сопоставления найденной величины со значениями признака целесообразно рассчитать среднее квадратическое отклонение.
QUOTE
QUOTE
Среднее квадратическое отклонение дает обобщающую характеристику колеблемости всех значений совокупности, наиболее же распространенным показателем колеблемости, используемым для оценки типичности средних величин, является коэффициент вариации.
Используя формулу:
Вычислим коэффициент вариации для значений дохода населения:
QUOTE
Так как найденный коэффициент вариации V<40%, то нельзя сказать, что колеблемость признака в изучаемой совокупности большая. Однако то, что полученное значение близко к 40, свидетельствует о довольно сильной колеблемости значений среднедушевого дохода населения по различным субъектам Российской Федерации.
3. Исследование связи. Проверка статистической значимости
Изучив характеристики факторного признака – среднедушевого дохода населения по субъектам РФ за 2004 год, приступим к изучению корреляционной связи между этим показателем и количеством собственных легковых автомобилей по субъектам РФ в 2006 году. При этом мы проверим предположение о возможности существования такой связи и, если она присутствует, установим количественные оценки тесноты этой связи, то есть степень влияния дохода населения на количество собственных автомобилей.
Для начала воспользуемся одним из самых простых методов оценки тесноты и формы связи – с помощью показателя корреляции рангов.
В ранжированном ряду (Приложение №1) каждому из значений денежных дохода населения и количества легковых автомобилей присвоим ранги от 1 до 21, показывающие увеличение значений (Приложение №5).
Теперь найдем разницу между рангами денежных доходов и количества автомобилей для каждого субъекта соответственно и квадраты этих разниц (Приложение №6). Полученное значение суммы квадратов разницы рангов равно 940, оно значительно больше нуля. Поэтому сразу отвергаем гипотезу о наличии прямой связи между доходом и количеством собственных автомобилей. Гипотезу об обратной связи тоже придется отвергнуть, так как в пяти случаях разница рангов равна 0, следовательно, значение квадрата разности не максимально. В итоге можем сделать предположение, что связь вовсе отсутствует. Для того, чтобы это проверить, построим регрессионную модель, наиболее простой формой которой является модель парной линейной регрессии:
QUOTE
Где QUOTE
а - константа, отражающая постоянное влияние факторов,
QUOTE
QUOTE
Для нахождения коэффициентов а и QUOTE
Далее вычисляем коэффициент QUOTE
QUOTE
QUOTE
И константу а:
QUOTE
QUOTE
Таким образом, получили уравнение модели:
QUOTE
На основании данного уравнения можно сказать, что при изменении денежного дохода на 1 единицу, количество собственных автомобилей изменяется на 0,00408, что является очень маленькой и незначительной величиной.
Теперь проверим качество линейного уравнения регрессии с помощью коэффициента детерминации QUOTE
Коэффициент детерминации рассчитывается по формуле:
QUOTE
QUOTE
QUOTE
Полученное значение меньше 0,3. На основании этого можно сказать, что связь между показателями отсутствует. Вариация количества собственных автомобилей лишь приблизительно на 1% определяется вариацией значений дохода населения. Однако значение коэффициента детерминации может быть случайным и являться результатом совпадений, поэтому необходимо провести проверку статистической значимости уравнения в целом и отдельных его параметров с помощью F- и t-статистики.
F-статистика характеризует статистическую значимость уравнения в целом и рассчитывается по формуле:
QUOTE
F=4,38
По таблице критических точек распределения Фишера-Снедекора при уровне значимости QUOTE
Однако проверим все же на статистическую значимость и отдельные параметры уравнения, то есть a и b. Для этого рассчитаем сначала стандартные ошибки для параметров:
QUOTE
QUOTE
QUOTE
QUOTE
А теперь вычислим t-статистику:
QUOTE
QUOTE
QUOTE
QUOTE
По таблице распределения Стьюдента для числа степеней свободы
n-2=19 находим значение tтабл= 2,093.
Теперь сравниваем полученные значения t-статистики с табличным значением.
QUOTE
QUOTE
Несмотря на то, что параметр а значим, в целом модель статистической значимости не имеет, а это говорит об отсутствии связи между доходом населения и числом собственных легковых автомобилей. Значит, уравнение модели нельзя использовать для статистических расчетов и прогнозов, поскольку связи нет, следовательно, отразить зависимость показателей оно не может, что видно на графике (Приложение №8). Здесь точками показаны исходные данные для 21 субъекта Российской Федерации, а линия – это графическое представление уравнения регрессии.
Остается разобраться в причинах отсутствии связи между, казалось бы, на первый взгляд, взаимосвязанными показателями как денежный доход населения и количество покупаемых автомобилей. Это может быть вызвано рядом причин: влияние дохода на приобретение автомобиля является не основным, а косвенным фактором. Так как не было учтено влияние других социально-экономических факторов. Так же сыграла роль нестабильная экономическая ситуация в стране, неуверенность в сохранении тенденции роста дохода так же могут вынуждать людей быть более осторожными и не совершать дорогих покупок. Так же имеет место быть недавний скачок в росте числа приобретаемых населением автомобилей, который может быть связан с доступностью потребительских кредитов, что позволяет покупать автомобили все большему числу людей, несмотря на их доход.
Заключение
В данной курсовой работе целью исследования было выявление взаимосвязи среднедушевого денежного дохода населения по субъектам Российской Федерации в 2004 году с числом собственных легковых автомобилей на тысячу человек по субъектам Российской Федерации на конец 2006 года.
В результате выяснили, что полученная в результате различных статистических вычислений модель линейной регрессии не характеризует взаимосвязь между показателями, следовательно, связь между этими показателями отсутствует. По итогам проведенного исследования можно сделать вывод, что одновременный рост данных показателей является скорее всего совпадением, нежели корреляционной зависимостью.
Список литературы
1. Гмурман В.Е. Теория вероятности и математическая статистика: Учеб. пособие – 12-е изд., перераб. – М.: Высшее бразование, 2008. – 479с.
2. Практикум по эконометрике: Учеб. пособие/ И.И.Елисеева, С.В.Курышева, Н.М. Гордеенко, И.В.Бабаева, Т.В.Костеева.; Под ред. И.И.Елисеевой. – М.:Финансы и статистика, 2003. – 192с.
3. Эконометрика: Ученик/И.И.Елисеева, С.В.Курышева, Т.В.Костеева.; Под ред. И.И.Елисеевой. – М.: Финансы и статистика,203. – 344с.
4. Федеральная служба государственной статистики[Электронный ресурс]: http://www.gks.ru/
5. Российский статистический ежегодник, 2007: Статистический сборник/Федеральная служба государственной статистки (Росстат) ; Ред. кол. : В. Л. Соколин (предс.) и др. - офиц. изд. - М.:Федеральная служба государственной статистики, 2007. - 811 с.
Приложение №1
Данные по субъектам Российской Федерации, полученные с помощью механической выборки
№ | Субъекты Российской Федерации | Среднедушевой денежный доход населения в месяц по субъектам Российской федерации за 2004г, руб | Число собственных легковых автомобилей на 1000 человек населения на конец 2006г, штук |
1 | Воронежская область | 7020,2 | 185,5 |
2 | Курская область | 6706,9 | 150,1 |
3 | Рязанская область | 6175,4 | 176,5 |
4 | Тульская область | 6636,2 | 175,7 |
5 | Республика Коми | 13406,8 | 163,5 |
6 | Калининградская область | 8887,6 | 259,4 |
7 | Псковская область | 6382,3 | 175,5 |
8 | Республика Ингушетия | 2923,8 | 59,7 |
9 | Республика Северная Осетия - Алания | 6027,3 | 153,6 |
10 | Астраханская область | 7089,6 | 184,9 |
11 | Республика Марий Эл | 4909,5 | 112,3 |
12 | Чувашская Республика | 5383,5 | 99,9 |
13 | Оренбургская область | 6174,9 | 208,4 |
14 | Уляновская область | 6157,1 | 155,8 |
15 | Челябинская область | 8613,5 | 171,3 |
16 | Республика Хакасия | 6366,7 | 207,6 |
17 | Эвенкийский автономный округ | 12865,7 | 26,6 |
18 | Новосибирская область | 8399,4 | 189,5 |
19 | Агинский Бурятский автономный округ | 6824,5 | 181,9 |
20 | Амурская область | 7232,9 | 167 |
Приложение №2
№ группы | № п/п | № | Субъекты Российской Федерации | Среднедушевой денежный доход населения в месяц по РФ за 2004г, руб | Число собственных легковых автомобилей на 1000 человек населения на конец 2005г, шт |
1 | 1 | 8 | Республика Ингушетия | 2923,8 | 59,7 |
2 | 11 | Республика Марий Эл | 4909,5 | 112,3 | |
Итого | 2 | 7833,3 | 172 | ||
2 | 1 | 12 | Чувашская Республика | 5383,5 | 99,9 |
2 | 9 | Республика Северная Осетия - Алания | 6027,3 | 153,6 | |
3 | 14 | Ульяновская область | 6157,1 | 155,8 | |
4 | 13 | Оренбургская область | 6174,9 | 208,4 | |
5 | 3 | Рязанская область | 6175,4 | 176,5 | |
6 | 16 | Республика Хакасия | 6366,7 | 207,6 | |
7 | 7 | Псковская область | 6382,3 | 175,5 | |
8 | 4 | Тульская область | 6636,2 | 175,7 | |
9 | 2 | Курская область | 6706,9 | 150,1 | |
10 | 19 | Агинский Бурятский автономный округ | 6824,5 | 181,9 | |
11 | 1 | Воронежская область | 7020,2 | 185,9 | |
12 | 10 | Астраханская область | 7089,6 | 184,9 | |
13 | 20 | Амурская область | 7232,9 | 167 | |
Итого | 13 | 84177,5 | 2222,4 | ||
3 | 1 | 18 | Новосибирская область | 8399,4 | 189,5 |
2 | 15 | Челябинская область | 8613,5 | 171,3 | |
3 | 6 | Калининградская область | 8887,6 | 259,4 | |
Итого | 3 | 25900,5 | 620,2 | ||
4 | |||||
Итого | 0 | 0 | 0 | ||
5 | 1 | 17 | Эвенкийский автономный округ | 12865,7 | 26,6 |
2 | 5 | Республика Коми | 13406,8 | 163,5 | |
Итого | 2 | 26272,5 | 190,1 | ||
6 | 1 | 21 | Сахалинская область | 16211,5 | 248,7 |
Итого | 1 | 16211,5 | 248,7 |
Приложение №3
Итоги группировки
Приложение №4
Вспомогательная таблица расчетов факторного признака
Приложение №5
Таблица рангов
Приложение №6
Разницу между рангами факторного и результативного признака соответственно и квадраты этих разниц.
Приложение №7
Вспомогательная расчетная таблица для определения параметров линейного уравнения регрессии a, b и
Приложение №8
График зависимости значений показателя числа собственных легковых автомобилей от значений среднедушевого дохода населения.
Итоги группировки
№ группы | Интервал | Кол-во субъектов | Всего доход | Кол-во а/м | В среднем на 1 субъект доход | В среднем на 1 субъект а/м | |
1 | 2923,8 | 5138,416667 | 2 | 7833,3 | 172 | 3916,65 | 86 |
2 | 5138,416667 | 7353,033334 | 13 | 84177,5 | 2222,4 | 6475,192308 | 170,9538462 |
3 | 7353,033334 | 9567,650001 | 3 | 25900,5 | 620,2 | 8633,25 | 206,7333333 |
4 | 9567,650001 | 11782,26667 | 0 | 0 | 0 | 0 | 0 |
5 | 11782,26667 | 13996,88334 | 2 | 26272,5 | 190,1 | 13136,25 | 95,05 |
6 | 13996,88334 | 16211,5 | 1 | 16211,5 | 248,7 | 16211,5 | 248,7 |
Всего | 21 | 160395,3 | 3453,4 | 48373,09231 | 807,4371795 |
Приложение №4
Вспомогательная таблица расчетов факторного признака
№ по порядку | х | хi-хср | |хi-хср| | (хi-хср)2 |
1 | 7020,2 | -41352,8923 | 41352,89231 | 1710061702 |
2 | 6706,9 | -41666,1923 | 41666,19231 | 1736071582 |
3 | 6175,4 | -42197,6923 | 42197,69231 | 1780645236 |
4 | 6636,2 | -41736,8923 | 41736,89231 | 1741968180 |
5 | 13406,8 | -34966,2923 | 34966,29231 | 1222641598 |
6 | 8887,6 | -39485,4923 | 39485,49231 | 1559104103 |
7 | 6382,3 | -41990,7923 | 41990,79231 | 1763226639 |
8 | 2923,8 | -45449,2923 | 45449,29231 | 2065638171 |
9 | 6027,3 | -42345,7923 | 42345,79231 | 1793166126 |
10 | 7089,6 | -41283,4923 | 41283,49231 | 1704326737 |
11 | 4909,5 | -43463,5923 | 43463,59231 | 1889083856 |
12 | 5383,5 | -42989,5923 | 42989,59231 | 1848105047 |
13 | 6174,9 | -42198,1923 | 42198,19231 | 1780687434 |
14 | 6157,1 | -42215,9923 | 42215,99231 | 178219007 |
15 | 8613,5 | -39759,5923 | 39759,59231 | 1580825181 |
16 | 6366,7 | -42006,3923 | 42006,39231 | 1764536995 |
17 | 12865,7 | -35507,3923 | 35507,39231 | 1260774909 |
18 | 8399,4 | -39973,6923 | 39973,69231 | 1597896077 |
19 | 6824,5 | -41548,5923 | 41548,59231 | 1726285523 |
20 | 7232,9 | -41140,1923 | 41140,19231 | 1692515423 |
21 | 16211,5 | 32161,5923 | 32161,59231 | 1034368020 |
Сумма | 855439,6385 | 35034118547 |
Приложение №5
Таблица рангов
№ | Субъекты Российской Федерации | Среднедушевой денежный доход населения в месяц по субъектам Российской федерации за 2004г, руб | Ранги | Число собственных легковых автомобилей на 1000 человек населения на конец 2005г, штук | Ранги |
8 | Республика Ингушетия | 2923,8 | 1 | 59,7 | 2 |
11 | Республика Марий Эл | 4909,5 | 2 | 112,3 | 4 |
12 | Чувашская Республика | 5383,5 | 3 | 99,9 | 3 |
9 | Республика Северная Осетия - Алания | 6027,3 | 4 | 153,6 | 6 |
14 | Ульяновская область | 6157,1 | 5 | 155,8 | 7 |
13 | Оренбургская область Республика Ингушетия | 6174,9 | 6 | 208,4 | 19 |
3 | Рязанская область | 6175,4 | 7 | 176,5 | 13 |
16 | Республика Хакасия | 6366,7 | 8 | 207,6 | 18 |
7 | Псковская область | 6382,3 | 9 | 175,5 | 11 |
4 | Тульская область Курская область | 6636,2 | 10 | 175,7 | 12 |
2 | Курская область Рязанская область | 6706,9 | 11 | 150,1 | 5 |
19 | Агинский Бурятский автономный округ | 6824,5 | 12 | 181,9 | 14 |
1 | Воронежская область | 7020,2 | 13 | 185,5 | 16 |
10 | Астраханская область | 7089,6 | 14 | 184,9 | 15 |
20 | Амурская область | 7232,9 | 15 | 167 | 9 |
18 | Новосибирская область | 8399,4 | 16 | 189,5 | 17 |
15 | Челябинская область | 8613,5 | 17 | 171,3 | 10 |
6 | Калининградская область | 8887,6 | 18 | 259,4 | 21 |
17 | Эвенкийский автономный округ | 12865,7 | 19 | 26,6 | 1 |
5 | Республика Коми | 13406,8 | 20 | 163,5 | 8 |
21 | Сахалинская область | 16211,5 | 21 | 248,7 | 20 |
Приложение №6
Разницу между рангами факторного и результативного признака соответственно и квадраты этих разниц.
Разница между рангами | Квадрат разницы | |
8 | -1 | 1 |
11 | -2 | 4 |
12 | 0 | 0 |
9 | -2 | 4 |
14 | -2 | 4 |
13 | -13 | 169 |
3 | -6 | 36 |
16 | -10 | 100 |
7 | -2 | 4 |
4 | -2 | 4 |
2 | 6 | 36 |
19 | -2 | 4 |
1 | -3 | 9 |
10 | -1 | 1 |
20 | 6 | 36 |
18 | -1 | 1 |
15 | 7 | 49 |
6 | -3 | 9 |
17 | 18 | 324 |
5 | 12 | 144 |
21 | 1 | 1 |
сумма | 0 | 940 |
Приложение №7
Вспомогательная расчетная таблица для определения параметров линейного уравнения регрессии a, b и
№ | хi | yi | xiyi | xi2 | yi2 | yi^ | Еi=yi-yiср | Ei2 |
1 | 7020,2 | 185,5 | 1302247,1 | 49283208,04 | 34410,25 | 161,930 | 555,52 | 7316,49 |
2 | 6706,9 | 150,1 | 1006705,6 | 44982507,61 | 160,653658 | -10,5537 | 111,37 | 1683,36 |
3 | 6175,4 | 176,5 | 1089958,1 | 38135565,16 | 158,487651 | 18,0123 | 324,44 | 3064,77 |
4 | 6636,2 | 175,7 | 1165980,3 | 44039150,44 | 160,365536 | 15,3344 | 235,14 | 18,35 |
5 | 13406,8 | 163,5 | 2192011,8 | 179742286,2 | 187,957567 | -24,4576 | 598,17 | 6,827 |
6 | 8887,6 | 259,4 | 2305443,4 | 78989433,76 | 169,540601 | 89,8594 | 8074, | 2491,1 |
7 | 6382,3 | 175,5 | 1120093,6 | 40733753,29 | 159,330825 | 16,1691 | 261,44 | 324,41 |
8 | 2923,8 | 59,7 | 174550,86 | 8548606,44 | 145,236499 | -85,5365 | 7316,4 | 2336,66 |
9 | 6027,3 | 153,6 | 925793,28 | 36328345,29 | 157,884103 | -4,2841 | 18,353 | 261,54 |
10 | 7089,6 | 184,9 | 1310867,0 | 50262428,16 | 162,213264 | 22,6867 | 514,68 | 114,76 |
11 | 4909,5 | 112,3 | 551336,85 | 24103190,25 | 153,328765 | -41,0288 | 1683,3 | 235,12 |
12 | 5383,5 | 99,9 | 537811,65 | 28982072,25 | 155,260444 | -55,3604 | 3064,7 | 112,339 |
13 | 6174,9 | 208,4 | 1286849,1 | 38129390,01 | 158,485613 | 49,9143 | 2491,4 | 431,43 |
14 | 6157,1 | 155,8 | 959276,18 | 37909880,41 | 158,413074 | -2,61307 | 6,8281 | 554,773 |
15 | 8613,5 | 171,3 | 1475492,5 | 74192382,25 | 168,42357 | 2,87643 | 43,678 | 514,776 |
16 | 6366,7 | 207,6 | 1321726,9 | 40534868,89 | 159,267250 | 48,3327 | 45,787 | 17,6676 |
17 | 12865, | 26,6 | 342227,62 | 165526236,5 | 185,752437 | -159,152 | 23,865 | 481,544 |
18 | 8399,4 | 189,5 | 1591686,3 | 70549920,36 | 167,551054 | 21,9489 | 76,546 | 8,2765 |
19 | 6824,5 | 181,9 | 1241376,5 | 46573800,25 | 161,13291 | 20,7670 | 58,768 | 25329 |
20 | 7232,9 | 167 | 1207894,3 | 52314842,41 | 162,797250 | 4,20274 | 43,878 | 598,172 |
21 | 16211 | 248,7 | 4031800,0 | 262812732,3 | 199,38748 | 49,3125 | 65,877 | 678,6 |
Приложение №8
График зависимости значений показателя числа собственных легковых автомобилей от значений среднедушевого дохода населения.