Предмет и метод эконометрики. Эконометрические взаимосвязи

Курсовая работа

Контрольно-курсовая работа Предмет и метод эконометрики. Эконометрические взаимосвязи

1. Эконометрика, предмет и метод

1.1 Предмет и метод

1.2Эконометрическая модель

1.3 Измерения в экономике

2. Изучение взаимосвязей в эконометрике

2.1 Понятие о взаимосвязях в эконометрике

2.2 Метод сопоставления параллельных рядов. Корреляция альтернативных признаков

2.3 Метод аналитических группировок

2.4 Корреляционно-регрессионный анализ

2.4.1 Парная регрессия. Парная корреляция

2.4.1.1 Парная линейная регрессия

2.4.1.2 Парная линейная корреляция

2.4.1.3 Оценка надежности параметров парной линейной регрессии и корреляции

2.4.1.4 Парная нелинейная регрессия

2.4.1.5 Коэффициенты эластичности в парных моделях

2.4.1.6 Парная нелинейная корреляция

2.4.1.7 Оценка надежности параметров парной нелинейной регрессии и корреляции

2.4.1.8 Прогнозирование на основе парной модели регрессии. Расчет доверительных интервалов для прогнозного значения, параметров уравнения регрессии и коэффициента (индекса) корреляции

2.4.2 Множественная регрессия. Множественная корреляция

2.4.2.1 Множественная регрессия

2.4.2.2 Частные уравнения регрессии

2.4.2.3 Множественная корреляция

2.4.2.4 Частная корреляция

2.4.2.5 Оценка надежности параметров множественной регрессии и корреляции Литература

1. Эконометрика, предмет и метод

1.1 Предмет и метод Термин «эконометрика» впервые введен в Австро-Венгрии П. Цьемпой. Слово эконометрика это комбинация слов «эконом» и «метрика» т. е. экономика и измерение. Соответственно эконометрика это измерение в экономике.

На данный момент под эконометрикой понимают науку, которая занимается измерением и анализом экономических явлений.

В основу эконометрики положены три основных компонента:

1. экономическая теория;

2. статистические методы;

3. математические методы.

Эконометрика это слияние всех этих трех компонентов, каждый из которых является ее неотъемлемой частью.

В основе метода эконометрики лежат методы статистики, такие как:

1. регрессионный анализ;

2. корреляционный анализ;

3. выделение тренда динамического ряда;

4. изучение сезонных и циклических колебаний динамического ряда;

5. статистическое оценивание результатов и т. д.

32 стр., 15973 слов

Многомерные статистические методы и эконометрика

... 1,083982 1,826879 Ln X5 0,263293 0,139855 1,882608 0,0063344 -0,01498 0,541561 Получили уравнение регрессии: . Регрессионная статистика Множественный R 0,683843 R-квадрат 0,467641 Нормированный R-квадрат ... признак, имеющий наименьшее значение t-статистики (X 4 ) и проведем регрессионный анализ по оставшимся признакам. Получим следующие результаты. Коэффициенты Стандартная ошибка t-статистика P ...

Но так как, эконометрика является эмпирической наукой и решает конкретные экономические задачи, методы эконометрического анализа должны исключать проявление процессов искажающих результаты статистического анализа. К таким процессам относятся:

1. асимметричность связей;

2. мультиколлинеарность переменных;

3. гетероскедастичность;

4. автокорреляция;

5. ложная корреляция;

6. наличие лагов и т. д.

1.2 Эконометрическая модель Эконометрические модели являются главным инструментом в эконометрике. Невозможно, например, абсолютно точно подсчитать спрос на автомобили в следующем году. Но можно, зная основные факторы, влияющие на спрос, построить модель спроса.

Эконометрическая модель — теоретическая модель экономических процессов, которая является средством прогнозирования эмпирических экономических процессов.

В эконометрике используют три класса эконометрических моделей:

1. Модели временных рядов.

2. Регрессионные модели с одним уравнением.

3. Системы одновременных уравнений.

Моделью временных рядов называется эконометрическая модель, в которой результативных признак — функция переменной времени, или переменных относящихся к другим моментам времени. К моделям временных рядов относятся:

1. Модель тренда — отражает зависимость результативного признака от трендовой компоненты:

(1)

где:

временной тренд, заданный функцией определенного вида, линейной или нелинейной.

  • случайная компонента.

2. Модель сезонности — отражает зависимость результативного признака от сезонной компоненты

(2)

где:

сезонная компонента.

  • случайная компонента.

3. Тренда и сезонности — отражает зависимость результативного признака и от трендовой и от сезонной компоненты. Может быть:

аддитивная (дополняющая) модель

(3)

мультипликативная (множительная) модель

(4)

4. К моделям, отражающим зависимость результативного признака от переменных, относящихся к другим моментам времени относятся:

модель с распределенным лагом — модель, отражающая зависимость результативного признака от предыдущих значений факторных признаков.

модель авторегрессии — модель, отражающая зависимость результативного признака от предыдущих значений результативных признаков.

модели ожидания — модель, отражающая зависимость результативного признака от будущих значений факторных или результативных переменных.

Регрессионной моделью с одним уравнением называется модель, в которой результативный признак представляется в виде функции факторных переменных:

(5)

где

  • результативный признак (зависимая переменная).

  • факторные признаки (независимые или объясняющие переменные).

Регрессионные модели с одним уравнением в зависимости от вида функции делятся на линейные и нелинейные.

Наиболее часто в экономике используют следующие модели с одним уравнением:

1. Функция цены, где цена товара зависит от объема поставки и цен конкурентов :

(6)

2. Функция спроса, где величина спроса товара зависит от его цены, от цен конкурентов, и доходов потребителей :

12 стр., 5691 слов

Сравнительный анализ эконометрических моделей регрессии

... В эконометрике в основном рассматривают ошибки спецификации модели, предполагая, что ошибки измерения сведены к минимуму. [2] Спецификация модели - выбор вида функциональной зависимости (уравнения регрессии). ... наилучшую спецификацию. Помимо выбора спецификации модели не менее важно также правильное описание структуры модели. Значение результативного признака может зависеть не от фактического ...

(7)

3. Производственная функция, где зависимость объема производства товара зависит от производственных факторов, например затрат капитала и затрат труда :

(8)

Системы одновременных уравнений — модели, которые описываются системами взаимосвязанных регрессионных уравнений.

Системы уравнений могут быть тождественными или поведенческими.

Тождественные системы уравнений состоят из уравнений, вид которых и значения параметров известны.

Поведенческие системы уравнений состоят из уравнений, вид которых и значение параметров требуется оценить, а также уравнения, которые в качестве независимых переменных могут включать, кроме факторных переменных, результативные признаки из других уравнений системы.

К системам одновременных уравнений относится, например, модель спроса и предложения из трех уравнений:

(9)

где

  • предложение товара в момент времени .
  • спрос на товар в момент времени .
  • цена товара в момент времени .
  • цена товара в предыдущий момент времени .
  • доход потребителя в момент времени .

Системы одновременных уравнений могут включать в себя большое количество уравнений, например, модель Уортона американской экономики, содержит более одной тысячи уравнений, которые решаются одновременно.

1.3 Измерения в экономике В настоящее время термин «измерение» употребляется в трех значениях:

1. Измерение — это получение, сравнение и упорядочение информации. Предполагает сравнение объектов исследования по наличию или отсутствию исследуемого свойства. Данному понятию соответствуют термины «классификация», «нумерация».

2. Измерение — это операция, в результате которой получается численное значение величины измеряемого признака. Данному понятию соответствуют термины «шкалирование», «топология», «упорядочение».

3. Измерение — измерение с обязательным наличием единицы измерения, т. е. сравнение изучаемых объектов с эталоном. Данному понятию соответствуют термины «измерение», «квантификация».

Измерение, по любому из определений, предполагает наличие шкалы измерения. Различают следующие типы шкал:

  • номинальная;
  • порядковая (ранговая, ординальная);
  • интервальная;
  • шкала отношений.

Тип шкалы определяется допустимым преобразованием, при котором истинные утверждения не становятся ложными, а ложные утверждения не становятся истинными.

Номинальная шкала Номинальная шкала — шкала, в которой измерением называется классификация, при которой каждое значение определяет отдельную категорию, т. е. каждая категория «отличается» от других, но это отличие не может быть количественно измерено. Например, нумерация игроков в футбольной команде.

Номинальной шкале присущи только свойства «симметричности» и «транзитивности».

Симметричность — если то и .

Транзитивность — если и то и .

Порядковая (ординальная, ранговая) шкала Порядковая шкала ранжирует объекты по уровню свойства, т. е. «больше» или «меньше», но не позволяет сказать «на сколько больше» или «на сколько меньше».

Ординальная шкала допускает следующие операции: «равенство-неравенство» и «больше-меньше».

11 стр., 5027 слов

Теория измерений в эконометрике

... в шкале наименований. Пол людей тоже измерен в шкале наименований, результат измерения принимает два значения - мужской, женский. Раса, национальность, цвет глаз, волос - номинальные признаки. Номера букв в алфавите - тоже измерения в шкале наименований. Никому в ... здравом уме не придет в голову складывать ...

Для порядковой шкалы возможно любое монотонное преобразование.

Среди порядковых шкал большое распространение получили бальные шкалы.

Примерами ординальной шкалы может служить рейтинг популярных песен, успеваемость учеников в школе, оценка силы волн, и т. д.

Интервальная шкала (шкала разностей) Интервальная шкала — шкала, которая позволяет не только упорядочить объекты по уровню свойства, но и сравнивать между собой разности количеств свойства.

Шкала разностей — интервальная шкала, масштаб в которой зафиксирован. По шкале разностей мы можем сказать, например, что температура воды 100С больше, чем 30С, но и определить разницу в 70С, между двумя значениями.

Шкала разностей допускает следующие операции: «равенство-неравенство» и «больше-меньше», «равенство-неравенство интервалов» и операцию вычитания.

Шкала отношений (пропорциональная шкала) Шкала отношений — шкала, на которой указан абсолютный ноль. По шкале отношений можно определить во сколько раз величина одного объекта больше другого. Например, используя шкалу температур Кельвина, можно сказать, что 400К по сравнения с 200К не только больше на 200, но и в два раза «горячее».

Шкала отношений допускает следующие операции: «равенство-неравенство интервалов», «больше-меньше» и операции вычитания и деления.

Особенность экономических измерений Естественно, что измерения в экономике отличаются от измерений в физике или механике. Экономика это так называемая «неточная» наука, так как ей свойственны большие погрешности, чем «точным» наукам.

Экономическим измерениям свойственна более низкая контролируемость их точности, т.к. в естественных науках точность измерения зависит, в основном, от самого измерения, а в экономических измерениях точность кроме самого измерения зависит от:

  • правильного определения экономической величины и экономического показателя;
  • формирования системы условий, определяющих точность экономического измерения;
  • выбора условий соизмеримости показателей;
  • разработки других специфических условий экономического измерения.

2. Изучение взаимосвязей в эконометрике

2.1 Понятие о взаимосвязях. Методы выявления и измерения взаимосвязей В природе, и тем более в обществе, все явления взаимосвязаны между собой. Урожайность зависит от качества почвы, внесения удобрений, обеспеченности производственными фондами и от многих других факторов; производительность труда от производственных затрат, обеспеченности основными и оборотными фондами и т. д. ; среднедневная температура от времени года, местоположения страны удаленности от океана и т. д. Соответственно, что бы прогнозировать, то есть управлять развитием явлений, общественных и природных, необходимо установить связи, существующие между интересующими нас явлениями, их силу, вид, направление и т. д.

Так как, в статистике изучают детерминированность следствия факторами (детерминизм — обусловленность явлений множеством факторов) будем называть признак (явление) характеризующий следствие результативным признаком (зависимым признаком, результатом).

Признаки, характеризующие факторы — факторными признаками (независимыми признаками).

Результативные признаки принимают то или иное значение под влиянием на них признаков факторных. Соответственно размер результативного признака есть результат влияние на него факторных признаков.

В статистике различают два вида взаимосвязей между явлениями: функциональная и корреляционная.

Функциональная связь — это связь, жестко детерминированная или полная (связь равная единице или 100%), размер результативного признака зависит только от одного фактора, причем каждому конкретному значению факторного признака может соответствовать одно, или несколько четко заданных значений результативного признака.

Строго определить функциональную связь можно, только придав ей математическую формулировку. Функциональной связью является, например, связь вида:

а), при ,

б), при, , или

Видно, что величина признака зависит, лишь от признака, причем строго определенным образом.

Но, в мире природы и тем более в обществе функциональных связей не бывает — все явления реального мира взаимосвязаны между собой. И поэтому функциональная связь — это связь абстрактная, упрощающая расчеты, но и упрощающая объективно существующую реальность. Тем не менее, представление о связях как связях функциональных используют такие науки как химия, физика, механика, электротехника и т. д.

Обратная величина функциональной связи — это отсутствие связи (связь между явлениями равна нулю), размер результативного признака совершенно не зависит от какого-то фактора. Отсутствие связи, как и связь функциональная не существует в реальном мире — это также абстрактное понятие, упрощающее расчеты и соответственно реальность.

Корреляционная связь — это связь схоластически детерминированная, неполная. При корреляционной связи каждому значению факторного признака (признаков) соответствует множество значений результативного признака. Корреляционная связь проявляется лишь при большом числе наблюдений, в среднем.

Также различают формы связи:

1. прямая связь — с возрастанием величины фактора наблюдается рост величины результата, а при уменьшении величины фактора уменьшение величины результативного признака.

2. обратная связь — с увеличением величины фактора величина результативного признака уменьшается, а с уменьшением увеличивается.

Кроме того, по математическому выражению, связи делятся на линейные и нелинейные.

При изучении взаимосвязей общественных явлений используют различные методы, такие как:

1. сопоставление параллельных рядов;

2. метод аналитических группировок;

3. корреляционно-регрессионный анализ;

4. и др.

Изучение взаимосвязей позволяет решить следующие задачи:

1. определить наличие связи;

2. определение формы связи;

3. измерение тесноты связи;

4. прогнозирование изменения результативного признака под влиянием изменения фактора (факторов).

2.2 Метод сопоставления параллельных рядов. Корреляция альтернативных признаков Метод сопоставления параллельных рядов является наиболее простым методом исследования взаимосвязей между явлениями.

Данный метод заключается в сопоставлении ранжированного ряда факторного признака с ранжированным рядом результативного признака. Данное сопоставление позволяет определить наличие или отсутствие связи между явлениями, а также ее направление.

Также метод параллельных радов позволяет определить тесноту связи. Для этого рассчитывают коэффициент Фехнера и коэффициент корреляции рангов Спирмена.

Расчет коэффициента Фехнера.

Для расчета данного коэффициента необходимо рассчитать отклонения значений признаков и от их средних значений и, при этом определяют знак отклонений или. Если знаки отклонений у признаков и совпадают, то делается вывод о согласованности вариации, если не совпадают — вариация несогласованна. Формула расчета коэффициента Фехнера:

(10)

где:

С — число совпавших знаков отклонений и

Н — число не совпавших отклонений и

Коэффициент Фехнера может принимать значения от до. В статистике принято считать, что до 0,3 связь слабая, от 0,3 до 0,7 связь средняя, свыше 0,7 связь сильная. Знак плюс показывает, что связь прямая, знак минус — связь обратная.

Необходимо учитывать, что коэффициент Фехнера определяет направление связи, но дает лишь очень грубую оценку ее величины.

Коэффициент корреляции рангов Спирмена Коэффициент корреляции рангов учитывает согласованность рангов единиц совокупности.

Ранг — номер, который занимает единица совокупности по признакам и .

Формула расчета коэффициента корреляции рангов:

(11)

где: — число единиц совокупности,

  • квадрат разности рангов.

Коэффициент корреляции рангов может принимать значения в интервале .

Корреляция альтернативных признаков В случае, когда имеются противоположные по значению варианты признака, говорят об альтернативном признаке (да, нет).

Например, продукция может быть годной или не годной.

Для исследования взаимосвязей между двумя альтернативными признаками, то есть, вариация обоих атрибутивных признаков ограничена двумя группами, используют «тетрахорические показатели». Их расчет основан на использовании определенной расчетной таблицы (табл. 1).

Таблица 1.

II

I

;

a

b

;

c

d

Она состоит из четырех ячеек обозначенных буквами a, b, c, d — частоты, расположенные в I, II, III, IV квадрантах. Знаки и в заголовках столбцов и строк характеризуют наличие или отсутствие альтернативного признака.

К «тетрахорическим показателям» относят:

коэффициент ассоциации Пирсона коэффициент коллигации Юла коэффициент контингенции Юла и Кендэла коэффициент Шарлье и др.

Рассмотрим некоторые из них.

Коэффициент ассоциации Пирсона, данный коэффициент используют для измерения тесноты взаимосвязи надежности и годности. Рассчитывается по формуле:

(12)

Коэффициент коллигации Юла рассчитывается как:

(13)

Данный коэффициент показывает средний размер связи.

Рассмотренные коэффициенты могут принимать значения от до .

Если при измерении связи между качественными показателями образуется более двух групп, для определения тесноты связи используют:

коэффициент взаимной сопряженности Пирсона коэффициент взаимной сопряженности Чупрова коэффициент взаимной сопряженности Крамера и. д.р.

Коэффициент взаимной сопряженности Пирсона рассчитывается:

(14)

Коэффициент взаимной сопряженности Чупрова рассчитывается:

(15)

где:

  • число групп по первому и второму признаку соответственно.
  • показатель взаимной сопряженности Коэффициент взаимной сопряженности Чупрова целесообразно использовать, когда число групп по каждому признаку одинаково. Если используют коэффициент Крамера.

Показатель взаимной сопряженности рассчитывают, используя вспомогательную таблицу (табл. 2)

Данные подставляют в формулу:

(16)

Таблица 2. Вспомогательная таблица для расчета показателя взаимной сопряженности

y

x

I

II

III

Итого

I

II

III

Итого

Коэффициент взаимной сопряженности Крамера рассчитывается:

(17)

где:

  • минимальное, из значений и

При значения коэффициентов Чупрова и Крамера совпадают.

Пример 1. По совокупности, состоящей из 27 предприятий, имеются данные о фондовооруженности тыс.руб. и производительности труда тыс.руб. (табл. 3).

Таблица 3.

8,0

11,1

8,2

11,6

8,3

11,8

8,4

12,0

8,9

12,1

9,2

12,3

9,3

12,5

9,4

12,9

9,7

13,0

9,9

13,2

10,2

13,7

10,3

13,8

10,6

14,0

10,9

Необходимо определить направление и тесноту связи с помощью коэффициента Фехнера и коэффициента корреляции рангов Спирмена.

Решение.

I. Рассчитаем коэффициент Фехнера.

1. В таблице 4 рассчитаем отклонения значений признаков и от их средних значений — и, определим знак отклонений или и подсчитаем число совпадений © и несовпадений (Н) знаков отклонений.

Таблица 4.

x

С или Н

8,0

— 2,9

— 6,2

С

8,2

— 2,7

— 5,2

С

8,3

— 2,6

— 6,2

С

8,4

— 2,5

— 3,2

С

8,9

— 2,0

— 6,2

С

9,2

— 1,7

— 5,2

С

9,3

— 1,6

— 3,2

С

9,4

— 1,5

— 2,2

С

9,7

— 1,2

— 2,2

С

9,9

— 1,0

— 0,2

С

10,2

— 0,7

— 2,2

С

10,3

— 0,6

— 1,2

С

10,6

— 0,3

— 0,2

С

10,9

0,0

0,8

С

11,1

0,2

1,8

С

11,6

0,7

— 0,2

Н

11,8

0,9

0,8

С

12,0

1,1

1,8

С

12,1

1,2

2,8

С

12,3

1,4

3,8

С

12,5

1,6

2,8

С

12,9

2,0

2,8

С

13,0

2,1

3,8

С

13,2

2,3

4,8

С

13,7

2,8

5,8

С

13,8

2,9

4,8

С

14,0

3,1

6,8

С

Среднее

10,9

9,2

2. Коэффициент Фехнера будет равен:

Коэффициент Фехнера показывает сильную положительную связь между признаками и .

II. Рассчитаем коэффициент корреляции рангов Спирмена.

1. Назначим ранги для показателя (табл. 5).

Для этого ранжируем показатель по возрастанию и определим ранг, который признак занимает в ранжированном ряде.

а) Значение признака равное 3 занимает № 1, № 2 и № 3, соответственно ранг данного значение будет .

б) Значение признака равное 4 занимает № 4 и № 5, соответственно ранг данного значение будет .

в) Значение признака равное 6 занимает № 6 и № 7, соответственно ранг данного значение будет .

г) Значение признака равное 7 занимает № 8, № 9 и № 10, соответственно ранг данного значение будет .

д) Значение признака равное 8 занимает № 11, соответственно ранг данного значение будет .

е) Значение признака равное 9 занимает № 12, № 13 и № 14, соответственно ранг данного значение будет .

ж) Значение признака равное 10 занимает № 15 и № 16, соответственно ранг данного значение будет .

з) Значение признака равное 11 занимает № 17 и № 18, соответственно ранг данного значение будет .

и) Значение признака равное 12 занимает № 19, № 20 и № 21, соответственно ранг данного значение будет .

к) Значение признака равное 13 занимает № 22 и № 23, соответственно ранг данного значение будет .

л) Значение признака равное 14 занимает № 24 и № 25, соответственно ранг данного значение будет .

м) Значение признака равное 15 занимает № 26, соответственно ранг данного значение будет .

н) Значение признака равное 16 занимает № 27, соответственно ранг данного значение будет .

Таблица 5

по возрастанию

ранг признака

А

2. Назначим ранги для показателя ранжированием по порядку возрастания — 1; 2; 3;. .. 27 (табл. 6).

Далее в таблице 6 проставим ранги признаков и, рассчитаем разности рангов, квадраты разности рангов и сумму квадратов разностей рангов (табл. 5).

Таблица 6

8,0

2,0

1,0

1,00

8,2

4,5

2,5

6,25

8,3

2,0

— 1,0

1,00

8,4

6,5

2,5

6,25

8,9

2,0

— 3,0

9,00

9,2

4,5

— 1,5

2,25

9,3

6,5

— 0,5

0,25

9,4

9,0

1,0

1,00

9,7

9,0

0,0

0,00

9,9

13,0

3,0

9,00

10,2

9,0

— 2,0

4,00

10,3

11,0

— 1,0

1,00

10,6

13,0

0,0

0,00

10,9

15,5

1,5

2,25

11,1

17,5

2,5

6,25

11,6

13,0

— 3,0

9,00

11,8

15,5

— 1,5

2,25

12,0

17,5

— 0,5

0,25

12,1

20,0

1,0

1,00

12,3

22,5

2,5

6,25

12,5

20,0

— 1,0

1,00

12,9

20,0

— 2,0

4,00

13,0

22,5

— 0,5

0,25

13,2

24,5

0,5

0,25

13,7

26,0

1,0

1,00

13,8

24,5

— 1,5

2,25

14,0

27,0

0,0

0,00

Итого

77,00

3. Рассчитаем коэффициент корреляции рангов Связь сильная.

Пример 2. Имеются данные о количестве торговых точек, сгруппированных по уровню средней прибыли и уровню квалификации продавцов в разных торговых точках (табл. 7).

Определить тесноту связи, через коэффициенты взаимной сопряженности.

Решение.

Рассчитаем показатель взаимной сопряженности непосредственно в таблице, используя формулу:

1. Рассчитаем коэффициент Пирсона.

и из полученного значения (значение находится в нижнем правом углу таблицы) вычтем единицу:

2. Так как рассчитаем коэффициент Чупрова:

Коэффициент Чупрова всегда меньше чем коэффициент Пирсона.

3. Коэффициент взаимной сопряженности Крамера:

Так как значения коэффициентов Чупрова и Крамера совпадают.

Таблица 7.

Средняя прибыль Квалификация

Низкая

Средняя

Высокая

Итого

Низкий

Средний

Высокий

Итого

Пример 3. Группа предприятий, исследованная по влиянию на прибыль новой маркетинговой схемы, разделена на две подгруппы по надою.

Таблица 8

Схема Прибыль

Переведены на новую схему

Не переведены

Прибыль увеличилась

230 (а)

84 (b)

Прибыль не увеличилась

99 (c)

210 (d)

Рассчитаем коэффициент ассоциации Пирсона:

Полученное значение показывает среднюю, прямую связь между исследуемыми признаками.

Рассчитаем коэффициент коллигации Юла:

Полученное значение показывает, что средняя связь между исследуемыми признаками прямая, средняя.

2.3 Метод аналитических группировок Этот метод позволяет определить взаимосвязи между двумя и более признаками.

В ходе построения аналитической группировки необходимо решить следующие вопросы:

1. выбор факторных признаков

2. определение числа групп

3. оценка линии регрессии

4. измерения тесноты связи Выбор факторных признаков Выбор основывается на всестороннем анализе изучаемого явления, экономической теории, опыте и знаниях исследователя и т. д.

Определение числа групп В принципе, чем больше число групп, тем точнее будет описана линия регрессии, но в месте с тем снижается точность расчета средних.

В данном вопросе необходимо, что бы увеличение числа групп, для более точного описания линия регрессии, не привело к утрате закономерного характера линии регрессии, из-за малочисленности групп.

Границы интервалов групп определяют, выделяя основные типы изучаемых явлений. При расчете величин интервалов возможно использование следующей формулы предложенной американским ученым Стерджессом.

(18)

где:

  • максимальное значение признака в совокупности
  • минимальное значение признака в совокупности

N — число единиц в совокупности.

При разбиении изучаемой совокупности рекомендуется соблюдение принципа равных частот, т. е. образование групп с примерно одинаковой численностью единиц.

Оценка линии регрессии Оценка линии регрессии в данном случае основывается на вычислении среднего значения признака для интервала значений признака .

В качестве группировочного признака, как правило, используется факторный признак.

Показатель, характеризующий влияние факторного признака на результативный признак называется показателем силы связи, который показывает, на сколько единиц изменится результативный признак, если факторный увеличится на одну единицу.

Если связь между признаками нелинейная, то есть, существенно изменяется при переходе от одной группе к другой, рассчитывается как:

(19)

Так, например, если совокупность разбита на четыре группы, рассчитывают

1); 2); 3)

где:

  • средне-групповые значения результативного признака.
  • средние значения (или середины интервалов) факторного признака.

Для группировочного признака, среднюю величину находят как середину интервала.

В случае линейной связи важным показателем является поазатель средней силы связи .

(20)

где:

  • средние значения результативного признака в последней и первой группах соответственно;
  • середины интервалов (или средние значения) факторного признака в последней и первой группах.

Измерение тесноты связи Измерение тесноты связи в аналитических группировках основано на правиле сложения дисперсий — общая дисперсия всегда равна сумме средней внутригрупповой и межгрупповой дисперсий:

(21)

где:

  • общая дисперсия, характеризует вариацию признака во всей совокупности, сложившуюся под влиянием всех факторов и условий:

или (22)

где — общая средняя.

  • средняя внутригрупповая дисперсия, оценивает вариацию признака, сложившуюся по влиянием других, неучтенных в данном исследовании факторов и независящую от фактора группировки. Она определяется как средняя из групповых дисперсий:

или (23)

  • внутригрупповая (случайная) дисперсия,

или (24)

где — групповая средняя.

  • межгрупповая (систематическая) дисперсия, измеряет систематическую вариацию, обусловленную влиянием фактора, по которому произведена группировка:

эконометрика корреляция коэффициент модель

(25)

Показателем тесноты связи между признаками в аналитической группировке служит корреляционное отношение:

(26)

Корреляционное отношение может принимать значения от 0 до 1. Принято считать, что до 0,3 связь слабая, от 0,3 до 0,7 связь средняя, свыше 0,7 связь сильная. Чем больше корреляционное отношение, тем больше фактор, положенный в основание группировки, оказывает влияние на общую вариацию результативного признака, то есть они более тесно взаимосвязаны.

Квадрат корреляционного отношения — коэффициент детерминации:

(27)

Показывает долю вариации результативного признака обусловленную включенным в модель фактором.

Пример 4. В таблице 9 приведены значения факторного признака — затраты на рекламу млн.руб. и результативного признака — прибыль млн. руб. и число предприятий в каждой группе .

Таблица 9.

Затраты на рекламу в месяц млн.руб.

Число предприятий,

Средняя прибыль за месяц млн. руб.

0,08−0,12

23,56

0,12−0,16

25,20

0,16−0,20

29,80

0,20−0,24

36,50

Необходимо рассчитать показатели силы связи.

Решение.

Рассчитаем среднее значение фактора как середину интервала, и изменение средней прибыли при переходе от одной группы к другой. Результаты занесем в таблицу 10.

Таблица 10

Затраты на рекламу в месяц млн.руб.

Число предприятий,

Средняя прибыль за месяц млн.руб.

Середина интервала млн.руб.

Изменение средней прибыли млн.руб.

0,08−0,12

23,56

0,10

;

0,12−0,16

25,20

0,14

1,64

0,16−0,20

29,80

0,18

4,60

0,20−0,24

36,50

0,22

6,70

Изменение средней прибыли имеет существенные отличия при переходе от одной группы к другой, соответственно связь меду признаками нелинейная. Необходимо рассчитывать несколько показателей силы связи характеризующих взаимосвязи при переходе от одной группы к другой.

1);

  • Это значит, что при увеличении затрат на рекламу от 0,08 до 0,16 млн руб. средняя прибыль будет увеличиваться в среднем на 41 руб. на каждый дополнительно потраченный на рекламу рубль.

2) ;

  • Это значит, что при увеличении затрат на рекламу от 0,16 до 0,20 млн руб. средняя прибыль будет увеличиваться в среднем на 115 руб. на каждый дополнительно потраченный на рекламу рубль.

3) .

Это значит, что при увеличении затрат на рекламу от 0,20 до 0,24 млн руб. средняя прибыль будет увеличиваться в среднем на 167,5 руб. на каждый дополнительно потраченный на рекламу рубль.

Различия между показателями силы связи обусловлены тем, что сила влияния затрат на прибыль не постоянна, она возрастает при переходе от одной группы к другой.

Пример 5. По данным табл. 10 необходимо рассчитать показатели силы связи.

Таблица 11

Затраты на рекламу в месяц млн.руб.

Число предприятий,

Средняя прибыль за месяц млн.руб.

Середина интервала млн.руб.

Изменение средней прибыли млн.руб.

0,08−0,12

23,56

0,10

;

0,12−0,16

25,20

0,14

1,64

0,16−0,20

26,86

0,18

1,66

0,20−0,24

28,51

0,22

1,65

Решение.

Изменения отличаются не существенно, то есть связь между признаками линейная, рассчитаем показатель средней силы связи.

Это значит, что для всей совокупности, увеличение затрат на рекламу в среднем увеличит среднюю прибыль на 41,25 руб. на каждый дополнительно затраченный рубль.

Пример 6. Имеются данные о средней прибыли на отдельных торговых точках и профессиональном разряде продавцов (табл. 11)

Таблица 12

Разряд

Средняя прибыль тыс.руб.

Число точек.

Разряд

Средняя прибыль тыс.руб.

Число точек.

I

I

I

I

II

II

II

II

II

II

I

II

1. Рассчитаем общую дисперсию выборки (табл. 13):

Таблица 13

Средняя прибыль тыс.руб.

Число точек.

— 8,673 077

75,222 265

376,111 323

— 0,673 077

0,453 033

3,171 229

— 1,673 077

2,799 187

11,196 747

6,326 923

40,29 955

120,89 864

2,326 923

5,414 571

27,72 853

1,326 923

1,760 725

8,803 623

— 3,673 077

13,491 495

40,474 484

— 0,673 077

0,453 033

1,812 131

5,326 923

28,376 109

141,880 543

— 1,673 077

2,799 187

11,196 747

3,326 923

11,68 417

33,205 250

0,326 923

0,106 879

0,427 515

Итого

775,44 231

Среднее

68,673 077

14,912 352

2. Рассчитаем дисперсию для каждой группы:

Таблица 14

Средняя прибыль тыс.руб.

Число точек.

— 6,375 000

40,640 625

203,203 125

1,625 000

2,640 625

18,484 375

3,625 000

13,140 625

65,703 125

— 1,375 000

1,890 625

5,671 875

1,625 000

2,640 625

10,562 500

Итого

303,625 000

Среднее

66,375

12,651 042

а) Группа с разрядом — I (табл. 14)

Таблица 15.

Средняя прибыль тыс.руб.

Число точек.

— 3,642 567

13,268 294

53,73 177

4,357 433

18,987 222

56,961 667

0,357 433

0,1 277 583

0,6 387 917

3,357 433

11,272 356

56,361 782

— 3,642 567

13,268 294

53,73 177

1,357 433

1,8 426 243

5,527 873

— 1,642 567

2,6 980 263

10,792 105

Итого

236,42 857

Среднее

70,642 567

8,4 438 776

б) Группа с разрядом равным II (табл. 15)

3. Рассчитаем среднюю внутригрупповую дисперсию:

4. Найдем межгрупповую дисперсию.

Проверим через правило сложения дисперсий

5. Рассчитаем корреляционное отношение:

То есть, фактор, положенный в основу группировки (разряд) оказывает среднее влияние на результат (среднюю прибыль).

6. Рассчитаем детерминационное отношение То есть вариация результативного признака на % обусловлена влиянием фактора — разряд продавца.

2.4 Корреляционно-регрессионный анализ Основные понятия Корреляция — взаимосвязь между признаками, заключается в изменении средней величины результативного признака в зависимости от значения фактора (факторов).

Регрессия — функция, позволяющая по величине одного корреляционно связанного признака вычислять средние значения другого.

Корреляция, регрессия парная — корреляция, регрессия между двумя признаками: результативным и факторным .

Корреляция, регрессия множественная — взаимосвязь между несколькими признаками (тремя и более), один из которых является результативным признаком, другие факторными признаками .

Корреляция линейная — корреляционная зависимость между признаками носящая линейный характер.

Корреляция нелинейная — корреляционная зависимость между признаками не носит линейный характер, а выражена соответствующей кривой — парабола, гипербола, экспонента, показательная функция и т. д.

Регрессия линейная — регрессионная функция, выраженная уравнение прямой.

Регрессия нелинейная — регрессионная функция выражена соответствующей нелинейной функцией — парабола, гипербола, экспонента, показательная функция и т. д.

Парная корреляционно-регрессионная модель строится для изучения взаимосвязи между результативным признаком и одним фактором. Применяется в случае доминирующего влияния на результат лишь одного фактора, остальные факторы оказывают на результат несущественное влияние. Модель парной регрессии имеет вид: .

Множественная корреляционно-регрессионная модель применяется, когда необходимо изучить влияние на результативный признак не одного, а нескольких факторных признаков. Множественная модель регрессии имеет вид:

2.4.1 Парная регрессия. Парная корреляция Если предполагается, что величина результативного признака сложилась, в основном, под влиянием лишь одного факторного признака, при исследовании взаимосвязей между ними используют парную модель функции регрессии.

(28)

Для того чтобы, построить парную корреляционно-регрессионную модель необходимо решить следующие задачи:

1. отбор фактора,

2. спецификация модели (выбор вида функции регрессии).

Отбор фактора в модель парной регрессии Фактор, который будет использован в парной модели, должен отвечать следующим требованиям: его влияние на результат должно быть таким, что влиянием всех остальных факторов можно пренебречь, но он не должен находиться в функциональной зависимости с результатом.

Число наблюдений фактора должно превышать число параметров при переменной в 6−7 раз. Так для модели вида необходимо не менее 6−7 наблюдений, а для модели потребуется не менее 12−14 наблюдений.

Спецификация модели парной регрессии В парной регрессии используют линейные и нелинейные функции:

  • линейная функция
  • полином второй степени
  • полином третьей степени и т. д.
  • равносторонняя гипербола
  • степенная функция
  • показательная функция и т. д.

Выбор вида функции в модели парной регрессии может быть осуществлен следующими методами:

Графический метод. В его основу положено построение и исследование графика «корреляционное поле», на основании которого делается вывод о виде функции описывающей взаимосвязь между явлениями.

Аналитический метод. Опирается на изучение природы взаимосвязи между исследуемыми явлениями.

Экспериментальный метод. Вид функции подбирается экспериментально через анализ качества подбора функции, путем сравнения остаточной дисперсии рассчитанной для разных моделей.

2.4.1.1 Парная линейная регрессия Парная линейная регрессия наиболее часто применяется в регрессионных моделях, в силу простоты расчета и интерпретирования результатов.

Расчет регрессионной модели данного вида заключается в нахождении уравнения вида:

(29)

или (30)

где;

  • теоретическое значение результативного признака, рассчитанное по уравнению регрессии, показывающему взаимосвязь между и.
  • фактическое значение результативного признака.
  • случайная величина (возмущение, шум)

(31)

Показывает влияние не учтенных в модели факторов, а также случайных ошибок.

  • параметры уравнения.

Решение уравнения регрессии заключается в расчете его параметров. Наибольшее распространение из методов расчета параметров уравнения получил метод наименьших квадратов (МНК).

МНК позволяет получать такие значения, которые минимизируют сумму квадратов отклонений фактических значений от теоретических .

(32)

При расчете параметров уравнения при помощи МНК необходимо решить систему из двух нормальных уравнений.

(33)

Также используют и готовые уравнения.

Для расчета параметра :

; так как получим:

или (34)

где: (35)

(36)

Для расчета параметра :

(37)

Параметр — это теоретическое значение результативного признака при и только в этом случае имеет экономический смысл, если параметр экономического смысла не имеет. В геометрическом представлении означает координату точки пересечения линии регрессии с осью ординат.

Параметр называется коэффициентом регрессии. Коэффициент регрессии показывает, на сколько единиц, в среднем изменится результативный признак, если факторный признак увеличится на одну единицу. Например, если уравнение регрессии имеет вид:

где прибыль млн. руб. в месяц, а затраты на маркетинг тыс. руб. в месяц. Можно сказать, что при дополнительных затратах на маркетинг на 1 тыс. руб. прибыль в среднем возрастет на 0,02 млн руб.

Геометрически это тангенс угла наклона прямой регрессии .

Пример 7. Имеются данные о средней прибыли (млн. руб.) и затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли (табл. 21).

Построить линейное уравнение регрессии.

Таблица 21.

37,8

0,3

38,0

0,5

39,0

0,7

37,5

0,8

39,5

0,9

36,8

1,1

40,0

1,3

40,1

1,6

40,0

1,7

39,0

2,2

38,0

2,5

41,0

2,6

41,6

2,7

41,0

3,0

41,9

3,2

Решение. Для расчета параметров уравнения регрессии используем МНК. МНК в данном случае дает систему уравнений:

1. Рассчитаем, в таблице 22, все возможные значения и подставим в систему.

После подстановки данных получим систему:

1) Решим систему методом исключения параметра. Для этого первое уравнение разделим на 15, а второе на 25,10.

Далее из второго уравнения вычтем первое Рассчитаем коэффициент регрессии:

Подставим значение в первое уравнение системы и рассчитаем параметр .

Таблица 22

37,80

0,30

0,09

11,34

37,792 344

38,00

0,50

0,25

19,00

38,28 410

39,00

0,70

0,49

27,30

38,264 476

37,50

0,80

0,64

30,00

38,382 510

39,50

0,90

0,81

35,55

38,500 543

36,80

1,10

1,21

40,48

38,736 609

40,00

1,30

1,69

52,00

38,972 676

40,10

1,60

2,56

64,16

39,326 775

40,00

1,70

2,89

68,00

39,444 808

39,00

2,20

4,84

85,80

40,34 974

38,00

2,50

6,25

95,00

40,389 074

41,00

2,60

6,76

106,60

40,507 107

41,60

2,70

7,29

112,32

40,625 140

41,00

3,00

9,00

123,00

40,979 240

41,90

3,20

10,24

134,08

41,215 306

Сумма

591,20

25,10

55,01

1004,63

591,199 993

В среднем

39,413 333

1,673 333

3,667 333

66,975 333

1,518 713

0,931 283

3,327 158

38,874 862

2,306 489

0,867 289

11,69 980

1511,254 918

2. Рассчитаем параметры уравнения, используя готовые уравнения.

Небольшие расхождения в расчете параметров разными методами объясняются ошибками округления.

Подставим полученные значения (возьмем значения полученные в Microsoft Excel, как наиболее точные. см. далее) в уравнение регрессии .

Коэффициент парной линейной регрессии показывает, что при увеличении фактора — «затраты на рекламу» на 1 единицу (1 млн руб.), результат — «средняя прибыль» увеличится, в среднем на 1,180 332 млн руб.

Далее подставляя значения фактора в уравнение регрессии, рассчитаем теоретические значения, занесем их в последний столбик таблицы 22.

2) Рассмотрим решение данной задачи в Microsoft Excel.

Первое. В новой книге Microsoft Excel внесем исходные данные (рис 1).

Рисунок 1.

Далее нажимаем кнопку Сервис и в открывшейся панели нажимаем кнопку Анализ данных.

В панели Анализ данных нажимаем Регрессия:

В панели регрессия вводим входной интервал, выделяя столбик, содержащий данные результативного признака, и входной интервал, выделяя столбик, содержащий данные фактора. Ответ можно поместить на новом рабочем листе, в новой рабочей книге, или на листе, содержащем условия выбирая выходной интервал, для чего указываем графа-клетку начала размещения ответа (рис 2).

Рисунок 2.

Нажимаем ОК. Появится таблица, содержащая результаты регрессионного анализа (рис 3).

Рисунок 3.

Параметр в данной таблице находится на пересечении столбика «Коэффициенты» и строки «Y-пересечение», параметр — на пересечении столбика «Коэффициенты» и строки «Переменная Х1».

2.4.1.2 Парная линейная корреляция Простейшим методом определения наличия и формы взаимосвязи является построения корреляционной таблицы и графика «корреляционное поле».

Корреляционная таблица — таблица, в которой записываются частоты сочетаний результативного и факторного показателей. В настоящее время корреляционная таблица не используется для вычисления уравнения связи.

Пример 8. Имеются данные о себестоимости единицы продукции (руб.) и затратах на рекламу (млн. руб.) (табл. 23).

Таблица 23.

Составим корреляционную таблицу (табл. 24).

Таблица 24.

y x

Итого

Итого

По корреляционной таблице можно сделать следующие выводы. Если и распложены по возрастанию, то расположение частот около диагонали таблицы слева вниз направо говорит о прямой форме связи, если по диагонали вверх направо, то связь обратная. Если частоты находятся равномерно по всей таблицы — связь слабая.

Корреляционное поле (графический метод изучения взаимосвязей) — точечный график, характеризующий единицу наблюдения по двум признакам. Факторный признак откладывается по оси абсцисс, результативный признак по оси ординат.

По данным примера 8 построим корреляционное поле (рис. 4).

Рисунок 4

Анализ корреляционного поля показывает, что имеется прямая связь.

Если связь между признаками обратная, то корреляционное поле будет иметь примерно такой вид (рис. 5).

Рисунок 5

Если корреляционное поле имеет следующий вид (рис. 6) можно сделать вывод об отсутствии выраженной взаимосвязи.

Рисунок 6

Корреляционная таблица и корреляционное поле показывают лишь наличие, отсутствие и направление связи. Но они не дают представления о тесноте, интенсивности связи между признаками.

Тесноту связи в парной линейной модели определяют, рассчитывая линейный коэффициент парной корреляции или просто коэффициент корреляции. Существуют формулы расчета:

(38)

или (39)

где: — коэффициент регрессии;

  • среднее квадратическое значение факторного признака;
  • среднее квадратическое значение результативного признака;

(40)

где — сумма квадратов отклонений обусловленная влиянием фактора ;

  • общая сумма квадратов отклонений признака .

Коэффициент корреляции также можно рассчитать через значение признаков в стандартизованном масштабе:

(41)

где: — значения признаков в стандартизованном масштабе.

(42)

(43)

Коэффициент корреляции может принимать значения от до. В статистике говорят, что если значения коэффициента парной корреляции:

  • меньше 0,3 (-0,3)? связь положительная (отрицательная) слабая;
  • от 0,3 до 0,7 (от -0,3 до -0,7)? связь положительная (отрицательная) средняя;
  • свыше 0,7 (-0,7) связь положительная (отрицательная) сильная;
  • равен 1 (-1) связь функциональная положительная (отрицательная);
  • равен 0 — связь отсутствует.

Другой показатель тесноты связи — коэффициент парной детерминации. Он показывает часть вариации результативного признака, которая сложилась под влиянием включенного в парную модель фактора. Коэффициент парной детерминации рассчитывают, возводя в квадрат коэффициент парной корреляции или по формуле:

(44)

Коэффициент парной детерминации позволяет определять тесноту связи не только в линейных, но и в нелинейных моделях.

Коэффициент парной детерминации может принимать значения от до .

Пример 9. Имеются данные о средней прибыли (млн. руб.) и затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли (табл. 25).

Таблица 25.

37,80

0,30

38,00

0,50

39,00

0,70

37,50

0,80

39,50

0,90

36,80

1,10

40,00

1,30

40,10

1,60

40,00

1,70

39,00

2,20

38,00

2,50

41,00

2,60

41,60

2,70

41,00

3,00

41,90

3,20

Сумма

591,20

25,10

В среднем

39,413 333

1,673 333

1,518 713

0,931 283

Рассчитать коэффициент парной линейной корреляции и коэффициент парной линейной регрессии .

Решение.

1) Так, как из примера 7 известно, что уравнение регрессии используем формулу:

Коэффициент парной корреляции показывает, что между исследуемыми признаками существует тесная положительная связь.

Возведя коэффициент корреляции в квадрат, получим коэффициент детерминации.

Коэффициент детерминации показывает, что 52% от всей вариации результативного признака обусловлено влиянием включенного в модель фактора, а 48% вариации вызвано влиянием всех остальных, не исследуемых в данной модели факторами.

2) Рассмотрим решение данной задачи в Microsoft Excel.

В новой книге Microsoft Excel внесем исходные данные (рис 7).

Далее нажимаем кнопку Сервис и в открывшийся панели нажимаем кнопку Анализ данных В панели Анализ данных нажимаем корреляция:

В панели корреляция вводим входной интервал, выделяя все столбики, содержащий и данные результативного признака и данные фактора. Ответ можно поместить на новом рабочем листе, в новой рабочей книге, или на листе, содержащем условия выбирая выходной интервал, для чего указываем графа-клетку начала размещения ответа (рис. 7).

Рисунок 7.

Нажимаем ОК.

Появится таблица парных линейных коэффициентов корреляции (рис. 8).

Рисунок 8.

На пересечении столбца 1 и столбца 2 и будет искомый коэффициент парной линейной корреляции.

2.4.1.3 Оценка надежности уравнения парной линейной регрессии, его параметров и коэффициента парной линейной корреляции Результаты корреляционно-регрессионного анализа необходимо проверить, проведя оценку существенности, как уравнения регрессии, так и его параметров и коэффициента корреляции.

Оценка существенности уравнения регрессии в целом проводится с помощью критерия Фишера — F-критерия.

При этом исходят из представления, что если между изучаемыми признаками и есть связь и уравнение парной линейной регрессии эту связь отражает, то вариация результативного признака, обусловленная влиянием факторного признака (факторная вариация) должна быть в несколько раз больше, чем вариация результативного признака, вызванная всеми другими факторами (остаточная вариация).

Для этого вначале проводят исследование дисперсии.

Общую сумму квадратов отклонений раскладывают на две части — «факторную» и «остаточную».

(45)

где: — общая сумма квадратов отклонений;

  • факторная сумма квадратов отклонений;
  • остаточная сумма квадратов отклонений.

Разделив каждую сумму квадратов отклонений на соответствующее число степеней свободы (для общей суммы, для факторной и для остаточной) получим дисперсию на одну степень свободы — .

(46)

(47)

(48)

Для расчета F-критерия сопоставим факторную и остаточную дисперсию;

(49)

Также F-критерий можно рассчитать по формуле:

(50)

Оценку существенности уравнения регрессии проводят, сравнивая полученное значение F-критерия () с табличным значением (), которое берут из таблиц критических значений F-отношений при определенном уровне значимости, как правило: или, и числе свободы:, (таблицы Снедекора-Фишера — приложение 2).

Если то уравнение регрессии значимо, если меньше незначимо.

Значимость параметров уравнения и коэффициента корреляции проверяют при помощи критерия Стьюдента — t-критерия.

Критерий Стьюдента для коэффициента регрессии рассчитывается как;

(51)

где;

  • коэффициент регрессии [26, «https:// «].
  • стандартная ошибка коэффициента регрессии, рассчитывается как:

(52)

Учитывая, что

(53)

Критерий Стьюдента для параметра рассчитывается как;

(54)

где: — свободный член уравнения регрессии.

  • стандартная ошибка параметра, рассчитывается как:

(55)

или (56)

Критерий Стьюдента для коэффициента корреляции рассчитывается как;

(57)

или (58)

где: — коэффициент парной линейной корреляции.

  • стандартная ошибка коэффициента корреляции, рассчитывается как:

(59)

Кроме того, для парной линейной регрессии верно, что:

(60)

Полученные фактические значения критерия Стьюдента сравнивают с табличными значениями при определенном уровне значимости, или, и числе степеней свободы (приложение 1), где — число единиц наблюдения, — число параметров уравнения регрессии. Если фактическое значение больше табличного соответствующий коэффициент статистически значим.

Пример 10. По данным примера 7 и примера 9 провести оценку существенности полученного уравнения регрессии, его параметров, и коэффициента корреляции .

Решение.

1. Оценка статистической значимости функции регрессии проводится при помощи критерия Фишера — F-критерия.

Рассчитаем для парной линейной регрессии. Расчет проведем по формуле:

Далее фактическое значение необходимо сравнить с табличным значением. Табличное значение берется из таблиц значения Фишера при разных уровнях значимости (приложение 2).

При и числе степеней свободы, ,. Так как, можно сказать, что уравнение регрессии статистически значимо.

2. Оценка статистической значимости параметров уравнения регрессии и коэффициента парной линейной корреляции проводится при помощи критерия Стьюдента — t-критерия.

Для расчета критерия Стьюдента составим таблицу 26.

Таблица 26

37,80

0,30

0,09

37,792 344

0,59

1,886 044

38,00

0,50

0,25

38,28 410

0,807

1,376 710

39,00

0,70

0,49

38,264 476

0,540 996

0,947 377

37,50

0,80

0,64

38,382 510

0,778 824

0,762 711

39,50

0,90

0,81

38,500 543

0,998 914

0,598 044

36,80

1,10

1,21

38,736 609

3,750 454

0,328 711

40,00

1,30

1,69

38,972 676

1,55 395

0,139 378

40,10

1,60

2,56

39,326 775

0,597 877

0,5 378

40,00

1,70

2,89

39,444 808

0,308 238

0,711

39,00

2,20

4,84

40,34 974

1,71 171

0,277 378

38,00

2,50

6,25

40,389 074

5,707 675

0,683 378

41,00

2,60

6,76

40,507 107

0,242 944

0,858 712

41,60

2,70

7,29

40,625 140

0,950 352

1,54 045

41,00

3,00

9,00

40,979 240

0,431

1,760 045

41,90

3,20

10,24

41,215 306

0,468 806

2,330 712

Сумма

591,20

25,10

55,01

591,199 992

16,472 942

13,9 333

В среднем

1,673 333

Фактически критерий Стьюдента для коэффициента регрессии рассчитывается как;

  • Значение стандартных ошибок, можно взять из результатов регрессионного анализа в Microsoft Excel — рисунок 3, столбец — стандартная ошибка.

Фактический критерий Стьюдента для свободного члена уравнение регрессии рассчитывается как:

  • Фактически критерий Стьюдента для коэффициента корреляции рассчитывается как;

Также верно, что

Полученные фактические критерии Стьюдента с табличным значением (приложение 1) при определенном уровне значимости и числе степеней свободы. Если фактические значения t-критерия превышают табличные можно принять, что соответствующее расчетное значение статистически значимо.

Для данного примера табличное значение, при и составит. Все фактические значения t-критерия превышают табличные. Можно сделать вывод о статистической значимости параметров уравнения регрессии и коэффициента парной линейной корреляции для парной линейной регрессии выраженной уравнением .

2) Расчет фактического критерия Фишера и критерия Стьюдента в Microsoft Excel.

Фактические значения критериев Фишера и Стьюдента представлены в итоговой таблице, содержащей результаты регрессионного анализа — пример 7, рис. 3.

Критерий Фишера расчетный обозначен в столбике F дисперсионного анализа, t-критерии для параметров уравнения в столбике t-статистика.

2.4.1.4 Парная нелинейная регрессия Естественно, что кроме линейных взаимосвязей между явлениями природы, и тем более общественного мира существуют связи нелинейные. Соответственно изучать нелинейные связи при помощи линейной регрессии было бы не верно, для этого необходимо использовать нелинейные регрессии.

Но использование нелинейных регрессий связанно следующим ограничением — так как, параметры уравнения регрессии находят при помощи МНК, решая систему нормальных уравнений, а этот метод позволяет оценивать параметры или линейных уравнений или уравнений приводимых к линейному виду, то выбор нелинейных регрессий ограничен — должна существовать возможность линеаризации данных функций.

Регрессии, приводимые к линейному виду, подразделяют на два класса:

I. нелинейные относительно включенного в модель фактора (независимой переменной), но линейны относительно результата (зависимой переменной).

К первому классу относятся такие функции как, например:

  • полиномы разных степеней;
  • полином второй степени
  • полином третьей степени и т. д.

равносторонняя гипербола: .

II. нелинейные относительно включенного в модель результата, но линейны относительно фактора.

Ко второму классу относятся такие функции как, например:

степенная функция: .

показательная: .

экспоненциальная: .

Рассмотрим линеаризацию наиболее часто применяемых функций.

Линеаризация полиномов разных степеней Проводится следующим образом.

В параболе второй степени,

(61)

заменяя переменные, получим двухфакторное линейное уравнение регрессии:

(62)

В параболе третьей степени,

(64)

заменяя переменные, получим трехфакторное линейное уравнение регрессии:

(65)

Аналогичным образом поступим с полиномами более высоких порядков.

Из полиномов наибольшее распространение получила парабола второго порядка.

МНК для оценки параметров функция регрессии по линеаризованной параболе второго порядка дает следующую систему уравнений:

(66)

Пример 11. Имеются данные о средней прибыли (млн. руб.) и затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятиях сферы торговли. Рассчитать функцию регрессии параболы второго порядка

Таблица 27

37,8

0,3

38,0

0,5

39,0

0,7

37,5

0,8

39,5

0,9

36,8

1,1

40,0

1,3

40,1

1,6

40,0

1,7

39,0

2,2

38,0

2,5

41,0

2,6

41,6

2,7

41,0

3,0

41,9

3,2

Решение. МНК для расчета параметров параболы второго порядка дает систему уравнений:

В таблице 28 рассчитаем все возможные значения:

Таблица 28

37,80

0,30

0,09

0,027

0,0081

11,34

3,402

38,23 560

38,00

0,50

0,25

0,125

0,0625

19,00

9,500

38,158 005

39,00

0,70

0,49

0,343

0,2401

27,30

19,110

38,307 508

37,50

0,80

0,64

0,512

0,4096

30,00

24,000

38,387 907

39,50

0,90

0,81

0,729

0,6561

35,55

31,995

38,472 071

36,80

1,10

1,21

1,331

1,4641

40,48

44,528

38,651 694

40,00

1,30

1,69

2,197

2,8561

52,00

67,600

38,846 375

40,10

1,60

2,56

4,096

6,5536

64,16

102,656

39,166 634

40,00

1,70

2,89

4,913

8,3521

68,00

115,600

39,280 917

39,00

2,20

4,84

10,648

23,4256

85,80

188,760

39,908 803

38,00

2,50

6,25

15,625

39,0625

95,00

237,500

40,330 713

41,00

2,60

6,76

17,576

45,6976

106,60

277,160

40,478 879

41,60

2,70

7,29

19,683

53,1441

112,32

303,264

40,630 810

41,00

3,00

9,00

27,000

81,0000

123,00

369,000

41,109 192

41,90

3,20

10,24

32,768

104,8576

134,08

429,056

41,446 938

Итого

591,20

25,10

55,01

137,573

367,7897

1004,63

2223,131

591,200 005

Подставим эти значения в систему уравнений.

Разделим каждое из уравнений системы на число при, первое на 15, второе на 25,01 и третье на 55,01.

Далее вычтем из 5-го уравнения 4-е, и из 6-го уравнения 5-е. система примет вид:

Разделим каждое уравнение на число при, 7-е на 0,5183, а 8-е на 0,30 924

Вычтем из 10-го уравнения 9-е Значение параметра

Подставим значение параметра в уравнение (9) и найдем значение параметра

Подставим значение параметров в уравнение (1) и найдем значение параметра

Подставим параметры в уравнение Подставляя в полученное уравнение и рассчитаем теоретические значения, занесем их в последний столбик таблицы.

Линеаризацию равносторонней гиперболы

(67)

проводят, заменяя на, в результате получим уравнение линейной регрессии:

(68)

МНК для оценки параметров функция регрессии по линеаризованной равносторонней гиперболе дает следующую систему уравнений:

(69)

Также можно использовать уравнения:

(70)

(71)

Пример 12. Имеются данные о средней прибыли (млн. руб.) и затратах на затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли. Рассчитать функцию регрессии равносторонней гиперболы

Таблица 29

37,8

0,3

38,0

0,5

39,0

0,7

37,5

0,8

39,5

0,9

36,8

1,1

40,0

1,3

40,1

1,6

40,0

1,7

39,0

2,2

38,0

2,5

41,0

2,6

41,6

2,7

41,0

3,0

41,9

3,2

МНК для оценки параметров функция регрессии по линеаризованной равносторонней гиперболе дает следующую систему уравнений:

В таблице 30 рассчитаем все возможные значения:

Таблица 30

37,80

0,30

3,333 333

126,0

11,111 111

36,808 395

38,00

0,50

2,0

76,0

4,0

38,266 516

39,00

0,70

1,428 571

55,714 286

2,40 816

38,891 425

37,50

0,80

1,250 000

46,875 000

1,562 500

39,86 709

39,50

0,90

1,111 111

43,888 889

1,234 568

39,238 597

36,80

1,10

0,909 091

33,454 545

0,826 446

39,459 524

40,00

1,30

0,769 231

30,769 231

0,591 716

39,612 474

40,10

1,60

0,625 000

25,62 500

0,390 625

39,770 204

40,00

1,70

0,588 235

23,529 412

0,346 021

39,810 409

39,00

2,20

0,454 545

17,727 273

0,206 612

39,956 611

38,00

2,50

0,400 000

15,200 000

0,160 000

40,16 262

41,00

2,60

0,384 615

15,769 231

0,147 929

40,33 086

41,60

2,70

0,370 370

15,407 407

0,137 174

40,48 664

41,00

3,00

0,333 333

13,666 667

0,111 111

40,89 168

41,90

3,20

0,312 500

13,93 750

0,97 656

40,111 951

Итого

591,20

25,10

14,269 937

552,158 190

22,964 285

591,199 995

Подставим полученные значения в систему уравнений Разделим первое уравнение на 15, а второе на 14,269 937

Вычтем из второго уравнения первое Подставим значение параметра в первое уравнение и рассчитаем параметр

Уравнение регрессии примет вид Подставляя в полученное уравнение регрессии значение, рассчитаем .

Линеаризацию степенной функции

(72)

проводят путем логарифмирования обеих частей уравнения, получая уравнение вида:

(73)

Обозначив через, получим линейное уравнение регрессии:

(74)

МНК для оценки параметров функция регрессии по линеаризованной степенной функции дает следующую систему уравнений:

(75)

Также можно использовать уравнения:

(76)

(77)

Рассчитав параметры, и составив линейное уравнение регрессии необходимо провести его потенцирование, что бы вернуться к степенной функции.

(78)

Пример 13. Имеются данные о средней прибыли (млн. руб.) и затратах на затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли. Рассчитать степенную функцию

Таблица 31.

37,8

0,3

38,0

0,5

39,0

0,7

37,5

0,8

39,5

0,9

36,8

1,1

40,0

1,3

40,1

1,6

40,0

1,7

39,0

2,2

38,0

2,5

41,0

2,6

41,6

2,7

41,0

3,0

41,9

3,2

Решение. Для расчета параметров данной функции проведем ее линеаризацию, прологарифмировав обе части уравнения

Обозначив через, получим линейное уравнение регрессии:

МНК для оценки параметров функция регрессии по линеаризованной степенной функции дает следующую систему уравнений:

В таблице 32 рассчитаем все возможные значения:

Таблица 32

37,80

0,30

1,577 492

— 0,522 879

— 0,824 837

37,183 851

38,00

0,50

1,579 784

— 0,301 030

— 0,475 562

37,910 774

39,00

0,70

1,591 065

— 0,154 902

— 0,246 459

38,397 333

37,50

0,80

1,574 031

— 0,96 910

— 0,152 539

38,592 153

39,50

0,90

1,596 597

— 0,45 757

— 0,73 056

38,764 817

36,80

1,10

1,565 848

0,41 393

0,64 815

39,60 772

40,00

1,30

1,602 060

0,113 943

0,182 544

39,308 870

40,10

1,60

1,603 144

0,204 120

0,327 234

39,619 441

40,00

1,70

1,602 060

0,230 449

0,369 193

39,710 581

39,00

2,20

1,591 065

0,342 423

0,544 817

40,100 534

38,00

2,50

1,579 784

0,397 940

0,628 659

40,295 293

41,00

2,60

1,612 784

0,414 973

0,669 262

40,355 237

41,60

2,70

1,619 093

0,431 364

0,698 418

40,413 002

41,00

3,00

1,612 784

0,477 121

0,769 493

40,574 705

41,90

3,20

1,622 214

0,505 150

0,819 461

40,674 075

Итого

591,20

25,10

23,929 804

2,37 398

3,301 443

590,961 438

В среднем

1,595 320

0,135 827

0,220 096

0,89 930

Подставим полученные значения в уравнение Выполним потенцирование полученного уравнения Подставляя в полученное уравнение значение фактора, рассчитаем .

Линеаризацию показательной функции Показательная функция

(79)

также проводят путем логарифмирования обеих частей уравнения:

(80)

Обозначив через, получим линейное уравнение регрессии:

(81)

МНК для оценки параметров функция регрессии по линеаризованной степенной функции дает следующую систему уравнений:

(82)

Также можно использовать уравнения:

(83)

(84)

Рассчитав параметры, и составив линейное уравнение регрессии необходимо провести его потенцирование, что бы вернуться к показательной функции.

(85)

Пример 14. Имеются данные о средней прибыли (млн. руб.) и затратах на затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли. Рассчитать показательную функцию

Таблица 33

37,8

0,3

38,0

0,5

39,0

0,7

37,5

0,8

39,5

0,9

36,8

1,1

40,0

1,3

40,1

1,6

40,0

1,7

39,0

2,2

38,0

2,5

41,0

2,6

41,6

2,7

41,0

3,0

41,9

3,2

Решение. Для расчета параметров данной функции проведем ее линеаризацию, прологарифмировав обе части уравнения Обозначив через, получим линейное уравнение регрессии:

МНК для оценки параметров функция регрессии по линеаризованной степенной функции дает следующую систему уравнений:

В таблице 34 рассчитаем все возможные значения:

Таблица 34

37,80

0,30

1,577 492

0,473 248

37,806 262

38,00

0,50

1,579 784

0,789 892

38,32 035

39,00

0,70

1,591 065

1,113 745

38,259 157

37,50

0,80

1,574 031

1,259 225

38,373 226

39,50

0,90

1,596 597

1,436 937

38,487 635

36,80

1,10

1,565 848

1,722 433

38,717 477

40,00

1,30

1,602 060

2,82 678

38,948 692

40,10

1,60

1,603 144

2,565 031

39,298 106

40,00

1,70

1,602 060

2,723 502

39,415 272

39,00

2,20

1,591 065

3,500 342

40,6 365

38,00

2,50

1,579 784

3,949 459

40,365 268

41,00

2,60

1,612 784

4,193 238

40,485 616

41,60

2,70

1,619 093

4,371 552

40,606 323

41,00

3,00

1,612 784

4,838 352

40,970 608

41,90

3,20

1,622 214

5,191 085

41,215 278

Итого

591,20

25,10

23,929 804

40,210 718

590,987 319

В среднем

1,673 333

1,595 320

2,680 715

0,867 289

Получили линеаризованное уравнение Произведем потенцирование линейного уравнения для возврата к показательной функции.

Подставим в полученное уравнение значения фактора, рассчитаем значения .

2.4.1.5 Коэффициенты эластичности в парных моделях Коэффициенты регрессии выражены в натуральных единицах, то есть являются именованными величинами, поэтому коэффициенты регрессии, выраженные в разных единицах несопоставимы между собой. Для сопоставления разноименных коэффициентов корреляции линейных и нелинейных моделей удобно использовать коэффициент эластичности.

(86)

где:

  • первая производная функции регрессии для соответствующей формы связи.

Так как коэффициент эластичности не всегда величина постоянная, а часто зависит от значения, обычно рассчитывают средний коэффициент эластичности.

(87)

Коэффициент средней эластичности для некоторых функций рассчитывается как:

уравнения прямой :

(88)

парабола второго порядка

уравнение равносторонней гиперболы :

(89)

степенного уравнения :

(90)

показательного уравнения :

(91)

Коэффициент средней эластичности показывает, на сколько процентов в среднем изменится результативный признак, если факторный признак увеличится на один процент.

Коэффициент средней эластичности позволяет ранжировать факторы по силе влияния на результат, чем больше коэффициент дляго фактора, тем сильнее данный фактор влияет на результат.

Пример 15. Исходя из рассчитанных уравнений регрессии (табл. 35) рассчитать коэффициенты средней эластичности для линейной функции, полинома второй степени, равносторонней гиперболы, степенной и показательной функций.

Таблица 35

Функция

Уравнение регрессии

Линейная

1,6713

Парабола второй степени

Равносторонняя гипербола

Степенная

Показательная

Рассчитать коэффициенты средней эластичности для каждого уравнения регрессии.

Решение.

1. Для линейной функции

2. Для полинома второй степени

3. Для равносторонней гиперболы

4. Для степенной функции

5. Для показательной функции

Пример 16. По группе предприятий, рассчитаны уравнения парной линейной регрессии, отражающие зависимость средней прибыли от уровня оплаты труда и затрат на маркетинг (табл. 36).

Таблица 36

Признак-фактор

Уравнение парной линейной регрессии

Среднее значение фактора

Уровень оплаты труда,

62,4

Затраты на маркетинг,

189,07

Используя коэффициенты средней эластичности определить степень влияния каждого из факторов.

Решение.

По формуле коэффициента средней эластичности для линейной функции рассчитаем данный коэффициент по каждому из факторов.

а) по фактору

б) по фактору

Исходя из рассчитанных коэффициентов средней эластичности, можно сказать, что фактор оказывает более сильное влияние на урожайность, чем фактор .

2.4.1.6 Парная нелинейная корреляция В нелинейных моделях для определения силы связи рассчитывают индекс корреляции:

(92)

где;

  • остаточная дисперсия результативного признака.
  • общая дисперсия результативного признака.

Отсюда: (93)

Величина индекса корреляции может принимать значения от до, то есть, он показывает только тесноту связи, но не показывает ее направление.

Квадрат индекса корреляции — индекс детерминации характеризует долю вариации результативного признака обусловленную влиянием включенного в модель фактора .

(94)

Величина индекса детерминации определяет качество подбора функции регрессии, чем индекс детерминации выше, тем «лучше» выбор формы уравнения регрессии.

Пример 17. По данным примера 12 (функция регрессии равносторонней гиперболы) рассчитать индекс корреляции, (табл. 37).

Решение.

1. Рассчитаем индекс корреляции Индекс множественной корреляции показывает, что между исследуемыми явлениями существует средняя связь.

Таблица 37

37,80

36,808 395

— 1,6133

2,6027

0,9602

0,9220

38,00

38,266 516

— 1,4133

1,9974

— 0,2770

0,0767

39,00

38,891 425

— 0,4133

0,1708

0,1071

0,0115

37,50

39,86 709

0,0867

0,0075

0,2649

0,0702

39,50

39,238 597

— 1,9133

3,6607

— 1,6938

2,8690

36,80

39,459 524

— 2,6133

6,8293

— 2,6529

7,0379

40,00

39,612 474

0,5867

0,3442

0,3964

0,1571

40,10

39,770 204

0,6867

0,4716

0,3409

0,1162

40,00

39,810 409

0,5867

0,3442

0,2013

0,0405

39,00

39,956 611

— 0,4133

0,1708

— 0,9428

0,8889

38,00

40,16 262

— 1,4133

1,9974

— 2,0016

4,0064

41,00

40,33 086

1,5867

2,5176

0,9984

0,9968

41,60

40,48 664

2,1867

4,7817

1,5664

2,4536

41,00

40,89 168

1,5867

2,5176

0,9265

0,8584

41,90

40,111 951

2,4867

6,1837

1,8040

3,2544

Сумма

591,2000

34,5973

23,7596

В среднем

39,4133

Рассчитаем индекс детерминации Индекс детерминации показывает, что вариация результативного признака на 31% обусловлена влиянием включенного в модель фактора.

2.4.1.7 Оценка надежности параметров парной нелинейной регрессии и корреляции Как и в парной линейной регрессии, в регрессии нелинейной оценку надежности уравнения в целом проводят с помощью критерия Фишера, а оценку параметров уравнения и коэффициента детерминации проводят с помощью критерия Стьюдента.

Общая формула фактический F-критерия имеет вид;

(95)

где:

  • индекс детерминации.
  • число наблюдений.
  • число параметров при переменных .

В случае нелинейной регрессии отлично для разных видов регрессии, и формула F-критерия различна для различных функций.

Например. Для степенной и показательной и:

(96)

Для параболы второго порядка и:

(97)

Для параболы третьего порядка и:

(98)

Как и в случае линейной регрессии, критерий Фишера фактический сравнивают с критерием Фишера табличным, при определенном уровне значимости или, и числе свободы —, (таблицы Снедекора-Фишера — приложение 2).

Значимость параметров уравнения парной нелинейной регрессии и индекса корреляции проверяется, аналогично парной линейной регрессии используя критерий Стьюдента (см. 2.3.1.3 ).

Критерий Стьюдента для коэффициента регрессии рассчитывается как;

(51)

где;

  • коэффициент регрессии.
  • стандартная ошибка коэффициента регрессии, рассчитывается как:

(52)

Учитывая, что

(53)

Критерий Стьюдента для параметра рассчитывается как;

(54)

где: — свободный член уравнения регрессии.

  • стандартная ошибка параметра, рассчитывается как:

(55)

или (56)

Критерий Стьюдента для индекса корреляции рассчитывается как;

(57)

или (58)

где: — индекс корреляции.

  • стандартная ошибка индекса корреляции, рассчитывается как:

(59)

Качество подбора модели определяют, рассчитывая среднюю ошибку аппроксимации. Для расчета средней ошибки аппроксимации используют формулы:

(99)

(100)

где (101)

(102)

Чем меньше средняя ошибка аппроксимации, тем выше качество модели. Допустимый предел не более 10%.

Пример 18. Необходимо оценить существенность уравнения регрессии равносторонней гиперболы

при:

где: — индекс детерминации.

  • число наблюдений.

Решение. Оценку существенности уравнения нелинейной регрессии проведем, используя критерий Фишера (F-критерий)

  • число параметров при переменных .

Найдем критерий Фишера табличный, при уровне значимости, и числе свободы —, (таблицы Снедекора-Фишера — приложение 2) — .

Так как уравнение регрессии признаем статистически значимым.

Пример 19. По данным примеров 7; 11; 12; 13; 14 рассчитаем средние ошибки аппроксимации для линейной функции, функции параболы второй степени, равносторонней гиперболы, степенной и показательной функций.

Решение. Для расчета средней ошибки аппроксимации используем формулу:

где

Расчет произведем в таблице 38. Средние ошибки аппроксимации составили для:

линейной функции

параболы второго порядка

функции равносторонней гиперболы

степенной функции

показательной функции

Соответственно линейная функция наиболее качественно описывает существующую взаимосвязь между исследуемыми явлениями. Но все регрессии находятся в допустимых пределах (не более 10%).

Таблица 38

Линейная

Парабола второго порядка

Гипербола

37,8

37,792 344

0,7 656

0,20 254

38,23 560

0,223 560

0,591 429

36,808 395

0,991 605

2,623 294

38,0

38,28 410

0,28 410

0,74 763

38,158 005

0,158 005

0,415 803

38,266 516

0,266 516

0,701 358

39,0

38,264 476

0,735 524

1,885 959

38,307 508

0,692 492

1,775 621

38,891 425

0,108 575

0,278 397

37,5

38,382 510

0,882 510

2,353 360

38,387 907

0,887 907

2,367 752

39,86 709

1,586 709

4,231 224

39,5

38,500 543

0,999 457

2,530 271

38,472 071

1,27 929

2,602 352

39,238 597

0,261 403

0,661 780

36,8

38,736 609

1,936 609

5,262 524

38,651 694

1,851 694

5,31 777

39,459 524

2,659 524

7,226 967

40,0

38,972 676

1,27 324

2,568 310

38,846 375

1,153 625

2,884 063

39,612 474

0,387 526

0,968 815

40,1

39,326 775

0,773 225

1,928 242

39,166 634

0,933 366

2,327 596

39,770 204

0,329 796

0,822 434

40,0

39,444 808

0,555 192

1,387 980

39,280 917

0,719 083

1,797 708

39,810 409

0,189 591

0,473 978

39,0

40,34 974

1,34 974

2,653 779

39,908 803

0,908 803

2,330 264

39,956 611

0,956 611

2,452 849

38,0

40,389 074

2,389 074

6,287 037

40,330 713

2,330 713

6,133 455

40,16 262

2,16 262

5,305 953

41,0

40,507 107

0,492 893

1,202 178

40,478 879

0,521 121

1,271 027

40,33 086

0,966 914

2,358 327

41,6

40,625 140

0,974 860

2,343 413

40,630 810

0,969 190

2,329 784

40,48 664

1,551 336

3,729 173

41,0

40,979 240

0,20 760

0,50 634

41,109 192

0,109 192

0,266 322

40,89 168

0,910 832

2,221 541

41,9

41,215 306

0,684 694

1,634 115

41,446 938

0,453 062

1,81 294

40,111 951

1,788 049

4,267 420

Итого

591,2

32,182 820

33,206 244

38,323 509

В среднем

2,145 521

2,213 750

2,554 901

Продолжение табл. 38

Степенная

Показательная

37,8

37,183 851

0,616 149

1,630 024

37,806 262

0,6 262

0,16 566

38,0

37,910 774

0,89 226

0,234 805

38,32 035

0,32 035

0,84 303

39,0

38,397 333

0,602 667

1,545 300

38,259 157

0,740 843

1,899 597

37,5

38,592 153

1,92 153

2,912 408

38,373 226

0,873 226

2,328 603

39,5

38,764 817

0,735 183

1,861 223

38,487 635

1,12 365

2,562 949

36,8

39,60 772

2,260 772

6,143 402

38,717 477

1,917 477

5,210 535

40,0

39,308 870

0,691 130

1,727 825

38,948 692

1,51 308

2,628 270

40,1

39,619 441

0,480 559

1,198 401

39,298 106

0,801 894

1,999 736

40,0

39,710 581

0,289 419

0,723 548

39,415 272

0,584 728

1,461 820

39,0

40,100 534

1,100 534

2,821 882

40,6 365

1,6 365

2,580 423

38,0

40,295 293

2,295 293

6,40 245

40,365 268

2,365 268

6,224 389

41,0

40,355 237

0,644 763

1,572 593

40,485 616

0,514 384

1,254 595

41,6

40,413 002

1,186 998

2,853 361

40,606 323

0,993 677

2,388 647

41,0

40,574 705

0,425 295

1,37 305

40,970 608

0,29 392

0,71 688

41,9

40,674 075

1,225 925

2,925 835

41,215 278

0,684 722

1,634 181

Итого

591,2

35,228 156

590,987 320

32,346 303

В среднем

2,348 544

2,156 420

2.4.1.8 Прогнозирование на основе парной модели регрессии Расчет доверительных интервалов для прогнозного значения, параметров уравнения регрессии и коэффициента (индекса) корреляции .

Парные модели регрессии позволяют прогнозировать значение результативного признака как точечный прогноз путем подстановки в уравнение регрессии соответствующего конкретного прогнозного значения .

Естественно, что полученное точечное значение рассчитанное для не может быть на 100% точным, поэтому необходим дополнительный расчет стандартной ошибки для функции регрессии и для индивидуальных значений зависимой переменной, и построение соответствующих интервалов которые с заданной вероятностью (- уровень значимости) накрывают неизвестное значение. Также доверительные интервалы рассчитываются для параметров уравнения регрессии и коэффициента (индекса) корреляции .

Расчет доверительного интервала для функции регрессии

Доверительный интервал для уравнения регрессии имеет вид:

(103)

где:

  • предельная ошибка

(104)

  • стандартная ошибка

(105)

  • остаточное стандартное отклонение на одну степень свободы

(106)

  • табличное значение критерия Стьюдента для числа степеней свободы и определенного уровня значимости .

Необходимо помнить, что прогноз значений результативного признака по уравнению регрессии тем точнее, чем значение фактора ближе к. Если же значение выходит за рамки обследованных значений результаты прогноза ухудшаются тем больше, чем больше разница между и .

Расчет доверительного интервала для индивидуальных значений результативного признака

При построение доверительного интервала для индивидуальных значений результативного признака, в отличие от доверительного интервала для функции регрессии необходимо учитывать вариацию вокруг линии регрессии. В результате стандартная ошибка индивидуальных значений при равна

(107)

Доверительный интервал примет вид:

(108)

где

  • предельная ошибка

(109)

Точность интервала рассчитывают как отношение максимального значения интервала к минимальному значению

(110)

Чем меньше отношение, тем меньше интервал, то есть он более точен.

Расчет доверительных интервалов для параметров уравнения регрессии

Для свободного члена уравнения регрессии доверительный интервал имеет вид:

(111)

Где

  • предельная ошибка

(112)

  • стандартная ошибка

(55)

Для коэффициента регрессии доверительный интервал имеет вид:

(113)

где

  • предельная ошибка

(114)

  • стандартная ошибка

(52)

Пример 20. По данным примера 7 и примера 9, необходимо:

1. провести прогнозирование на основе парной линейной модели регрессии для индивидуального значения результативного признака при .

2. рассчитать доверительные интервалы для а) функции регрессии

б) индивидуального прогнозного значения, при

в) свободно члена уравнения регрессии

г) коэффициента регрессии

Решение.

1) Рассчитаем прогнозное значение результативного признака, подставив индивидуальное значение фактора в линейное уравнение регрессии

2) Рассчитаем доверительные интервалы

a) Доверительный интервал прогноза для функции регрессии рассчитаем как:

Где:

Для расчетов используем таблицу 39.

табличное значение критерия Стьюдента для числа степеней свободы и определенного уровня значимости .

Доверительный интервал прогноза показывает, что с вероятностью прогнозное значение средней прибыли по совокупности предприятий для конкретного значения фактора будет находиться в интервале от 35,187 403 до 41,223 517, не принимая нулевых значений, т. е. являются статистически значимыми.

Таблица 39

37,80

0,30

0,09

37,792 344

1,886 044

0,59

38,00

0,50

0,25

38,28 410

1,376 710

0,807

39,00

0,70

0,49

38,264 476

0,947 377

0,540 996

37,50

0,80

0,64

38,382 510

0,762 711

0,778 824

39,50

0,90

0,81

38,500 543

0,598 044

0,998 914

36,80

1,10

1,21

38,736 609

0,328 711

3,750 454

40,00

1,30

1,69

38,972 676

0,139 378

1,55 395

40,10

1,60

2,56

39,326 775

0,5 378

0,597 877

40,00

1,70

2,89

39,444 808

0,711

0,308 238

39,00

2,20

4,84

40,34 974

0,277 378

1,71 171

38,00

2,50

6,25

40,389 074

0,683 378

5,707 675

41,00

2,60

6,76

40,507 107

0,858 712

0,242 944

41,60

2,70

7,29

40,625 140

1,54 045

0,950 352

41,00

3,00

9,00

40,979 240

1,760 045

0,431

41,90

3,20

10,24

41,215 306

2,330 712

0,468 806

Итого

591,20

25,10

55,01

591,199 992

13,9 333

16,472 942

В среднем

1,673 333

б) Рассчитаем доверительный интервал для индивидуального прогнозного значения, при

Доверительный интервал примет вид:

Доверительный интервал прогноза показывает, что с вероятностью прогнозное значение индивидуальной средней прибыли для конкретного значения фактора будет находиться в интервале от 35,148 114 до 41,262 806, не принимая нулевых значений, т. е. являются статистически значимыми.

в) Рассчитаем доверительный интервал для свободного члена уравнения .

где Доверительный интервал прогноза показывает, что с вероятностью значение параметра находится в интервале от 36,147 123 до 38,729 365, не принимая нулевых значений, т. е. являются статистически значимыми.

г) Для коэффициента регрессии доверительный интервал имеет вид:

где Доверительный интервал показывает, что с вероятностью прогнозное значение будет находиться в интервале от 0,505 907 до 0,674 425, не принимая нулевых значений, т. е. является статистически значимым.

2.4.2 Множественная регрессия. Множественная Корреляция

2.4.2.1 Множественная регрессия В тех случаях, когда известно, что на результативный признак существенное влияние оказывает не один, как в парной модели, а несколько факторов, причем их влиянием нельзя пренебречь рассчитывают функцию не парной, а множественной регрессии.

(115)

Множественная модель позволяет установить связь результативного признака с каждым отдельно взятым фактором, при условии неизменяемости других включенных в модель факторных признаков.

При построении функции множественной регрессии, как и в парной регрессии, необходимо решить две задачи:

1. отбор факторов,

2. спецификация модели.

Отбор факторов модели множественной регрессии Так как, во множественной регрессии исследуют влияние на результат нескольких факторов, то в отличии от парной модели, имеются особые требования к их отбору.

Все факторы должны быть выражены в количественных единицах. Качественные факторы, при включении их в модель, необходимо перевести в количественные, например, путем пересчета в баллы.

Факторы, включенные в модель не должны быть интеркоррелированы, то есть факторы во множественной модели не должны находится в сильной корреляционной связи между собой, сила связи между факторами не должна быть выше чем сила связи между каким то фактором и результатом. В статистике говорят, что факторы явно коррелированны если коэффициент корреляции между ними, а если связь между ними близка к функциональной, то наличие такой связи называется мультиколлинеарностью.

Спецификация модели множественной регрессии

Функция множественной регрессии может, как и парной регрессии, иметь линейный или нелинейный вид.

Наиболее широкое распространение получила линейная функция:

(116)

Но при значительной вариации признаков возможно применение нелинейных функций. Данные функции, так же, как и в парной регрессии должны иметь возможность свей линеаризации. Из всего множества нелинейных функций чаще всего используют:

Множественная степенная функция

(117)

2. Множественная показательная функция

(118)

3. Множественная экспонента

(119)

4. Множественная гипербола

(120)

5. Множественная парабола второго порядка

(121)

Выбор вида функции проводится аналитическим или экспериментальным методами.

Расчет параметров уравнения множественной регрессии Параметры множественной регрессии, как и параметры парной регрессии можно определить, используя МНК. Так для расчета параметров уравнения множественной линейной регрессии:

МНК даст систему уравнений:

(122)

Параметры уравнения находим как отношение частных определителей к определителю системы

, ,…, (123)

где

  • определитель системы, находится, как:

(124)

  • частные определители системы рассчитывают, заменяя соответствующий столбец матрицы определителя системы данными левой части системы.

Параметр во множественной регрессии называется свободным членом уравнения регрессии и также как в парной регрессии не имеет экономической интерпретации. Параметр — коэффициентом регрессии, он показывает, на сколько единиц, в среднем, изменится результативный признак, если соответствующий данному коэффициенту фактор увеличится на одну единицу при постоянной величине остальных факторов.

Коэффициенты регрессии можно рассчитать и используя уравнения регрессии в стандартизованном виде представив все переменные уравнения как центрированные и нормированные. Для этого выразим их как отношение их отклонений от средних величин на их стандартное отклонение:

(125)

где

  • стандартизованные переменные:

(126)

(127)

— стандартизованные коэффициенты регрессии, показывают на сколько, в среднем, среднеквадратических отклонений изменится вариация результативного признака, если вариация соответствующего фактора увеличится на одно среднеквадратическое отклонение, при постоянной величине остальных факторов. Расчет параметров уравнения в стандартизированной форме более прост, так как, по сравнению с уравнением в натуральной форме отсутствует параметр .

МНК для уравнения множественной регрессии в стандартизированном масштабе даст следующую систему уравнений:

(128)

где

  • коэффициент парной корреляции (38)

или (39)

Как, и в уравнении в натуральном масштабе параметры стандартизированного уравнения можно найти методом определителей:

(129)

где:

(130)

Определитель получается из определителя, заменой в нем соответствующего столбца столбцом свободных членов исходной системы.

Кроме того, можно рассчитать используя их взаимосвязь с коэффициентами парной линейной корреляции. Так, например, для двухфакторной линейной модели, выраженной в стандартизованном масштабе, рассчитываются, как:

(131)

Определив значение ?-коэффициентов и зная, что между ?-коэффициентами и коэффициентами регрессии в натуральном масштабе существует следующая взаимосвязь:

или (132)

От уравнения множественной регрессии в стандартизованном виде

(125)

перейдем к уравнению в натуральном масштабе

(116)

параметр, который мы не рассчитали в стандартизованном уравнении, рассчитаем, как

(133)

Расчет параметров нелинейных уравнений множественной регрессии ведется так же, как и в линейной модели используя МНК. Разница заключается в том, что нелинейные модели вначале линеаризуются, и расчет параметров проводится по преобразованным данным (см. парную регрессию).

2.4.2.2 Частные уравнения регрессии Частные уравнения регрессии, рассчитываются на основе множественного уравнения регрессии:

(116)

Они показывают изолированное влияние одного конкретного фактора на результативный признак, при зафиксированном, на среднем уровне, положении остальных, включенных в модель факторов. Влияния зафиксированных факторов в уравнениях частной регрессии присоединены к свободному члену уравнения регрессии .

Частные множественные регрессии записываются, как:

(134)

Обозначение показывает, что изучается влияние на результат, фактора, при зафиксированном на среднем уровне положении факторов. Обозначение показывает, что изучается влияние на результат, фактора, при зафиксированном на среднем уровне положении факторов, и т, д. Знак в нижнем индексе обозначения отделяет фактор влияния, которого исследуется, от факторов, влияние которых изолируется.

Частные уравнения множественной регрессии для линейной модели имеют вид:

(135)

На основе частных уравнений регрессии рассчитывают частные коэффициенты эластичности:

(136)

Частные коэффициенты эластичности отличаются от средних коэффициентов.

Частный коэффициент эластичности показывает, на сколько, в среднем, процентов изменится результат при подстановке в уравнение регрессии конкретного значения .

Средний коэффициент эластичности показывает, на сколько в среднем процентов изменится результат, если соответствующий данному коэффициенту фактор увеличится на 1%, при зафиксированных, на средних уровнях величин остальных, включенных в модель, факторов.

(137)

Пример 20. Имеются данные по 40 хозяйствам о средней урожайности (ц/га), качества почвы (балов), затратах труда (чел-час./1га.), внесение минеральных удобрений (ц.д.в. на 1га.), стоимость ОС (тыс. руб. на 100 га.) (табл. 42).

Таблица 42

Урожайность, ц/га

Качество пашни, балов

Затраты труда чел.-час на 1 га

Внесение мин. удобрений на 1 га ц.д.в.

Стоимость ОФ на тыс.руб. 100 га

10,49

15,45

0,76

18,21

10,48 113

8,57

16,13

1,06

19,17

9,601 560

10,95

17,59

1,06

20,42

11,593 826

9,23

18,84

0,52

20,00

8,633 346

11,97

18,43

0,99

20,37

11,524 121

8,56

12,44

0,67

21,04

8,887 059

12,18

15,50

1,02

20,25

9,800 000

7,93

16,34

0,44

17,68

7,427 264

15,75

17,13

1,22

28,19

14,929 855

13,61

17,10

0,72

22,63

11,502 371

13,99

27,16

1,59

40,16

15,194 027

12,57

14,92

1,23

21,12

13,414 848

10,93

18,17

0,82

26,01

11,506 605

9,86

17,24

0,98

17,99

9,461 020

7,39

14,64

0,41

21,90

7,917 362

9,23

14,70

0,79

20,47

9,804 117

15,40

28,81

1,20

29,01

15,372 985

13,14

21,87

0,99

23,40

13,824 023

13,12

16,88

0,91

25,53

13,217 642

10,27

16,65

0,83

21,18

10,512 752

9,12

16,10

0,81

20,24

9,395 289

13,42

18,02

1,21

20,22

12,140 147

10,29

16,91

0,78

24,89

11,485 126

11,55

14,90

0,86

20,86

11,101 097

15,26

17,64

1,21

28,42

14,808 601

12,35

14,41

1,20

19,73

12,305 857

8,24

12,62

1,07

18,57

8,749 497

10,41

18,13

0,79

21,07

10,573 475

9,62

17,30

0,77

24,46

9,806 811

10,76

17,16

0,82

20,46

10,532 588

8,35

14,65

0,63

22,82

8,842 748

10,31

13,66

0,79

19,89

10,941 740

9,38

12,07

0,73

22,92

9,174 913

14,93

14,38

1,05

33,99

13,502 339

12,46

14,53

1,03

22,95

12,436 891

10,45

16,54

0,92

23,20

10,534 678

12,38

21,64

0,95

21,64

12,955 222

7,74

10,27

0,65

16,87

9,872 332

14,49

19,44

1,05

24,49

14,236 792

8,50

15,05

0,56

17,89

7,582 986

Итого

445,15

2657,00

671,41

36,09

900,31

445,152 022

Среднее

11,128 750

66,425 000

16,785 250

0,902 250

22,507 750

2,305 561

12,959 335

3,458 573

0,240 692

4,463 267

Необходимо построить уравнение множественной линейной регрессии, рассчитать парные коэффициенты регрессии, частные и средние коэффициенты эластичности, провести прогнозирование урожайности, при различных значениях факторов, то есть рассчитать:

максимально возможную урожайность, минимальную урожайность, урожайность для средних значений фактора, частные уравнения регрессии, при максимальном значении одного фактора и средних значениях двух других факторов.

Решение.

1) Уравнение множественной линейной регрессии для нашего примера имеет вид:

Для решения данного уравнения представим его в стандартизированном масштабе:

где: — стандартизованные переменные:

  • стандартизованные коэффициенты регрессии МНК для решения множественного уравнения линейной регрессии в стандартизованном виде дает систему уравнений:

Для нашего примера:

Между стандартизированными переменными и коэффициентами парной корреляции существует следующая взаимосвязь:

2) Рассчитаем коэффициенты парной корреляции. Расчет проведем, используя программу Microsoft, таблица 43.

Таблица 43

Столбец 1

y

Столбец 2

x1

Столбец 3

x2

Столбец 4

x3

Столбец 5

x4

Столбец 1

y

1,0

Столбец 2

x1

0,749 996

1,0

Столбец 3

x2

0,545 459

0,188 222

1,0

Столбец 4

x3

0,731 053

0,474 013

0,466 501

1,0

Столбец 5

x4

0,640 037

0,223 318

0,549 570

0,539 163

1,0

3) Подставим значения коэффициентов корреляции в систему.

Для решения системы уравнения воспользуемся методом Гаусса.

4).

Составим матрицу, в которую внесем все числа (коэффициенты) при переменных, за горизонтальную черту вынесем итог по каждому уравнению:

  • матрица 1

5) Далее необходимо привести к нулю первые коэффициенты строк 2,3,4, первая строка остается без изменений — рабочая строка. Для этого:

а) Умножим первую (рабочую) строку на число противоположное 1-му коэффициенту второй строки матрицы 1, т. е. на, получим суммируем полученную строку со второй строкой матрицы 1, получим расчетную строку 1.

б) Умножим первую (рабочую) строку на число противоположное 1-му коэффициенту третьей строки матрицы 1, т. е. на получим суммируем полученную строку с третьей строкой матрицы 1, получим расчетную строку 2.

в) Умножим первую (рабочую) строку на число противоположное 1-му коэффициенту четвертой строки матрицы 1, т. е. на получим суммируем полученную строку с четвертой строкой матрицы 1, получим расчетную строку 3.

6) Составим новую матрицу (матрица 2).

Первой строкой данной матрицы будет первая строка матрицы 1, второй строкой (рабочей) — расчетная строка 1, третьей — строка 2, четвертой — строка 3.

  • матрица 2

7) Далее, необходимо привести к нулю вторые коэффициенты строк 3 и 4 матрицы 2, первая строка остается без изменений, рабочей будет вторая строка. Для этого:

а) Найдем число, которое при умножении на второй коэффициент рабочей строки матрицы 2 —, даст число, противоположное (с другим знаком) второму коэффициенту третьей строки —. Для этого найдем отношение:, так как второй коэффициент третьей строки число положительное, полученное число возьмем со знаком минус и умножим на него вторую (рабочую) строку матрицы 2:

суммируем полученную строку с третьей строкой матрицы 2, получим расчетную строку 4:

б) Найдем число, которое при умножении на второй коэффициент рабочей строки матрицы 2 —, даст число, противоположное (с другим знаком) второму коэффициенту четвертой строки —. Для этого найдем отношение:, так как второй коэффициент четвертой строки число положительное, полученное число возьмем со знаком минус и умножим на него вторую (рабочую) строку матрицы 2:

суммируем полученную строку с четвертой строкой матрицы 2, получим расчетную строку 5:

8).

Составим новую матрицу — 3. Первые две строки возьмем без изменений из матрицы два, третьей строкой (рабочей) будет расчетная строка 4, четвертой строкой — расчетная строка 5.

  • матрица 3

9) Далее необходимо привести к нулю третий коэффициент строки 4. Для этого:

Найдем число, которое при умножении на третий коэффициент рабочей строки матрицы 3 —, даст число, противоположное (с другим знаком) третьему коэффициенту четвертой строки —. Для этого найдем отношение, так как третий коэффициент четвертой строки число положительное, полученное число возьмем со знакам минус и умножим на него третью (рабочую) строку матрицы 3.

суммируем полученную строку с четвертой строкой матрицы 3

10) Составим новую матрицу — 4. Первые три строки возьмем без изменений из матрицы три, а четвертой строкой — расчетная строка 6.

  • матрица 4

11) Подставим полученные коэффициенты в систему

12) Рассчитаем значение стандартизированных коэффициентов регрессии .

а) Из четвертого уравнения системы рассчитаем:

б) Подставим полученное значения в третье уравнение системы и рассчитаем значение :

в) Подставим значения и во второе уравнения системы и получим значение :

г) Подставим значения, , во второе уравнения системы и получим значение :

13) Зная, что между ?-коэффициентами и коэффициентами регрессии в натуральном масштабе существует следующая взаимосвязь:

соответственно

а)

б)

в)

г)

Таким образом, используя метод Гаусса, рассчитали коэффициенты регрессии, параметр найдем по формуле:

14) Подставим рассчитанные параметры в уравнение множественной регрессии:

а) Коэффициент регрессии показывает, что при увеличении фактора — качество пашни на 1 балл, средняя урожайность в среднем возрастет на 0,96 083 ц/га., при фиксированном положении остальных факторов.

б) Коэффициент регрессии показывает, что при увеличении фактора — затраты труда на 1 чел.-час./га, средняя урожайность в среднем возрастет на 0,113 165 ц/га., при фиксированном положении остальных факторов.

в) Коэффициент регрессии показывает, что при увеличении фактора — внесение минеральных удобрений на 1 ц.д.в./га средняя урожайность в среднем возрастет на 2,243 155 ц/га., при фиксированном положении остальных факторов.

г) Коэффициент регрессии показывает, что при увеличении фактора — стоимость ОФ на одну тыс.руб./100га, средняя урожайность в среднем возрастет на 0,15 490 ц/га., при фиксированном положении остальных факторов.

15) Проведем прогнозирование средней урожайности на основе полученного уравнения множественной регрессии:

а) Рассчитаем максимально возможную урожайность, для этого по каждому из факторов, в уравнение подставим максимальное значение, если коэффициент регрессии для данного фактора положителен, или минимальное значение, если коэффициент регрессии для данного фактора отрицателен. В нашем примере все коэффициенты регрессии положительны, соответственно значения факторов берем максимальные, ,, , и подставляем в уравнение.

б) Рассчитаем минимально возможную урожайность, для этого по каждому из факторов, в уравнение подставим минимальное значение, если коэффициент регрессии для данного фактора положителен, или максимальное значение, если коэффициент регрессии для данного фактора отрицателен. В нашем примере все коэффициенты регрессии положительны, соответственно значения факторов берем минимальные, ,, , и подставляем в уравнение.

в) Рассчитаем среднюю возможную урожайность, для этого по каждому из факторов, в уравнение подставим средние значения, ,, .

16) Рассчитаем частные уравнения регрессии а) Рассчитаем среднюю возможную урожайность при максимальном значении фактора (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов, , .

б) Рассчитаем среднюю возможную урожайность при максимальном значении фактора (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов, , .

в) Рассчитаем среднюю возможную урожайность при максимальном значении фактора (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов, , .

г) Рассчитаем среднюю возможную урожайность при максимальном значении фактора (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов, , .

17) На основе частных уравнений регрессии рассчитаем частные коэффициенты эластичности:

а) При максимальном значении фактора, и зафиксированных на среднем уровне значении остальных факторов, , .

то есть средняя урожайность в среднем возрастет, при подстановке в уравнение регрессии конкретного значения на 0,64%, и зафиксированных на среднем уровне значении остальных факторов.

б) При максимальном значении фактора (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов, , .

то есть средняя урожайность в среднем возрастет, при подстановке в уравнение регрессии конкретного значения на 0,26%, и зафиксированных на среднем уровне значении остальных факторов.

в) При максимальном значении фактора (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов, , .

то есть средняя урожайность в среднем возрастет, при подстановке в уравнение регрессии конкретного значения на 0,28%, и зафиксированных на среднем уровне значении остальных факторов.

г) При максимальном значении фактора (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов, , .

то есть средняя урожайность в среднем возрастет, при подстановке в уравнение регрессии конкретного значения на 0,45%, и зафиксированных на среднем уровне значении остальных факторов.

18) Рассчитаем средние коэффициенты эластичности для каждого фактора:

а) Рассчитаем средний коэффициент эластичности для фактора

то есть средняя урожайность, при увеличении фактора на 1%, в среднем возрастет на 0,57%, при фиксированном положении остальных факторов.

б) Рассчитаем средний коэффициент эластичности для фактора

то есть средняя урожайность, при увеличении фактора на 1%, в среднем возрастет на 0,17%, при фиксированном положении остальных факторов.

в) Рассчитаем средний коэффициент эластичности для фактора

то есть средняя урожайность, при увеличении фактора на 1%, в среднем возрастет на 0,18%, при фиксированном положении остальных факторов.

г) Рассчитаем средний коэффициент эластичности для фактора

то есть средняя урожайность, при увеличении фактора на 1%, в среднем возрастет на 0,31%, при фиксированном положении остальных факторов.

19) Коэффициенты средней эластичности позволяют ранжировать факторы по степени их влияния на результативный признак, для нашего примера:

1. — качество пашни, балов

2. — стоимость ОФ тыс.руб. на 100га

3. — внесение минеральных удобрений на 1га.тыс.руб.

4. — затраты труда, чел.-час.

20) Расчет множественной регрессионной модели в программе Microsoft Excel аналогичен расчету парной регрессии и рассмотрен в примере 1 (вводим входной интервал, выделяя все столбики содержащие факторы).

Для данного примера приведем таблицу, содержащую результаты — рисунок 9.

Рисунок 9.

Параметр в данной таблице находится на пересечении столбика «Коэффициенты» и строки «Y-пересечение», параметр — на пересечении столбика «Коэффициенты» и строки «Переменная Х1», — строки «Переменная Х2», — строки «переменная Х3», — строки «Переменная Х4».

2.4.2.3 Множественная корреляция Силу связи во множественных моделях изучают с помощью показателя множественной корреляции и его квадрата — показателя множественной детерминации.

Показатель множественной корреляции — показывает тесноту связи между результативным признаком и всеми включенными в модель факторами. Может принимать значения от 0 до 1, то есть в отличие от парной модели не показывает направление связи.

Показатель множественной детерминации — показывает часть вариации результативного признака, которая сложилась под влиянием всех включенных в модель факторов.

В статистике и эконометрике показатель множественной корреляции (детерминации) принято называть индексом или коэффициентом множественной (совокупной) корреляции.

Для линейной множественной функции и для функций нелинейных по переменным (полиномы разных степеней, равносторонняя гипербола и т. п. функции) индекс множественной корреляции совпадает с коэффициентом множественной корреляции.

Коэффициент (индекс) множественной корреляции рассчитывают, используя следующие формулы:

(138)

где:

  • остаточная дисперсия (139)
  • общая дисперсия для признака (140)

(141)

Коэффициент множественной корреляции можно рассчитать и, как:

(142)

где:

  • парные коэффициенты корреляции между результативным признаком и одним из факторов .

Для функций нелинейных по оцениваемым параметрам (степенная, показательная, экспоненциальная и т. п. функции) индекс множественной корреляции не совпадает с коэффициентом множественной корреляции. Его называют «» и определяют как

(143)

Коэффициенты (индексы) множественной детерминации получают, возводя коэффициенты (индексы) корреляции в квадрат, или по формулам.

(144)

(145)

(146)

Скорректированный индекс множественной детерминации Индекс множественной детерминации используют для определения качества регрессии, чем больше, к единице тем выше качество подбора регрессии.

Но использование только одного индекса детерминации для определения наилучшего уравнения регрессии недостаточно. Необходимо учитывать, что при увеличении факторов включенных в уравнение регрессии, при одном и том же числе наблюдений, при расчете показателей корреляции, за счет использования остаточной дисперсии появляется систематическая ошибка — чем больше число параметров в уравнении регрессии, при одном и том же числе наблюдений, тем больше получается расчетный показатель тесноты связи. Если число факторов приближается к числу наблюдений, то расчетный показатель корреляции будет близок к единице, то есть показывать тесную связь, даже если связь незначительна. Для того чтобы избежать этого рассчитывают скорректированный индекс множественной детерминации.

(147)

или

(148)

Скорректированный индекс множественной корреляции рассчитывают соответственно как:

(149)

или

(150)

где:

  • для линейной множественной модели — число факторов включенных в регрессионную модель. Для нелинейной модели — число параметров при и их линеаризации (и так далее), которое может быть больше числа факторов.
  • число наблюдений.

В силу сказанного выше необходимо понимать, что нельзя перегружать множественную модель факторами, так как снижается достоверность расчетов, принято считать, что на каждые 8−10 наблюдений в модель целесообразно включать один фактор.

2.4.2.4 Частная корреляция Множественный коэффициент (индекс) корреляции показывает тесноту связи между результатом и всеми включенными в модель факторами, для того, чтобы изучить силу связи между результатом и только одним из включенных в модель факторов, рассчитывают частные коэффициенты корреляции, для каждого из факторов включенных в модель.

Частный коэффициент корреляции показывает тесноту связи между результативным признаком и только одним фактором при элиминировании (устранении) влияния всех остальных включенных в модель факторов.

В зависимости от того, влияние скольких факторов необходимо исключать различают частные коэффициенты разных порядков: нулевого, первого, второго, третьего и т. д. Так, например:

Коэффициенты частной корреляции нулевого порядка — коэффициенты парной корреляции, так как нет необходимости устранять влияние даже одного фактора.

Коэффициенты частной корреляции первого порядка — коэффициенты частной корреляции, в которых элиминируется влияние одного фактора (, и т. д. ).

Коэффициенты корреляции второго порядка — коэффициенты частной корреляции, в которых элиминируется влияние двух факторов (, и т. д. ) и так далее.

Коэффициенты частной корреляции более высоких порядков рассчитываются через коэффициенты корреляции более низких порядков. Коэффициенты первого порядка через коэффициенты нулевого порядка, второго порядка через коэффициенты первого порядка и т. д. Рекуррентная формула для расчета коэффициентов частной корреляции порядка имеет вид:

(151)

Коэффициенты частной корреляции могут принимать значения в пределах от -1 до 1.

Также частные коэффициенты корреляции можно рассчитать через множественные коэффициенты детерминации. Так коэффициент частной корреляции второго порядка рассчитывается как:

или и т. д. (152)

В общем виде уравнение для расчета коэффициентов частной корреляции порядка имеет вид:

(153)

где

  • коэффициент множественной детерминации для всех факторов.
  • коэффициент множественной детерминации без включения в модель фактора .

Рассчитанные через множественные коэффициенты детерминации частные коэффициенты корреляции могут принимать значения в интервале от 0 до 1.

Кроме того, частные коэффициенты корреляции можно рассчитать через. Так, например, частные коэффициенты корреляции первого порядка для двухфакторной линейной модели, выраженной в стандартизованном масштабе :

(131)

Отсюда:

и (154)

Возводя в квадрат коэффициенты частной корреляции, получают коэффициенты частной детерминации.

Частные коэффициенты корреляции используют при формировании корреляционно-регрессионной модели, для отбора факторов. При этом из модели исключают факторы несущественные по критерию Стьюдента.

Коэффициент частной детерминации показывает долю вариации результативного признака дополнительно сложившуюся при включении в модель фактора, в вариации признака, не объясненную включенными до этого в модель факторами. Можно рассчитать по формуле на основе коэффициентов множественной детерминации.

(155)

где

  • коэффициент множественной детерминации для всех факторов.
  • коэффициент множественной детерминации без включения в модель фактора .

Зная коэффициенты частной детерминации, последовательно нулевого, первого, второго и более высоких порядков, определяют коэффициент множественной корреляции.

(156)

Пример 21. По данным примера 20 необходимо рассчитать:

1. линейный индекс множественной корреляции, детерминации

2. линейные коэффициенты частной корреляции первого и второго порядков, детерминации.

Решение.

1. Рассчитаем индекс множественной корреляции по формуле:

В таблице 44 рассчитаем все возможные значения.

Таблица 44

10,49

0,408 002

10,48 113

0,195 264

8,57

6,547 202

9,601 560

1,64 116

10,95

0,31 952

11,593 826

0,414 512

9,23

3,605 252

8,633 346

0,355 996

11,97

0,707 702

11,524 121

0,198 808

8,56

6,598 477

8,887 059

0,106 968

12,18

1,105 127

9,800 000

5,664 400

7,93

10,232 002

7,427 264

0,252 743

15,75

21,355 952

14,929 855

0,672 638

13,61

6,156 602

11,502 371

4,442 100

13,99

8,186 752

15,194 027

1,449 681

12,57

2,77 202

13,414 848

0,713 768

10,93

0,39 502

11,506 605

0,332 473

9,86

1,609 727

9,461 020

0,159 185

7,39

13,978 252

7,917 362

0,278 111

9,23

3,605 252

9,804 117

0,329 610

15,40

18,243 577

15,372 985

0,730

13,14

4,45 127

13,824 023

0,467 887

13,12

3,965 077

13,217 642

0,9 534

10,27

0,737 452

10,512 752

0,58 929

9,12

4,35 077

9,395 289

0,75 784

13,42

5,249 827

12,140 147

1,638 024

10,29

0,703 502

11,485 126

1,428 326

11,55

0,177 452

11,101 097

0,201 514

15,26

17,67 227

14,808 601

0,203 761

12,35

1,491 452

12,305 857

0,1 949

8,24

8,344 877

8,749 497

0,259 587

10,41

0,516 602

10,573 475

0,26 724

9,62

2,276 327

9,806 811

0,34 898

10,76

0,135 977

10,532 588

0,51 716

8,35

7,721 452

8,842 748

0,242 801

10,31

0,670 352

10,941 740

0,399 095

9,38

3,58 127

9,174 913

0,42 061

14,93

14,449 502

13,502 339

2,38 216

12,46

1,772 227

12,436 891

0,534

10,45

0,460 702

10,534 678

0,7 170

12,38

1,565 627

12,955 222

0,330 880

7,74

11,483 627

9,872 332

4,546 840

14,49

11,298 002

14,236 792

0,64 114

8,50

6,910 327

7,582 986

0,840 915

Итого

445,150 000

212,624 438

445,152 025

29,602 363

В среднем

11,128 750

Рассчитаем индекс множественной корреляции по формуле:

Значение стандартизованных коэффициентов регрессии и коэффициенты корреляции из примера 21.

Индекс множественной корреляции показывает, что между результативным признаком и всеми тремя включенными м модель факторами существует тесная связь (направление связи индекс множественной корреляции не определяет).

Индекс множественной детерминации:

Индекс множественной детерминации показывает, что 86% вариации результативного признака обусловлено влиянием включенных в модель факторов.

Расчет множественного индекса корреляции и множественного индекса детерминации произведем в программе Microsoft Excel рассмотрен в примере 20, рисунок 9.

2. Рассчитаем частные коэффициенты корреляции по рекуррентной формуле:

Для этого воспользуемся матрицей парных коэффициентов корреляции из примера 20, (табл. 45).

Таблица 45

Столбец 1

y

Столбец 2

x1

Столбец 3

x2

Столбец 4

x3

Столбец 5

x4

Столбец 1

y

1,0

Столбец 2

x1

0,749 996

1,0

Столбец 3

x2

0,545 459

0,188 222

1,0

Столбец 4

x3

0,731 053

0,474 013

0,466 501

1,0

Столбец 5

x4

0,640 037

0,223 318

0,549 570

0,539 163

1,0

а) Рассчитаем частные коэффициенты корреляции и детерминации первого порядка.

коэффициенты частной корреляции и детерминации первого порядка между результативным признаком и фактором :

коэффициенты частной корреляции и детерминации первого порядка между результативным признаком и фактором :

коэффициенты частной корреляции и детерминации первого порядка между результативным признаком и фактором :

коэффициенты частной корреляции и детерминации первого порядка между результативным признаком и фактором :

коэффициенты частной корреляции первого порядка между факторами (для расчета частных коэффициентов второго порядка):

б) Рассчитаем частные коэффициенты корреляции и детерминации второго порядка.

коэффициенты частной корреляции и детерминации второго порядка между результативным признаком и фактором :

коэффициенты частной корреляции и детерминации второго порядка между результативным признаком и фактором :

коэффициенты частной корреляции и детерминации второго порядка между результативным признаком и фактором :

коэффициенты частной корреляции и детерминации второго порядка между результативным признаком и фактором :

Коэффициенты частной корреляции третьего порядка рассчитываем аналогичным образом через частные коэффициенты корреляции второго порядка.

2.4.2.5 Оценка надежности параметров множественной регрессии и корреляции Оценка значимости множественного уравнения регрессии в целом проводится с помощью, (критерия Фишера).

(157)

где:

  • факторная дисперсия (158)
  • остаточная дисперсия (159)

F-критерий можно рассчитать и по формуле:

(160)

где:

  • для линейной множественной модели — число факторов включенных в регрессионную модель. Для нелинейной модели — число параметров при и их линеаризации (и так далее), которое может быть больше числа факторов
  • число наблюдений Если расчетный превышает табличный при определенном уровне значимости или, и числе свободы —, (таблицы Снедекора-Фишера — приложение 2) можно сказать, что уравнение множественной регрессии статистически значимо.

Величина позволяет также оценить статистическую значимость и коэффициента (индекса) множественной корреляции .

Кроме оценки уравнения в целом, большое практическое значение имеет статистическая оценка значимости каждого отдельно включенного в модель фактора, через частные критерии Фишера, ().

Данная оценка позволяет оценить целесообразность включения в модель множественной регрессии каждого из факторов после введения в модель остальных факторов.

Расчет частного, для фактора проводится по формуле:

(161)

  • коэффициент множественной детерминации для модели, включающей все факторы
  • коэффициент множественной детерминации для модели, без включения фактора

Расчета частного в общем виде, для фактора проводится по формуле:

(162)

Расчета частного, для оценки значимости влияния фактора после включения в модель других факторов проводится по формуле:

(163)

Если величина расчетного частного превышает величину табличного при определенном уровне значимости или, и числе свободы —, (таблицы Снедекора-Фишера — приложение 2), можно сказать, что включение в модель фактора, после введения в модель остальных факторов, целесообразно. Если величина расчетного частного меньше табличного значения, можно сказать, что включение в модель фактора, после введения в модель остальных факторов, статистически неоправданно, и его необходимо исключить из рассматриваемой модели.

Зная величину частного критерия Фишера, рассчитывают частные критерии Стьюдента, для определения значимости каждого из коэффициентов чистой регрессии .

(164)

Критерий Стьюдента также можно рассчитать по формуле:

(165)

где:

  • коэффициент чистой регрессии для фактора
  • стандартная ошибка (166)

где:

  • коэффициент детерминации множественного уравнения регрессии
  • коэффициент множественной детерминации зависимости фактора со всеми остальными факторами уравнения множественной регрессии
  • среднеквадратическое отклонение результативного признака
  • среднеквадратическое отклонение факторного признака

Полученные фактические значения критерия Стьюдента сравнивают с табличными значениями при определенном уровне значимости, или, и числе степеней свободы (приложение 1).

Если фактическое значение больше табличного соответствующий коэффициент регрессии статистически значим.

Фактические значения критерия Стьюдента сравнивают с табличными значениями при определенном уровне значимости, или, и числе степеней свободы, где — число исключенных переменных (приложение 1).

Если фактическое значение больше табличного соответствующий коэффициент частной корреляции статистически значим.

Пример 22. По данным примеров 20 и 21 необходимо:

1. провести оценку существенности уравнения регрессии и его параметров:

2. рассчитать частные. Оценить с их помощью статистическую значимость включения факторов, ,, решить вопрос включения в регрессионную модель одних факторов после включения других.

Решение.

1. Оценку существенности множественного уравнения проведем, используя критерий Фишера (F-критерий)

где:

  • число факторов включенных в регрессионную модель.
  • число наблюдений Табличное значение для данной модели при уровне значимости, и числе свободы —, (значение 35 в приложении 2 отсутствует, возьмем ближайшее значение 30) будет равно 2,69.

Расчетное значение значительно больше табличного, соответственно множественное уравнение регрессии признается статистически значимым.

Расчет фактического, в программе Microsoft Excel — рисунок 9.

2. Рассчитаем частные для оценки значимости влияния фактора после включения в модель других факторов Табличное значение при уровне значимости, и числе свободы —, будет равно 4,12.

а)

Фактическое значение больше табличного. Значит включение в модель фактора после факторов, статистически значимо.

б)

Фактическое значение больше табличного. Значит включение в модель фактора после факторов, , статистически значимо.

в)

Фактическое значение больше табличного. Значит включение в модель фактора после факторов, статистически значимо.

г)

Фактическое значение больше табличного. Значит включение в модель фактора после факторов, статистически значимо.

где: — коэффициент множественной детерминации для множественной регрессионной модели со всеми включенными в нее факторами.

  • коэффициент множественной детерминации для множественной регрессионной модели без фактора .
  • коэффициент множественной детерминации для множественной регрессионной модели без фактора .
  • коэффициент множественной детерминации для множественной регрессионной модели без фактора .
  • коэффициент множественной детерминации для множественной регрессионной модели без фактора .

Значения коэффициентов, ,, , рассчитаем в программе Microsoft Excel, методика расчета рассмотрена в примере 20 рисунок 9.

3. Статистическую оценку значимости коэффициентов регрессии по Стьюдента. Зная частные воспользуемся следующей формулой:

а)

б)

в)

г)

Табличное значение критерия Стьюдента при, и числе степеней свободы (значение 35 в приложении 1 отсутствует, возьмем ближайшее значение 30) равно 2,0423. Все фактические значения критерия Стьюдента больше табличного, то есть можно сделать вывод о статистической значимости всех коэффициентов регрессии .

Расчет и критериев Стьюдента для в программе Microsoft Excel приведен на рисунке 9. обозначен как F, а критерии Стьюдента как t-статистика.

Литература , Айвазян С. А., С. А. Вводный, В. А. Эконометрика

Доугерти Кристофер.

Введение

Е. Н. Лукаш

Мхитарян В. С., Т. А. Прогнозирование, Катышев П. К., Т. Т. Цымбаленко, И. А. Прикладная, О. В. Эконометрическое, И. И. Елисеева, С. А. Основы, В. М. Методы, Е. П. Прогнозирование, В. С. Мхитаряна, И. И. Елисеевой, С. В. Курышева