Ключевые слова. модель регрессии, метод наименьших квадратов, остатки регрессии

Методические рекомендации

Тема

3. Линейная модель парной регрессии и метод наименьших квадратов

Вопросы для изучения

1. Спецификация линейной модели парной регрессии.

2. Метод наименьших квадратов (МНК) – идентификация линейной модели парной регрессии.

3. Предпосылки МНК и свойства МНК-оценок.

Аннотация. Данная тема раскрывает суть регрессионного анализа в эконометрике.

Ключевые слова. Модель регрессии, метод наименьших квадратов, остатки регрессии.

Методические рекомендации по изучению темы

 Тема содержит лекционную часть, где даются общие положения по теме.

 В дополнение к лекции есть презентация, которую необходимо изучить, и ответить на вопросы.

 В качестве самостоятельной работы предлагается выполнить практические задания.

 Для проверки усвоения темы имеется тест для самоконтроля.

Рекомендуемые информационные ресурсы:

1. http://tulpar.kpfu.ru/mod/resource/view.php?id=382

2. Эконометрика: [Электронный ресурс] Учеб.пособие / А.И. Новиков. — 2-e изд., испр. и доп. — М.: ИНФРА-М, 2011. — 144 с.: с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none) С. 28-46.

3.Уткин, В. Б. Эконометрика [Электронный ресурс] : Учебник / В. Б. Уткин; Под ред. проф. В. Б. Уткина. — 2-е изд. — М.: Издательско-торговая корпорация «Дашков и К°», 2012. — 564 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA %D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D 0%BA%D0%B0&page=4#none) С. 323-338.

4. Валентинов, В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. — 3-е изд. — М.: Дашков и К, 2010. — 436 с.

(http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none) С. 38-99.

5.Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. — М.: НИЦ ИНФРА-М; Мн.: Нов.знание, 2014. — 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С. 82-99.

6. Электронный курс “Econometrics and Public Policy (Advanced)”, Princeton University, URL: https://blackboard.princeton.edu/webapps /portal/frameset.jsp?tab_group=courses&url=%2Fwebapps%2Fblackboard%2F execute%2FcourseMain%3Fcourse_id%3D_214206_1 Спецификация линейной модели парной регрессии. В зависимости от количества факторов, включенных в уравнение регрессии, принято различать простую (парную) и множественную регрессии. Простая регрессия представляет собой регрессию между двумя переменными – y и x, т.е. модель вида:

12 стр., 5691 слов

Курсовой проект: Сравнительный анализ эконометрических моделей регрессии

... времени. В эконометрике в основном рассматривают ошибки спецификации модели, предполагая, что ошибки измерения сведены к минимуму. [2] Спецификация модели - выбор вида функциональной зависимости (уравнения регрессии). ... следующими особенностями: 1. причина Х и следствие Y взаимодействуют не непосредственно, а через промежуточные факторы, которые при анализе опускаются. 2. социально-экономические ...

у  fˆ ( x) (1) где y – зависимая переменная (результативный признак); x — независимая, или объясняющая переменная (признак – фактор, или регрессор).

Множественная регрессия представляет собой регрессию результативного признака с двумя и большим числом факторов, т.е. модель вида:

y  fˆ ( x1 , х2 ,…хk ) (2)

Любое эконометрическое исследование начинается со спецификации модели, т.е. с формулировки вида модели, исходя из соответствующей теории связи между переменными. Из всего круга факторов, влияющих на результативный признак, необходимо выделить наиболее существенно влияющие факторы. Парная регрессия достаточна, если имеется доминирующий фактор, который и используется в качестве объясняющей переменной. Например, выдвигается гипотеза о том, что величина спроса y на товар находится в обратной зависимости

от цены x, т.е. yˆ x  a  b  x.

Уравнение простой регрессии характеризует связь между двумя переменными, которая проявляется как закономерность лишь в среднем по совокупности наблюдений. (Например, если зависимость спроса «y» от цены «x» имеет вид: y=5000-2x. Это означает, что с ростом цены на 1 д.е. спрос в среднем уменьшается на 2 д.е.).

В уравнении регрессии корреляционная по сути связь признаков представляется в виде функциональной связи. В каждом отдельном случае величина y складывается из двух слагаемых:

y j  yˆ x j   j

,

yj  ŷ x j

где фактическое значение результативного признака; — значение признака, найденное из математической функции связи y и x, т.е. из уравнения

регрессии;

 j — случайная величина, характеризующая отклонение реального значения признака от найденного по уравнению регрессии.

Случайная величина ɛ называется также возмущением. Она включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения. Ее порождают 3 источника: спецификация модели, выборочный характер исходных данных и ошибки измерения. Например, зависимость спроса от цены точнее следует записывать так: y=5000-2x+ɛ. В данном случае слева запи сано просто y, что означает фактическое значение, а не ŷ , отвечающее значению, рассчитанному по уравнению регрессии.

Метод наименьших квадратов (МНК) – идентификация линейной модели парной регрессии. Линейная регрессия сводится к нахождению уравнения вида

yˆ x  a  bx (или y  a  bx   ) (3)

Первое выражение позволяет по заданным значениям фактора x рассчитать теоретические значения результативного признака, подставляя в него фактические значения фактора x. На графике теоретические значения лежат на прямой, которая представляют собой линию регрессии.

Построение линейной регрессии сводится к оценке ее параметров- а и b. Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов (МНК).

y

15 стр., 7256 слов

Курсовая работа: Реферат: Экономический рост его типы и модели. Факторы и тенденции экономического роста

... и повышает производительность труда. Каждая страна в современный период решает следующие проблемы экономического роста: Ш определение тенденции и источников (факторов) роста; Ш обеспечение устойчивости экономического роста в долгосрочной перспективе; Ш определение последствий ...

yi

a

x

xi

МНК позволяет получить такие оценки параметров а и b, при которых

сумма квадратов отклонений фактических значений y от теоретических ŷ x минимальна:

n

 y  yˆ   min, или   i2  min

i xi (4)

i

i 1

Для нахождения минимума надо вычислить частные производные суммы (4) по каждому из параметров — а и b — и приравнять их к нулю.

 i2  S 2  ( y  yˆ x )2  ( y  a  bx)2  s  a  2 y  2na  2b  x  0;  s (5)   2 y  x  2a  x  2b  x 2  0  b Преобразуем, получаем систему нормальных уравнений:

n  a  b  x   y ,

 (6)

 а  х  b  x 2

  yx В этой системе n- объем выборки, суммы легко рассчитываются из исходных данных. Решаем систему относительно а и b, получаем:

n yx   y  x  b ,

n x   x 

(7)

1 b a

n

 y 

n

 x. (8)

Выражение (7) можно записать в другом виде:

ух  y  x соv( x, у ) b  , (9)

x х

2 2

 2

х

где соv( x, у)  ковариация признаков,  х2  дисперсия фактора x.

Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу. Возможность четкой экономической интерпретации коэффициента регрессии сделала линейное уравнение регрессии достаточно распространенным в эконометрических исследованиях.

Формально a- значение y при x=0. Если x не имеет и не может иметь нулевого значения, то такая трактовка свободного члена a не имеет смысла. Параметр a может не иметь экономического содержания. Попытки экономически интерпретировать его могут привести к абсурду, особенно при a 0. Интерпретировать можно лишь знак при параметре a. Если a 0, то относительное изменение результата происходит медленнее, чем изменение фактора. Сравним эти относительные изменения:

a  bx bx  a  bx при a  0, x  0  b 

x

bdx a  bx dy y dy dx

      .

dx. x dx x y x

Иногда линейное уравнение парной регрессии записывают для отклонений от средних значений:

y  b  x , (10)

где y  y  y , x  x  x . При этом свободный член равен нулю, что и отражено в выражении (10).

Этот факт следует из геометрических соображений: уравнению регрессии отвечает та же прямая (3), но при оценке регрессии в отклонениях начало координат перемещается в точку с координатами  x, y . При этом в выражении (8) обе суммы будут равны нулю, что и повлечет равенство нулю свободного члена.

Предпосылки МНК и свойства МНК-оценок. Как было сказано выше, связь между y и x в парной регрессии является не функциональной, а корреляционной. Поэтому оценки параметров a и b являются случайными величинами, свойства которых существенно зависят от свойств случайной составляющей ε. Для получения по МНК наилучших результатов необходимо выполнение следующих предпосылок относительно случайного отклонения (условия Гаусса – Маркова): 10. Математическое ожидание случайного отклонения равно нулю для всех наблюдений: M  i   0 . 20. Дисперсия случайных отклонений постоянна: D i   D j    2 .

12 стр., 5531 слов

Курсовая работа: Модели множественной линейной регрессии

... курсовой работы производились c помощью приложения MS Excel. 1. Модели м ножественной линейной регрессии Построение уравнения множественной регрессии ... параметров. Данное уравнение регрессии называют уравнением регрессии в естественном (натуральном) масштабе. Коэффициент регрессии bj при факторе хj называют условно-чистым коэффициентом регрессии. Он измеряет среднее по совокупности отклонение ...

Выполнимость данной предпосылки называется гомоскедастичностью (постоянством дисперсии отклонений).

Невыполнимость данной предпосылки называется гетероскедастичностью (непостоянством дисперсии отклонений)

30. Случайные отклонения εi и εj являются независимыми друг от друга для i  j:

 0, i  j cov i ,  j    2

 , i  j. Выполнимость этого условия называется отсутствием автокорреляции.

40. Случайное отклонение должно быть независимо от объясняющих переменных. Обычно это условие выполняется автоматически, если объясняющие переменные в данной модели не являются случайными. Кроме того, выполнимость данной предпосылки для эконометрических моделей не столь критична по сравнению с первыми тремя.

При выполнимости указанных предпосылок имеет место теорема ГауссаМаркова: оценки (7) и (8), полученные по МНК, имеют наименьшую дисперсию в классе всех линейных несмещенных оценок.

Таким образом, при выполнении условий Гаусса-Маркова оценки (7) и (8) являются не только несмещенными оценками коэффициентов регрессии, но и наиболее эффективными, т.е. имеют наименьшую дисперсию по сравнению с любыми другими оценками данных параметров, линейными относительно величин yi.

Вопросы и задания для самоконтроля

1. Что такое функция регрессии?

2. Чем регрессионная модель отличается от функции регрессии?

3. Каковы основные причины наличия в регрессионной модели случайного отклонения?

4. Как осуществляется спецификация модели?

5. В чем состоит различие между теоретическим и эмпирическим уравнениями регрессии?

6. В чем суть метода наименьших квадратов?

7. Каковы формулы расчета коэффициентов эмпирического парного линейного уравнения регрессии по МНК?

8. Каковы предпосылки МНК? Каковы последствия их выполнимости или невыполнимости?

9. Действительно ли оценки коэффициентов регрессии будут иметь нормальное распределение, если случайные отклонения распределены нормально?

10. Действительно ли в любой линейной регрессионной модели, построенной по МНК, сумма случайных отклонений равна нулю?

Задача 1. При исследовании корреляционной зависимости между ценой на нефть X и индексом нефтяных компаний Y получены следующие данные: x  16,2; y  4000;  x2  4; cov( x, y)  40.

Задание: построить линейное уравнение регрессии Y на X.

Задача 2. По выборке объема n  10 получены следующие данные:

x i  100; y i  200; x y

i i  21000; x 2

i  12000; y 2

i  45000.

Задание: оценить с помощью МНК параметры линейного уравнения регрессии, найти выборочный коэффициент корреляции rxy .

Лекция 1(3) Тема 4. Экономическая и статистическая интерпретация линейной модели парной регрессии Вопросы для изучения: 1. Экономическая интерпретация параметров модели. 2. Коэффициенты корреляции и детерминации в линейной модели парной регрессии.

5 стр., 2146 слов

Реферат: Модели финансовой эконометрики

... эконометрики – финансовой эконометрики, истоки которого лежат в XVI веке. Различные классы моделей финансовой эконометрики ... рассматривались эконометрические модели, значения коэффициентов которых ... этапе содержательного анализа при выборе состава независимых переменных (факторо При нахождении оценок параметров линейной эконометрической модели с использованием МНК предполагалось, что их значения ...

3. Проверка качества линейной модели парной регрессии (верификация модели).

4. Интервалы прогноза по линейному уравнению регрессии.

Аннотация. Данная тема раскрывает прикладное содержание регрессионного анализа.

Ключевые слова. Коэффициент регрессии, статистическая значимость, метод наименьших квадратов, коэффициент детерминации.

Методические рекомендации по изучению темы

 Тема содержит лекционную часть, где даются общие представления по теме.

 В дополнение к лекции есть презентация, которую необходимо изучить, и ответить на вопросы.

 В качестве самостоятельной работы предлагается выполнить практические задания.

 Для проверки усвоения темы имеется тест.

Рекомендуемые информационные ресурсы:

1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766

2. Эконометрика: [Электронный ресурс] Учеб.пособие / А.И. Новиков. — 2-e изд., испр. и доп. — М.: ИНФРА-М, 2011. — 144 с.: с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none) С. 46-56.

3. Уткин, В. Б. Эконометрика [Электронный ресурс] : Учебник / В. Б. Уткин; Под ред. проф. В. Б. Уткина. — 2-е изд. — М.: Издательско-торговая корпорация «Дашков и К°», 2012. — 564 с.

(http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA %D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D 0%BA%D0%B0&page=4#none) С. 338-365.

4. Валентинов, В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. — 3-е изд. — М.: Дашков и К, 2010. — 436 с.

(http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none) С. 67-99.

5.Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. — М.: НИЦ ИНФРА-М; Мн.: Нов.знание, 2014. — 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С. 99-133.

Экономическая интерпретация параметров модели

• показывает среднее

изменение результата с

Коэффициент изменением фактора на

регрессии b одну единицу

• b>0- связь прямая

• b<0- связь обратная

• показывает значение Y

при х=0

• если a>0, то Vx>Vy

Свободный

• если признак-фактор х не

коэффициент a

может иметь нулевого

значения, то трактовка а

не имеет смысла

Рис. 4.1. Интерпретация параметров модели Коэффициенты корреляции и детерминации в линейной модели парной регрессии. Если все точки лежат на построенной прямой, то регрессия Y на Х «идеально» объясняет поведение зависимой переменной. Обычно поведение Y лишь частично объясняется влиянием переменной Х.

Рис. 4.2. Диаграмма Венна

Линейный коэффициент парной корреляции:

 x cov( x, y ) yx  y  x

ryx  b  

10 стр., 4961 слов

Бизнес-план: Глава 28 линейная регрессия

... регрессии. Для парной линейной регрессии можно воспользоваться и статистической функцией ПРЕДСКАЗ (х; изв_знач_і/; изв_знач_л:), где х — это значение переменной х, для которого ищется прогноз. § 28.5. ОСНОВНЫЕ ПРЕДПОСЫЛКИ МОДЕЛИ ПАРНОЙ ЛИНЕЙНОЙ РЕГРЕССИИ ...

y  x y  x  y

 1  ryx  1

Если b>0, то ryx>0; если b<0, то ryx<0.

По абсолютной величине, чем ближе значение rxy к единице, тем теснее связь, чем ближе значение rxy к нулю, тем слабее связь между y и x.

ryx  0,3  слабая 0,3  ryx  0,7  средняя

ryx  0,7  сильная , тесная

Суммы квадратов отклонений:

— общая (TSS):  ( y  y)

i — регрессионная (ESS): (y x  y) 2

— остаточная (RSS): ( y i  yx )2

( y i  y ) 2   ( y x  y ) 2   ( yi  y x ) 2

Рис.4.3. Геометрическая интерпретация

Число степеней свободы (df-degrees of freedom) — это число независимо варьируемых значений признака. Для общей СКО требуется (n-1) независимых отклонений, т.к.  ( y  y )  0, что позволяет свободно варьировать (n-1) значений, а последнее n-е отклонение определяется из общей суммы, равной нулю. Поэтому df общ.  n  1.

Факторную СКО можно выразить так:

  yˆ x  y    a  bx   a  bx 

2 2

  bx  bx   b 2  x  x 

2 2

Эта СКО зависит только от одного параметра — b,поскольку выражение под знаком суммы к значениям результативного признака не относится. Следовательно, факторная СКО имеет одну степень свободы, и df факт.  1.

Для определения df остат. воспользуемся аналогией с балансовым равенством (11).

Можно записать равенство и между числами степеней свободы:

df общ.  df факт.  df остат.

Таким образом, можем записать: n  1  1  n  2 Из этого баланса определяем, что df остат.=n-2.

Разделив каждую СКО на свое число степеней свободы, получим средний квадрат отклонений, или дисперсию на одну степень свободы.

Выборочные оценки дисперсий:

— общая дисперсия: S 2

TSS 

 ( y  y) i

n 1

— регрессионная дисперсия: S 2

ESS 

(y x  y) 2

m

— остаточная дисперсия: S 2

RSS 

(y i  yx )2

n  m 1

Коэффициент детерминации:

R 2

(y x  y) 2

 1

(y  y ) i x

(y i  y) 2  ( y  y) i

R 2  r 2 yx ;0  R 2  1

Коэффициент детерминации определяет долю разброса зависимой переменной Y, объясняемую регрессией Y на X.

Проверка качества модели линейной парной регрессии (верификация модели)

Проверка Проверка Проверка

общего значимости соблюдения

1 этап

2 этап

3 этап

качества коэффициен предпосы уравнения -тов лок МНК

регрессии регрессии

Рис. 4.5. Этапы проверки качества модели 1 этап: F-тест состоит в проверке гипотезы H0 о статистической незначимости уравнения регрессии и показателя тесноты связи. H 0 : D 2 ESS  D 2 RSS H 1 : D 2 ESS  D 2 RSS

F

(y x  y) 2 / m

r 2 xy

 (n  2)

(y i  y x ) 2 /( n  m  1) 1  r 2 xy F  F ,v1  m ,v2  n  m 1  H 1 F  F ,v1  m ,v2  n  m 1  H 0

2 этап: T-тест состоит в проверке гипотезы Н0 о статистической незначимости коэффициентов регрессии и корреляции.

H0 :   0 H1 :   0

tb  t / 2,n  2  H1

tb  t / 2,n  2  H 0

b a r r b  ;ta  ;tr    n2

mb ma mr 1 r2

15 стр., 7247 слов

Реферат: Линейная модель множественной регрессии

... х1 и х2 . Подставляя соответствующие значения в формулу рассчитаем МНК - оценки для параметров А . по всей выборке 23 ... модели, оценка точности модельных данных. Проблема верификации заключается в решении вопроса о том, можно ли рассчитывать, что использование построенной модели ... признака объясненную поведением выборочной функции регрессии. При росте числа регрессоров значение R 2 возрастает, однако ...

mb 

 ( y  y ) /( n  2)  S

x

2 2

RSS

S RSS

 ( x  x)  ( x  x) x n

2 2

ma 

(y  y x )2

x 2

(n  2) n ( x  x)

1 r2 2 mr  ;t r  t 2b  F

n2

3 этап: проведение тестов на гетероскедастичность и автокорреляцию остатков.

Доверительные интервалы для коэффициентов теоретического уравнения регрессии:

b

t

mb

b  t / 2,n  2  mb ;

b  b    b  b

a  t / 2,n  2  ma ;

a  a    a  a

Интервалы прогноза по линейному уравнению регрессии. Прогнозирование по уравнению регрессии представляет собой подстановку в уравнение регрессии соответственного значения х. Такой прогноз ŷ x называется точечным. Он не является точным, поэтому дополняется расчетом стандартной

 ошибки ŷ x ; получается интервальная оценка прогнозного значения y :

yˆ x  myˆ x  y   yˆ  myˆ x

Преобразуем уравнение регрессии:

yˆ x  a  bx   y  bx   bx  y  bx  x 

ошибка m yˆ зависит от ошибки y и ошибки коэффициента регрессии b, т.е.

x

my2ˆ x  my2  mb2 ( x  x ) 2 .

2

Из теории выборки известно, что m 2y 

n

Используем в качестве оценки  2 остаточную дисперсию на одну сте S2 пень свободы S , получаем:

m 2y 

n Ошибка коэффициента регрессии :

S2 mb2 

 ( x  x )2

Таким образом, при x  xк получаем:

S2 S2 

2 1 ( x ê  õ) 2  m 2

  ( x ê  õ)  S

  yˆ x

n  (x  x)2  n  ( õ  õ) 2 

 

1 ( x ê  õ) 2 m yˆ x S  (11)

n  ( õ  õ) 2

Как видно из формулы (11), величина m yˆ x достигает минимума при

xк  х и возрастает по мере удаления хк от х в любом направлении.

y

x

Для нашего примера эта величина составит:

 1 ( xê  3,143) 2  m yˆ x  53  

7 10,857 

При хк  х myˆ  53 : 7  2,75 . При хк  4

x

 1 (4  3,143) 2  m yˆ x  53    3,34

7 10,857 

Для прогнозируемого значения ó̂õ 95% — ные доверительные интервалы

при заданном хк определены выражением:

óˆ õê  t m yˆ x , (12) т.е. при хк  4 yˆ x  2,57  3,34 или yˆ x  8,58. При хк  4 прогнозное значение

ê ê

составит у р  5,79  36,84  4  141,57 — это точечный прогноз.

Прогноз линии регрессии лежит в интервале:

132,99  óˆ õê  150,15

Мы рассмотрели доверительные интервалы для среднего значения у при заданном х. Однако фактические значения у варьируются около среднего зна чения óˆ õ , они могут отклоняться на величину случайной ошибки ε, дисперсия которой оценивается как остаточная дисперсия на одну степень свободы S . Поэтому ошибка прогноза отдельного значения у должна включать не только

стандартную ошибку m yˆ x , но и случайную ошибку S. Таким образом, средняя ошибка прогноза индивидуального значения у составит:

1 ( xк  х )2

m yi ( x  S 1  (13)

9 стр., 4323 слов

Курсовая работа: Системы эконометрических уравнений, их применение в эконометрике

... этого направления научной деятельности. Цель курсовой работы - рассмотреть системы эконометрических уравнений, их применение в эконометрике. Предмет работы - эконометрика как набор математическо-статистических методов. Объект работы - системы эконометрических уравнений. В связи с поставленной ...

к)

n ( х  х )2

Для примера:

 1 (4  3,143) 2  m yi ( x  4 )  53  1     8,01

к

 7 10,857 

Доверительный интервал прогноза индивидуальных значений y при xк  4 с

вероятностью 0,95 составит: 141,57  2,57  8,01, или 120,98  у р  162,16.

Пусть в примере с функцией издержек выдвигается предположение, что в предстоящем году в связи со стабилизацией экономики затраты на производство 8 тыс. ед. продукции не превысят 250 млн. руб. Означает ли это изменение найденной закономерности или затраты соответствуют регрессионной модели? Точечный прогноз: yˆ x8  5,79  36,84  8  288,93.

Предполагаемое значение — 250. Средняя ошибка прогнозного индивидуального значения:

1 (х  х) my  S 1  к  i ( xi ) n  (х  х)

 1 (8  3,143) 2   53  1     13,26

 7 10,857 

 

Сравним ее с предполагаемым снижением издержек производства, т.е. 250288,93=-38,93:

 38,93 t  2,93.

12,26

Поскольку оценивается только значимость уменьшения затрат, то используется односторонний t- критерий Стьюдента. При ошибке в 5 % с n  2  5 tтаб.  2,015 , поэтому предполагаемое уменьшение затрат значимо отличается от прогнозируемого значения при 95 % — ном уровне доверия. Однако, если увеличить вероятность до 99%, при ошибке 1 % фактическое значение t – критерия оказывается ниже табличного 3,365, и различие в затратах статистически не значимо, т.е. затраты соответствуют предложенной регрессионной модели.

Вопросы и задания для самоконтроля

1. Каков экономический смысл коэффициента регрессии?

2. Какой смысл может иметь свободный коэффициент уравнения регрессии?

3. Какова связь между линейным коэффициентом корреляции и коэффициентом регрессии в линейной модели парной регрессии?

4. Каков статистический смысл коэффициента детерминации?

5. Как записывается баланс для сумм квадратов отклонений результативного признака?

6. Что происходит, когда общая СКО равна остаточной? В каком случае общая СКО равна факторной?

7. Что такое число степеней свободы? Чему равны числа степеней свободы для различных СКО в парной регрессии?

8. Как используется F-статистика в регрессионном анализе?

9. Как F-статистика связана с коэффициентом детерминации в парной регрессии?

10. Как рассчитать критерий Стьюдента для коэффициента регрессии в линейной модели парной регрессии?

11. В чем суть предсказания индивидуальных значений зависимой переменной?

Задача 1. Пусть имеется следующая модель парной регрессии, построен ная по 20 наблюдениям: ~

y  8  7 x . При этом r  — 0,5. xy

Задание: построить доверительный интервал для коэффициента регрессии в этой модели с вероятностями 0,9 и 0,95.

Задача 2. Анализируется зависимость между доходами горожан (X), имеющими индивидуальные домовладения, и рыночной стоимостью их домов (Y).

По случайной выборке из 120 горожан данной категории получены результаты:

x i  27343; y i  115870;  (x i  x ) 2  75200;

( y i  y ) 2  1620340; (x i  x )( yi  y )  250431.

Задание: найти оценку коэффициента регрессии b1 и построить 95% доверительный интервал для коэффициента регрессии.

Лекция 2(1)

Тема 5. Линейная модель множественной регрессии, оценка ее параметров

4 стр., 1522 слов

Курсовая работа: « “Эконометрика” Тема: Эконометрическая модель уровня образования РФ и её анализ. Выполнила студентка 130- 2 группы 2 курса …»

... и корреляции, вычислены значеня статистики, проверка статистической значимости коэффициентов регрессии,, и уравнения регрессии в целом; Вывод. Частные парные регрессии показывают – что не все три фактора могут быть включены в модель множественной регрессии ...

Вопросы для изучения

1. Линейная модель множественной регрессии. Эмпирическая форма записи. Оценка параметров модели с помощью МНК.

2. Показатели качества множественной регрессии.

3. Мультиколлинеарность.

Аннотация. Данная тема раскрывает особенности линейной модели множественной регрессии.

Ключевые слова. Стандартизованный коэффициент регрессии, метод наименьших квадратов, мультиколлинеарность.

Методические рекомендации по изучению темы

 Тема содержит лекционную часть, где даются общие представления по теме.

 В дополнение к лекции есть презентация, которую необходимо изучить и ответить на вопросы.

 В качестве самостоятельной работы предлагается выполнить практические задания.

 Для проверки усвоения темы имеется тест.

Рекомендуемые информационные ресурсы:

1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766

2. Эконометрика: [Электронный ресурс] Учеб.пособие / А.И. Новиков. — 2-e изд., испр. и доп. — М.: ИНФРА-М, 2011. — 144 с.: с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none) С. 3. Уткин, В. Б. Эконометрика [Электронный ресурс] : Учебник / В. Б. Уткин; Под ред. проф. В. Б. Уткина. — 2-е изд. — М.: Издательско-торговая корпорация «Дашков и К°», 2012. — 564 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA %D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D 0%BA%D0%B0&page=4#none)

4. Валентинов, В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. — 3-е изд. — М.: Дашков и К, 2010. — 436 с.

(http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none) С. 142-181.

5.Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. — М.: НИЦ ИНФРА-М; Мн.: Нов.знание, 2014. — 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С. 133-140.

6. Электронный курс “Econometrics and Public Policy (Advanced)”, Princeton University, URL: https://blackboard.princeton.edu/webapps /portal/frameset.jsp?tab_group=courses&url=%2Fwebapps%2Fblackboard%2F execute%2FcourseMain%3Fcourse_id%3D_214206_1

Линейная модель множественной регрессии. Эмпирическая форма записи. Оценка параметров модели с помощью МНК. На любой экономический показатель чаще всего оказывает влияние не один, а несколько факторов. Например, спрос на некоторое благо определяется не только ценой данного блага, но и ценами на замещающие и дополняющие блага, доходом потребителей и многими другими факторами. В этом случае вместо парной регрессии

  рассматривается множественная регрессия yˆ  f x1 , x2 ,…, x p .

Множественная регрессия широко используется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах и в ряде других вопросов экономики. В настоящее время множественная регрессия – один из наиболее распространенных методов в эконометрике. Основной целью множественной регрессии является построение модели с большим числом факторов, а также определение влияния каждого фактора в отдельности и совокупного их воздействия на моделируемый показатель.

Множественный регрессионный анализ является развитием парного регрессионного анализа в случаях, когда зависимая переменная связана более чем с одной независимой переменной. Большая часть анализа является непосредственным расширением парной регрессионной модели, но здесь также появляются и некоторые новые проблемы, из которых следует выделить две. Первая проблема касается исследования влияния конкретной независимой переменной на зависимую переменную, а также разграничения её воздействия и воздействий других независимых переменных. Второй важной проблемой является спецификация модели, которая состоит в том, что необходимо ответить на вопрос, какие факторы следует включить в регрессию (1), а какие – исключить из неё. В дальнейшем изложение общих вопросов множественного регрессионного анализа будем вести, разграничивая эти проблемы. Поэтому вначале будем полагать, что спецификация модели правильна.

Самой употребляемой и наиболее простой из моделей множественной регрессии является линейная модель множественной регрессии:

y   ‘ 1 ‘ x1   2 ‘ x2  …   p ‘ x p  

(1)

По математическому смыслу коэффициенты  j в уравнении (1) равны

частным производным результативного признака y по соответствующим факторам:

y y y

1 ‘  , 2 ‘  ,…,  p ‘  .

x1 x2 x p Параметр α называется свободным членом и определяет значение y в случае, когда все объясняющие переменные равны нулю. Однако, как и в случае парной регрессии, факторы по своему экономическому содержанию часто не могут принимать нулевых значений, и значение свободного члена не имеет экономического смысла. При этом, в отличие от парной регрессии, значение каждого регрессионного коэффициента  j равно среднему изменению y при увеличе нии xj на одну единицу лишь при условии, что все остальные факторы остались неизменными. Величина ε представляет собой случайную ошибку регрессионной зависимости. Поскольку параметры  ‘ , 1 ‘ ,  2 ‘…,  p ‘ являются случайными величинами, определить их истинные значения по выборке невозможно. Поэтому вместо теоретического уравнения регрессии оценивается так называемое эмпирическое уравнение множественной регрессии, которое можно представить в виде:

y  a  b1x1  b2 x2  …  bp x p  e (2)

Здесь a, b1 , b2 ,…, b p — оценки теоретических значений  ‘ , 1 ‘ ,  2 ‘…,  p ‘ , или эмпирические коэффициенты регрессии, е – оценка отклонения ε. Тогда рас четное выражение имеет вид: yˆ  a  b1 x1  b2 x2  …  bp x p

Пусть имеется n наблюдений объясняющих переменных и соответствующих им значений результативного признака:

xi1, xi 2 ,…, xip , yi , i  1, n Для однозначного определения значений параметров эмпирического уравнения множественной регрессии объем выборки n должен быть не меньше количества параметров, т.е. n  p  1. В противном случае значения параметров не могут быть определены однозначно. Для получения надежных оценок параметров уравнения объём выборки должен значительно превышать количество определяемых по нему параметров. Практически, как было сказано ранее, объём выборки должен превышать количество параметров при xj в уравнении (4) в 6-7 раз.

Рис.5.1. Геометрическая интерпретация линейной модели множествен ной регрессии

Y  a0  b1  x1  b2  x2  e

, где

Y-общая величина расходов на питание;

X1- располагаемый личный доход;

X2- цена продуктов питания.

Экономическая интерпретация: При каждом увеличении располагаемого личного дохода X1 на 1 единицу собственного измерения, расходы на питание (Y) увеличиваются на b1 единиц измерения при сохранении постоянных цен. На каждую единицу индекса цен X2 эти расходы уменьшаются на b2 единиц измерения при сохранении постоянных доходов. Если a0>0, то вариация расходов меньше вариации факторов; если a0<0, то вариация расходов больше вариации факторов.

Для проведения анализа в рамках линейной модели множественной регрессии необходимо выполнение ряда предпосылок МНК. В основном это те же предпосылки, что и для парной регрессии, однако здесь нужно добавить предположения, специфичные для множественной регрессии: 50.Спецификация модели имеет вид: y   ‘ 1 ‘ x1   2 ‘ x2  …   p ‘ x p   . 60.Отсутствие мультиколлинеарности: между объясняющими переменными: отсутствует строгая линейная зависимость, что играет важную роль в отборе факторов при решении проблемы спецификации модели.

70.Ошибки  i , i  1, n имеют нормальное распределение  i ~ N 0,   . Выполнимость этого условия нужна для проверки статистических гипотез и построения интервальных оценок.

При выполнимости всех этих предпосылок имеет место многомерный аналог теоремы Гаусса – Маркова: оценки a, b1 , b2 ,…, b p , полученные по МНК,

являются наиболее эффективными (в смысле наименьшей дисперсии) в классе линейных несмещенных оценок.

2 вопроса спецификации модели

Выбор вида уравнения

Отбор факторов

регрессии

Рис.5.2. Проблемы спецификации модели

Кроме этого, факторы, включаемые во множественную регрессию, должны быть количественно измеримы.

Рассмотрим три метода расчета параметров множественной линейной регрессии.

1. Матричный метод. Представим данные наблюдений и параметры модели в матричной форме. Y  [ y1, y2 ,…, yn ]’ — n – мерный вектор – столбец наблюдений зависимой переменной; B  [a, b1, b2 ,…, b p ]’ — (p+1) – мерный вектор – столбец параметров уравнения

регрессии y  a  b1x1  b2 x2  …  b p x p  e ; Y  [ y1, y2 ,…, yn ]’ — n – мерный вектор – столбец отклонений выборочных

значений yi от значений ŷ i , получаемых по уравнению

yˆ  a  b1 x1  b2 x2  …  bp x p .

Для удобства записи столбцы записаны как строки и поэтому снабжены штрихом для обозначения операции транспонирования.

Наконец, значения независимых переменных запишем в виде прямоугольной матрицы размерности n   p  1 :

1 x11 x12  x1 p 

1 x21 x22  x2 p 

X  

    

 

1 xn1 xn 2  xnp 

Каждому столбцу этой матрицы отвечает набор из n значений одного из факторов, а первый столбец состоит из единиц, которые соответствуют значениям переменной при свободном члене.

В этих обозначениях эмпирическое уравнение регрессии выглядит так: Y  XB  e . Отсюда вектор остатков регрессии можно выразить таким образом: e  Y  XB .

Таким образом, функционал Q   ei2 , который, собственно, и минимизируется по МНК, можно записать как произведение вектора – строки е’ на вектор – столбец е: Q  e’ e  Y  XB’ Y  XB  .

В соответствии с МНК дифференцирование Q по вектору В приводит к выра Q жению:  2 X ‘ Y  2 X ‘ X B , которое для нахождения экстремума следу B ет приравнять к нулю. В результате преобразований получаем выражение для

вектора параметров регрессии: B   X ‘ X  X ‘ Y . Здесь  X ‘ X 1

1

— матрица, обратная к X ‘ X .

Пример. Бюджетное обследование пяти случайно выбранных семей дало следующие результаты (в тыс. руб.):

Семья Накопления, S Доход, Y Имущество, W

1 3 40 60

2 6 55 36

3 5 45 36

4 3,5 30 15

5 1,5 30 90

Оценим регрессию S на Y и W. Введем обозначения: S=[3;6;5;3,5;1,5]’ – вектор наблюдений зависимой переменной; B=[a;b1;b2]’ – вектор параметров уравнения регрессии;

1 40 60

1 55 36 

 

X  1 45 36 

 

1 30 15 

1 30 90  — матрица значений независимых переменных.

Далее с помощью матричных операций вычисляем (используем табличный процессор MS Excel и функции ТРАНСП, МУМНОЖ и МОБР в нем):

 5 200 237  5,6916  0,1074  0,0252 X ‘ X  200 8450 9150;

 X ‘ X 1

   0,1074 0,0024 0,00024

   

237 9150 14517  0,0252 0,00024 0,00033

B   X ‘ X 1 X ‘ Y  0,2787 0,1229  0,0294

Регрессионная модель в скалярном виде:

Sˆ  0,2787  0,1229Y  0,0294W

2. Скалярный метод. При его применении строится система нормальных уравнений, решение которой и позволяет получить оценки параметров регрессии:

an

 b1  x12  b2  x2  …  b p  xp  y

a x1  b1

 x1  b2  x2 x1 .  …  b p  x p x1   yx1

    

a x p  b1

  x1x p  b2  x2 x p  …  b p  x 2p   yx p

Решить эту систему можно любым подходящим способом, например, методом определителей или методом Гаусса. При небольшом количестве определяемых параметров использование определителей предпочтительнее.

Рассмотрим пример, приведенный выше. Здесь для двух факторов, Y и W, система нормальных уравнений запишется так:

an

 b1Y 2  b2 W  S

a Y  b1 Y  b2WY   SY

a W

   b1 YW  b 2 W 2   SW

Рассчитываем значения сумм, получаем:

5a  200b1  237b2  19

200a  8450b1  9150b2  825

237a  9150b1  14517b2  863,5

Рассчитаем значения определителей этой системы, используем функцию МОПРЕД в Excel:

  6842700;  a  1903325; b1  840825; b2  201225.

Отсюда получим оценки параметров модели:

a   /  a  1903325 / 6842700  0,2787;

b1   b1 /   840825 / 6842700  0,1229;

b2   b2 /   201205 / 6842700  0,0294. Обратите внимание, что коэффициенты в левой части системы нормальных уравнений совпадают с соответствующими элементами матрицы X ‘ X .

3. Регрессионная модель в стандартизованном масштабе. Уравнение регрессии в стандартизованном масштабе имеет вид:

t y  1t x1   2t x2     pt x p   где t y , t x1 , t x2 ,…, t x p — стандартизованные переменные:

y y xj  xj

ty  ; tx j  , j  1, n

y  xj для которых среднее значение равно нулю: t y  t x1  t x2  …  t x p  0 , а сред нее квадратическое отклонение равно единице:  y   t x  1, j  1, n ; βj –

j

стандартизованные коэффициенты регрессии, или β – коэффициенты (не следу ет путать их с параметрами уравнения y   ‘ 1 ‘ x1   2 ‘ x2  …   p ‘ x p   ).

Применяя МНК к уравнению t y  1t x1   2t x2     pt x p   , после

соответствующих преобразований получим систему нормальных уравнений:

1   2 rx2 x1   3rx3 x1   p rx p x1  ryx1

 r  2   3rx3 x2   p rx p x 2  ryx2

 1 x1 x2

    

1rx1 x p   2 rx2 x p   3rx3 x p  p  ryx p

 В этой системе ryx ,

j

rxi x j , j, k  1, p — элементы расширенной матрицы пар ных коэффициентов корреляции или, другими словами, коэффициенты парной корреляции между различными факторами или между факторами и результативным признаком. Имея измеренные значения всех переменных, вычислить матрицу парных коэффициентов корреляции на компьютере не составляет большого труда, используя, например, табличный процессор MS Excel или программу Statistica.

Решением данной системы определяются β – коэффициенты. Эти коэффициенты показывают, на сколько значений с.к.о. изменится в среднем результат, если соответствующий фактор хj изменится на одну с.к.о. при неизменном среднем уровне других факторов. Поскольку все переменные заданы как центрированные и нормированные, β – коэффициенты сравнимы между собой. Сравнивая их друг с другом, можно ранжировать факторы по силе их воздействия на результат. В этом основное достоинство стандартизованных коэффициентов регрессии, в отличие от коэффициентов обычной регрессии, которые несравнимы между собой.

Пусть функция издержек производства y (тыс. руб.) характеризуется

уравнением вида: y  200  1,2 x1  1,1×2   , где факторами являются основные производственные фонды (тыс. руб.) и численность занятых в производстве (чел.).

Отсюда видно, что при постоянной занятости рост стоимости основных производственных фондов на 1 тыс. руб. влечет за собой увеличение затрат в среднем на 1,2 тыс. руб., а увеличение числа занятых на одного человека при неизменной технической оснащенности приводит к росту затрат в среднем на 1,1 тыс. руб.. Однако это не означает, что первый фактор сильнее влияет на издержки производства по сравнению со вторым. Такое сравнение возможно, если обратиться к уравнению регрессии в стандартизованном мас штабе. Пусть оно выглядит так: tˆy  0,5t x1  0,8t x2 . Это означает, что с ростом первого фактора на одно с.к.о. при неизменном числе занятых затраты на продукцию увеличиваются в среднем на 0,5 с.к.о. Так как β1<�β2 (0,5<0,8), то можно заключить, что большее влияние на производство продукции оказывает второй фактор, а не первый, как кажется из уравнения регрессии в натуральном масштабе.

В парной зависимости стандартизованный коэффициент регрессии есть не что иное, как линейный коэффициент корреляции r. Подобно тому, как в парной зависимости коэффициенты регрессии и корреляции связаны между собой, так и во множественной регрессии коэффициенты «чистой» регрессии bj

y связаны с β – коэффициентами: b j   j .

 xj

Это позволяет от уравнения регрессии в стандартизованном масштабе: tˆy  1t x1   2t x2     p t x p переходить к уравнению регрессии в натуральном масштабе yˆ  a  b1 x1  b2 x2  …  bp x p . Параметр а определяется так:

a  y  b1x1  b2 x2  …  bp x p .

Свободный член в уравнении tˆy  1t x   2t x     p t x отсутствует, по 1 2 p

скольку все стандартизованные переменные имеют нулевое среднее значение.

Рассмотренный смысл стандартизованных коэффициентов регрессии позволяет использовать их при отсеве факторов – из модели исключаются факторы с наименьшим значением βj.

Компьютерные программы построения уравнения множественной регрессии в зависимости от использованного в них алгоритма решения позволяют получить либо только уравнение регрессии для исходных данных, либо, кроме того, уравнение регрессии в стандартизованном масштабе.

В заключение приведем расчет стандартизованного уравнения регрессии по данным рассмотренного выше числового примера. Используя функцию КОРРЕЛ в Excel, рассчитаем расширенную матрицу парных коэффициентов корреляции:

 1  0,27149 0,873684

R

 0,27149 1  0,68224 ,

в которой последний столбец состоит из элементов ryx1 rSY  и rSW (ryx2 ) соот ветственно, а неединичные элементы в первых двух столбцах соответствуют rYW (rx1 x2 ) . Эта матрица является расширенной матрицей системы уравнений для определения β – коэффициентов:

 1  0,27149 2  0,873684,

 0,271491  2  0,68224

Решаем систему методом определителей, получаем:

Δ=0,926291; Δ1=0,688461; Δ2=-0,44504;

β1=0,688461/0,926291=0,743245;

β2=-0,44504/0,926291=-0,48045;

Тогда стандартизованное уравнение регрессии запишется так:

tˆy  0,743245tY  0,48045tW

Отсюда видно, что первый фактор оказывает большее воздействие на результат, чем второй (|β1|>|β2|), однако эта разница не так велика, как для коэффициентов в натуральном масштабе (0,1229 и –0,0294).

От этого уравнения можно перейти к уравнению в натуральном масштабе. Для этого с помощью функции СТАНДОТКЛОН в Excel определим стандартные отклонения всех переменных:  S  1,75357;  Y  10,6066;  W  28,6496, а с помощью функции СРЗНАЧ – средние значения: S  3,8; Y  40; W  47,4.

Далее определяем оценки параметров:

y 1,75357

b1  1  0,743245   0,1229;

 x1 10,6066

y 1,75357

b2   2  0,48045   0,0294;

 x2 28,6496

a  s  b1Y  b2W  3,8  0,1229  40  0,0294  47,4  0,2787.

Эти значения оценок совпадают с оценками, полученными ранее.

Показатели качества множественной регрессии. Практическая значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата – коэффициента детерминации. Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком, или оценивает тесноту совместного влияния факторов на результат. Независимо от формы связи показатель множественной корреляции может быть найден как индекс множественной корреляции:

 2 îñò

R yx1x2 …x p  1 2 .

 y

Методика построения индекса множественной корреляции аналогична построению индекса корреляции для парной зависимости. Границы его изменения те же: от 0 до 1. Чем ближе его значение к 1, тем теснее связь результативного признака со всем набором исследуемых факторов.

Если обратиться к линейному уравнению множественной регрессии в стандартизованном масштабе, то для расчета индекса множественной корреляции можно использовать формулу следующего вида:

R yx1x2 …x p   xi  ryxi

Формула индекса множественной корреляции для линейной регрессии получила название линейного коэффициента множественной корреляции, или совокупного коэффициента корреляции.

При линейной зависимости определение совокупного коэффициента корреляции возможно без построения регрессии и оценки её параметров, а с использованием только матрицы парных коэффициентов корреляции:

r

R yx1 x2 …x p  1  ,

r11 где Δr – определитель матрицы парных коэффициентов корреляции:

1 ryx1 ryx2  ryx p

rx1 y 1 rx1 x 2  rx1 x p

r 

    

rx p y rx p x1 rx p x 2  1

а Δr11 – определитель матрицы межфакторной корреляции:

1 rx1 x 2 rx1 x3  rx1 x p

rx x 1 rx2 x3  rx2 x p

r11  2 1

    

rx p x1 rx p x2 rx p x3  1

Определитель матрицы межфакторной корреляции остаётся после вычеркивания из матрицы коэффициентов парной корреляции первого столбца и первой строки, что и соответствует матрице коэффициентов парной корреляции между факторами.

Проверка статистического качества оцененного уравнения регрессии проводится, с одной стороны, по статистической значимости параметров уравнения, а с другой стороны, по общему качеству уравнения регрессии. Кроме этого, проверяется выполнимость предпосылок МНК.

Сначала рассмотрим первые два вида проверок и связанные с ними вопросы. Некоторые предпосылки МНК и проверки их выполнимости будем рассматривать отдельно.

Для проверки общего качества уравнения регрессии используется коэффициент детерминации R , который в общем случае рассчитывается по форму

ле: R  1 

2  ei2 . Он показывает, как и в парной регрессии, долю об   yi  y 2 щей дисперсии у, объясненную уравнением регрессии. Его значения находятся между нулем и единицей. Чем ближе этот коэффициент к единице, тем больше уравнение регрессии объясняет поведение у.

Для множественной регрессии R является неубывающей функцией числа объясняющих переменных. Добавление новой объясняющей переменной никогда не уменьшает значение R . Действительно, каждая следующая объясняющая переменная может лишь дополнить, но никак не сократить информацию, объясняющую поведение зависимой переменной.

В формуле расчета коэффициента детерминации используется остаточная дисперсия, которая имеет систематическую ошибку в сторону уменьшения, тем более значительную, чем больше параметров определяется в уравнении регрессии при заданном объёме наблюдений n. Если число параметров (р+1) приближается к n, то остаточная дисперсия будет близка к нулю и коэффициент детерминации приблизится к единице даже при слабой связи факторов с результатом.

Поэтому в числителе и знаменателе делается поправка на число степеней свободы остаточной и общей дисперсии соответственно и рассчитывается скорректированный коэффициент детерминации:

R  1

2  ei

/ n  p  1

  yi  y 2 /n  1

Поскольку величина обычного коэффициента детерминации, как правило, увеличивается при добавлении объясняющей переменной к уравнению регрессии даже без достаточных на то оснований, скорректированный коэффициент детерминации компенсирует это увеличение путем наложения «штрафа» за увеличение числа независимых переменных. Перепишем формулу скорректированного коэффициента детерминации следующим образом:

R 2  1  1  R2  n n p1 1  n n p1 1 R 2

p

n  p 1

 R2 

p

n  p 1

1  R2  По мере роста р увеличивается отношение р/(n-p-1) и, следовательно, возрастает размер корректировки коэффициента R в сторону уменьшения.

Очевидно, что R  R при р>1. С ростом р R растет медленнее, чем

2 2 2

R2. Другими словами, он корректируется в сторону уменьшения с ростом числа объясняющих переменных. При этом R  R только при R =1. R

2 2 2 2

может даже принимать отрицательные значения (например, при R =0).

Поэтому для корректировки формулы скорректированного коэффициента детерминации нет строгого математического обоснования.

Доказано, что R увеличивается при добавлении новой объясняющей переменной тогда и только тогда, когда t – статистика для этой переменной по модулю больше единицы. Из этого отнюдь не следует, как можно было бы предположить, что увеличение R означает улучшение спецификации уравнения. Тем не менее, добавление в модель новых факторов осуществляется до тех пор, пока растет скорректированный коэффициент детерминации.

2 2

Обычно приводятся данные как по R , так и по R , являющиеся суммарными мерами общего качества уравнения регрессии. Однако не следует абсолютизировать значимость коэффициентов детерминации. Существует немало примеров неправильно построенных моделей, имеющих высокие коэффициенты детерминации. Поэтому коэффициент детерминации в настоящее время рассматривается лишь как один из ряда показателей, которые нужно проанализировать, чтобы уточнить строящуюся модель.

Анализ статистической значимости коэффициента детерминации проводится на основе проверки нуль – гипотезы Н0: R =0 против альтернативной гипотезы Н1: R >0. Для проверки данной гипотезы используется следующая F – статистика:

R2 n  p 1

F 

1  R2 p

Величина F при выполнении предпосылок МНК и при справедливости нуль – гипотезы имеет распределение Фишера. Из формулы расчета Fстатистики видно, что показатели F и R равны или не равны нулю одновременно. Если F=0, то R =0, и линия регрессии y  y является наилучшей по МНК, и, следовательно, величина у линейно не зависит от x1 , x2 ,…, x p . Для

проверки нуль – гипотезы при заданном уровне значимости α по таблицам критических точек распределения Фишера находится критическое значение Fтабл(α; p; n-p-1).

Если F>Fтабл, нуль – гипотеза отклоняется, что равно 2 2 сильно статистической значимости R , т.е. R >1.

Эквивалентный анализ может быть предложен рассмотрением другой нуль – гипотезы, которая формулируется как H 0 : 1 ‘   2 ‘  …   p ‘  0 . Эту

гипотезу можно назвать гипотезой об общей значимости уравнения регрессии. Если данная гипотеза не отклоняется, то делается вывод о том, что совокупное влияние всех р объясняющих переменных x1 , x2 ,…, x p на зависимую переменную у можно считать статистически несущественным, а общее качество уравнения регрессии невысоким.

Проверка такой гипотезы осуществляется на основе дисперсионного анализа сравнения объясненной и остаточной дисперсий, т.е. нуль – гипотеза формулируется как Н0:Dфакт=Dост против альтернативной гипотезы Н1:Dфакт>Dост. При этом строится F – статистика:

  yˆ  y / p

F

i

y  yˆ i  / n  p  1

i

Здесь в числителе – объясненная (факторная) дисперсия в расчете на одну степень свободы (число степеней свободы равно числу факторов, т.е. р).

В знаменателе – остаточная дисперсия на одну степень свободы. Её число степеней свободы равно (n-p-1).

Потеря (р+1) степени свободы связана с необходимостью решения системы (р+1) линейных уравнений при определении параметров эмпирического уравнения регрессии. Если учесть, что число степеней свободы общей дисперсии равно (n-1), то число степеней свободы объясненной дисперсии равна разности (n-1) – (n-p-1), т.е. р. Следует отметить, что выражение

  yˆ  y / p

R2 n  p 1 F

i

эквивалентно выражению F   . Это   yi  yˆ i  /n  p  1 1 R 2

p

  yˆ  y / p становится ясно, если числитель и знаменатель F  i

разде   yi  yˆ i  /n  p  1 лить на общую СКО:

  yˆ  y  /   y  y 

2 2

n  p 1 R 2 n  p 1

F   

i i

  y  yˆ  /   y  y 

i i

i

p 1 R2 p

Поэтому методика принятия или отклонения нуль – гипотезы для статистики

  yˆ  y / p F

i

ничем не отличается от таковой для статистики

  yi  yˆ i  /n  p  1

R2 n  p 1 F  . 1  R2 p

Анализ статистики F позволяет сделать вывод о том, что для принятия гипотезы об одновременном равенстве нулю всех коэффициентов линейной регрессии коэффициент детерминации R должен существенно отличаться от нуля. Его критическое значение уменьшается при росте числа наблюдений и может стать сколь угодно малым.

Например, пусть при оценке регрессии с двумя объясняющими пере менными по 30 наблюдениям R =0,65. Тогда F  0,65  30  2  1  25,07

0,35 2

По таблицам критических точек распределения Фишера найдем F(0,05; 2; 27)=3,36; F(0,01; 2; 27)=5,49. Поскольку Fнабл=25,05>Fкр как при 5% — ном, так и при 1% — ном уровне значимости, то нулевая гипотеза в обоих случаях от клоняется. Если в той же ситуации R =0,4, то F  0,65  30  2  1  25,07 . Пред 0,35 2 положение о незначимости связи отвергается и здесь.

Как и в случае парной регрессии, статистическая значимость параметров множественной линейной регрессии с р факторами проверяется на основе t –

bj  a  статистики: tb j   или ta   , где величина mb j ma  называется

mb j  ma

стандартной ошибкой параметра b j a  . Она определяется так. Обозначим мат рицу: Z

1

  X ‘ X 1, и в этой матрице обозначим j – й диагональный элемент как z jj ‘ . Тогда выборочная дисперсия эмпирического параметра регрессии рав на: mb j  s z jj ‘ , j  1, p , а для свободного члена выражение имеет вид:

2 2

ma2  s 2 z00 ‘ , если считать, что в матрице Z 1 индексы изменяются от 0 до р.

Здесь S – несмещенная оценка дисперсии случайной ошибки ε: s 

2 2  ei2 .

n  p 1 Стандартные ошибки параметров регрессии равны:

  mb j  mb2j  или ma  ma2  .

 

bj  a 

Полученная по выражению tb j   или ta   t – статистика

mb j  ma

для соответствующего параметра имеет распределение Стьюдента с числом степеней свободы (n-p-1).

При требуемом уровне значимости α эта статистика сравнивается с критической точкой распределения Стьюдента t(α; n-p-1) (двухсторонней).

Если |t|>t(α; n-p-1), то соответствующий параметр считается статистически значимым, и нуль – гипотеза в виде Н0:bj=0 или Н0:а=0 отвергается. В противном случае (|t|

Строгую проверку значимости параметров можно заменить простым сравнительным анализом.

Если t  1, т.е. b j  mb j , то коэффициент статистически незначим.

Если 1  t  2 , т.е. b j  2mb j , то коэффициент относительно значим. В

данном случае рекомендуется воспользоваться таблицей критических точек распределения Стьюдента.

Если 2  t  3 , то коэффициент значим. Это утверждение является га рантированным при (n-p-1)>20 и   0,05 .

Если |t|>3, то коэффициент считается сильно значимым. Вероятность ошибки в данном случае при достаточном числе наблюдений не превосходит 0,001.

К анализу значимости коэффициента bj можно подойти по – другому. Для этого строится интервальная оценка соответствующего коэффициента. Если задать уровень значимости α, то доверительный интервал, в который с веро ятностью (1-α) попадает неизвестное значение параметра  j ‘  ‘, определяется неравенством:

b j  t  ; n  p  1  mb j   j ‘  b j  t  ; n  p  1  mb j

или

a  t  ; n  p  1  ma   ‘  a  t  ; n  p  1  ma Если доверительный интервал не содержит нулевого значения, то соответствующий параметр является статистически значимым, в противном случае гипотезу о нулевом значении параметра отвергать нельзя.

Мультиколлинеарность. Мультиколлинеарность — это линейная взаимосвязь двух или нескольких объясняющих переменных (х1, х2, … хm).

Если объясняющие переменные связаны строгой функциональной зависимостью, то говорят о совершенной мультиколлинеарности. Мультиколлинеарность не позволяет однозначно разделить вклады объясняющих переменных x1,x2,…xm в их влияние на зависимую переменную Y.

Рис.5.3. Диаграмма Венна

Коррелированность регрессоров обусловливает существенное усложнение процедуры поиска наилучшего уравнения регрессии, так как любое изменение состава регрессоров приводит к необходимости пересчитывать все параметры заново.Если факторы связаны строгой функциональной зависимостью, то это свидетельствует о полной (совершенной, строгой) мультиколлинеарности. Полная мультиколлинеарность не позволяет однозначно оценить параметры исходной модели и разделить вклады регрессоров в зависимую переменную Y. Наличие линейно связанных регрессоров относят к ошибкам спецификации. Такие ошибки при двух линейно связанных регрессорах встречаются крайне редко и легко могут быть выявлены при анализе матрицы парных коэффициентов корреляции.

Чаще возникают ошибки, обусловленные включением в модель факторов, один из которых является линейной комбинацией нескольких других. Так, при использовании количественных показателей, характеризующих часть какойлибо величины, в число объясняющих переменных нельзя включать все составляющие этой величины, так как при этом одну из них можно определить путем вычитания из этой величины значений остальных факторов. Например, в линейной регрессионной модели оборота банка (Y) недопустимым является одновременное использование в модели следующих независимых переменных: сумма кредитов, выданных юридическим лицам (Х1), сумма кредитов, выданных физическим лицам (Х2), общая сумма кредитов, выданных банком (Х3=Х1+Х2).

В регрессионной модели ̂ увеличение значений коэффициентов при первых двух регрессорах на произвольную константу с и уменьшение на эту же константу значения коэффициента при третьем регрессоре не приведет к изменению значения зависимой переменной. Это означает, что при одних и тех же значениях регрессоров и зависимой переменной существует множество различных значений параметров уравнения.

Последствия мультиколлинеарности: увеличиваются стандартные ошибки оценок; уменьшаются t-статистики МНК-оценок регрессии; МНК-оценки чувствительны к изменениям данных; возможность неверного знака МНКоценок; трудность в определении вклада независимых переменных в дисперсию зависимой переменной. В реальных эконометрических исследованиях мультиколлинеарность чаще проявляется в стохастической форме, когда между хотя бы двумя объясняющими переменными существует тесная корреляционная связь. Иногда такой вид мультиколлинеарности называют частичной (несовершенной, реальной, скрытой, неполной).

Матрица X X в этом случае является неособенной (близкой к вырожденной), имеет полный ранг, но ее определитель очень мал, т.е. близок к нулю. Такие матрицы ещё называют плохо обусловленными. Частичная мультиколлинеарность приводит к следующим последствиям: Увеличение дисперсий оценок параметров. Это расширяет интервальные оценки и ухудшает их точность. Уменьшение t-статистик коэффициентов, что приводит к неоправданному выводу о значимости регрессоров. Неустойчивость МНК – оценок параметров и их дисперсий: небольшое изменение исходных данных (добавление или исключение одного – двух наблюдений) будет приводить к значительному изменению этих оценок. Возможность получения неверного (с точки зрения теории) знака у параметра регрессии или неоправданно большого значения этого параметра. В результате получаются значительные средние квадраты отклонения коэффициентов регрессии a, b1, b2, b3 … bp и оценка их значимости по t-критерию Стьюдента не имеет смысла, хотя в целом регрессионная модель может оказаться значимой по F-критерию. Наиболее простой формой сильной взаимосвязи факторов является высокая парная корреляция регрессоров. Она может быть выявлена при анализе матрицы парных коэффициентов корреляции. Обычно факторы считаются тесно связанными, если значения выборочных парных коэффициентов корреля ции | | . При наличии такой тесной связи для какой-либо пары

признаков обычно рекомендуется не включать в модель один из них, если это допустимо с точки зрения корректности модели. Действительная мультиколлинеарность в полном смысле слова возникает при наличии тесной взаимосвязи множества независимых переменных. Она может и не обнаруживаться по матрице парных коэффициентов корреляции. В отсутствие тесной корреляционной связи одного из признаков с каждым из остальных может наблюдаться тесная связь с их совокупностью. Такую связь можно выявить путем углубленного корреляционного анализа. Он состоит в том, что при значениях множественного коэффициента корреляции какого-либо j – го независимого фактора с остальными регрессорами модели Rj ≥ (0,7…0,8) можно говорить о наличии проблемы мультиколлинеарности. Основная проблема заключается в том, что расчет множественных коэффициентов корреляции каждого из регрессоров с совокупностью остальных факторов модели может не дать нужного результата, поскольку наличие мультиколлинеарности в этой совокупности искажает и результат оценки степени взаимосвязи независимых переменных. Поскольку заранее корреляционная структура данных, как правило, неизвестна, это приводит к необходимости рассчитывать большое число множественных коэффициентов корреляции, начиная с анализа взаимосвязи одного признака со всеми возможными парами из остальных, затем с тройками признаков и т.д. Такой анализ становится очень трудоемким и редко используется на практике. Признаки мультиколлинеарности: высокий R2; близкая к 1 парная корреляция между малозначимыми независимыми переменными; высокие частные коэффициенты корреляции; сильная дополнительная регрессия между независимыми переменными. Методы устранения мультиколлинеарности: исключение из модели коррелированных переменных (при отборе факторов); сбор дополнительных данных или новая выборка; изменение спецификации модели; использование предварительной информации о параметрах; преобразование переменных.

Мультиколлинеарность чаще всего обнаруживает себя в ходе регрессионного анализа. К ее признакам можно отнести следующие:

1) значительные изменения коэффициентов при регрессорах при изменениях состава регрессоров и объектов, входящих в выборку;

2) незначимость большинства или всех коэффициентов при значимости уравнения в целом;

3) чрезмерно высокие или противоречащие экономической теории значения коэффициентов регрессионной модели.

Таким образом, точных количественных критериев для определения наличия или отсутствия мультиколлинеарности не существует. Тем не менее, ее наличие можно обнаружить с помощью:

1. Анализа корреляционной матрицы между объясняющими переменными и выявлении пар переменных, имеющих высокие коэффициенты корреляции.

2. Расчета множественных коэффициентов корреляции (коэффициентов детерминации) между одной из объясняющих переменных и некоторой группы из них. Наличие высокого множественного коэффициента детерминации свидетельствует о мультиколлинеарности.

3. Проверки чувствительности (устойчивости) оценок коэффициентов к небольшим изменениям исходных данных.

4. Исследования матрицы  X X  . Если определитель матрицы  X X  либо ее минимальное собственное значение близки к нулю, то это говорит о наличии мультиколлинеарности. Об этом же может свидетельство вать и значительное отклонение максимального собственного значения max матрицы  X X  от ее минимального собственного значения .

Одним из способов устранения мультиколлинеарности является исключение переменных из модели. Самым простым, но далеко не всегда возможным является способ, когда из двух объясняющих переменных, имеющих высокий коэффициент корреляции (обычно больше 0,8), одну переменную исключают из рассмотрения. При этом в первую очередь на основании экономических соображений решают, какую переменную оставить, а какую удалить из анализа. Если с экономической точки зрения ни одной из переменных нельзя отдать предпочтение, то оставляют ту из двух переменных, которая имеет больший коэффициент корреляции с зависимой переменной.

Более углубленный анализ регрессоров можно получить, используя метод дополнительной регрессии. Его суть заключается в том, что для выявления списка зависимых регрессоров проводится дополнительная регрессия – регрессия каждого независимого фактора Xj, j=1,2,…p на оставшиеся независимые факторы. Стандартным способом, на основе F-статистики, проверяется статистическая значимость коэффициентов детерминации дополнительных регрессий:

R 2j n p

Fj  

1  Rj 2

p 1

где n – число наблюдений, p – число независимых переменных в первоначальной спецификации регрессионной модели. Статистика имеет распределение

Фишера с параметрами:  1  p  1,  2  n  p . Если коэффициент статистически не значим, то регрессор Xj не приводит к мультиколлинеарности и его оставляют в списке переменных модели. В противном случае рекомендуется исключить его из списка.

В ряде случаев можно попытаться изменить спецификацию модели: либо изменить форму модели, либо добавить объясняющие переменные, не учтенные в первоначальной модели, но существенно влияющие на зависимую переменную. В результате уменьшается сумма квадратов отклонений, а, следовательно, сокращается стандартная ошибка регрессии. В свою очередь это приводит к уменьшению стандартных ошибок параметров модели.

Вопросы и задания для самоконтроля

1. Как записывается эмпирическое уравнение линейной модели множественной регрессии?

2. Что измеряют коэффициенты регрессии линейной модели множественной регрессии?

3. Какие этапывключает алгоритм определения коэффициентов множественной линейной регрессии по МНК в матричной форме?

4. Какие требования предъявляются к факторам для их включения их в модель множественной регрессии?

5. Как интерпретируются коэффициенты регрессии линейной модели потребления?

6. Какой смысл приобретает сумма коэффициентов регрессии в производственных фукнциях?

7. Как в линейной модели множественной регрессии, записанной в стандартизованном виде, сравнить факторы по силе их воздействия на результат?

8. Как связаны стандартизованные коэффициенты регрессии с натуральными?

9. Как корректируется коэффициент детерминации?

10. Каково назначение частной корреляции при построении модели множественной регрессии?

11. Как проверяется адекватность линейной модели множественной регрессии в целом?

Задача 1. Получены следующие величины:

y  15,0; x1  6,5; x2  12,0;  y  4,0;  x1  2,5;  x  3,5; ryx1

 0,63; ryx2  0,78; rx1 x2  0,52.

Задание: записать регрессию y на x1 и x2 в стандартизованной и естественной формах.

Задача 2. Уравнение регрессии, построенное по 15 наблюдениям, имеет вид:

~

y  12,4  9,6 x1  ? x2  6,3×3

mb (?) (3,2) (0,12) (?)

tb (1,55) (?) (4,0) (3,15).

Задание: определить пропущенные значения и построить доверительный

интервал для  3 с вероятностью 0,99.

Задача 3. Уравнение регрессии в стандартизованной форме имеет вид

t y  0,37t x1  0,52t x2  0,43t x3 .

При этом коэффициенты вариации равны:

Vy  18%, Vx  25%, Vx  38%, Vx  30%.

1 2 3

Задание: определить частные коэффициенты эластичности.

Лекция 2(2) Тема 8, 9. Гетероскедастичность и автокорреляция в остатках регрессии

Вопросы для изучения

1. Понятие и последствия гетероскедастичности.

2. Обнаружение и устранение гетероскедастичности.

3. Понятие и последствия автокорреляции.

4. Обнаружение и устранение автокорреляции.

Аннотация. Данная тема раскрывает способы проверки соблюдения второй и третьей предпосылок МНК в остатках регрессии.

Ключевые слова. Гетероскедастичность, автокорреляция, остатки регрессии.

Методические рекомендации по изучению темы

 Тема содержит лекционную часть, где даются общие положения по теме;

 В качестве самостоятельной работы предлагается ознакомиться с решениями типовых задач, презентацией и ответить на вопросы для изучения.

 Для проверки усвоения темы имеется тест для самоконтроля.

Рекомендуемые информационные ресурсы:

1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766

2. Эконометрика: [Электронный ресурс] Учеб.пособие / А.И. Новиков. — 2-e изд., испр. и доп. — М.: ИНФРА-М, 2011. — 144 с.: с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none) С. 92-106.

3. Валентинов, В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. — 3-е изд. — М.: Дашков и К, 2010. — 436 с.

(http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none) С. 202-229.

5.Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. — М.: НИЦ ИНФРА-М; Мн.: Нов.знание, 2014. — 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С. 197-244. Понятие и последствия гетероскедастичности. Гетероскедастичностью остатков называется нарушение 2 предпосылки МНК о постоянстве дисперсий случайных отклонений. Если предпосылка МНК о том, что D(i)=D(j)=2 соблюдена, то имеет место гомоскедастичность случайных отклонений. Последствия гетероскедастичности: МНК-оценки сохраняют свойства несмещенности и линейности, но теряют свойство эффективности; дисперсии МНК-оценок смещены; t-статистика и F-статистика завышены. В качестве примера реальной гетероскедастичности можно привести то, что люди с большим доходом не только тратят в среднем больше, чем люди с меньшим доходом, но и разброс в их потреблении также больше, поскольку они имеют больше простора для распределения дохода.

В ряде случаев, зная характер исходных данных, можно предвидеть гетероскедастичность и попытаться устранить её ещё на стадии спецификации. Однако значительно чаще эту проблему приходится решать после построения уравнения регрессии.

Обнаружение и устранение гетероскедастичности. Графическое построение отклонений от эмпирического уравнения регрессии позволяет визуально определить наличие гетероскедастичности. В этом случае по оси абсцисс откладываются значения объясняющей переменной xi (для парной регрессии) либо линейную комбинацию объясняющих переменных:

yˆi  a  b1 xi1  …  bp xip , i  1, n

(для множественной регрессии), а по оси ординат либо отклонения ei, либо их

квадраты ei2 , i  1, n .

Если все отклонения ei2 находятся внутри горизонтальной полосы постоянной ширины, это говорит о независимости дисперсий ei от значений объясняющей переменной и выполнимости условия гомоскедастичности.

В других случаях наблюдаются систематические изменения в соотношениях между значениями ŷi и квадратами отклонений ei . Такие ситуации отражают большую вероятность наличия гетероскедастичности для рассматриваемых статистических данных. В настоящее время для определения гетероскедастичности разработаны специальные тесты и критерии для них.

2. Выделение трех

1. Ранжирование n подвыборок

наблюдений по размерностью

переменной х k, n-2k, k.

4. Сравнение остаточных

3. Оценка регрессий

дисперсий по

для первых и

регрессиям для первых и

последних k

последних k

наблюдений

наблюдений

Рис. 8.1. Тест Голдфелда-Квандта F-статистика для сравнения дисперсий:

k n

S 21   ei ; S 2 3  e

2 2

i ,

i 1 i  n  k 1

H 0 : S 2 3  S 21 ( г омоскедастичность)

H1 : S 2 3  S 21 ( г етероскедастичность)

S 2 3 /( k  m  1)

F 2 ,

S 1 /( k  m  1)

F  F ,m ,k  m 1  H1

Тест ранговой корреляции Спирмена. При использовании данного теста предполагается, что дисперсия отклонений будет либо увеличиваться, либо уменьшаться с увеличением значений х. Поэтому для регрессии, построенной по МНК, абсолютные величины отклонений |ei| и значения xi будут коррелированы. t- статистика для проверки значимости rx,e:

rx ,e  1  6  ( d i / n(n 2  1))

H 0 : rx ,e  0( г омоскедастичность)

H1 : rx ,e  0( г етероскедастичность)

rx ,e  n  2

t ,

1  r 2 x ,e

t  t ,n  2  H1

Для устранения гетероскедастичности в случае, если дисперсии отклонений известны для каждого наблюдения, применяется метод взвешенных наименьших квадратов (ВНК).

Гетероскедастичность устраняется, если разделить каждое наблюдаемое значение на соответствующее ему значение дисперсии:

y    x

y 1 x 

    

   

y*    z    x * v

Если дисперсии отклонений неизвестны для каждого наблюдения, то предполагается, что дисперсии σ2e пропорциональны xi  2 i   2 xi

yi 1 x 

   i  i

xi xi xi xi

yi 1

     xi  vi

xi xi y*    z    x * vi

Дисперсии σ2e пропорциональны x2i  2i   2  x 2i

yi 1 x 

     i  i

xi xi xi xi

yi 1

      vi

xi xi y*    z    vi

Таким образом, наблюдения с наименьшими дисперсиями получают наибольшие «веса», а наблюдения с наибольшими дисперсиями – наименьшие «веса». Поэтому наблюдения с меньшими дисперсиями отклонений будут более значимыми при оценке параметров регрессии, чем наблюдения с большими дисперсиями. При этом повышается вероятность получения более точных оценок. В этом заключается смысл ВНК.

Полученные по МНК оценки параметров модели можно использовать в первоначальной модели.

Для применения ВНК необходимо знать фактические значения дисперсий

отклонений  i . На практике такие значения известны крайне редко. Поэтому, чтобы применить ВНК, необходимо сделать реалистические предположения о

значениях  i . Чаще всего предполагается, что дисперсии отклонений пропор 2 циональны или значениям xi, или значениям xi .

Если в уравнении регрессии присутствует несколько объясняющих переменных, вместо конкретной переменной xj используется исходное уравнение множественной регрессии

yˆ  a  b1 x1  b2 x2  …  bp x p , т.е. фактически линейная комбинация факторов. В этом случае получают сле yi 1 x x  дующую регрессию: a  b1 i1  …  bp ip  i .

yˆ i yˆ i yˆ i yˆ i yˆ i

Понятие и последствия автокорреляции. Автокорреляцией остатков называется нарушение третьей предпосылки МНК о независимости случайного отклонения  i от отклонений во всех других наблюдениях. Если предпосылка МНК о том, что cov(i,j)=0, соблюдена, то автокорреляция случайных отклонений отсутствует. Чаще всего положительная автокорреляция вызывается направленным постоянным воздействием некоторых не учтенных в регрессии факторов. Например, при исследовании спроса у на прохладительные напитки в зависимости от дохода х на трендовую зависимость накладываются изменения спроса в летние и зимние периоды. Аналогичная картина может иметь место в макроэкономическом анализе с учетом циклов деловой активности. Автокорреляция остатков обычно встречается при использовании данных временных рядов. В перекрестных данных наличие автокорреляции бывает редко. Положительная автокорреляция имеет место, когда ri,j>0. Отрицательная автокорреляция имеет место, когда ri,j<0. Отрицательная автокорреляция фактически означает, что за положительным отклонением следует отрицательное и наоборот. Такая ситуация может иметь место, если ту же зависимость между спросом на прохладительные напитки и доходами рассматривать не ежемесячно, а раз в сезон (зима–лето).

Последствия автокорреляции: МНК-оценки сохраняют свойства несмещенности и линейности, но теряют свойство эффективности; дисперсии МНКоценок смещены в сторону занижения; t-статистика и F-статистика завышены.

Обнаружение и устранение автокорреляции. Методы обнаружения автокорреляции: графический анализ остатков; критерий Дарбина-Уотсона; метод рядов.

Метод рядов. По этому методу последовательно определяются знаки от клонений et , t  1, n от регрессионной зависимости. Например, имеем при 20 наблюдениях

(——)(+++++++)(—)(++++)(-) .

Ряд определяется как непрерывная последовательность одинаковых знаков. Количество знаков в ряду называется длиной ряда. Если рядов слишком мало по сравнению с количеством наблюдений n, то вполне вероятна положительная автокорреляция. Если же рядов слишком много, то вероятна отрицательная автокорреляция.

Пусть n – объём выборки, n1 – общее количество положительных отклонений; n2 – общее количество отрицательных отклонений; k – количество рядов. В приведенном примере n=20, n1=11, n2=5.

При достаточно большом количестве наблюдений (n1>10, n2>10) и отсутствии автокорреляции СВ k имеет асимптотически нормальное распределение, в котором

2n1n2

M k    1;

n1  n2

2n1n2 2n1n2  n1  n2 

Dk  

n1  n2 2 n1  n2  1

Тогда, если

M k   u / 2  Dk   k  M k   u / 2  Dk  , то гипотеза об отсутствии автокорреляции не отклоняется. Если

k  M k   u / 2  Dk  , то констатируется положительная автокорреля ция; в случае k  M k   u / 2  Dk  признается наличие отрицательной автокорреляции.

Для небольшого числа наблюдений (n1<20, n2<20) были разработаны таблицы критических значений количества рядов при n наблюдениях. В одной таблице в зависимости от n1 и n2 определяется нижняя граница k1 количества рядов, в другой – верхняя граница k2. Если k1

N

 (e  e

i i 1 )2 DW  n2

N

e

i

n 1

DW  2  (1  rei ,ei1 );0  DW  4 rei ,ei1  0  DW  2 rei ,ei1  1  DW  0(«» автокорреляция) rei ,ei1  1  DW  4(«» автокорреляция)

Рис. 8.2. Проверка гипотезы об автокорреляции остатков по DW-критерию Можно показать, что статистика DW тесно связана с коэффициентом автокор n

 et 1et

t 2 реляции первого порядка: ret 1et  .

n 1 n

  et2 et21

t 1 t 2

Связь выражается формулой: DW  21  re e  . t 1 t

Отсюда вытекает смысл статистического анализа автокорреляции. Поскольку значения r изменяются от –1 до +1, DW изменяется от 0 до 4. Когда автокорреляция отсутствует, коэффициент автокорреляции равен нулю, и статистика DW равна 2. DW=0 соответствует положительной автокорреляции, когда

выражение в скобках равно нулю r  1 . При отрицательной автокорреля ции r  1 . DW=4, и выражение в скобках равно двум.

Ограничения критерия Дарбина-Уотсона: 1. Критерий DW применяется лишь для тех моделей, которые содержат сво бодный член.

2. Предполагается, что случайные отклонения определяются по итерационной схеме et  et 1  vt , называемой авторегрессионной схемой первого порядка AR(1).

Здесь vt – случайный член.

3. Статистические данные должны иметь одинаковую периодичность (не должно быть пропусков в наблюдениях).

4. Критерий Дарбина – Уотсона не применим к авторегрессионным моделям

вида: yt  a  b1 xt1  … bp xtp  cyt 1  et , которые содержат в числе факторов также зависимую переменную с временным лагом (запаздыванием) в один период.

Автокорреляция чаще всего вызывается неправильной спецификацией модели. Поэтому следует попытаться скорректировать саму модель, в частности, ввести какой – нибудь неучтенный фактор или изменить форму модели (например, с линейной на полулогарифмическую или гиперболическую).

Если все эти способы не помогают и автокорреляция вызвана какими – то внутренними свойствами ряда {et}, можно воспользоваться преобразованием, которое называется авторегрессионной схемой первого порядка AR(1).

Линейная модель парной регрессии

yi=α+βxi+εi (1) yi-1=α+βxi-1+εi-1(2)

Из (1) вычтем (2), умноженное на ρ

yi-ρyi-1=α(1-ρ)+β(xi-ρxi-1)+(εi-ρεi-1)

получим

Yi*=α*+βx*+vi ρ≈1-DW/2

Рис.8.3. Авторегрессионное преобразование

Поскольку случайные отклонения vt удовлетворяют предпосылкам МНК, оценки а* и b будут обладать свойствами наилучших линейных несмещенных оценок. По преобразованным значениям всех переменных с помощью обычного МНК вычисляются оценки параметров а* и b, которые затем можно использовать в регрессии (71).

Однако способ вычисления преобразованных переменных (75) приводит к потере первого наблюдения, если нет информации о предшествующих наблюдениях. Это уменьшает на единицу число степеней свободы, что при больших выборках не очень существенно, однако при малых выборках приводит к потере эффективности. Тогда первое наблюдение восстанавливается с помощью поправки Прайса – Уинстена:

x1*  1   2  x1 ,

y1*  1   2  y1

Авторегрессионное преобразование может быть обобщено на произвольное число объясняющих переменных, т.е. использовано для уравнения множественной регрессии.

Вопросы и задания для самоконтроля

1. В чем суть гомоскедастичности и гетероскедастичности? Каковы последствия гетероскедастичности?

2. Действительно ли, вследствие гетероскедастичности оценки перестают быть эффективными и состоятельными?

3. Какие критерии могут быть использованы для проверки гипотезы о гомоскедастичности регрессионных остатков?

4. В чем заключается тест Спирмена?

5. Какова схема теста Голдфелда-Квандта?

6. Каково предположение теста Парка?

7. Что такое автокорреляция случайных отклонений?

8. Каковы основные причины и последствия автокорреляции?

9. Что такое автокорреляционная функция?

10. Какова основная идея метода рядов при обнаружении автокорреляции?

11. Как проводится тест Дарбина-Уотсона?

12. В чем состоит авторегрессионная схема 1-го порядка?

Задача 1. Заданы следующие значения остатков линейной модели: Ранг xi 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 ei -1 2 -3 2 0 -3 3 1 -2 -4 5 -11 8 -20 12 -21 18 14

Задание: установить, имеется ли гетероскедастичность по тесту ранговой корреляции Спирмена на уровне значимости   0,05.

Задача 2. По статистическим данным за 20 лет построено уравнение регрессии между ценой бензина и объемом продаж бензина, d  DW  0,71.

Задание: ответить на вопросы: будет ли иметь место автокорреляция остатков? Что могло послужить причиной автокорреляции?

Лекция 3(1) Тема 15. Модели одномерных временных рядов Вопросы для изучения: 1. Понятие временного ряда и его основные компоненты. 2. Построение аддитивной модели. 3. Построение мультипликативной модели.

Аннотация. Данная тема раскрывает порядок построения аддитивных и мультипликативных моделей одномерных временных рядов. Ключевые слова. Тренд, сезонные и случайные колебания, аддитивная модель, мультипликативная модель. Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме.  В дополнение к лекции есть презентация, которую необходимо изучить, и ответить на вопросы.  В качестве самостоятельной работы предлагается выполнить практические задания.  Для проверки усвоения темы имеется тест для самоконтроля. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766 2. Валентинов В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. — 3-е изд. — М.: Дашков и К, 2010. — 436 с.

(http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none) С. 242-261. 3. Эконометрика: учебник / И. И. Елисеева. – M.: Проспект, 2010. – 288 с. С.128-183. 4. Электронныйкурс “Time Series Econometrics”, Princeton University, URL: http://sims.princeton.edu/yftp/Times05/;https://blackboard.princeton.edu/webap ps/portal/frameset.jsp?tab_group=courses&url=%2Fwebapps%2Fblackboard% 2Fexecute%2FcourseMain%3Fcourse_id%3D_52968_1.

Понятие временного ряда и его основные компоненты. Временнóй ряд – это совокупность значений какого – либо показателя за несколько последовательных моментов или периодов времени. Каждое значение (уровень) временного ряда формируется под воздействием большого числа факторов, которые можно условно разделить на три группы: факторы, формирующие тенденцию ряда; факторы, формирующие циклические колебания ряда; случайные факторы. Тенденция характеризует долговременное воздействие факторов на динамику показателя. Тенденция может быть возрастающей или убывающей. Циклические колебания могут носить сезонный характер или отражать динамику конъюнктуры рынка, а также фазу бизнес – цикла. Реальные данные часто содержат все три компоненты. В большинстве случаев временной ряд можно представить как сумму или произведение трендовой (Т ) , циклической (S ) и случайной (Е ) компонент. В случае суммы имеет место аддитивная модель временного ряда: у  Т  S  Е, (1) в случае произведения – мультипликативная модель: у  Т S  Е. (2) Основная задача эконометрического исследования отдельного временного ряда – получение количественного выражения каждой из компонент и использование этой информации для прогноза будущих значений ряда или построение модели взаимосвязи двух или более временных рядов. Сначала рассмотрим основные подходы к анализу отдельного временного ряда. Такой ряд может содержать, помимо случайной составляющей, либо только тенденцию, либо только сезонную (циклическую) компоненту, либо все компоненты вместе. Для того, чтобы выявить наличие той или иной неслучайной компоненты, исследуется корреляционная зависимость между последовательными уровнями временного ряда, или автокорреляция уровней ряда. Основная идея такого анализа заключается в том, что при наличии во временном ряде тенденции и циклических колебаний значения каждого последующего уровня ряда зависят от предыдущих. Количественно автокорреляцию можно измерить с помощью линейного коэффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени. Коэффициент автокорреляции уровней ряда первого порядка измеряет за висимость между соседними уровнями ряда t и t  1, т.е. при лаге 1. Он вычисляется по следующей формуле:

n

 ( yt  y1 )( yt 1  y2 )

t 2 r1 

n n

 ( yt  y1 )  ( yt 1  y2 ) 2 ,

t 2 t 2 (3) где в качестве средних величин берутся значения:

n

 yt

n

y t 1

t 2 y2  t 2 y1  ; .

n 1 n 1 (4) В первом случае усредняются значения ряда, начиная со второго до последнего, во втором случае — значения ряда с первого до предпоследнего. Формулу (3) можно представить как формулу выборочного коэффициента корреляции:

rxy 

 ( xi  x )( yi  y )

 ( xi  x )2  ( yi  y )2 , (5)

где в качестве переменной х берется ряд у 2 , у3 ,…, у n , а в качестве пере менной у  ряд у1 , у 2 ,…, у n1.

Если значение коэффициента (3) близко к единице, это указывает на очень тесную зависимость между соседними уровнями временного ряда и о наличии во временном ряде сильной линейной тенденции.

Аналогично определяются коэффициенты автокорреляции более высоких порядков. Так, коэффициент автокорреляции второго порядка характеризует

тесноту связи между уровнями

yt и

yt  2 и определяется по формуле:

n

(y t  y 3 )( y t  2  y 4 )

r2  t 3

n n

(y

t 3

t  y3 ) 2

(y

t 3

t 2  y4 ) 2 ,

(6)

где в качестве одной средней величины берут среднюю уровней ряда с третьего до последнего, а в качестве другой — среднюю всех уровней ряда, кроме последних двух:

n

 yt

n

y t 2

y3  t 3

; y4  t 3

n2 n2 (7)

Число периодов, по которым рассчитывается коэффициент автокорреляции, называют лагом. С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Для обеспечения статистической достоверности максимальный лаг, как считают некоторые известные эконометристы, не должен превышать четверти общего объема выборки.

Коэффициент автокорреляции строится по аналогии с линейным коэффициентом корреляции, и поэтому он характеризует тесноту только линейной связи текущего и предыдущего уровней ряда. По нему можно судить о наличии линейной или близкой к линейной тенденции. Однако для некоторых временных рядов с сильной нелинейной тенденцией (например, параболической или экспоненциальной), коэффициент автокорреляции уровней ряда может приближаться к нулю. Кроме того, по знаку коэффициента автокорреляции нельзя делать вывод о возрастающей или убывающей тенденции в уровнях ряда. Большинство временных рядов экономических данных имеют положительную автокорреляцию уровней, однако при этом не исключается убывающая тенденция. Последовательность коэффициентов автокорреляции уровней различных порядков, начиная с первого, называется автокорреляционной функцией временного ряда. График зависимости ее значений от величины лага называется коррелограммой. Анализ автокорреляционной функции и коррелограммы помогает выявить структуру ряда. Здесь уместно привести следующие качественные рассуждения.

Если наиболее высоким является коэффициент автокорреляции первого порядка, очевидно, исследуемый ряд содержит только тенденцию. Если наибо лее высоким оказался коэффициент автокорреляции порядка τ, ряд содержит циклические колебания с периодичностью в τ моментов времени. Если ни один из коэффициентов автокорреляции не является значимым, то либо ряд не содержит тенденции и циклических колебаний и имеет только случайную составляющую, либо ряд содержит сильную нелинейную тенденцию, для исследования которой нужно провести дополнительный анализ.

В случае, если при анализе структуры временного ряда обнаружена только тенденция и отсутствуют циклические колебания (случайная составляющая присутствует всегда), следует приступать к моделированию тенденции. Если же во временном ряде имеют место и циклические колебания, прежде всего следует исключить именно циклическую составляющую, и лишь затем приступать к моделированию тенденции. Выявление тенденции состоит в построении аналитической функции, характеризующей зависимость уровней ряда от времени, или тренда. Этот способ называют аналитическим выравниванием временного ряда.

Зависимость от времени может принимать разные формы, поэтому для её формализации используют различные виды функций:

линейный тренд: yˆ t  a  b  t ;

гипербола: yˆ t  a  b / t ;

a  b t

экспоненциальный тренд: yˆt  e (или yˆ t  a  b );

t

степенной тренд: yˆ t  a  t ;

b

параболический тренд второго и более высоких порядков:

yˆ t  a  b1  t  b2  t 2  …  bk  t k .

Параметры каждого из трендов можно определить обычным МНК, ис пользуя в качестве независимой переменной время t  1,2,…, n , а в качестве зависимой переменной – фактические уровни временного ряда yt (или уровни за вычетом циклической составляющей, если таковая была обнаружена).

Для нелинейных трендов предварительно проводят стандартную процедуру их линеаризации.

Существует несколько способов определения типа тенденции. Чаще всего используют качественный анализ изучаемого процесса, построение и визуальный анализ графика зависимости уровней ряда от времени, расчет некоторых основных показателей динамики. В этих же целях можно использовать и коэффициенты автокорреляции уровней ряда. Тип тенденции можно определить путем сравнения коэффициентов автокорреляции первого порядка, рассчитанных по исходным и преобразованным уровням ряда. Если временной ряд имеет линейную тенденцию, то его соседние уровни yt и yt-1 тесно коррелируют. В этом случае коэффициент автокорреляции первого порядка уровней исходного ряда должен быть высоким. Если временной ряд содержит нелинейную тенденцию, например, в форме экспоненты, то коэффициент автокорреляции первого порядка по логарифмам уровней исходного ряда будет выше, чем соответствующий коэффициент, рассчитанный по уровням ряда. Чем сильнее выражена нелинейная тенденция в изучаемом временном ряде, тем в большей степени будут различаться значения указанных коэффициентов.

Выбор наилучшего уравнения в случае, если ряд содержит нелинейную тенденцию, можно осуществить путем перебора основных форм тренда, расчета по каждому уравнению скорректированного коэффициента детерминации

R 2 и выбора уравнения тренда с максимальным значением этого коэффициента. Реализация этого метода относительно проста при компьютерной обработке данных.

При анализе временных рядов, содержащих сезонные или циклические колебания, наиболее простым подходом является расчет значений сезонной компоненты методом скользящей средней и построение аддитивной или мультипликативной модели временнóго ряда в форме (1) или (2).

Если амплитуда колебаний приблизительно постоянна, строят аддитивную модель (1), в которой значения сезонной компоненты предполагаются постоянными для различных циклов. Если амплитуда сезонных колебаний возрастает или уменьшается, строят мультипликативную модель (2), которая ставит уровни ряда в зависимость от значений сезонной компоненты.

Построение аддитивной модели.

1 шаг. Выравнивание уровней ряда. Просуммируем уровни ряда за каждые четыре квартала со сдвигом на один момент времени. Разделив полученные суммы на 4, найдем скользящие средние. Найдем центрированные скользящие средние как средние значения из двух последовательных скользящих средних.

2 шаг. Расчет сезонной компоненты S. Найдем разность между уровнями и центрированными скользящими средними. Расчет средней оценки сезонной компоненты для каждого квартала за все годы. Расчет скорректированной сезонной компоненты.Моделирование сезонных колебаний:Аддитивная модель: Yt  Tt  St  et . Оценка сезонной компоненты за каждый квартал: st  yt  yt . Средняя оценка се зонной компоненты для квартала за все годы: St   t . Скорректированная се s

n

S t зонная компонента: S t  S t  k ; k  t 1

3 шаг. Устранение сезонной компоненты S.Вычтем скорректированное значение сезонной компоненты из каждого уровня исходного временного ряда. Получим: T+E=Y-S.

4 шаг. Расчет значений тренда. Проведем аналитическое выравнивание ряда (T+E) с помощью линейного тренда. Рассчитаем значения T для каждого момента времени по уравнению тренда.

5 шаг. Расчет значений T+S. Прибавим к уровням T значения сезонной компоненты (S) для соответствующих кварталов.

6 шаг. Расчет абсолютной ошибки. Выполним расчет ошибки для каждого уровня ряда по формуле: E=Y-(T+S).

Расчет суммы квадратов абсолютных ошибок и ее сравнение с общей суммой квадратов отклонений уровней ряда.

Построение мультипликативной модели.

1 шаг. Выравнивание уровней ряда. Просуммируем уровни ряда за каждые четыре квартала со сдвигом на один момент времени. Разделив полученные суммы на 4, найдем скользящие средние. Найдем центрированные скользящие средние как средние значения из двух последовательных скользящих средних.

2 шаг. Расчет сезонной компоненты S. Найдем оценки сезонной компоненты как частное от деления уровней на центрированные скользящие средние. Расчет средней оценки сезонной компоненты для каждого квартала за все годы. Расчет скорректированной сезонной компоненты. Моделирование сезонных колебаний: Мультипликативная модель: Yt  Tt  St  et .

yt

Оценка сезонной компоненты за каждый квартал: st  . Средняя оценка

yt

сезонной компоненты для квартала за все годы: St   t . Скорректированная

s

n сезонная компонента: St  St  k ; k  4

S

t 1

t

3 шаг. Устранение сезонной компоненты S.Разделим каждый уровень исходного временного ряда на скорректированное значение сезонной компоненты. Получим: T*E=Y/S.

4 шаг. Расчет значений тренда.Проведем аналитическое выравнивание ряда (T*E) с помощью линейного тренда. Рассчитаем значения T для каждого момента времени по уравнению тренда.

5 шаг. Расчет значений T+S. Умножим уровни T на значения сезонной компоненты (S) для соответствующих кварталов.

6 шаг. Расчет абсолютной ошибки.Выполним расчет ошибки для каждого уровня ряда по формуле: E=Y/(T*S).

Расчет суммы квадратов абсолютных ошибок и ее сравнение с общей суммой квадратов отклонений уровней ряда.

Вопросы и задания для самоконтроля

1. В чем особенность временного ряда?

2. Каковы основные компоненты уровней временного ряда?

3. В чем состоит основная задача эконометрического исследования временного ряда?

4. Как определяется автокорреляция остатков во временных рядах?

5. Какие свойства имеет коэффициент автокорреляции?

6. Как определяется автокорреляционная функция?

7. Что такое коррелограмма? Что выявляют при помощи анализа коррелограммы?

8. Как сформулировать вывод о структуре временного ряда?

9. Какие методы применяются для выявления основной тенденции ряда?

10. В чем суть сглаживания временных рядов?

Задача 1. Имеются следующие данные об урожайности пшеницы y за 12 лет: yt 16,3 20,2 17,1 9,7 15,3 16,3 19,9 14,4 18,7 20,7 19,5 21,1 t 1 2 3 4 5 6 7 8 9 10 11 12

Задание:

1) определить среднее значение, среднее квадратическое отклонение и коэффициенты автокорреляции (для лагов   1,2) временного ряда;

2) провести сглаживание исходного временного ряда методом скользящих средних, используя среднюю арифметическую с интервалом сглаживания:

а) m  3;

б) m  4;

3) записать уравнение тренда ряда, полагая, что он линейный, и проверить его значимость на уровне   0,05.

Задача 2. Данные, отражающие динамику роста доходов yt на душу населения за восемь лет, приведены в таблице: Год, t 1 2 3 4 5 6 7 8 yt 1130 1220 1350 1390 1340 1380 1490 1680

Задание: определить точечный прогноз дохода населения по линейному тренду на 9 год.

Лекция 3(2)

Тема 17. Модели стационарных и нестационарных временных рядов

Вопросы для изучения:

1. Модели стационарных и нестационарных временных рядов, их идентификация.

2.Модель авторегрессии–скользящего среднего (модель ARMA).

3. Авторегрессионная модель проинтегрированного скользящего среднего (модель ARIMA).

Аннотация. Данная тема раскрывает особенности моделей стационарных и нестационарных временных рядов и методы их оценивания. Ключевые слова. Стационарный процесс, модель авторегрессии, модель Бокса-Дженкинса. Методические рекомендации по изучению темы  Тема содержит лекционную часть, где даются общие представления по теме.  В дополнение к лекции есть презентация, которую необходимо изучить и ответить на вопросы.  В качестве самостоятельной работы предлагается подготовить реферат в рамках вопросов для изучения.  Для проверки усвоения темы имеется тест для самоконтроля. Рекомендуемые информационные ресурсы: 1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766 2. Валентинов, В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. — 3-е изд. — М.: Дашков и К, 2010. — 436 с.

(http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none) С. 328-338. 3.Тихомиров Н. П. Эконометрика: учебник. — М.: Экзамен, серия «Учебник Плехановской академии», 2007, -512 с. С.211-222. 4. Эконометрика: учебник / под ред. В. С. Мхитаряна. — М.: Проспект, 2008. -384 с. С. 325-336. 5. Электронный курс “Time Series Econometrics”, PrincetonUniversity, URL: http://sims.princeton.edu/yftp/Times05/;https://blackboard.princeton.edu/webap ps/portal/frameset.jsp?tab_group=courses&url=%2Fwebapps%2Fblackboard% 2Fexecute%2FcourseMain%3Fcourse_id%3D_52968_1.

Модели стационарных и нестационарных временных рядов, их идентификация. Набор случайных переменных X(t) называется стохастическим процессом. Стохастический процесс Xt называется стационарным в сильном смысле, если совместное распределение вероятностей всех переменных Xt1, Xt2,…, Xtn, такое же, что и для переменных Xt1+, Xt2+,…, Xtn+. Для стационарного процесса в слабом смысле среднее и дисперсия независимо от рассматриваемого периода времени имеют постоянное значение, а автоковариация зависит только от длины лага между рассматриваемыми переменными.

Временной ряд x1,x2,…,xt, т.е. конкретная реализация стационарного стохастического процесса Xt, также называется стационарным.

Стационарность означает отсутствие:

систематиче

ски изменя ющихся

систематиче

строго взаимозави ских

тренда периодичны симостей

изменений

х колебаний между

дисперсии

элементами

временного

ряда

Рис. 17.1. Признаки стационарности временного ряда

Линейные модели временных рядов применяются, как правило, для описания стационарных процессов. Чаще всего это стационарные процессы второго порядка, то есть процессы, имеющие постоянные значения всех своих моментов до второго порядка включительно на всех временных отрезках, входящих в интервал t  1,2,…, T . Следовательно, для любых двух интервалов времени T T  и T3,T4  в таком процессе yt 1, 2

выполняются условия равенства математических ожиданий, дисперсий и коэффициентов автокорреляции одинаковых порядков. На практике для оценок этих показателей должны выполняться соотношения:

1 T2 1 T4

y 1 

T2  T1 t T1

yt   yt  y 2

T4  T3 t T3

(1)

T2 T4

D1  y    yt  y 2  1 y  y   D2  у 

T2  T1 t T1 T4  T3

t

t T3

(2)

T2 i

 yt  y  yt i  y  T i  yt  y  yt i  y  2 

 

1

ri  ri , i  1,2,…

t T T2  T1  i   D y  t T T4  T3  i   D y 

1 3

(3)

Здесь y , y , D  y  , D  y  , ri , ri — оценки математических ожиданий,

1 2  1 2 1 2 

дисперсий и коэффициентов автокорреляции i — го порядка процесса yt на пер вом и втором интервалах; y и D y  — оценки среднего значения и дисперсии

процесса на интервале 1, T  .

Равенства (1) – (3) понимаются в статистическом смысле. Это значит, что каждое из этих равенств может в точности не выполняться, однако разница между оценками укладывается в границы соответствующего критерия.

Такие критерии реализуются через различные тесты, которые мы сейчас рассмотрим.

Параметрические тесты стационарности применяются при достаточно строгих предположениях о законе распределения временного ряда и его параметрах. Они оценивают степень близости эмпирических характеристик временного ряда к их теоретическим аналогам. Для выражений (1) – (3) параметрическими критериями стационарности являются критерии Стьюдента и Фишера. Здесь предполагается нормальный закон распределения значений временного ряда и его выборочных характеристик, что справедливо для многих реальных процессов. Тестирование математического ожидания по статистике Стьюдента требует разбить временной ряд (1,T) на две части, не обязательно одинаковые, H0 – гипотеза о постоянстве математического ожидания:

y1  y2

 ,  12   22

2 2

s s

 2

T1 T2

y1  y2 T1  T2

  ,  12   22  

s 2

T1  T2

   ( p, v  T1  T  2)  H 0

Тестирование математического ожидания по статистике Фишера (если количество наблюдений достаточно велико), Н0 – гипотеза о постоянстве математического ожидания временного ряда. Интервал наблюдений делится на несколько частей.

n

  T j ( y j  y)2 n  1 j 1 F

s 2 ( n)

n s 2 ( n)    (T j  1)  s j2

T  n j 1 F  F ( p, v1  n  1, v2  T1  T2  …  Tn  n  H 0

где, n – число частей разбиения интервала (1,Т); Tj- число измерений переменной yt на j-ой части; j=1,2,…,n; y — среднее значение временного ряда; s 2 (n) — средняя дисперсия.

Тестирование дисперсии временного ряда на постоянство ее значения проводится разбиением исходного интервала на две части с использованием двухстороннего критерия Фишера, который рассчитывается по формуле:

s12

F 2

s2 ,

2 2 где s1 и s 2 — оценки дисперсии ряда на первой и второй подвыборок соответственно и числом измерений T1 и T2.

Этот тест аналогичен проверке гипотезы о равенстве дисперсий двух

нормальных СВ с той разницей, что здесь сравнивается дисперсия в разных частях одного временного ряда.

Рассчитанное значение F — статистики сравнивается с критическими на уровнях /2 и 1-/2 и числами степеней свободы (T1-1) и (T2-1).

Если Fкр . 1   / 2;T1  1;T2  1  F  Fкр .  / 2;T1  1;T2  1

, то гипотеза  1   2   принима 2 2 2

ется на уровне  .

Поскольку критические значения удовлетворяют соотношению

F  / 2; v1 ; v2  

F 1   / 2; v1 ; v2  ,

на практике проверяется только соотношение F  Fкр.  / 2;T1  1;T2 1

при условии, что s1  s2 .

2 2

При достаточно больших объемах наблюдений временного ряда T  40 вместо критерия Фишера рекомендуют использовать стандартизированное

нормальное распределение. При выборках 40  T  100 закону N 0,1 подчиняется случайная величина

1 s12 1  1 1 

ln    

2 s22 2  v1 v2 

Ф

1 1 1 

  

2  v1 v2 

При больших выборках расчетное значение случайной величины определяется так:

s12 s2

Ф  s1  s2   2

2T1 2T2

  Ф / 2

В любом случае, если , то гипотеза о постоянстве дисперсии принимается.

Если временной ряд разбивается на большее число частей (n>2), гипотеза о постоянстве дисперсии может быть проверена критерием Кокрена, основанном на распределении Фишера. При этом обычно объемы этих частей принимаются равными между собой, то есть T1=T2=…=Tn. Рассчитывается критерий по формуле:

2

smax

K 2

s1  …  sn2

 maxs 2j ,

____

smax j  1, n

Здесь j .

Табличное значение критерия Кокрена определяется по формуле:

F 1   / n; N  1; n  1N  1 K  ; n; N  1 

n  1  F 1   / n; N  1; n  1N  1

Если K  K  ; n; N  1 , то гипотеза о постоянстве дисперсии временного ряда принимается на уровне .

Критерий Бартлетта также используется при проверке гипотезы о постоянстве дисперсии. Он является более мощным, чем критерий Кокрена, но и более чувствительным к отклонениям значений временного ряда от нормального закона. Здесь временной ряд также разбивается на несколько частей, причем не обязательно одинаковых по величине.

Согласно критерию, следующая величина:

1 n si2

    Ti  1ln 2

c i 1 s

распределена приблизительно по закону  с n  1 степенями свободы. Здесь

n

 Ti  1si2

s2  i 1

n

 Ti  1

i 1 средняя дисперсия на n интервалах;

n

1 1 1

c  1  

3n  1 i 1 Ti  1 n

 T  1

i 1

i

При больших Ti c  1 .

Для одинаковых размеров подвыборок v1  v2  …  vn  v , тогда n 1  1 n 2 n 1  T i  1  T  n   nv ln s 2 

 si 

n i 1  , где

c  1 i 1 , поэтому c 3 n  v .

Если     , n  1, то гипотеза о равенстве дисперсий на рассматриваемых частях временного интервала принимается.

По рассмотренным параметрическим критериям следует отметить их ограниченность в применении вследствие достаточно жестких предположений нормальности закона распределения временного ряда. Кроме того, они требуют значительных вычислений. Однако реальные временные ряды могут быть распределены по закону, отличному от нормального. Поэтому на практике при проверке стационарности процессов часто используют непараметрические критерии, не имеющие ограничений по закону распределения и не столь сложные по вычислениям.

Тест Манна – Уитни используется вместо критерия Стьюдента для проверки идентичности распределений двух совокупностей, то есть временных последовательностей одного временного ряда, определенных на разных временных частях интервала 1,2,…,T. Он тестирует постоянство математического ожидания.

Пусть первая подвыборка образована T1 последовательными значениями yt, а вторая – T2 его последовательными значениями, и эти последовательности не пересекаются.

1

Обозначим элементы первой подвыборки символом y , второй – симво 2  лом y . Затем объединим эти подвыборки в одну совокупность объемом (T1+T2), расположив все элементы в порядке возрастания их значений. При этом элементы подвыборок оказываются перемешанными между собой.

Если ряд стационарный, то элементы разных подвыборок довольно равномерно перемешаны друг с другом. В противном случае общая последовательность оказывается разделенной на массивы, состоящие в основном из единиц одной из совокупностей. Например, для возрастающего или убывающего временного ряда элементы подвыборок скапливаются на разных концах общей последовательности.

В тесте Манна – Уитни проверяется гипотеза о стационарности временного ряда на основе критерия u  , равного числу случаев, когда элементы из первой подвыборки предшествуют элементам из второй подвыборки. Значение

T1 T1  1  u   R1  u рассчитывается по формулам: 2 или

T1 T1  1

u   T1  T2   R2

2 , где R1 и R2 — суммы рангов элементов первой и второй подвыборок соответственно, определяемых по их общей последовательности.

Для достаточно больших последовательностей (T>50) случайная величи на u  распределена по нормальному закону с математическим ожиданием

T1  T2 T1  T2  T1  T2  1

  M u 

2 и дисперсией

D[u * ] 

12 .

T1  T2 1

u  

z 2 2

Таким образом, случайная величина  (u )

распределена

по закону N 0,1. Поправка 1/2 вводится для обеспечения непрерывности z. Она

прибавляется, если z< 0 . Она прибавляется, если z<0, и вычитается, если z>0

Если обе подвыборки идентичны, их элементы перемешаны между собой,

тогда значение u  будет находиться вблизи своего среднего значения, а значение z — около нуля. Поэтому гипотеза о стационарности процесса yt принимается на уровне значимости , если выполняется неравенство:

u1 / 2  z  u / 2

Непараметрический тест Сигела – Тьюки используют вместо параметрического критерия Фишера для проверки гипотезы о постоянстве дисперсии временного ряда. Он также основан на сопоставлении рангов элементов двух подвыборок из данного интервала.

Сначала исходный временный ряд центрируется, то есть каждое значение заменяется отклонением от среднего согласно выражению yå  yt  y , где y среднее значение ряда yt.

Далее интервал (1,T) делится на две, желательно равные, части, где эле 1 2  менты обозначаются соответственно y и y . Эти элементы в объединенной совокупности сортируются в порядке возрастания их значений. Затем каждому значению присваивается его ранг по следующему правилу: все нечетные номера получают отрицательные элементы в порядке возрастания их значений, а все четные номера – положительные элементы, но в порядке убывания их значений. Другими словами, ранг 1 получает наименьшее отрицательное значение, а ранг 2 – наибольшее положительное.

Если обозначить R1 сумму рангов элементов первой подвыборки, то слу T1  T1  T2  1 1

R1  

z 2 2

T1  T2  T1  T2  1 чайная величина 12 оказывается распределен ной по закону N 0,1. Здесь также поправка 1/2 вводится для обеспечения непрерывности z.

Отдельную группу непараметрических тестов стационарности составляют тесты, основанные на так называемых сериальных критериях. Они анализируют закономерности серий измеренных значений временного ряда. Для их применения необходим достаточно большой объем данных, чтобы считать обнаруженные закономерности устойчивыми.

Серией называют последовательность значений временного ряда, отклоняющихся от значения некоторого признака в одну и ту же сторону. Например, при тестировании автокорреляции в остатках по методу рядов таким признаком было расчетное значение результативного признака. Во временных рядах в роли этого признака часто выступает медиана значений ряда. Тогда элементы, по значению превышающие медиану, образуют серии с положительным знаком, а элементы, не превосходящие по значению медиану – серии с отрицательным знаком.

Критерий Вальда – Вольфовица основан на подсчете общего числа серий. Среднее число серий рассчитывается по выражению:

M N s  

2 N1 N 2

1

N1  N 2 , а дисперсия – по формуле:

2 N1 N 2  2 N1  N 2  N1  N 2 

DN s  

N1  N 2 2  N1  N 2  1

Здесь N1 и N2 — количества элементов соответственно с положительным и

с отрицательным знаком; (N1+N2)=T; N s — число серий.

Как видим, эти формулы в точности повторяют формулы метода рядов.

При большом объеме временного ряда случайная величина

N s  M N s  

z 2

 N s  распределена по закону N 0;1.

Если реальный временной ряд не представляет стационарный процесс второго порядка, его нужно привести к стационарному процессу. Это делается с помощью соответствующих преобразований: взятия конечных разностей, логарифмирования цепных индексов, расчета темпов прироста и др.

Например, когда закон изменения yt близок к линейному, преобразование заключается во взятии первых разностей:

yt  yt  yt  yt 1

Разности второго порядка:

yt yt  yt  yt1   yt  yt 1    yt 1  yt 2   yt  2 yt 1  yt 2

применяются при законе изменения yt , близком к квадратической параболе.

При экспоненциальном росте yt логарифмируются цепные индексы:

yt

yt  ln  ln yt  ln yt 1

yt 1

Расчет темпов прироста выполняется по формуле

yt  yt 1 y

yt   t 1

yt 1 yt 1

Для трансформации исходного нестационарного ряда в стационарный можно использовать и другие преобразования. В каждом конкретном случае

надо исходить из примерной формы временного графика yt . Подходящее преобразование должно обеспечивать приблизительное выполнение условия yt  f  yt   const .

Особенности конкретного стационарного процесса второго порядка полностью определяются характером его автокорреляционной функции, представляющей собой последовательность коэффициентов автокорреляции r0 , r1 , r2 , … Здесь r0  1, остальные значения располагаются на отрезке  1;1 .

Аналогично формируется автокорреляционная функция как последовательность значений автокорреляций  0 ,  1 ,  2 ,… в зависимости от сдвига.

Между значениями двух функций существует взаимосвязь  i  ri y2 , i=0,1,2,…;

 0   y2 .

Модель авторегрессии–скользящего среднего (модель ARMA).

Построение модели АР(k) сводится к решению двух задач: — определение рационального порядка модели (величины k); — оценивание параметров модели на основе уравнений Юла-Уокера.

yt  1 yt 1   2 yt 2  …   k yt k   t

Система уравнений Юла-Уокера: r1  a1  a2 r1  …  ak rk 1 ; r2  a1r1  a2  …  ak rk  2 ;  rk  a1rk 1  a2 rk  2  …  ak ; r1,r2,…rk – известные оценки коэффициентов автокорреляции; a1,a2,…ak — неизвестные оценки коэффициентов модели.

Модель авторегрессии первого порядка АР(1): yt  1 yt 1   t , a1  r1

Модель авторегрессии второго порядка АР(2): yt  1 yt 1   2 yt  2   t , r1  a1  a2 r1 ; r2  a1r1  a2 .

r1 (1  r2 ) a1  ;

1  r12

r2  r12 a2 

1  r12

Модель скользящего среднего первого порядка СС(1): yt   t  1 t 1 ,  y2  (1  12 ) 2 ,

 1 1 

1  12

Модель скользящего среднего второго порядка СС(2): yt   t  1 t 1   2 t  2 ,  y2  (1  12   22 ) 2 ,

 1 (1  1 )  2 1  ; 2  ;  i  0, i  3.

1  1   2

2 2

1  12   22

Простейшая модель авторегрессии — скользящего среднего АРСС(k,m) (AutoRegressive-MovingAverage (ARMA (k,m)) : yt  yt 1   t   t 1 yt  yt 1   t   t 1,   1,   1

Значения автокорреляционной функции для ARMA (1,1) будут иметь вид:

(1   )(   )  (1)  ,  1

1   2  2  ( )   (  1)    1  (1),  1

Авторегрессионная модель проинтегрированного скользящего среднего (модель ARIMA).Для описания нестационарных однородных временных рядов применяется модель Бокса-Дженкинса (ARIMA –модель).

Наиболее распространены ARIMA (k,m,q) – модели, со значениями параметров, не превышающими 2, q – порядок разности (дискретной производной).

Этапы методологии Бокса-Дженкинса:

1. Тестирование исходного ряда на стационарность. Анализ автокорреляционной функции. Переход к стационарному ряду путем взятия последовательных разностей (дискретные производные).

Определение параметра q.

2. Исследование характера автокорреляционной функции и предположение о значениях параметров k (порядок авторегрессии) и m (порядок скользящего среднего).

3. Оценивание параметров ARIMA (k,m,q) – модели.

4. Проверка пробной модели на адекватность путем анализа ряда остатков.

Для обнаружения «белого шума» в остатках применяют Q-статистику Бокса-Пирса, H0 об отсутствии автокорреляции в остатках:

 Q  n rp2 ,

p 1

Q   2 ( , v    k  m)  H 0 :   0

Критерии качества подгонки модели Бокса-Дженкинса: КритерийАкайка (Akaike information criterion, AIC):

 n 2

  et 

k m AIC   ln  t 1 

n  n 

 

 

Выбор следует сделать в пользу модели с меньшим значением AIC. Критерий Шварца (Swarzcriterion):

 n 2

  et 

( p  q) ln n SIK   ln  t 1 

n  n 

 

 

Вопросы для самоконтроля

1. Какая модель временного ряда называется статической?

2. Когда модель временного ряда называется динамической?

3. Как определяются авторегрессионные модели?

4. Как определяется модель ARMA?

5. Как интерпретируют параметры моделей авторегрессии?

6. Что означает стационарность временного ряда?

7. Какой стационарный процесс называется «белым шумом»?

8. Какие типы включают модели стационарных временных рядов?

9. Какие типы включают модели нестационарных временных рядов?

10. Как определяется ARIMA-модель?

Лекция 4(1)

Тема 19. Понятие о системах эконометрических уравнений

Вопросы для изучения:

1. Понятие о системах уравнений. Системы независимых уравнений и системы взаимозависимых уравнений.

2. Структурная и приведенная формы модели.

3. Идентификация модели.

Аннотация. Данная тема излагает типы систем эконометрических уравнений.

Ключевые слова. Система взаимозависимых уравнений, идентификация системы взаимозависимых уравнений, структурная и приведенная формы модели.

Методические рекомендации по изучению темы

 Тема содержит лекционную часть, где даются общие представления по теме.

 В дополнение к лекции есть презентация, которую необходимо изучить, и ответить на вопросы.

 В качестве самостоятельной работы предлагается выполнить практические задания.

 Для проверки усвоения темы имеется тест для самоконтроля.

Рекомендуемые информационные ресурсы:

1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766

2. Эконометрика: [Электронный ресурс] Учеб.пособие / А.И. Новиков. — 2-e изд., испр. и доп. — М.: ИНФРА-М, 2011. — 144 с.: с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none)С. 117-136.

3. Валентинов В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. — 3-е изд. — М.: Дашков и К, 2010. — 436 с.

(http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none) С. 338-356.

4.Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. — М.: НИЦ ИНФРА-М; Мн.: Нов.знание, 2014. — 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С. 286-313.

Понятие о системах уравнений. Системы независимых уравнений и системы взаимозависимых уравнений. Объектом статистического изучения в социальных науках являются сложные системы. Построение изолированных уравнений регрессии недостаточно для описания таких систем и объяснения механизма их функционирования. Изменение одной переменной, как правило, не может происходить без изменения других. Поэтому важное место занимает проблема описания структуры связей между переменными системой так называемых одновременных уравнений. Так, если изучается модель спроса как отношение цен и количества потребляемых товаров, то одновременно для прогнозирования спроса необходима модель предложения товаров, в которой рассматривается также взаимосвязь между количеством и ценой предлагаемых благ. Это позволяет достичь равновесия между спросом и предложением.

Изменение одного фактора, как правило, не может

происходить при неизменности других.

Отдельное уравнение регрессии не может характеризовать

истинные влияния факторов на y.

Структура связей между факторами описывается системой

одновременных (структурных) уравнений

Рис. 19.1. Необходимость систем уравнений

переменные уравнения

поведенческие

эндогенные

уравнения

уравнения экзогенные

тождества

Рис. 19.2. Составляющие систем уравнений

Эндогенные переменные обычно обозначаются как y. Это зависимые переменные, значения которых определяются внутри модели. Их число равно числу уравнений в системе.

Экзогенные переменные обычно обозначаются как x. Это внешние по отношению к модели переменные. Они влияют на эндогенные переменные, но не зависят от них.

Лаговые переменные – это значения эндогенных переменных за предшествующий период времени (yt-1).

В модели участвуют в качестве экзогенных переменных.

В поведенческих уравнениях описываются взаимодействия между переменными.

В уравнениях-тождествах описываются соотношения, которые должны выполняться во всех случаях. Тождества не содержат подлежащие оценке параметры a и b, а также случайное отклонение ε.

Системы эконометрических уравнений

Система

Система Система взаимозависимых

независимых рекурсивных

(одновременных)

уравнений уравнений

уравнений

Рис. 19.3. Виды систем уравнений

В системе независимых уравнений каждая зависимая переменная y рассматривается как функция одного и того же набора факторов x:

 y1  a11x1  a12 x2  …  a1m xm   1 ,

 y  a x  a x  …  a x   ,

 2 21 1 22 2 2m m 2

…………………………………………….

 yn  an1 x1  an 2 x2  …  anm xm   n .

Набор • Экономическая

факторов xi в нецелесообразность

включения фактора в

каждом модель

уравнении • Незначимое значение t может статистики и частного F изменяться критерия

Рис. 19.4. Включение факторов в модель

Система независимых уравнений с различным набором факторов:

 y1  f ( x1 , x2 , x3 , x4 , x5 ),

y 

 2 f ( x1 , x3 , x4 , x5 ),

 y3  f ( x2 , x3 , x5 ),

 y4  f ( x3 , x4 , x5 ).

В системе рекурсивных уравнений каждое последующее уравнение включает в качестве факторов все зависимые переменные y предшествующих уравнений наряду с набором собственно факторов х:

 y1  a11x1  a12 x2  …  a1m xm   1 ,

 y  b y  a x  a x  …  a x   ,

 2 21 1 21 1 22 2 2m m 2

 y3  b31 y1  b32 y2  a31x1  a32 x2  …  a3m xm   3 ,

………………………………………………………..

 yn  bn1 y1  bn 2 y2  bn 3 y3  …  bnn1 yn 1 

 an1 x1  an 2 x2  …  anm xm   n .

В системе взаимозависимых уравнений одни и те же зависимые переменные y в одних уравнениях входят в левую часть, а в других уравнениях – в правую часть системы:

 y1  b12 y2  b13 y3  …  b1n yn  a11x1  a12 x2  …  a1m xm   1 ,

 y2  b21 y1  b23 y3  …  b2 n yn  a21x1  a22 x2  …  a2 m xm   2 ,

………………………………

 y  b y  b y  …  b y  a x  a x  …  a x   .

 n n1 1 n2 2 nn1 n 1 n1 1 n2 2 nm m n

Этот вид систем уравнений получил наибольшее распространение в эконометрических исследованиях. В эконометрике эта система уравнений называется также структурной формой модели (СФМ).

Для нахождения параметров каждого уравнения традиционный МНК неприменим, здесь используются специальные методы оценивания. В этом случае каждое из уравнений не может рассматриваться самостоятельно.

Структурная и приведенная формы модели. Система взаимозависимых (одновременных) уравнений, описывающая структуру связей между переменными, называется структурной формой модели. Коэффициенты bi и aj называются структурными коэффициентами модели. Приведенная форма модели представляет собой систему линейных функций эндогенных переменных от экзогенных. В каждое приведенное уравнение включаются все экзогенные переменные структурной модели. Система одновременных уравнений (т.е. структурная форма модели) обычно содержит эндогенные и экзогенные переменные. Эндогенные переменные – это зависимые переменные, число которых равно числу уравнений в системе. Они обозначаются через y. Экзогенные переменные – это предопределенные переменные, влияющие на эндогенные переменные, но не зависящие от них. Они обозначаются через x.

Простейшая структурная форма модели имеет вид:

 y1  b12 y2  a11 x1  1,

 у2  b21 y1  a22 x2   2,

где y1,y2 – эндогенные переменные, x1,x2 – экзогенные.

Классификация переменных на эндогенные и экзогенные зависит от теоретической концепции принятой модели. Экономические переменные могут выступать в одних моделях как эндогенные, а в других – как экзогенные переменные. Внеэкономические переменные (например, климатические условия) входят в систему как экзогенные переменные. В качестве экзогенных переменных можно рассматривать значения эндогенных переменных за предшествующий период времени (лаговые переменные).

Например, потребление текущего года yt может зависеть также и от уровня потребления в предыдущем году yt-1.

Структурная форма модели позволяет увидеть влияние изменений любой экзогенной переменной на значения эндогенной переменной. Целесообразно в качестве экзогенных переменных выбирать такие переменные, которые могут быть объектом регулирования. Меняя их и управляя ими, можно заранее иметь целевые значения эндогенных переменных.

a

Коэффициенты bi при эндогенных и j – при экзогенных переменных называются структурными коэффициентами модели. Все переменные в модели

могут быть выражены в отклонениях ( x  x ) и ( y  y ) от среднего уровня, и тогда свободный член в каждом уравнении отсутствует.

Использование МНК для оценивания структурных коэффициентов модели дает смещенные и несостоятельные оценки. Поэтому обычно для определения структурных коэффициентов модели структурная форма преобразуется в приведенную.

Приведенная форма модели (ПФМ) представляет собой систему линейных функций эндогенных переменных от экзогенных:

 yˆ1  11×1  …  1m xm,

 уˆ 2   21х1  …   2 m xm,



 yˆ   x …   x

 n n1 1 nm m.

 ij 

коэффициенты приведенной формы модели.

По своему виду приведенная форма модели ничем не отличается от си  ij стемы независимых уравнений. Применяя МНК, можно оценить , а затем оценить значения эндогенных переменных через экзогенные.

Приведенная форма позволяет выразить значения эндогенных переменных через экзогенные, однако аналитически уступает структурной форме модели, т.к. в ней отсутствуют оценки взаимосвязи между эндогенными переменными.

Идентификация модели. При переходе от приведенной формы модели к структурной исследователь сталкивается с проблемой идентификации. Идентификация – это единственность соответствия между приведенной и структурной формами модели.

Структурная модель в полном виде, состоящая в каждом уравнении системы из n эндогенных и m экзогенных переменных, содержит n(n-1+m) параметров. Приведенная модель в полном виде содержит nm параметров. Таким образом, в полном виде структурная модель содержит большее число параметров, чем приведенная форма модели. Поэтому n(n-1+m) параметров структурной модели не могут быть однозначно определены через nm параметров приведенной формы модели.

Чтобы получить единственно возможное решение для структурной модели, необходимо предположить, что некоторые из структурных коэффициентов модели равны нулю. Тем самым уменьшится число структурных коэффициентов.

С позиции идентифицируемости структурные модели можно подразделить на три вида: идентифицируемые; неидентифицируемые; сверхидентифицируемые.

Модель идентифицируема, если все структурные ее коэффициенты определяются однозначно, единственным образом по коэффициентам приведенной формы модели, т.е. число параметров структурной модели равно числу параметров приведенной формы модели.

Модель неидентифицируема, если число приведенных коэффициентов меньше числа структурных коэффициентов, и в результате структурные коэффициенты не могут быть оценены через коэффициенты приведенной формы модели.

Модель сверхидентифицируема, если число приведенных коэффициентов больше числа структурных коэффициентов. В этом случае на основе приведенных коэффициентов можно получить два или более значений одного структурного коэффициента. Сверхидентифицируемая модель, в отличие от неидентифицируемой, практически решаема, но требует для этого специальных методов исчисления параметров.

Структурная модель всегда представляет собой систему совместных уравнений, каждое из которых требуется проверять на идентификацию. Модель считается идентифицируемой, если каждое уравнение системы идентифицируемо. Если хотя бы одно из уравнений системы неидентифицируемо, то и вся модель считается неидентифицируемой. Если же в системе нет неидентифицируемых уравнений и имеется хотя бы одно сверхидентифицируемое, то модель будет сверхидентифицируемой.

Обозначим Н – число эндогенных переменных в i- ом уравнении системы, D – число экзогенных переменных, которые содержатся в системе, но не входят в данное уравнение. Тогда условие идентифицируемости уравнения может быть записано в виде следующего счетного правила:

D+1 = Н – уравнение идентифицируемо;

D+1 < Н – уравнение неидентифицируемо;

D+1 > Н – уравнение сверхидентифицируемо. Это счетное правило отражает необходимое, но не достаточное условие идентификации. Достаточное условие идентификации отдельного уравнения состоит в том, чтобы матрица из коэффициентов при переменных, которые в данном уравнении отсутствуют (то есть коэффициенты берутся из всех остальных уравнений системы), имела ранг не меньший, чем количество эндогенных переменных в системе минус единица.

Следует помнить, что на идентификацию проверяется каждое уравнение модели.

• Если каждое уравнение

Модель модели

идентифицируема идентифицируемо

• Если хотя бы одно

Модель

неидентифицируем уравнение модели

а неидентифицируемо

•Если хотя бы одно

Модель уравнение

сверхидентифици- сверхидентифицируемо

руема

Рис. 19.5. Вывод об идентификации

Вопросы и задания для самоконтроля

1. В чем преимущество систем эконометрических уравнений?

2. Какие переменные называют предопределенными?

3. Что такое структурная форма модели?

4. Что такое приведенная форма модели?

5. Почему нужна приведенная форма модели?

6. Когда структурная модель является идентифицируемой?

7. Когда структурная модель является неидентифицируемой?

8. В каком случае модель является сверхидентифицируемой?

9. Как идентифицируется отдельное уравнение в системе по счетному правилу?

10. В чем состоит достаточное условие идентификации отдельного уравнения?

Задача 1. Дана модель Менгеса:

Yt  1  b11Yt 1  b12 I t  1 ,

I t   2  b21Yt  b22Qt   2 ,

Ct   3  b13Yt  b32Ct 1  b33Pt   3 ,

Qt   4  b41Qt 1  b42 Rt   4 .

где Y — национальный доход; C — расходы на личное потребление; I — чистые инвестиции; Q — валовая прибыль экономики; P — индекс стоимости жизни; R — объем продукции промышленности; t — текущий период; ( t  1) — предыдущий период.

Задание: проверить идентифицируемость каждого уравнения с использованием необходимого и достаточного условий идентификации.

Задача 2. Имеется модель денежного и товарного рынков:

Rt  1  b12Yt  b14M t  1 ,

Yt   2  b21Rt  b23I t  b25Gt   2 ,

I t   3  b31Rt   3 ,

где R — процентные ставки; Y — реальный ВВП; M — денежная масса; I внутренние инвестиции; G — реальные государственные расходы; t — текущий период.

Задание: проверить идентифицируемость каждого уравнения с использованием необходимого и достаточного условий идентифицируемости и записать приведенную форму модели.

Лекция 4(2) Тема 20.Методы оценки систем одновременных уравнений Вопросы для изучения: 1. Косвенный, двухшаговый и трехшаговый МНК.

2. Применение систем уравнений для построения макроэкономических моделей и моделей спроса – предложения.

Аннотация. Данная тема раскрывает методы оценки систем эконометрических уравнений. Ключевые слова. Косвенный метод наименьших квадратов, двухшаговый метод наименьших квадратов, модели спроса-предложения.

Методические рекомендации по изучению темы

 Тема содержит лекционную часть, где даются общие представления по теме.

 В дополнение к лекции есть презентация, которую необходимо изучить, и ответить на вопросы.

 В качестве самостоятельной работы предлагается выполнить практические задания.

 Для проверки усвоения темы имеется тест.

Рекомендуемые информационные ресурсы:

1. http://tulpar.kpfu.ru/mod/resource/view.php?id=11766

2. Эконометрика: [Электронный ресурс] Учеб.пособие / А.И. Новиков. — 2-e изд., испр. и доп. — М.: ИНФРА-М, 2011. — 144 с.: с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none) С. 117-136.

3. Валентинов В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. — 3-е изд. — М.: Дашков и К, 2010. — 436 с.

(http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none) С. 338-356.

4.Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. — М.: НИЦ ИНФРА-М; Мн.: Нов.знание, 2014. — 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none) С. 286-313.

Косвенный, двухшаговый и трехшаговый МНК. Косвенный МНК применяется для оценивания идентифицируемых систем одновременных уравнений.

Исходя из

структурных Определяются

Оцениваются

уравнений, МНК-оценки

структурные

строятся приведенных

коэффициенты

приведенные коэффициентов

уравнения

Рис. 20.1. Этапы косвенного МНК

Основная идея ДМНК

На основе приведенной формы модели получить для

сверхидентифицируемого уравнения теоретические значения эндогенных

переменных, содержащихся в правой части уравнения

Подставить их вместо фактических значений и применить обычный МНК к

структурной форме сверхидентифицируемого уравнения

Рис. 20.2. Основная идея двухшагового метода наименьших квадратов Таким образом, метод наименьших квадратов используется дважды: 1) При определении приведенной формы модели и нахождении на ее основе

yˆi   i1 x1   i 2 x2  …   ij x j оценок эндогенной переменной 2) При определении структурных коэффициентов структурного сверхидентифицируемого уравнения на основе оценок эндогенных переменных. Двухшаговый метод наименьших квадратов является наиболее общим и широко распространенным методом решения системы одновременных уравнений. Для точно идентифицируемых уравнений ДМНК дает тот же результат, что и КМНК.

Трехшаговый МНК разработан для оценки одновременно всех уравнений структурной формы модели с учетом возможной взаимной коррелированности регрессионных остатков различных уравнений системы. Этот метод оказывается более эффективным, чем ДМНК, если случайные остатки различных уравнений системы взаимно коррелированы, т.е. если их взаимная ковариационная матрица отлична от диагональной. Однако и в этой ситуации ДМНК – оценки структурных параметров системы остаются состоятельными.

В трехшаговом МНК сохранены первые два шага ДМНК. Однако полученные в результате этих двух шагов, отдельно для каждого уравнения, оценки структурных параметров не являются окончательными, а пересчитываются на 3 – м шаге следующим образом. Оценки структурных коэффициентов используются для подсчета выборочной ковариационной матрицы случайных остатков. Последняя, в свою очередь, используется для одновременного вычисления оценок всех структурных параметров системы с помощью обобщенного МНК в рамках соответствующим образом построенной обобщенной линейной модели множественной регрессии.

Применение систем уравнений для построения макроэкономических моделей и моделей спроса – предложения

Основные направления использования

систем эконометрических уравнений

Построение Построение

статических динамических Построение

моделей моделей производственных

функционирования функционирования функций

экономики страны экономики страны

Рис. 20. 3. Основные направления использования систем эконометрических уравнений

Наиболее широко системы одновременных уравнений используются при построении макроэкономических моделей экономики страны. В большинстве случаев это мультипликаторные модели кейнсианского типа. Статическая модель Кейнса в самом простом виде следующая:

C  a  by   ,

у  С  I,

где С – личное потребление;

y – национальный доход в постоянных ценах;

I – инвестиции в постоянных ценах.

В силу наличия тождества в модели (второе уравнение системы) b  1. Он характеризует предельную склонность к потреблению. Если b  0,65, из каждой дополнительной тысячи рублей дохода на потребление расходуется в среднем 650 рублей и 350 рублей инвестируется. Если b>1 то y

Структурный коэффициент b используется для расчета мультипликаторов. По данной функции потребления можно определить два мультипликатора – инвестиционный мультипликатор потребления Mc и национального дохода My :

b 0,65

Мс  , М с   1,857

1  b т.е. при b  0,65 ; 1  0,65 .

Это означает, что дополнительные вложения 1 тыс. руб. приведут при прочих равных условиях к дополнительному увеличению потребления на 1,857 тыс. руб.

Мy 

, Мy   2,857

1  b т.е. при b  0,65 1  0,65 ,

т.е. дополнительные вложения 1 тыс. руб. на длительный срок приведут при прочих равных условиях к дополнительному доходу 2,857 тыс. руб.

Эта модель точно идентифицируема, и для получения b применяется КМНК. Строится система приведенных уравнений:

C  A  B  I  U1

 y  A  B  I  U 2,

в которой А  А, а параметры В и B являются мультипликаторами,

В  М у т.е. В  М с и . Для проверки подставим балансовое равенство в первое уравнение структурной модели:

С  а  by    a  bC  I     a  bc  bI   

a b 1

 C (1  b)  a  bI    C   I 

1 b 1 b 1 b

A Мс U1

Аналогично поступим и со вторым уравнением структурной модели:

y  C  I  y  a  by    I  y 1  b   a  I   

a 1 1

y  I 

1 b 1 b 1 b

A  A М у U2

Таким образом, приведенная форма содержит мультипликаторы, интерпретируемые как коэффициенты множественной регрессии, отвечающие на вопрос, на сколько единиц изменится значение эндогенной переменной, если экзогенная изменится на 1 единицу. Это делает модель удобной для прогнозирования.

В более поздних исследованиях статическая модель Кейнса включала уже не только функцию потребления, но и функцию сбережений:

C  a  by  1,

r  T  К С  I    2,

 у  С  I  r,

где r  сбережения.

Здесь три эндогенные переменные – С, r и y и одна экзогенная –I. Систе ма идентифицируема: в первом уравнении Н=2 и D=2, во втором Н=1, D=0; C  I рассматривается как предопределенная переменная.

Наряду со статическими широкое распространение получили динамические модели экономики. Они содержат в правой части лаговые переменные, а также учитывают тенденцию. Например, модель Кейнса экономики США 19501960 гг. в упрощенном варианте:

C t  b1 S t  b2 Pt  b3   1,

 I t  b4 Pt  b5 Pt 1  b6   2,

S t  b7 Rt  b8 Rt 1  b9 t  b10   3,

R  S  P  T

 t t t t,

 Rt  C t  I t  Gt

где Tt  чистые трансферты в пользу администрации;

I t  кап. вложения;

Gt  правительственные расходы;

St  заработная плата в период t ;

Pt  прибыль;

Pt 1  прибыль в период t  1;

Rt  общий доход.

Модель содержит 5 эндогенных переменных – Ct , I t , S t , Rt ( в левой ча сти системы) и Pt (зависимая переменная, определяемая по первому тожде ству), три экзогенные переменные – Tt , Gt , t и две лаговые предопределенные

переменные Pt 1 и Rt 1. Данная модель сверхидентифицируема и решается ДМНК. Для прогнозных целей используется приведенная форма модели:

Ct  d1T  d 2G  d 3t  d 4 Pt 1  d 5 Rt 1  U1,

 I t  d 6T  d 7G  d8t  d 9 Pt 1  d 10Rt 1  U 2,

St  d11T  d12G  d13t  d14 Pt 1  d15 Rt 1  U 3,

R  d T  d G  d t  d P  d R  U

 t 16 17 18 19 t 1 20 t 1 4,

 Pt  d 21T  d 22G  d 23t  d 24 Pt 1  d 25 Rt 1  U 5

Здесь мультипликаторами являются коэффициенты при экзогенных переменных. Они отражают влияние экзогенной переменной на эндогенную переменную.

Система одновременных уравнений нашла применение в исследованиях спроса и предложения. Линейная модель спроса и предложения имеет вид:

Q d  a0  a1 P   1, — объём спроса,



Q  b0  b1 P   2, — объём предложения,

s

 d

Q  Q

s

d s d s

Здесь 3 эндогенные переменные: Q , Q и Р. При этом, если Q иQ представляют собой эндогенные переменные, исходя из структуры самой системы, то P является эндогенной по экономическому содержанию (цена зависит от спроса и предложения), а также в результате наличия тождества

Q d  Q s . Приравняем уравнения, получим:

a0  a1P  1  b0  b1P   2 ,

b0  a0  2  1

P 

a1  b1 a1  b1 .

Модель не содержит экзогенной переменной. Однако, чтобы модель имела статистическое решение и можно было убедиться в ее справедливости, в модель вводятся экзогенные переменные.

Например, модель вида:

Q d  a0  a1P  a2 R  1,



Q  b0  b1P  b2W   2,

s

 d

Q  Q ,

s

где R  доход на душу населения; W  климатические условия (при спросе и предложении зерна).

Переменные R и W экзогенные. Введя их в модель, получаем идентифи цированную структурную модель.

Динамическая модель Клейна:

Ct  b1  St  b2  Pt  b3   1 , I  b  P  b  P  b   ,  t 4 t 5 t 1 6 2

St  b7  Rt  b8  Rt 1  b9  t  b10   3 , R  S  P  T ,  t t t t

 Rt  Ct  I t  Gt .

Сt – функция потребления в период t; St – заработная плата в период t;Pt – прибыль в период t; Pt-1 – прибыль в период t-1; Rt – общий доход в период t; Rt-1 – общий доход в предыдущий период;t – время;Tt – чистые трансферты в пользу администрации в период t; It – капиталовложения в период t;Gt – спрос административного аппарата, правительственные расходы в период t.

Динамическая модель Клейна сверхидентифицируема и решаема ДМНК. Для прогнозных целей используется приведенная форма модели: Ct  d1T  d 2G  d 3t  d 4 Pt 1  d 5 Rt 1  u1 , I  d T  d G  d t  d P  d R  u ,  t 6 7 8 9 t 1 10 t 1 2

St  d11T  d12G  d13t  d14 Pt 1  d15Rt 1  u3 , R  d T  d G  d t  d P  d R  u ,  t 16 17 18 19 t 1 20 t 1 4

 Pt  d 21T  d 22G  d 23t  d 24 Pt 1  d 25Rt 1  u5 ,

В данной модели коэффициенты при экзогенных переменных T и G яв ляются мультипликаторами, отвечающими на вопрос: На сколько единиц изме нится значение эндогенной переменной, если экзогенная переменная изменится на одну единицу своего измерения. Коэффициенты d1, d6, d11, d16, d21 – муль типликаторы чистых трансфертов в пользу администрации относительно личного потребления d1, инвестиций d6, заработной платы d11, дохода d16 и прибыли d21. Соответственно коэффициенты d2, d7, d12, d17, d22 являются мультипликаторами правительственных расходов относительно соответствующих эндогенных переменных.

Динамическая модель Кейнса: Ct  a  b1Yt  b2Yt 1   1 ,  Yt  Ct  Gt  I t  Lt , P  Y  Z .  t t t

Yt – имеющийся в распоряжении доход в период времени t; Сt – частное потребление в период времени t; Pt – валовой национальный продукт в период времени t; Yt-1 – доход предыдущего года; Gt — общественное потребление; It – валовые капиталовложения; Lt – изменение складских запасов; Zt – сальдо платежного баланса.

Первое уравнение динамической модели Кейнса является сверхидентифицируемым, а второе и третье – тождествами, доход является лаговой переменной.

Линейная модель спроса и предложения: Q d  a0  a1 P   1 ,  s Q  b0  b1 P   2 ,  d Q  Q .

s

Qd – спрашиваемое количество благ (объем спроса);

Qs – предлагаемое количество благ (объем предложения).

В этой системе три эндогенные переменные – Qd, Qs и P. При этом если Qd и Qs представляют собой эндогенные переменные исходя из структуры самой системы (они расположены в левой части), то P является эндогенной по экономическому содержанию (цена зависит от предлагаемого и испрашиваемого количества благ), а также в результате наличия тождества Qd=Qs. Линейная модель спроса и предложения не содержит экзогенной переменной. Однако для того, чтобы модель имела статистическое решение и можно было убедиться в ее справедливости, в модель вводятся экзогенные переменные: R и W, после чего модель становится идентифицируемой и может быть оценена КМНК.

Qd  a0  a1 P  a2 R   1 ,  Qs  b0  b1 P  b2W   2 , Q  Q .  d s

R – доход на душу населения;

W – климатические условия (например, спрос и предложение на зерно).

Общий перечень информационных ресурсов

1. http://tulpar.kpfu.ru/mod/resource/view.php?id=382

2. Эконометрика: [Электронный ресурс] Учеб.пособие / А.И. Новиков. — 2-e изд., испр. и доп. — М.: ИНФРА-М, 2011. — 144 с.: (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=1#none)

3. Эконометрика: учебник / И. И. Елисеева. – M.: Проспект, 2010. – 288 с.

4. Уткин, В. Б. Эконометрика [Электронный ресурс] : Учебник / В. Б. Уткин; Под ред. проф. В. Б. Уткина. — 2-е изд. — М.: Издательско-торговая корпорация «Дашков и К°», 2012. — 564 с.

(http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA %D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D 0%BA%D0%B0&page=4#none)

5. Валентинов, В. А. Эконометрика [Электронный ресурс]: Практикум / В. А. Валентинов. — 3-е изд. — М.: Дашков и К, 2010. — 436 с.

(http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%B A%D0%BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8% D0%BA%D0%B0&page=3#none)

6. Эконометрика. Практикум: [Электронный ресурс] Учебное пособие / С.А. Бородич. — М.: НИЦ ИНФРА-М; Мн.: Нов.знание, 2014. — 329 с. (http://znanium.com/catalog.php?item=booksearch&code=%D1%8D%D0%BA%D0 %BE%D0%BD%D0%BE%D0%BC%D0%B5%D1%82%D1%80%D0%B8%D0%B A%D0%B0&page=4#none)

7.Тихомиров Н. П. Эконометрика: учебник. — М.: Экзамен, серия «Учебник Плехановской академии», 2007, -512 с.

8. Эконометрика: учебник / под ред. В. С. Мхитаряна. — М.: Проспект, 2008. -384 с.

9. Электронный курс “Econometrics and Public Policy (Advanced)”, Princeton University, URL: https://blackboard.princeton.edu/webapps /portal/frameset.jsp?tab_group=courses&url=%2Fwebapps%2Fblackboard%2F execute%2FcourseMain%3Fcourse_id%3D_214206_1

10. Электронный курс “Time Series Econometrics”, Princeton University, URL: http://sims.princeton.edu/yftp/Times05/;https://blackboard.princeton.edu/webap ps/portal/frameset.jsp?tab_group=courses&url=%2Fwebapps%2Fblackboard% 2Fexecute%2FcourseMain%3Fcourse_id%3D_52968_1.

Вопросы и задания для зачета

1. Каковы типы моделей и переменных, применяемых в эконометрике?

2. Что понимается под спецификацией модели?

3. Что понимается под верификацией модели?

4. Что такое функция регрессии?

5. Чем регрессионная модель отличается от функции регрессии?

6. Каковы основные причины наличия в регрессионной модели случайного отклонения?

7. Как осуществляется спецификация модели?

8. В чем состоит различие между теоретическим и эмпирическим уравнениями регрессии?

9. В чем суть метода наименьших квадратов?

10. Каковы формулы расчета коэффициентов эмпирического парного линейного уравнения регрессии по МНК? 11. Каковы предпосылки МНК? Каковы последствия их выполнимости или невыполнимости? 12. Действительно ли оценки коэффициентов регрессии будут иметь нормальное распределение, если случайные отклонения распределены нормально? 13. Действительно ли в любой линейной регрессионной модели, построенной по МНК, сумма случайных отклонений равна нулю? 14. В чем заключается суть коэффициента детерминации? 15. В каких пределах изменяется коэффициент детерминации? 16. Действительно ли для парной линейной регрессии коэффициент корреляции превосходит коэффициент детерминации? 17. Как записывается баланс для сумм квадратов отклонений результативного признака? 18. Что происходит, когда общая СКО равна остаточной? В каком случае общая СКО равна факторной? 19. Что такое число степеней свободы? Чему равны числа степеней свободы для различных СКО в парной регрессии? 20. Как используется F-статистика в регрессионном анализе? 21. Как рассчитать критерий Стьюдента для коэффициента регрессии в линейной модели парной регрессии? 22. В чем состоит «грубое» правило анализа статистической значимости коэффициентов регрессии? 23. Какая связь между tb- и F- статистиками в парной линейной регрессии? 24. Какие этапы включает схема определения интервальных оценок коэффициентов регрессии? 25. В чем суть предсказания индивидуальных значений зависимой переменной? 26. В каком месте доверительный интервал прогноза по парной модели является наименьшим?Как записывается эмпирическое уравнение линейной модели множественной регрессии? 27. Что измеряют коэффициенты регрессии линейной модели множественной регрессии? 28. Какие требования предъявляются к факторам длявключения их в модель множественной регрессии? 29. Какой смысл приобретает сумма коэффициентов регрессии в производственных функциях? 30. Как в линейной модели множественной регрессии, записанной в стандартизованном виде, сравнить факторы по силе их воздействия на результат? 31. Как связаны стандартизованные коэффициенты регрессии с натуральными? 32. Как определяется статистическая значимость коэффициентов регрессии в линейной модели множественной регрессии? 33. Как строятся доверительные интервалы для параметров линейной модели множественной регрессии? 34. В чем недостаток использования коэффициента детерминации при оценке общего качества линейной модели множественной регрессии? 35. Как корректируется коэффициент детерминации? 36. Каково назначение частной корреляции при построении модели множественной регрессии? 37. Как определяется индекс множественной корреляции и какой он имеет смысл? 38. Каковы способы отбора факторов для включения в линейную модель множественной регрессии? 39. Как проверить обоснованность исключения части переменных из уравнения регрессии? 40. Как проверить обоснованность включения группы новых переменных в уравнение регрессии? 41. В чем различие терминов «коллинеарность» и «мультиколлинеарность»? 42. Что такое полная и частичная мультиколлинеарность? 43. Каковы причины и последствия мультиколлинеарности? 44. Как можно обнаружить мультиколлинеарность? 45. Каковы основные методы устранения мультиколлинеарности? 46. Какие значения парных коэффициентов корреляции свидетельствуют о наличии тесной связи независимых переменных? 47. Какой смысл имеет частный коэффициент корреляции? 48. В чем суть гомоскедастичности и гетероскедастичности? Каковы последствия гетероскедастичности? 49. Действительно ли, вследствие гетероскедастичности оценки перестают быть эффективными и состоятельными? 50. Какие критерии могут быть использованы для проверки гипотезы о гомоскедастичности регрессионных остатков? 51. В чем заключается тест Спирмена? 52. Какова схема теста Голдфелда-Квандта? 53. Каково предположение теста Парка? 54. В чем суть метода взвешенных наименьшихквадратов? 55. Какие типы преобразований применяются для устранения гетероскедастичности? 56. Что такое автокорреляция случайных отклонений? 57. Каковы основные причины и последствия автокорреляции? 58. Каковы основные методы обнаружения автокорреляции? 59. Что такое автокорреляционная функция? 60. В чем отличие положительной и отрицательной автокорреляции? 61. Какова основная идея метода рядов при обнаружении автокорреляции? 62. Как проводится тест Дарбина-Уотсона? 63. Как можно найти оценки регрессионных коэффициентов в случае линейной модели с коррелированными остатками? 64. В чем состоит авторегрессионная схема 1-го порядка? 65. В чем смысл поправки Прайса-Уинстена?

66. Какие статистические данные называют неоднородными?

67. Когда применяются фиктивные переменные?

68. В чем преимущества фиктивных переменных?

69. Как фиктивные переменные включаются в модель регрессии?

70. В чем суть ANOVA-моделей?

71. В чем суть ANCOVA-моделей?

72. В чем состоит правило применения фиктивных переменных?

73. Какой смысл имеет дифференциальный свободный член?

74. Какой смысл имеет дифференциальный угловой коэффициент?

75. В чем особенность моделей с переменной структурой?

76. Какова идея теста Чоу?

77. Как определяются коэффициенты эластичности по разным видам регрессионных моделей?

78. Какие показатели корреляции используются при нелинейных соотношениях рассматриваемых признаков?

79. В чем смысл средней ошибки аппроксимации и как она определяется?

80. Какие этапы содержит процедура построения тренд-сезонных моделей временных рядов?

81. В чем отличие аддитивной и мультипликативной моделей временных рядов?

82. Чему равна сумма сезонных компонент в аддитивной модели временного ряда?

83. Как осуществляется прогнозирование на основе трендовой и трендсезонной моделей временных рядов?

84. Как определяется модель ARMA?

85. Как интерпретируют параметры моделей авторегрессии?

86. Что означает стационарность временного ряда?

87. Какой стационарный процесс называется «белым шумом»?

88. Какие типы включают модели стационарных временных рядов?

89. Какие типы включают модели нестационарных временных рядов?

90. Как определяется ARIMA-модель?

91. Какие переменные называют предопределенными?

92. В чем отличие системы взаимозависимых уравнений от системы независимых уравнений?

93. В чем особенность системы рекурсивных уравнений?

94. Что такое структурная форма модели?

95. Что такое приведенная форма модели?

96. Почему нужна приведенная форма модели?

97. Что называют идентификацией модели?

98. В чем суть косвенного МНК?

99. Всегда ли можно применить косвенный МНК?

100. В чем суть двухшагового МНК и когда он применяется?

Задача 1. При исследовании корреляционной зависимости между ценой на нефть X и индексом нефтяных компаний Y получены следующие данные: x  16,2; y  4000;  x2  4; cov( x, y)  40.

Задание:

1. По МНК оцените коэффициенты уравнений регрессии Y на X и X на Y.

2. Оцените коэффициент корреляции ryх и коэффициент детерминации R2.

Задача 2. Имеется следующая модель регрессии, характеризующая зависимость y от x:

y  8  7  x  e . Известно, что ryх=-0,5; n=20.

Задание:

1. Постройте доверительный интервал для коэффициента регрессии в этой модели: а) с вероятностью 90%, б) с вероятностью 99%.

2. Проанализируйте полученные результаты и поясните причины их различий.

Задача 3. По совокупности 30 торговых фирм изучается зависимость между ценой на товар, тыс. руб. (X) и прибылью, млн. руб. (Y).

При оценке регрессионной модели были получены следующие промежуточные результаты:

( y i  yˆ x ) 2  39000;  ( yi  y ) 2  120000

Задание:

1. Определите коэффициент детерминации.

2. Постройте таблицу дисперсионного анализа для расчета значения F-критерия Фишера.

3. Сравните фактическое значение F-критерия с табличным. Сделайте выводы.

Задача 4. Зависимость объема продаж, млн. руб. (Y) от расходов на рекламу, тыс. руб. (X) характеризуется по 12 предприятиям концерна следующим образом: y=12,5+0,8*x; σx=5,4; σy=3,4.

Задание:

1. Определите коэффициент корреляции.

2. Постройте таблицу дисперсионного анализа для оценки значимости уравнения в целом.

3. Найдите стандартную ошибку оценки коэффициента регрессии.

4. Оцените значимость коэффициента регрессии через t-критерий Стьюдента.

5. Определите доверительный интервал для коэффициента регрессии с вероятностью 0,95 и сделайте экономический вывод.

Задача 5. Уравнение регрессии, построенное по 15 наблюдениям, имеет вид:

y  10  0,34 x1  7,4 x 2  ? x3

mв 9  2,2 4,5

tв   3,4   4,1

Задание: Восстановите пропущенные значения и постройте доверительный интервал для b3 с вероятностью 0,95.

Задача 6. По 30 заводам, выпускающим продукцию А, изучается зависимость потребления электроэнергии y (тыс. кВт*ч) от производства продукции – x1(тыс. ед.) и уровня механизации труда – x2(%).

Данные приведены в таблице: Признак Среднее значение Среднее квадра- Парный коэффи тическое откло- циент корреляции

нение y 1000 27 ryx1=0,77 x1 420 45 ryx2=0,43 x2 41,5 18 rx1x2=0,38

Задание:

1. Постройте уравнение множественной регрессии в стандартизованной и натуральной форме.

2. Определите показатели частной и множественной корреляции.

3. Найдите частные коэффициенты эластичности и сравните их с βкоэффициентами.

Задача 7. Уравнение регрессии в стандартизованных переменных выглядит так: tˆy  0,82t x1  0,65t x2  0,43t x3 .

При этом вариации всех переменных равны следующим величинам:

V y  32%;Vx1  38%;Vx 2  43%;Vx3  35% .

Задание: Сравнить факторы по степени влияния на результирующий признак и определить значения частных коэффициентов эластичности.

Задача 8. На основе помесячных данных за последние 4 года была построена аддитивная модель временного потребления тепла. Скорректированные значения сезонной компоненты приведены в таблице:

Январь + 30 май — 20 сентябрь — 10

февраль + 25 июнь — 34 октябрь ?

март + 15 июль — 42 ноябрь +22

апрель -2 август — 18 декабрь +27

Уравнение тренда выглядит так:

T  350  1,3  t

Задание: Определите значение сезонной компоненты за октябрь, а также точечный прогноз потребления тепла на 1 квартал следующего года.

Задача 9. На основе поквартальных данных за 16 лет построена мульти пликативная модель некоторого временного ряда. Скорректированные

значения сезонной компоненты равны:

I квартал – 1,4.

II квартал – 0,6.

III квартал – 0,5.

IV квартал — ?

Уравнение тренда имеет вид:

T  10,4  0,2  t

Задание: Определите значение сезонной компоненты за IV квартал и прогноз на II и III кварталы следующего года.

Задача 10. На основе квартальных данных объемов продаж 1999 – 2004

гг. была построена аддитивная модель временного ряда. Трендовая ком понента имеет вид: T  260  3  t

Показатели за 2004 г. приведены в таблице: Квартал Фактический Компонента аддитивной модели

объем продаж трендовая сезонная случайная

1 270 T1 S1 -9

2 Y2 T2 10 +4

3 310 T3 40 E3

4 Y4 T4 S4 E4 ИТОГО: 1200

Задание: Заполните недостающие данные в таблице.

Задача 11. Имеются следующие данные об уровне безработицы yt (%) за 8 месяцев:

Месяц … 1 2 3 4 5 6 7 8

yt 8,8 8,6 8,4 8,1 7,9 7,6 7,4 7,0

Задание:

1. Определите коэффициенты автокорреляции уровней этого ряда пер вого и второго порядка.

2. Обоснуйте выбор уравнивания тренда и определите его параметры.

3. Интерпретируйте полученные результаты.

Задача 12. В таблице указаны остатки регрессии:

Год Остатки Год Остатки Год Остатки

1996 — 0,6 2000 0,0 2004 0,0

1997 0,0 2001 0,2 2005 0,2

1998 — 0,1 2002 — 0,1 2006 0,2

1999 0,8 2003 — 0,1 2007 — 0,1

Задание: Применив критерий Дарбина-Уотсона, сделайте вывод об отсутствии или наличии автокорреляции.

Задача 13. Модель Менгеса имеет следующий вид:

Yt = a1 + b11Yt-1 + b12It + e1,

It = a2 + b21Yt + b22Qt + e2,

Ct = a3 + b31Y + b32Ct-1 + b33Pt + e3,

Qt = a4 + b41Qt-1 + b42Rt + e4. где Y – национальный доход; С – расходы на личное потребление; I – чистые инвестиции; Q – валовая прибыль экономики; P – индекс стоимости жизни; R – объем продукции промышленности; t – текущий период; t – 1 – предыдущий период.

Задание: Применив необходимое и достаточное условие идентификации, определите, идентифицировано ли каждое из уравнений модели. Определите метод оценки параметров модели. Запишите приведенную форму модели.

Задача 14. Одна из версий модели Кейнса имеет вид:

Ct  a1  b11Yt  b12Yt 1  1,

I t  a2  b21Yt  b22Yt 1   2 ,

Yt  Ct  I t  Gt ,

где C — расходы на потребление; Y — доход; I — инвестиции; G — государственные расходы; t — текущий период; t  1 — предыдущий период.

Задание: Применив необходимое и достаточное условие идентификации, определите, идентифицировано ли каждое из уравнений модели. Определите метод оценки параметров модели. Запишите приведенную форму модели.

Задача 15. Имеется следующая структурная модель:

Y1 = b12Y2 + a11X1+ a12X2,

Y2 = b21Y1 + b23Y3 + a22X2,

Y3 = b32Y2 + a31X1 + a33X3.

Приведенная форма исходной модели имеет вид:

Y1 = 2X1 – 4X2 + 10X3,

Y2 = X1 + 3X2 + 2X3,

Y3 = -6X1 + 7X2 + 6X3.

Задание:

1. Проверьте структурную форму модели на идентификацию.

2. Определите структурные коэффициенты первого уравнения модели.