Имитационное моделирование (simulation) является одним из мощнейших методов анализа экономических систем.
В общем случае, под имитацией понимают процесс проведения на ЭВМ экспериментов с математическими моделями сложных систем реального мира.
Цели проведения подобных экспериментов могут быть самыми различными — от выявления свойств и закономерностей исследуемой системы, до решения конкретных практических задач. С развитием средств вычислительной техники и программного обеспечения, спектр применения имитации в сфере экономики существенно расширился. В настоящее время ее используют как для решения задач внутрифирменного управления, так и для моделирования управления на макроэкономическом уровне. Рассмотрим основные преимущества применения имитационного моделирования в процессе решения задач финансового анализа.
Как следует из определения, имитация — это компьютерный эксперимент. Единственное отличие подобного эксперимента от реального состоит в том, что он проводится с моделью системы, а не с самой системой. Однако проведение реальных экспериментов с экономическими системами, по крайней мере, неразумно, требует значительных затрат и вряд ли осуществимо на практике. Таким образом, имитация является единственным способом исследования систем без осуществления реальных экспериментов.
Часто практически невыполним или требует значительных затрат сбор необходимой информации для принятия решений. Например, при оценке риска инвестиционных проектов, как правило, используют прогнозные данные об объемах продаж, затратах, ценах и т.д.
Однако чтобы адекватно оценить риск необходимо иметь достаточное количество информации для формулировки правдоподобных гипотез о вероятностных распределениях ключевых параметров проекта. В подобных случаях отсутствующие фактические данные заменяются величинами, полученными в процессе имитационного эксперимента (т. е. сгенерированными компьютером).
При решении многих задач финансового анализа используются модели, содержащие случайные величины, поведение которых не поддается управлению со стороны лиц, принимающих решения. Такие модели называют стохастическими. Применение имитации позволяет сделать выводы о возможных результатах, основанные на вероятностных распределениях случайных факторов (величин).
В общем случае, проведение имитационного эксперимента можно разбить на следующие этапы:
Ш Установить взаимосвязи между исходными и выходными показателями в виде математического уравнения или неравенства.
Методическая разработка по экономике «Решение задач по темам: ...
... естественная безработица, циклическая безработица и фактическая занятость. Решение: Решение задачи может быть представлено в виде таблицы: Годы ... цен) - Каковы основные причины инфляции? (избыточный спрос, рост издержек производства и ) - Как измеряется интенсивность инфляции? ... = изменение уровня цен 2009/ уровень цен 2008. Определим стоимость (СПК) по годам: СПК08 = 2*30 + 70*4 + 5*20 = 60+ 280 ...
Ш Задать законы распределения вероятностей для ключевых параметров модели.
Ш Провести компьютерную имитацию значений ключевых параметров модели.
Ш Рассчитать основные характеристики распределений исходных и выходных показателей.
Ш Провести анализ полученных результатов и принять решение.
Результаты имитационного эксперимента могут быть дополнены статистическим анализом, а также использоваться для построения прогнозных моделей и сценариев.
1. ОСНОВНЫЕ ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ КОЛИЧЕСТВЕННОГО ФАКТОРА
Цель данного раздела — изучить основные числовые характеристики количественного фактора, получить точечные и интервальные оценки для факторов вес и окружность запястья.
Фактор «Окружность запястья» принимает следующие значения (Таблица 1.1).
Таблица 1.1 — Фактор «Окружность запястья»
Окружность запястья |
|||||||||
15 |
18 |
17 |
16 |
17 |
16 |
17 |
16 |
17 |
|
16 |
17 |
18 |
17 |
17 |
17 |
16 |
16 |
18 |
|
19 |
17 |
18 |
18 |
14 |
20 |
18 |
18 |
||
17 |
16 |
17 |
18 |
19 |
16 |
16 |
19 |
||
18 |
18 |
15 |
20 |
16 |
16 |
16 |
16 |
||
18 |
18 |
17 |
17 |
17 |
17 |
17 |
17 |
||
17 |
17 |
16 |
16 |
16 |
19 |
16 |
17 |
||
16 |
17 |
18 |
18 |
15 |
18 |
17 |
16 |
||
17 |
17 |
15 |
18 |
16 |
19 |
19 |
19 |
||
С помощью инструмента анализа данных «Описательная статистика» вычисляются основные числовые характеристики фактора «Окружность запястья» (Таблица 1.2).
Таблица 1.2 — Основные числовые характеристики фактора «Окружность запястья»
Среднее |
17,06849315 |
|
Стандартная ошибка |
0,142451849 |
|
Медиана |
17 |
|
Мода |
17 |
|
Стандартное отклонение |
1,217109133 |
|
Дисперсия выборки |
1,481354642 |
|
Эксцесс |
-0,066966556 |
|
Асимметричность |
0,198488395 |
|
Интервал |
6 |
|
Минимум |
14 |
|
Максимум |
20 |
|
Сумма |
1246 |
|
Счет |
74 |
|
Продолжение таблицы 1.2 |
||
Наибольший(2) |
20 |
|
Наименьший(2) |
15 |
|
Уровень надежности(95,0%) |
0,283972571 |
|
Математическое ожидание характеризует среднее значение случайной величины. В данной выборке среднее значение окружности запястья равно 17,06849315.
Дисперсия и среднеквадратическое отклонение характеризуют степень рассеивания случайной величины относительно ее математического ожидания. Чем меньше дисперсия, тем меньше степень рассеивания случайной величины. Но глядя лишь на одно значение дисперсии, нельзя сказать, большое рассеивание данных относительно математического ожидания или нет. Ведь при вычислении значения дисперсии большое значение имеет, например, масштабирование данного фактора (можно измерять в тоннах или граммах), значение математического ожидания, минимальное и максимальное значение, которые может принимать фактор.
Мода определяет наиболее вероятное значение случайной величины. По данным выборки наиболее вероятная окружность запястья равна 17.
Медиана делит выборку на две равные по объему части, то есть вероятность того, что окружность запястья меньше, чем 17, равна 0,5.
Эксцесс — это характеристика островершинности кривой функции плотности распределения по сравнению с нормально распределенной случайной величиной с такими же значениями математического ожидания и дисперсии. По значению эксцесса можно судить о разбросе данных относительно математического ожидания. Если эксцесс положительный, то разброс данных меньше, чем у НРСВ; если отрицательный, то больше, чем у НРСВ. У фактора «Окружность запястья» эксцесс отрицательный, поэтому разброс значений больше, чем у НРСВ. Фактор «Вес» принимает значения, отраженные в таблице 1.3. С помощью инструмента анализа данных «Описательная статистика» вычисляются основные числовые характеристики фактора «Вес» (Таблица 1.4).
Таблица 1.3 — Фактор «Вес»
Вес |
||||||||
87 |
70 |
60 |
68 |
73 |
77 |
70 |
67 |
|
87 |
68 |
86 |
75 |
79 |
52 |
61 |
94 |
|
74 |
94 |
76 |
73 |
85 |
72 |
91 |
72 |
|
76 |
77 |
96 |
90 |
74 |
91 |
80 |
60 |
|
68 |
102 |
81 |
83 |
83 |
78 |
69 |
66 |
|
83 |
73 |
72 |
82 |
92 |
78 |
79 |
95 |
|
69 |
79 |
69 |
83 |
79 |
77 |
68 |
89 |
|
83 |
95 |
80 |
81 |
79 |
78 |
75 |
98 |
|
76 |
83 |
65 |
72 |
66 |
74 |
85 |
85 |
|
86 |
101 |
|||||||
Таблица 1.4 — Основные числовые характеристики фактора «Вес»
Среднее |
78,45205479 |
|
Стандартная ошибка |
1,19598534 |
|
Медиана |
78 |
|
Мода |
83 |
|
Стандартное отклонение |
10,21850323 |
|
Дисперсия выборки |
104,4178082 |
|
Эксцесс |
-0,065746418 |
|
Асимметричность |
0,155871109 |
|
Интервал |
50 |
|
Минимум |
52 |
|
Максимум |
102 |
|
Сумма |
5727 |
|
Счет |
74 |
|
Наибольший(2) |
101 |
|
Наименьший(2) |
60 |
|
Уровень надежности(95,0%) |
2,384153202 |
|
Математическое ожидание характеризует среднее значение случайной величины. В данной выборке среднее значение веса равно 78,45205479.
Дисперсия и среднеквадратическое отклонение характеризуют степень рассеивания случайной величины относительно ее математического ожидания. Чем меньше дисперсия, тем меньше степень рассеивания случайной величины. Но глядя лишь на одно значение дисперсии, нельзя сказать, большое рассеивание данных относительно математического ожидания или нет. Ведь при вычислении значения дисперсии большое значение имеет, например, масштабирование данного фактора (можно измерять в тоннах или граммах), значение математического ожидания, минимальное и максимальное значение, которые может принимать фактор.
Мода определяет наиболее вероятное значение случайной величины. По данным выборки наиболее вероятный вес равен 83.
Медиана делит выборку на две равные по объему части, то есть вероятность того, что вес меньше, чем 78, равна 0,5.
Эксцесс — это характеристика островершинности кривой функции плотности распределения по сравнению с нормально распределенной случайной величиной с такими же значениями математического ожидания и дисперсии. По значению эксцесса можно судить о разбросе данных относительно математического ожидания. Если эксцесс положительный, то разброс данных меньше, чем у НРСВ; если отрицательный, то больше, чем у НРСВ. У фактора «Все» эксцесс отрицательный, поэтому разброс значений больше, чем у НРСВ.
Таким образом, были получены основные числовые характеристики для каждого из двух факторов. Они выражают наиболее существенные особенности закона распределения, которые были приведены выше.
2. ЧАСТОТА
Цель данного раздела — вычислить и проанализировать значения эмпирических (выборочных) и кумулятивных (интегральных) частот для факторов вес и окружность запястья.
Фактор «Вес» принимает значения, указанные в таблице 2.1.
Таблица 2.1 — Фактор «Вес»
Вес |
||||||||
87 |
70 |
60 |
68 |
73 |
77 |
70 |
67 |
|
87 |
68 |
86 |
75 |
79 |
52 |
61 |
94 |
|
74 |
94 |
76 |
73 |
85 |
72 |
91 |
72 |
|
76 |
77 |
96 |
90 |
74 |
91 |
80 |
60 |
|
68 |
102 |
81 |
83 |
83 |
78 |
69 |
66 |
|
83 |
73 |
72 |
82 |
92 |
78 |
79 |
95 |
|
69 |
79 |
69 |
83 |
79 |
77 |
68 |
89 |
|
83 |
95 |
80 |
81 |
79 |
78 |
75 |
98 |
|
76 |
83 |
65 |
72 |
66 |
74 |
85 |
85 |
|
86 |
101 |
|||||||
Определяются эмпирическая и кумулятивная частоты (Таблица 2.2).
Эмпирическая частота — это число попаданий фактора в заданный интервал, а кумулятивная (интегральная) частота — это накопленная эмпирическая частота, деленная на общее число наблюдений.
Таблица 2.2 — Эмпирическая и кумулятивная частоты
№ |
Карманы |
Частота |
Интегральный, % |
|
1 |
52 |
1 |
1,35% |
|
2 |
62 |
3 |
5,41% |
|
3 |
72 |
17 |
28,38% |
|
4 |
82 |
27 |
64,86% |
|
5 |
92 |
18 |
89,19% |
|
6 |
102 |
8 |
100,00% |
|
Всего |
74 |
|||
Для данной выборки строится гистограмма частот и полигон кумулятивных частот (Рисунок 2.1).
Рисунок 2.1 — Гистограмма частот и полигон кумулятивных частот
Фактор «Окружность запястья» принимает значения, указанные в таблице 2.3.
Таблица 2.3 — Фактор «Окружность запястья»
Окружность запястья |
|||||||||
15 |
18 |
17 |
16 |
17 |
16 |
17 |
16 |
17 |
|
16 |
17 |
18 |
17 |
17 |
17 |
16 |
16 |
18 |
|
19 |
17 |
18 |
18 |
14 |
20 |
18 |
18 |
||
17 |
16 |
17 |
18 |
19 |
16 |
16 |
19 |
||
18 |
18 |
15 |
20 |
16 |
16 |
16 |
16 |
||
18 |
18 |
17 |
17 |
17 |
17 |
17 |
17 |
||
17 |
17 |
16 |
16 |
16 |
19 |
16 |
17 |
||
16 |
17 |
18 |
18 |
15 |
18 |
17 |
16 |
||
17 |
17 |
15 |
18 |
16 |
19 |
19 |
19 |
||
Определяются эмпирическая и кумулятивная частоты (Таблица 2.4).
Таблица 2.4 — Эмпирическая и кумулятивная частоты
№ |
Карманы |
Частота |
Интегральный, % |
|
1 |
14 |
1 |
1,35% |
|
2 |
14,75 |
0 |
1,35% |
|
3 |
15,5 |
4 |
6,76% |
|
4 |
16,25 |
20 |
33,78% |
|
5 |
17 |
24 |
66,22% |
|
6 |
17,75 |
0 |
66,22% |
|
7 |
18,5 |
16 |
87,84% |
|
8 |
19,25 |
7 |
97,30% |
|
9 |
20 |
2 |
100,00% |
|
Всего |
74 |
|||
Для данной выборки строится гистограмма частот и полигон кумулятивных частот (Рисунок 2.2).
Рисунок 2.2 — Гистограмма частот и полигон кумулятивных частот
Таким образом, на основе двух выборок было получено их статистическое распределение, то есть перечень вариант и соответствующих им частот или относительных частот (Таблицы 2.2 и 2.4).
Эмпирической функцией распределения называется функция , определяющая для каждого значения относительную кумулятивную частоту события , где частоты попадания в интервалы, лежащие левее , а — объем выборки. Например, для фактора «Вес» (Таблица 2.2) 64,82 % людей имеют вес менее 82 килограмм, и также видно, что большинство людей имею вес в интервале от 72 до 82 килограмм.
3. ПРОСТАЯ ГИПОТЕЗА
Цель данного раздела — исследовать статистическую гипотезу о равенстве математического ожидания конкретному числу.
Статистической называют гипотезу о виде неизвестного распределения или о параметрах неизвестного распределения. Нулевой (основной) называют выдвинутую гипотезу , конкурирующей (альтернативной) называют гипотезу , которая противоречит основной.
В зависимости от вида альтернативной гипотезы мы можем говорить о двусторонней, левосторонней или правосторонней альтернативных гипотезах.
Основная гипотеза: М(х) = 2000, двустороння альтернативная гипотеза: М(х) < > 2000, левосторонняя альтернативная гипотеза: М(х) < 2000, правосторонняя альтернативная гипотеза: М(х) > 2000.
Фактор «Год окончания школы» принимает значения, указанные в таблице 3.1.
Таблица 3.1 — Год окончания школы
Год окончания школы |
||||||||
2000 |
1999 |
2000 |
1999 |
1999 |
1999 |
1999 |
1999 |
|
1999 |
1999 |
1999 |
1999 |
2000 |
2000 |
2000 |
2000 |
|
2000 |
2000 |
1999 |
1999 |
1999 |
1999 |
2000 |
2000 |
|
1999 |
2000 |
2000 |
2000 |
1999 |
1999 |
1999 |
1999 |
|
1999 |
1999 |
2000 |
2000 |
1999 |
1999 |
2000 |
1999 |
|
1999 |
1999 |
2000 |
1999 |
2000 |
1999 |
2000 |
2000 |
|
2000 |
1999 |
1999 |
1999 |
1999 |
2000 |
2000 |
2000 |
|
1999 |
1999 |
2000 |
1999 |
1999 |
1999 |
1999 |
2000 |
|
1999 |
1999 |
2000 |
2000 |
1999 |
1999 |
2000 |
2000 |
|
1999 |
2000 |
|||||||
Для проверки гипотезы о том, что значение математического ожидания равняется конкретному значению (: M(X) = 2000) для НРСВ, вычисляется t-статистика.
Прямой метод проверки гипотезы зависит от вида альтернативной гипотезы. В нашем случае возможны три вида альтернативных гипотез:
1. Двусторонняя гипотеза H1: M(X) ? b. Вычисляется значение критической точки t. Если t наблюдаемое по модулю больше критической точки t, то гипотезу отвергают.
2. Правосторонняя гипотеза H1: M(X) > b. Вычисляется значение критической точки t. Если t наблюдаемое больше критической точки t, то гипотезу отвергают.
3. Левосторонняя гипотеза H1: M(X) < b. Вычисляется значение критической точки t. Если t наблюдаемое меньше критической точки t, то гипотезу отвергают. При проверке гипотезы обратным методом вид альтернативной гипотезы не влияет на выводы об отвержении гипотезы. На основе наблюдаемого значения t и объема выборки находится значение вычисленного уровня значимости б. Если вычисленный уровень значимости меньше теоретического уровня значимости, то гипотезу отвергают.
Результаты исследования гипотезы приведены в таблице 3.2.
Таблица 3.2 — Проверка гипотезы
Проверка гипотезы |
||
Уровень значимости |
0,05 |
|
М(х) |
2000 |
|
tнабл. |
-10,06270662 |
|
Альтернативная гипотеза <> |
||
tкр. |
1,992997126 |
|
выч. уровень значимости |
1,95135E-15 |
|
Выводы |
Отвергаем |
|
Выводы (обр.) |
Отвергаем |
|
Альтернативная гипотеза > |
||
tкр. |
1,665996224 |
|
Выводы |
Нет основания отвергнуть |
|
Альтернативная гипотеза < |
||
tкр. |
1,665996224 |
|
Выводы |
Отвергаем |
|
4. СЛОЖНАЯ ГИПОТЕЗА
Цель данного раздела — проверить гипотезу о том, что фактор «Рост» распределен по нормальному закону распределения.
На практике не всегда известны две гипотезы: основная и конкурирующая. Часто под конкурирующей гипотезой подразумевается то, что просто не выполнена основная гипотеза. Тогда задача ставится так: согласуются ли результаты наблюдений с выдвинутым утверждением.
С помощью оценок параметров функции распределения, а, следовательно, и оценки функции распределения, можно проверить гипотезы о том, насколько хорошо выборочные данные согласуются с теоретическими выводами о виде функции распределения.
Проверка гипотезы о том, что фактор «Рост» распределен по нормальному закону распределения, приведена на рисунке 4.1.
Рисунок 4.1 — Проверка гипотезы
5. ДИСПЕРСИОННЫЙ АНАЛИЗ
Цель данного раздела — изучить влияние качественного фактора на количественный фактор; исследовать две выборки на однородность.
Однофакторный дисперсионный анализ используется для проверки гипотезы о сходстве средних значений двух или более выборок, принадлежащих одной и той же генеральной совокупности. Данную процедуру можно применять для исследования влияния качественного фактора на количественный. Количественный фактор — размер ноги, качественный фактор — направление. Исследуется гипотеза о том, что влияние качественного фактора «Направление» на количественный фактор «Размер ноги» несущественно.
Фактор «Размер ноги» группируется по фактору «Направление» (Таблица 5.1).
Таблица 5.1 — Группировка по качественному фактору
Направление |
Размер ноги |
|
Ж. Д. |
37, 38, 38, 38, 39, 39, 39, 39, 40, 40, 40, 40, 40, 40, 40, 41, 41, 41, 41, 41, 41, 41, 41, 41, 41, 41, 42, 42, 42, 42, 42, 42, 42, 43, 43, 43, 44, 44, 44, 44, 44, 44, 45, 45, 45, 45, 46, 47 |
|
Ком. |
40, 40, 41, 43, 45 |
|
Нет |
37, 38, 38, 39, 39, 40, 40, 40, 40, 41, 41, 41, 41, 41, 42, 42, 43, 44, 44, 45, 45 |
|
В результате использования процедуры «Однофакторный дисперсионный анализ» можно сделать вывод о том, что направление не влияет на размер ноги, так как вычисленное значение статистики Фишера по модулю меньше критического значения статистики Фишера (Рисунок 5.1).
Двухвыборочный t-тест с различными дисперсиями реализует критерий проверки гипотезы о равенстве (неравенстве) математических ожиданий распределений двух независимых генеральных совокупностей, имеющих нормальные распределения с неизвестными и различными дисперсиями. Данную процедуру можно использовать для анализа двух выборок на однородность. Исследуется гипотеза о том, что выборки однородны.
Рисунок 5.1 — Однофакторный дисперсионный анализ
Разделим фактор «Год окончания школы» на две одинаковые выборки (Таблица 5.2).
Таблица 5.2 — Год окончания школы
Год окончания школы_1 |
Год окончания школы_2 |
|||||||
2000 |
1999 |
2000 |
1999 |
1999 |
1999 |
1999 |
1999 |
|
1999 |
1999 |
1999 |
1999 |
2000 |
2000 |
2000 |
2000 |
|
2000 |
2000 |
1999 |
1999 |
1999 |
1999 |
2000 |
2000 |
|
1999 |
2000 |
2000 |
2000 |
1999 |
1999 |
1999 |
1999 |
|
1999 |
1999 |
2000 |
2000 |
1999 |
1999 |
2000 |
1999 |
|
1999 |
1999 |
2000 |
1999 |
2000 |
1999 |
2000 |
2000 |
|
2000 |
1999 |
1999 |
1999 |
1999 |
2000 |
2000 |
2000 |
|
1999 |
1999 |
2000 |
1999 |
1999 |
1999 |
1999 |
2000 |
|
1999 |
1999 |
2000 |
2000 |
1999 |
1999 |
2000 |
2000 |
|
В результате использования процедур «Двухвыборочный t-тест с различными дисперсиями» и «Двухвыборочный t-тест с одинаковыми дисперсиями» можно сделать вывод о том, что данные выборки однородны, и их можно объединить в одну для получения статистически значимых результатов.
6. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
Цель данного раздела — произвести количественную оценку влияния одного количественного фактора на другой количественный фактор.
Для анализа используется процедура «Корреляция». После вызова данной процедуры получается матрицу корреляций (Таблица 6.1), которая является симметричной матрицей, поэтому отображаются значения ниже главной диагонали.
Таблица 6.1 — Матрица корреляций
Год окончания школы. |
Математика. |
Физика |
Литература |
Рост |
Окружность запястья |
Размер ноги |
Вес |
||
Год окончания школы |
1 |
||||||||
Математика |
-0,13808 |
1 |
|||||||
Физика |
0,026328 |
-0,084459 |
1 |
||||||
Литература |
-0,11529 |
0,501661 |
-0,289467 |
1 |
|||||
Рост |
0,047558 |
0,2481742 |
-0,050003 |
0,072068858 |
1 |
||||
Окружность запястья |
0,066283 |
0,1532910 |
-0,14246 |
-0,022892 |
0,726489 |
1 |
|||
Размер ноги |
0,08249 |
0,2762417 |
-0,03995 |
0,108558 |
0,929858 |
0,650806 |
1 |
||
Вес |
0,08222 |
0,2732739 |
-0,06909 |
0,121046 |
0,965425 |
0,713697 |
0,8920 |
1 |
|
Для проверки гипотезы о незначимости коэффициента корреляции с уровнем значимости a = 0,05, необходимо найти минимальный объем выборки n по всем количественным факторам. Находится значение tк р с помощью функции СТЬЮДРАСПОБР(a, n-2 ) (Таблица 6.2).
Таблица 6.2 — Вычисление tк р
уровень значимости |
0,05 |
|
минимальный объем выборки |
74 |
|
t кр |
1,993463567 |
|
Найдем абсолютные значения критериальной статистики для каждого значения коэффициента корреляции, кроме значений, равных единице. Получаем матрицу значений tнабл (Таблица 6.3).
Таблица 6.3 — Матрицу значений tнабл
Год окончания школы. |
Математика. |
Физика |
Литература |
Рост |
Окружность запястья |
Размер ноги |
||
Год окончания школы. |
||||||||
Математика. |
1,183057315 |
|||||||
Физика |
0,223482503 |
0,719231599 |
||||||
Литература |
0,984902964 |
4,920726295 |
2,56607432 |
|||||
Рост |
0,40400025 |
2,173836159 |
0,424821324 |
0,61311886 |
||||
Окружность запястья |
0,563669722 |
1,316274743 |
1,221279856 |
0,194300412 |
8,970714748 |
|||
Размер ноги |
0,702418679 |
2,438890903 |
0,339309467 |
0,92662419 |
21,44534693 |
7,27338357 |
||
Вес |
0,700108842 |
2,410561173 |
0,587659529 |
1,034725035 |
31,42547179 |
8,64570476 |
16,74824 |
|
Сравнивая значения t набл и t кр можно сделать вывод о значимости коэффициента корреляции с помощью прямого метода проверки гипотез. Если tнабл > tкр , то гипотезу о незначимости коэффициента корреляции отвергают.
Для проверки гипотезы с помощью обратного метода вычисляется значения вычисленных уровней значимости с помощью функции СТЬЮДРАСП(tнабл; n — 2; 2) Если вычисленный уровень значимости меньше 0.05, то гипотезу о незначимости коэффициента корреляции отвергают. Получается матрица вычисленных уровней значимости (Таблица 6.4).
Таблица 6.4 — Матрица вычисленных уровней значимости
Год окончания школы. |
Математика. |
Физика |
Литература |
Рост |
Окружность запястья |
Размер ноги |
Вес |
||
Год окончания школы. |
|||||||||
Математика. |
0,240678184 |
||||||||
Физика |
0,823792873 |
0,474326221 |
|||||||
Литература |
0,327969929 |
5,28218E-06 |
0,01236661 |
||||||
Рост |
0,687410029 |
0,033006333 |
0,672233804 |
0,541729725 |
|||||
Окружность запястья |
0,574730391 |
0,192256926 |
0,225964088 |
0,846487842 |
2,368E-13 |
||||
Размер ноги |
0,484682863 |
0,017199068 |
0,735364324 |
0,357217405 |
5,45054E-33 |
3,45234E-10 |
|||
Вес |
0,48611542 |
0,018482789 |
0,558599455 |
0,304260271 |
8,83214E-44 |
9,55247E-13 |
1,53E-26 |
||
7. РЕГРЕССИОННЫЙ АНАЛИЗ
Цель данного раздела — исследовать влияние количественных факторов на выходной количественный фактор и подобрать график для набора наблюдений.
Линейный регрессионный анализ заключается в подборе графика для набора наблюдений с помощью метода наименьших квадратов. Регрессия используется для анализа воздействия на отдельную зависимую переменную значений одной или более независимых переменных.
После вызова процедуры «Регрессия» получаются следующие результаты (Рисунок 7.1).
Рисунок 7.1 — Результаты
Проанализировать регрессионную модель можно с помощью встроенной блочной функции ЛИНЕЙН(Y, X, p1, p2), где параметр p1 = 1, если в модели учитывается свободный член и равен нулю, если не учитывается; параметр p2 = 1, если необходимо вычислить дополнительную статистику регрессии, и ноль, если нужно вычислить лишь коэффициенты регрессии (Таблица 7.1).
Таблица 7.1 — Результаты работы функции «Линейн»
К-т регрессии |
4,027362462 |
-88,40470315 |
Св. член |
|
Ошибка для b |
0,240464854 |
9,984125401 |
Ошибка для a |
|
К-т детерминации |
0,795746684 |
4,640276263 |
Станд. Остаток |
|
Ст-ка Фишера |
280,5034564 |
72 |
Число степеней свободы |
|
Сумма квадратов отклонения регрессии |
6039,846369 |
1550,315793 |
Сумма квадратов отклонения остаточная |
|
Зная значение статистики Фишера, можно обратным методом проверки гипотез сделать вывод о значимости регрессии (гипотеза — регрессия незначима).
Для этого надо найти вычисленный уровень значимости. Вычисленный уровень значимости равен 1,53452E-26, это меньше 0.05, поэтому гипотеза о незначимости регрессии отвергается.
Выводы об отвержении гипотезы можно сделать прямым методом, найдя значение Fкр. В данном случае Fкр = 3.97, это меньше значения статистики Фишера, поэтому гипотеза о незначимости регрессии также отвергается. Многофакторный регрессионный анализ проводится аналогично, только исследуется влияние нескольких количественных факторов на выходной количественный фактор (Рисунок 7.2).
Рисунок 7.2 — Результаты многофакторного анализа
После анализа модели необходимо выбросить все незначимые факторы (у которых Р-значение больше 0.05) и построить модель вновь. Получаются следующие результаты (Рисунок 7.3).
Рисунок 7.3 — Результаты многофакторного анализа без незначимых факторов
Модель без незначимых факторов лучше модели с теми же факторами, так в первом случае стандартизированный коэффициент детерминации больше, чем во втором.
8. КРИВОЛИНЕЙНЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ
Цель данного раздела — исследовать, какая модель лучше описывает выборочные данные.
Для анализа строятся следующие модели: линейная (Таблица 8.1), показательная (Таблица 8.2), кубическая (Таблица 8.3), равносторонняя гипербола (Таблица 8.4) и степенная (Таблица 8.5).
Таблица 8.1 — Линейная модель
y = a + b*x |
||||
b — к-т регрессии |
0,0846 |
10,42 |
a — св. член |
|
ст. откл. b |
0,0098 |
0,7752 |
ст. откл а |
|
к-т детерм. |
0,5094 |
0,8525 |
ст. остаток |
|
F |
74,748 |
72 |
df |
|
SS регр. |
54,33 |
52,332 |
SS ост. |
|
Обратный |
P |
1E-12 |
Отвергаем |
|
Прямой |
F |
3,9739 |
Отвергаем |
|
Таблица 8.2 — Показательная модель
y = a*b^X |
||||
b — к-т регрессии |
1,004918 |
11,57961 |
a — св. член |
|
ст. откл. b |
0,000578 |
0,045803 |
ст. откл а |
|
к-т детерм. |
0,500001 |
0,050373 |
ст. остаток |
|
F |
72,00036 |
72 |
df |
|
SS регр. |
0,182699 |
0,182698 |
SS ост. |
|
Обратный |
P |
1,9E-12 |
Отвергаем |
|
Прямой |
F |
3,973897 |
Отвергаем |
|
Таблица 8.3 — Кубическая модель
y = a + b*x^3 |
||||
b — к-т регрессии |
4E-06 |
14,791 |
a — св. член |
|
ст. откл. b |
5E-07 |
0,2687 |
ст. откл а |
|
к-т детерм. |
0,5337 |
0,8311 |
ст. остаток |
|
F |
82,415 |
72 |
Df |
|
SS регр. |
56,928 |
49,734 |
SS ост. |
|
Обратный |
P |
1E-13 |
Отвергаем |
|
Прямой |
F |
3,9739 |
Отвергаем |
|
Таблица 8.4 — Равносторонняя гипербола
y = a + b*1/x |
||||
b — к-т регрессии |
-465,67 |
23,096 |
a — св. член |
|
ст. откл. b |
60,753 |
0,7935 |
ст. откл а |
|
к-т детерм. |
0,4493 |
0,9032 |
ст. остаток |
|
F |
58,751 |
72 |
df |
|
SS регр. |
47,927 |
58,735 |
SS ост. |
|
Обратный |
P |
6E-11 |
Отвергаем |
|
Прямой |
F |
3,9739 |
Отвергаем |
|
Таблица 8.5 — Степенная модель
y = a*x^b |
||||
b — к-т регрессии |
0,371941 |
0,527542 |
a — св. член |
|
ст. откл. b |
0,045868 |
0,086803 |
ст. откл а |
|
к-т детерм. |
0,477327 |
0,022367 |
ст. остаток |
|
F |
65,75352 |
72 |
df |
|
SS регр. |
0,032896 |
0,036022 |
SS ост. |
|
Обратный |
P |
9,6E-12 |
Отвергаем |
|
Прямой |
F |
3,973897 |
Отвергаем |
|
По данным построенным моделям можно сделать вывод о том, что регрессия значима для каждой из моделей, и лучшей моделью является кубическая, так как она имеет самый высокий коэффициент детерминации.
Далее необходимо построить график, на котором отобразить выборочные данные и прогнозные значения (Рисунок 8.1).
Рисунок 8.1 — График выборочных и прогнозных данных
У равносторонней гиперболы оценивается ошибка аппроксимации (таблица 8.6).
Таблица 8.6 — Ошибка аппроксимации
Окружность запястья |
Вес |
Равносторонняя гипербола |
Ошибка аппроксимации равносторонней гиперболы |
|
14 |
61 |
15,46252435 |
0,104466025 |
|
15 |
66 |
16,04084688 |
0,069389792 |
|
15 |
68 |
16,24836261 |
0,083224174 |
|
15 |
68 |
16,24836261 |
0,083224174 |
|
15 |
76 |
16,96920673 |
0,131280449 |
|
19 |
101 |
18,4858342 |
0,027061358 |
|
20 |
94 |
18,14249556 |
0,092875222 |
|
20 |
102 |
18,53103565 |
0,073448217 |
|
Всего |
3,327688413 |
|||
Ошибка аппроксимации |
4,50% |
|||
Ошибка аппроксимации меньше 10%, поэтому данная модель удовлетворительного качества.
Также необходимо оценить качество линейной и кубической модели по частным коэффициентам эластичности (Таблица 8.7).
Чем больше значение коэффициента эластичности, тем больше влияние X на Y.
Таблица 8.7 — Коэффициент эластичности
к-т эластичности |
Линейная |
Кубическая |
|
0,38946222 |
0,254005393 |
||
9. МАТРИЦА СОПРЯЖЕННОСТИ
Цель данного раздела — исследовать влияние качественного фактора «Математика» на качественный фактор «Физика».
Создадим таблицу сопряженности с двумя входами с использованием функции «СЧЕТЕСЛИ» или сводной таблицы (Таблица 9.1).
Таблица 9.1 — Матрица сопряженности
Математика |
Физика |
Всего |
|||
3 |
4 |
5 |
|||
2 |
3 |
0 |
0 |
3 |
|
3 |
5 |
0 |
0 |
5 |
|
4 |
0 |
20 |
32 |
52 |
|
5 |
14 |
0 |
0 |
14 |
|
Всего |
22 |
20 |
32 |
74 |
|
Для проверки гипотезы о независимости случайных величин X и Y вычисляется критериальная статистика. Для вычисления t -статистики сначала получаем таблицу слагаемых (Таблица 9.2).
Таблица 9.2 — Таблица для расчета критериальной статистики
Математика |
Физика |
|||
3 |
4 |
5 |
||
2 |
0,136364 |
0 |
0 |
|
3 |
0,227273 |
0 |
0 |
|
4 |
0 |
0,384615 |
0,615385 |
|
5 |
0,636364 |
0 |
0 |
|
Затем вычисляем t -статистику. Эта статистика приближенно имеет распределение ?2 со степенью свободы, равной (r -1)(s -1), и равна 74. В рассматриваемом примере r = 4 (количество строк), s = 3 (количество столбцов).
Для проверки гипотезы о незначимости влияния одного качественного фактора на другой найдем критическое значение с использованием статистической функции ?ХИ2ОБР? с уровнем значимости 0,05 и со степенью свободы ( r -1)(s -1).
В данном случае получается значение 12,59. Делаем выводы прямым методом проверки гипотез о влиянии одного качественного фактора на другой.
10. АНАЛИЗ ТРЕНДА ВРЕМЕННОГО РЯДА
Цель данного раздела — проанализировать тренд временного ряда (Таблица 10.1).
Таблица 10.1 — Тренд временного ряда
t |
y |
скользящее среднее |
стандартная погрешность |
экспоненциальное сглаживание |
Ст. погрешность |
|
1 |
160,4311755 |
#Н/Д |
#Н/Д |
#Н/Д |
#Н/Д |
|
2 |
158,4629085 |
158,4089754 |
#Н/Д |
158,4629085 |
#Н/Д |
|
3 |
158,3550424 |
159,3945789 |
0,736051956 |
158,3766156 |
#Н/Д |
|
4 |
160,4341155 |
159,8968224 |
0,827441858 |
160,0226155 |
#Н/Д |
|
5 |
159,3595293 |
158,9374442 |
0,483135444 |
159,4921465 |
1,249616476 |
|
6 |
158,515359 |
159,387112 |
0,684875554 |
158,7107165 |
1,369562304 |
|
7 |
160,2588649 |
160,100174 |
0,626552473 |
159,9492353 |
1,124064139 |
|
8 |
159,9414831 |
160,5954769 |
0,475862717 |
159,9430335 |
1,056872326 |
|
9 |
161,2494706 |
160,7836377 |
0,567762357 |
160,9881832 |
1,169558528 |
|
10 |
160,3178047 |
160,3692548 |
0,331396632 |
160,4518804 |
0,847790328 |
|
11 |
160,420705 |
160,6709536 |
0,180653644 |
160,4269401 |
0,847969562 |
|
12 |
160,9212022 |
159,9168369 |
0,731906374 |
160,8223497 |
0,48120483 |
|
13 |
158,9124717 |
159,4212669 |
0,796122504 |
159,2944473 |
1,139137257 |
|
14 |
159,9300621 |
159,4085147 |
0,515210793 |
159,8029392 |
1,19665302 |
|
15 |
158,8869672 |
158,8549939 |
0,369482102 |
159,0701616 |
1,276798725 |
|
16 |
158,8230206 |
160,0217324 |
0,847918668 |
158,8724488 |
0,659315171 |
|
17 |
161,2204441 |
161,6829119 |
0,908511511 |
160,7508451 |
1,46209498 |
|
18 |
162,1453798 |
160,6794551 |
1,086924953 |
161,8664728 |
1,583128506 |
|
19 |
159,2135304 |
159,3303658 |
1,039852328 |
159,7441189 |
2,19817444 |
|
20 |
159,4472012 |
159,4505373 |
0,082648773 |
159,5065847 |
1,738868485 |
|
21 |
159,4538734 |
159,7333816 |
0,197656211 |
159,4644157 |
1,541540599 |
|
22 |
160,0128898 |
158,9866103 |
0,752121815 |
159,903195 |
0,361368905 |
|
23 |
157,9603308 |
158,2692839 |
0,757859363 |
158,3489036 |
1,165950769 |
|
24 |
158,578237 |
159,1680141 |
0,470791426 |
158,5323703 |
1,173049996 |
|
25 |
159,7577913 |
159,8888217 |
0,427203745 |
159,5127071 |
1,332788023 |
|
26 |
160,019852 |
160,2991175 |
0,21812628 |
159,918423 |
0,777055642 |
|
27 |
160,5783829 |
160,5568978 |
0,198054045 |
160,4463909 |
0,85525819 |
|
28 |
160,5354127 |
160,7929805 |
0,182760447 |
160,5176084 |
0,483276274 |
|
29 |
161,0505482 |
161,0505482 |
0,182127912 |
160,9439603 |
0,492441828 |
|
Построим графики прогнозных и фактических значений для скользящего среднего и экспоненциального сглаживания (Рисунок 10.1 и 10.2).
Рисунок 10.1 — Скользящее среднее
Рисунок 10.2 — Экспоненциальное сглаживание
ЗАКЛЮЧЕНИЕ
В результате выполнения данной работы были изучены и отработаны навыки математического моделирования стохастических процессов с помощью методов аналитической статистики, таких как:
— Дисперсионный анализ, который применялся для исследования влияния одной или нескольких качественных переменных (факторов) на одну зависимую количественную переменную (отклик);
— Анализ временных рядов был применим к одиночным или связанным временным рядам и позволяет выделять различные формы периодичности и взаимовлияния временных процессов, а также осуществлять прогнозирование будущего поведения временного ряда.
— Регрессионные процедуры позволили рассчитать модель, описываемую некоторым уравнением и отражающую функциональную зависимость между экспериментальными количественными переменными, а также проверяют гипотезу об адекватности модели экспериментальным данным. По полученным результатам можно оценить природу и степень зависимости переменных и предсказать новые значения зависимой переменной.
— Корреляционный анализ — это группа статистических методов, направленная на выявление и математическое представление структурных зависимостей между выборками.
СПИСОК ЛИТЕРАТУРЫ
1. Усова Э.А., Котюков В.И. Моделирование систем. Учеб. пособие. — Новосибирск: Изд-во СГУПСа, 2008. — 124 с. (51 У76)
2. Моделирование систем. Метод. указ. к лабораторным работам / Сост. В.И. Котюков, Э.А. Усова. — Новосибирск: Изд-во СГУПСа, 2007. — 38 с.
3. Гмурман В.Е. Теория вероятностей и математическая статистика. М.: Высш. школа, 2012.
4. Математическая статистика/ Под ред. А.М. Длина. М.: Высш. школа
5. Айвазян С.А., Мешалкин Л.Д. Прикладная статистика: Исследование зависимостей. М.: Финансы и статистика, 1985.
6. Экономико-математические модели и методы: Учеб. пособие для студ. экон. спец. БГУИР всех форм обуч. / С.А. Поттосина, В.А. Журавлев. Мн.: БГУИР, 2003. — 94 с.: ил.
7. Котюков В.И. Численные методы многофакторного статистического анализа данных на ЭВМ (в задачах транспорта и строительства).
Учеб. пособие. Новосибирск, 2012.
8. Кнут Д. Искусство программирования для ЭВМ. Получисленные алгоритмы. т. 2. М.: Мир, 1977, С. 22-51 , С. 356-370, С. 476-478.
9. Практикум по эконометрике: Учеб. Пособие / И.И. Елисеева, С.В. Курышева, Н.М. Гордиенко и др.; Под ред. И.И. Елисеевой. М.: Финансы и статистика, 2014, 192 с.
10. Получение на ЭВМ равномерно распределенных псевдослучайных чисел. Метод. Указ. К лабораторной работе. Уфа, Изд-во Уфимского государственного авиационного технического университета.
11. Интернет университет. Информационные технологии. Курс «Введение в математическое моделирование». / Под ред. Ю.В. Губаря. — http://www.intuit.ru.