Менеджмент - это управление организацией, функционирующей в условиях рыночной экономики.
Прикладная статистика и основы эконометрики
. Постройте матрицу парных коэффициентов корреляции. Установите, какие факторы коллинеарны.
. Постройте уравнение множественной регрессии, обосновав отбор факторов.
. Проведите тестирование ошибок уравнения множественной регрессии на гетероскедатичность, применив тест Гельфельда-Квандта.
. Оцените статистическую значимость уравнения множественной регрессии. Какие факторы значимо воздействуют на формирование средней продолжительности жизни в этом уравнении?
. Постройте уравнение множественной регрессии со статистически значимыми факторами.
Решение.
Воспользуемся MS Excel.
. Построим матрицу парных коэффициентов корреляции. Установим, какие факторы коллинеарны.
Сервис - Анализ данных - Корреляция
Y |
X1 |
X2 |
X3 |
X4 | |
Y |
1 | ||||
X1 |
0,780323 |
1 | |||
X2 |
-0,72516 |
-0,62259 |
1 | ||
X3 |
-0,53368 |
-0,65827 |
0,873778 |
1 | |
X4 |
-0,96876 |
-0,74343 |
0,736073 |
0,553603 |
1 |
Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная, т.е. средняя ожидаемая продолжительность жизни, имеет тесную связь с коэффициентом младенческой смертности (ryx4=-0,969), с ВВП в паритетах покупательской способности (ryx1=0,780), с темпами прироста населения (ryx2=0,725). Однако факторы Х2 и Х3 тесно связаны между собой (rx2x3=0,874) и факторы Х2 и Х4 также тесно связаны (rx2x4=0,736), что свидетельствует о наличии коллинеарности.
Коллинеарность - зависимость между факторами. В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств:
r(xjy) > r(xkxj) ; r(xky) > r(xkxj).
Коллинеарны факторы х2 и х3, х2 и х4, а также х3 и х4.
. Построим уравнение множественной регрессии, обосновав отбор факторов.
Из модели исключим фактор х3, так как зависимая переменная слабо зависит от этого фактора и чтобы исключить мультиколлинеарность.
Сервис - Анализ данных - Регрессия
ВЫВОД ИТОГОВ | ||||||
Регрессионная статистика | ||||||
Множественный R |
0,972926 | |||||
R-квадрат |
0,946586 | |||||
Нормированный R-квадрат |
0,94436 | |||||
Стандартная ошибка |
2,267593 | |||||
Наблюдения |
76 | |||||
Дисперсионный анализ | ||||||
df |
SS |
MS |
F |
Значимость F | ||
Регрессия |
3 |
6560,936 |
2186,979 |
425,3186 |
1,05E-45 | |
Остаток |
72 |
370,2223 |
5,141977 | |||
Итого |
75 |
6931,158 | ||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% | |
Y-пересечение |
75,43822 |
0,998632 |
75,54159 |
2,59E-70 |
73,44749 |
77,42896 |
X1 |
0,044695 |
0,01381 |
3,236416 |
0,00183 |
0,017165 |
0,072225 |
X2 |
-0,0452 |
0,421364 |
-0,10727 |
0,91487 |
-0,88518 |
0,794772 |
X4 |
-0,23956 |
0,013205 |
-18,1409 |
1,45E-28 |
-0,26588 |
-0,21323 |