Парная линейная регрессия

Контрольная работа по эконометрике

“Парная линейная регрессия”

Вариант №6

В таблице приведены значения выручки от экспорта 1 тонны синтетического каучука за 10 кварталов и цены его на внутреннем рынке.

ПериодВыручка от экспорта 1 тонны, долл.Цена внутреннего рынка, долл. За 1 тонну
1-й квартал20101030
2-й квартал11901550
3-й квартал13402180
4-й квартал13702370
5-й квартал14702380
6-й квартал15102560
7-й квартал15352590
8-й квартал15702700
9-й квартал15402759
10-й квартал16352760

Линейное уравнение парной регрессии имеет вид:

ŷ = b0 + b1 – x

Где ŷ – оценка условного математического ожидания y;

B0 , b1 – эмпирические коэффициенты регрессии, подлежащие определению.

Эмпирические коэффициенты регрессии b0 , b1 будем определять с помощью инструмента Регрессия надстройки Анализ данных табличного процессора MS Excel.

Из таблицы “Линейн” видно, что эмпирические коэффициенты регрессии соответственно равны:

B0 = 1738,671

B1 = – 0,097

Тогда уравнение парной линейной регрессии, связывающей величину выручки от экспорта yи его цены на внутреннем рынке x, имеет вид:

ŷ = 1739 – 0,097 – x

1. Рассчитайте параметры уравнения линейной зависимости выручки от экспорта 1тонны синтетического каучука от цены его на внутреннем рынке.

При помощи статистической функции “ЛИНЕЙН” получим:

Линейн
-0,0968882471738,670621
0,129769731305,1064952
0,065140593222,2670586
0,557436498
27538,83722395221,1628

Где соответственно

Значение коэффициента bЗначение коэффициента a
Среднеквадратическое отклонение bСреднеквадратическое отклонение a
Коэффициент детерминации R2Среднеквадратическое отклонение y
F – статистикаЧисло степеней свободы
Регрессионная сумма квадратовОстаточная сумма квадратов

2. Найти оценки дисперсий S2 , D( b0 ), D( b1 ), D(ŷ).

А) Найдем S2

S2 =∑ ei2 / n-2

НаблюдениеОстатки eiКвадрат отклонений
1371,1242736137733,2264
2-398,4938378158797,3387
3-187,454241935139,0928
4-139,045474919333,64409
5-38,076592411449,82689
619,36329212374,9370817
747,269939542234,447184
892,927646768635,547532
968,644053354712,006061
10163,740941626811,09596
Сумма395221,1628

Используя данные таблицы, получим S2 = 395221,1628 / 10 – 2 = 395221,1628 / 8 = 49402,64535

Б) Найдем D(b0 )

D(b0 ) = S2 – (∑ xi2 / n ∑ (xi – x)2 )

ПериодЦена внутреннего рынка, долл. За 1 тонну, xX – x ср.Квадрат(x – x ср.)Квадрат x
1-й квартал1030-1257,91582312,411060900
2-й квартал1550-737,9544496,412402500
3-й квартал2180-107,911642,414752400
4-й квартал237082,16740,415616900
5-й квартал238092,18482,415664400
6-й квартал2560272,174038,416553600
7-й квартал2590302,191264,416708100
8-й квартал2700412,1169826,417290000
9-й квартал2759471,1221935,217612081
10-й квартал2760472,1222878,417617600
Сумма228791805190,828678500
Среднее значение x2287,9

D(b0 ) = 49402,64535 – (8678500/ 10 -1805190,82) = 49402,64535 – (8678500/ 18051908,2) = 49402,64535 – 0,48075 = 23750,32175

В) Найдем D(b1 )

D(b1 ) = S2 – (1/ ∑ (xi – x)2 )

D(b1 ) = 49402,64535 – (1/1805190,82) = 49402,64535 – 0,000000554 = 0,02737

Г) Найдем D(ŷ)

D(ŷ) = S2 – ( 1 + 1/n + ((xi – x)2 /∑ (xi – x)2 )) = 49402,64535 – (1 + 1/10 + )

3. Постройте таблицу дисперсионного анализа.

Таблица построена при помощи инструмента Регрессия надстройки Анализ данных.

Дисперсионный анализ

DfSSMSFЗначимость F
Регрессия127538,8372227538,837220,557436490,476661041
Остаток8395221,162849402,64535
Итого9422760

4. Оцените тесноту связи с помощью коэффициента корреляции и детерминации.

В соответствии с заданием, необходимо оценить тесноту статистической связи между величиной выручки от экспорта y и ценой на внутреннем рынке x. Эту оценку можно сделать с помощью коэффициента корреляции rxy. Величина этого коэффициента в таблице “Регрессионная статистика” обозначена как множественный R и равна 0,255. Поскольку теоретически величина данного коэффициента находится в пределах от -1 до +1, то можно сделать вывод о несущественности статистической связи между величиной выручки от экспорта y и ценой на внутреннем рынке x.

Параметр R-квадрат, представленный в таблице “Регрессионная статистика” представляет собой квадрат коэффициента корреляции rxy2 и называется коэффициентом детерминации. Соответственно величина 1 – rxy2 характеризует долю дисперсии переменной y, вызванную влиянием всех остальных, неучтенных в эконометрической модели объясняющих переменных. Из таблицы “Регрессионная статистика” видно, что доля всех неучтенных в полученной эконометрической модели объясняющих переменных приблизительно составляет: 1 – 0,06514 = 0,93486 или 93,5%.

Таким образом, при R< 0,3 – связь слабая. В рассматриваемом случае R=0,255, 0,255< 0,3 значит модель строить нельзя.

Регрессионная статистика

Множественный R0,255226553
R-квадрат0,065140593
Нормированный R-квадрат-0,051716833
Стандартная ошибка222,2670586
Наблюдения10

5. Оцените с помощью средней ошибки аппроксимации качество уравнения.

Определим среднюю ошибку аппроксимации по зависимости:

Для этого исходную таблицу дополняем двумя колонками, в которых определяем значения ŷ, рассчитанные с использованием зависимости и значения разности .

ПериодВыручка от экспорта 1 тонны, долл. YЦена внутреннего рынка, долл. За 1 тонну xŷ
1-й квартал201010301639,090,184532
2-й квартал119015501588,650,335
3-й квартал134021801527,540,13996
4-й квартал137023701509,110,10154
5-й квартал147023801508,140,02595
6-й квартал151025601490,680,012795
7-й квартал153525901487,770,030769
8-й квартал157027001477,10,059172
9-й квартал154027591471,3770,04456
10-й квартал163527601471,280,100135
Сумма15170228791,034413

Тогда средняя ошибка аппроксимации равна:

Практически полагают, что значение средней ошибки аппроксимации не должно превышать 12-15% для грубого приближения регрессии к реальной зависимости. В нашем же случае средняя ошибка аппроксимации, т. е. среднее отклонение расчетных значений от фактических равна 10,34%. Поскольку ошибка меньше 15%, то данное уравнение можно использовать в качестве регрессии.

6. Оцените значимость коэффициента корреляции и значимость коэффициента регрессии b1 с помощью t-критерия Стьюдента.

На этом этапе необходимо оценить статистическую значимость коэффициентов регрессии с помощью t-критерия Стьюдента. Технология оценки статистической значимости коэффициентов регрессии основывается на проверке нулевой гипотезы о незначимости коэффициентов регрессии. При этом проверяется выполнение условия: если tT > tКРИТ, то нулевая гипотеза отвергается и коэффициент регрессии принимается значимым. Из таблицы №3 в приложении видно, что tT для коэффициента регрессии равен -0,7466. Критическое значение tКРИТ при уровне значимости α = 0,05 равно 2,3060.

Поскольку tT <tКРИТ для коэффициента регрессии (0,7466<2,3060), то нулевая гипотеза не отвергается и объясняющая переменная x является статистически незначимой и ее можно исключить из уравнения регрессии.

7. Оцените с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования.

Из таблицы дисперсионного анализа:

Дисперсионный анализ
DfSSMSFЗначимость F
Регрессия127538,8372227538,8370,55743650,476661041
Остаток8395221,162849402,645
Итого9422760

Следует, что FT = 0,56. FКРИТ определяем с помощью таблицы значений F-критерия Фишера. Для модели парной линейной регрессии число степеней свободы равно 8 и n – k – 1 (где k = 1 – число объясняющих переменных). И второе число степеней свободы равно: 10 – 2 = 8. FКРИТ = 3,44. Следовательно, FT <FКРИТ (0,56<3,44) и уравнение регрессии в целом является незначимым.


Парная линейная регрессия