Прогнозування моделями простої лінійної регресії

НЕПАРАМЕТРИЧНІ МЕТОДИ ОЦІНКИ ТІСНОТИ ЗВ`ЯЗКУ

План

1. Критерії Спірмена та Кендала

2. Критерій Фехнера

3. Коефіцієнти асоціації і контингенції

4. Коефіцієнт взаємної спряженості Пірсона і Чупрова

Література

1. Критерії Спірмена та Кендала

Серед непараметричних (емпіричних) методів оцінки тісноти зв’язку найбільше значення мають розрахунки рангових коефіцієнтів Спірмена і Кендала .

Ці коефіцієнти можуть бути використанні для визначення тісноти зв’язку як між кількісними, так і між якісними ознаками при умові, якщо значення цих показників можуть бути впорядковані або проранговані по спаданню або зростанню ознаки.

Для визначення рангового коефіцієнта кореляції рангують (тобто записують у зростаючому або спадаючому порядку) всі значення факторної ознаки і разом з тим записують відповідні значення результативної ознаки . Другими словами, визначають ранг по обох ознаках, тобто номер кожної ознаки в рангових рядах.

Ступінь тісноти зв’язку між ознаками визначається ранговим коефіцієнтом кореляції Спірмена по формулі:

Де – квадрати різниць рангів зв’язаних величин і ; п – число спостережень (число пар рангів).

У випадку відсутності зв’язку ; при прямому зв’язку коефіцієнт додатній, а при оберненому зв’язку – від’ємний.

Приклад 1. Визначити, чи існує залежність між стажем роботи та виробітком робітника для слідуючих даних:

Таблиця 1

№ п/пСтаж роботи робітників, х, рокиВиробіток на 1 робітника, у
12,5222
22,5223
31200
41202
51205
65244
75250
83234
94,5241
104,4244
112,7230

Рішення.

Фактори і ранжуємо (впорядкуємо) в порядку зростання (спадання) їх значень і заповнюємо табл. 2.

Таблиця 2

Ранг ознаки хРанг ознаки уРангова різниця
12004311
12024400
120545-11
2,52221,510,50,25
2,52231,52-0,50,25
2,7230111100
32348800
4,424110911
4,52449811
52446,58-1,52,25
52506,57-0,50,25
Всього3,5-3,5=07

Визначаємо ранги по обох ознаках, тобто номер кожної ознаки в рангованих рядах. Для рівних значень факторів х та у ранг знаходять шляхом ділення суми рангів, що приходяться на неї, на число рівних значень.

3. Знаходимо рангову різницю та.

4. Розрахуємо коефіцієнт кореляції рангів Спірмена:

Розрахунок рангового коефіцієнта Кендала відбувається за формулою:

Де п – число спостережень; S – сума додатних та від’ємних балів по одній із зв’язаних величин, ранги котрої розміщені у відповідності з впорядкованими рангами другої.

2. Критерій Фехнера

Одним із найпростіших показників кореляційної залежності, пов’язаний з іменем відомого німецького вченого психофізика Фехнера.

Коефіцієнт Фехнера базується на застосуванні перших ступенів відхилень всіх значень взаємозв’язаних ознак від середньої величини по кожній ознаці.

Коефіцієнт Фехнера вимірює тісноту зв’язку за наступною формулою:

Де – число збігів та незбігів знаків відхилень значень фактичної і результативної ознак від своїх середніх, тобто При цьому фіксуються збіги та незбіги знаків в відхиленнях від середньої у різних пар значень ознак.

Коефіцієнт Фехнера К змінюється в межах від – 1 до +1. Якщо зв’язок між ознаками обернений, то К від’ємний; у випадку прямого зв’язку – додатній. Чим ближче К до , тим зв’язок більш тісний.

Приклад 2. Розрахувати коефіцієнт Фехнера для наступних даних:

Таблиця 3

Стаж роботи, хВиробіток на 1 робітника, уЗбіг чи незбіг знаків
2,5222С
2,5223С
1200С
1202С
1205С
5+244+С
5+250+С
3+234+С
4,5+241+С
4,5+244+С
2,7230+Н

Коефіцієнт Фехнера

Величина К досить близька до величини коефіцієнта рангової кореляції Спірмена, що свідчить про тісний зв’язок між ознаками х і у.

3. Коефіцієнти асоціації і контингенції

Для визначення тісноти зв’язку двох якісних ознак, кожна із котрих складається тільки із двох груп, використовують коефіцієнти асоціації і контингенції. Для їх розрахунку будується чотирьохклітинна таблиця кореляції, котра виражає зв’язок між двома явищами, кожне із них в свою чергу повинно бути альтернативним, тобто складається із двох якісно відмінних друг від друга значень ознаки (наприклад, хороший, поганий).

Наприклад, при вивчені залежності врожайності від кількості внесених в грунт добрив виділимо по врожайності і по кількості внесених добрив лише по дві групи. При цій умові можна побудувати наступну чотирьохклітинну таблицю.

Таблиця 4

Удобрено

Урожайність

ДобреПоганоВсього
ВисокаАВA+b
НизькаСDC+d
ВсьогоА+cB+d

Числа, які стоять на перетині рядків і граф a, в, c, d показують, скільки дільниць зустрічаються з тою або другою кількістю добрив, що внесені в грунт, з тією або другою врожайністю.

Коефіцієнт асоціації Юла і коефіцієнт контингенції розраховується за наступними формулами:

Асоціації Юла;

Контингенції .

Де a, в, c, d – кількісні характеристики досліджувальних груп.

Коефіцієнт контингенції завжди менший коефіцієнта асоціації Юла. Зв’язок рахується підтвердженим, якщо:

або .

Приклад 3. Дослідити зв’язок між виконанням норм виробітку молодими робітниками і закінченням ними середньої школи. Результати обстеження характеризуються даними (табл. 5).

Таблиця 5

Групи робітниківВиконують нормуНе виконують нормуВсього
Закінчили середню школу7822100
Не закінчили середню школу3268100
Всього11090200

Рішення. За даними таблиці

Між досліджувальними ознаками спостерігається чіткий зв’язок, що підтверджується досить високими значеннями коефіцієнтів асоціації і контингенції.

4. Коефіцієнт взаємної спряженості Пірсона і Чупрова

Якщо кожна із якісних ознак складається більше ніж із двох груп, то для визначення тісноти зв’язку можна використати коефіцієнт взаємної спряженості Пірсона. Цей коефіцієнт розраховується за наступною формулою:

Де q2 – показник взаємної спряженості.

Коефіцієнт Чупрова:

,

Де К1 , К2 – число груп по кожній із ознак.

Розрахунок коефіцієнта взаємної спряженості проводиться за наступною схемою (табл. 6).

Таблиця 6

Групи ознаки АГрупи ознак ВРазом
В1В2В3
А1F1F2F3N1
A2F4F5F6N2
A3F7F8F9N3
РазомТ1Т2Т3

Розрахунок q2 :

По першому рядку

По другому рядку

По третьому рядку

.

Приклад 4. В таблиці 2.7 приведені згруповані дані накладних видатків (х ) та собівартості продукції (у ). За допомогою коефіцієнта взаємної спряженості дослідити зв’язок між собівартістю продукції та накладними витратами на реалізацію.

Рішення.

Розрахуємо q2 :

По першому рядку

Таблиця 2.7

НакладніСобівартістьРазом
ВитратиНижняСередняВисока
Нижні1912940
Середні7181540
Високі4102640
Разом304050

По другому рядку

По третьому рядку

.

.

Підставляємо у відповідні формули і знаходимо:

Коефіцієнт Пірсона: ,

Коефіцієнт Чупрова: .

Досить високе значення с вказує на наявність зв’язку між собівартістю продукції та накладними витратами на реалізацію.

Непараметричні методи вимірювання зв’язку використовуються для перевірки умов використання метода найменших квадратів, незалежності розподілу ознак, однорідності вибірок, наявності тренда в рядах динаміки.

Література

1. Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы эконометрики. М., ЮНИТИ. 1998 – 1022 с.

2. Ликеш И., Ляга Й. Основные таблицы математической статистики. – М. “Финансы и статистика”, 1985. – 356 с.

3. Доугерти Кристофер. Введение в эконометрику. Пер. с англ. – М., ИНФРА-М. – XIV. 1997 – 402 c.

4. Maddala G. L., Kim In-Moo Unit Roots, Cointegration, and Structural Change. Cambridge Univ. Press., 1999.

5. Davidson R., MacKinnon J. G. Estimation and Inference in Econometrics. Oxford Univ. Press., 1993.


Прогнозування моделями простої лінійної регресії