Зведення та групування даних

За даними бюджетних обстежень 20 домогосподарств ( наведені в таблиці ) згрупувати домогосподарства за кількістю членів та загальним грошовим доходом, побудувати комбінаційне групування за вказаними ознаками, побудувати аналітичне групування, яке б характеризувало зв’язок між середньодушовим доходом та кількістю членів домогосподарств та типологічне групування, виділивши групи бідних, середніх та заможних домогосподарств.

Таблиця 1.

Порядковий номер домогосподарстваКількість членів домогосподарстваЗагальний грошовий доход, включаючи трансферти, гр. од.Середньодушовий доход, гр. од.
Гр. 1Гр. 2Гр. 3Гр. 4
1218592,5
2326889,3
34539134,7
4219396,5
53473157,6
63324108,0
74710177,5
8317257,3
9424862,0
102350175,0
113516172,0
123374124,7
134450112,5
143603201,0
15322976,3
162368184,0
17431378,3
183346115,3
193447149,0
20439298,0

Розв’язання.

Кількість членів домогосподарств є дискретною ознакою і групування зводиться до підрахунку числа домогосподарств для кожного значення ознаки. Число груп визначається кількістю різних значень ознаки: 2, 3,4. Слід відмітити, що різних значень ознаки не багато, тому кожне наступне значення визначатиме групу. Результати групування представимо в таблиці 2.

Таблиця 2.

Чисельність членів домогосподарстваКількість домогосподарствВ % до підсумку
Гр. 1Гр. 2Гр. 3 =(гр. 2 : 20) . 100
2420
31050
4630
В цілому20100

Грошовий місячний дохід – ознака неперервна, межі її варіації досить широкі – від 172 до 710 грн. од., а тому доцільно складати інтервальний ряд розподілу, враховуючи характер розподілу. Визначимо етапи проведення групування.

1. За формулою Стерджеса , де N – кількість спостережень визначимо необхідну кількість груп:

2. Обчислимо ширину інтервалу за формулою

3. Знайдемо межі інтервалів за формулами, . Дані запишемо в таблиці.

Таблиця 3.

Загальний грошовий доход домогосподарства, гр. од.Кількість домогосподарствВ % до підсумку
Гр. 1Гр. 2Гр. 3 =(гр. 2 : 20) . 100
172 – 279,6630
279,6 – 387,2630
387,2 – 494,8420
494,8 – 602,4210
602,4 – 710210
В цілому20100

Слід зазначити, що нижні межі інтервалів ми будемо включати до інтервалу, а верхні – ні. В інтервал 602,4 – 710 включаємо обидві межі.

В багатьох випадках кількість інтервалів та ширину інтервалу дослідник визначає сам. Інтервали можуть бути відкритими та закритими.

Наприклад, виконаємо теж завдання, але сформуємо чотири інтервали: До 200; 200 – 400; 400 – 600; 600 і більше.

Таблиця 4.

Загальний грошовий доход домогосподарства, гр. од.Кількість домогосподарствВ % до підсумку
Гр. 1Гр. 2Гр. 3 =(гр. 2 : 20) . 100
До 200315
200 – 4001050
400 – 600525
600 і більше210
В цілому20100

Групування домогосподарств одночасно за двома ознаками дає комбінаційний розподіл. В таблиці підметом буде групування за факторною ознакою (в даному випадку – за кількістю членів домогосподарств), а групи за результативною ознакою (загальний грошовий дохід ) розмістимо вгорі.

Таблиця 5.

Чисельність членів домогосподарстваЗагальний грошовий доход домогосподарства, гр. од.В цілому
До 200200 – 400400 – 600600 і більше
2224
3153110
43216
В цілому3105220

Для побудови даного групування необхідно підрахувати кількість домогосподарств, які одночасно належать до певної групи за факторною ознакою та до тієї чи іншої групи за результативною ознакою. В нашому випадку ми маємо, наприклад, 5 домогосподарств, кількість членів яких дорівнює 3 і загальний грошовий дохід яких не менше 200 і не більше 400 гр. од. і т. д.

Розміщення частот таблиці у напрямку з верхнього лівого кута у нижній правий вказує на наявність прямого зв’язку між факторною та результативною ознакою, в нашому випадку – між чисельністю членів домогосподарств та загальним грошовим доходом домогосподарств.

Розміщення частот таблиці у напрямку з нижнього лівого кута у верхній правий вказує на наявність зворотного зв’язку між факторною та результативною ознакою.

Виявити наявність та напрямок зв’язку між двома ознаками можна за допомогою аналітичного групування. Для його побудови знайдемо середнє значення результативної ознаки в кожній групі за факторною ознакою. Результати представимо в таблиці 6.

Таблиця 6.

Чисельність членів домогосподарстваКількість домогосподарств

Сумарна кількість членів домогосподарств

Дохід за місяць, гр. од.
Загальний грошовийУ середньому
На одне домогосподарствоНа одного члена домогосподарства
Гр. 1Гр. 2Гр. 3 = гр. 1 .гр. 2Гр. 4Гр. 5 = гр. 4 : гр. 2Гр. 4 = гр. 4 : гр. 3
2481096274,0137,0
310303752375,2125,1
46242652442,0110,5
В цілому20627500375,0121,0

За даними таблиці 6 із збільшенням кількості членів домогосподарства зростає середній дохід на одне домогосподарство, але середньодушовий дохід зменшується.

Паралельнезіставлення групових значень факторної та результативної ознак дає можливість визначити не лише напрямок зв’язку, а й інтенсивність змін результативної ознаки. За умови рівномірного нарощування значень факторної ознаки різниця між груповими середніми результативної ознаки використовується для оцінки ефекту впливу фактора на результат. Ефект впливу другої групи 125,1 – 137,0 = – 11,9 гр. од.; третьої групи 110,5 – 125,1 = – 14,6 гр. од., тобто інтенсивність впливу фактора на результат зростає.

Згідно з методикою Європейської комісії ООН до бідних віднесено домогосподарства, середньодушовий доход яких не перевищує 2/3 середньодушового рівня за сукупністю в цілому. До середнього прошарку віднесено домогосподарства, середньодушовий доход яких знаходиться в інтервалі Домогосподарства із середньодушовим доходом і більше ідентифікуються як заможні. В нашому випадку межею бідності є гр. од. До середнього прошарку віднесемо домогосподарства, середньодушовий доход яких належить інтервалу 121 ± 121/3, тобто від 181 до 161 гр. од. Домогосподарства з середньодушовим доходом 161 гр. од. І більше ідентифікуються як заможні.

Таблиця 7.

Середньодушовий дохід, гр. од.КількістьЗагальний грошовий дохід домогосподарств, гр. од.Середньодушовий дохід, гр. од.
ДомогосподарствЧленів домогосподарств
Гр. 1Гр. 2Гр. 3Гр. 4Гр. 5 = гр. 4 : гр. 3
До 8141496268,7
81 – 16111343991117,4
161 і більше5142547181,9
За сукупністю в цілому20627500121,0

За результатами групування середньодушовий дохід в групах становить: 181,9; 117,4; 68,7 гр. од., тобто дохід заможних домогосподарств в 2,6 рази перевищує дохід бідних.

Статистичні показники

1. Маємо дані про попит та пропозицію на ринку праці служби зайнятості у I півріччі 1998 та 1999 років за категоріями працівників та службовців.

Таблиця 8.

Категорії працівниківСередньоспискова кількість незайнятих громадян, тис. осібСередньомісячна кількість вільних робочих місць та вакантних посад, тис. осіб
1998199919981999
Гр. 1Гр. 2Гр. 3Гр. 4Гр. 5
Робітники34,133,0155,8126,9
Службовці21,320,89,613,2
Всього55,453,8165,4140,1

Визначити:

A) зміну чисельності незайнятих громадян та вільних робочих місць та вакантних посад за допомогою відносних і абсолютних показників динаміки;

B) структуру попиту та пропозиції на ринку праці служби зайнятості та її зміни за допомогою абсолютних і відносних показників;

C) показники координації для характеристики співвідношення попиту та пропозиції.

Обчисленні показники звести до окремих таблиць і проаналізувати.

Розв’язання.

Величина абсолютного приросту за суміжні періоди чи моменти часу обчислюється за формулою: ,

Де – абсолютний приріст, уt – будь-який рівень ряду, починаючи з другого, уt-1 – рівень, що передує уt. Це ланцюгові абсолютні прирости.

Базисні абсолютні прирости – це прирости за період у цілому, вони визначаються за формулою: , де – абсолютний приріст, yt – рівень ряду, y0 – значення показника, взяте за базисне. Базисні темпи росту: ; ланцюгові темпи росту: .

Відносні величини структури характеризують склад сукупності, їх обчислюють діленням обсягу кожної частини сукупності на обсяг сукупності в цілому. Виражаються в коефіцієнтах або у відсотках. Зміни в структурі характеризують структурні зрушення. Вони показують на скільки процентних пунктів змінилась частка певної частини сукупності в даному періоді порівняно з попереднім.

Відносні величини координації характеризують співвідношення частин досліджуваної сукупності, які показують, у скільки разів порівнювана частина сукупності більша або менша частини, що приймається за базу порівняння. Вибір бази порівняння довільний. В даному випадку ми розраховуємо скільки незайнятих громадян припадає на 100 вільних робочих місць.

Таблиця 9.

Категорії працівниківСередньоспискова кількість незайнятих громадян, тис. осібАбсолютний приріст, тис. осібТемп ростуСтруктура незайнятих громадян, % до підсумкуСтруктурні зрушення, п. п.
19981999K19981999
Гр. 1Гр. 2Гр. 3Гр. 4 = гр. 3 – гр. 2Гр. 5 =(гр. 3 : гр. 2 ) . 100Гр. 6 =(гр. 2 : 55,4 ) . 100Гр. 7 =(гр. 3 : 53,8 ) . 100Гр. 8 =(гр. 7 : гр. 6 )
Робітники, ст. 134,133,0-1,196,7761,5561,34-0,21
Службовці, ст. 221,320,8-0,597,6538,4538,660,21
Всього, ст. 355,453,8-1,697,11100,00100,000,00

Таблиця 10.

Категорії працівниківСередньомісячна кількість вільних робочих місць та вакантних посад, тис. осібАбсолютний приріст, тис. осібТемп ростуСтруктура середньомісячної кількості вільних робочих місць та вакантних посад, % до підсумкуСтруктурні зрушення, п. п.Відносні величини координації, чисельність незайнятих громадян на 100 вільних робочих місць
19981999K1998199919981999
Гр. 1Гр. 2Гр. 3Гр. 4 = гр. 3 – гр. 2Гр. 5 =(гр. 3 : гр. 2 ) . 100Гр. 6 =(гр. 2 : 55,4 ) . 100Гр. 7 =(гр. 3 : 53,8 ) . 100Гр. 8 =(гр. 7 : гр. 6 )Гр. 9Гр. 10
Робітники, ст. 1155,8126,9-28,981,4594,2090,58-3,622226
Службовці, ст. 29,613,23,6137,505,809,423,62222158
Всього, ст. 3165,4140,1-25,384,70100,00100,000,003338

Гр. 9 =((ст. 1; 2; 3, гр. 2(таб. 9.)) : ((ст. 1; 2; 3, гр. 2(таб. 10))) . 100; гр. 10 =((ст. 1; 2; 3, гр. 3(таб. 9.)) : ((ст. 1; 2; 3, гр. 3(таб. 10))) . 100.

2. За трьома районами міста є наступні дані на кінець 2003 року:

Таблиця 11.

Район містаКількість банківСереднє число вкладівСередній розмір вкладу, грн.
Гр. 1Гр. 2Гр. 3Гр. 4
151500400
261000450
342000500

Визначити в цілому по місту:

A) середню кількість банків;

B) середнє число вкладів в банки;

C) середній розмір вкладу;

D) середню суму вкладів в банках.

Розв’язання.

В даному випадку середні значення показників обчислюватимемо за формулами середньої арифметичної. Для розв’язання задачі в кожному випадку починатимемо з логічної формули розрахунку середньої.

При розрахунку трьох останніх показників ми використали формулу середньої арифметичної зваженої. Для розрахунку середнього числа вкладів в банках в якості ваги ми використали кількість вкладів в одному банку.

4. Залишки обігових коштів на початок місяця становили тис. гр. од. :

Січень ___________________1400; лютий___________________1550; березень___________________1270; квітень___________________1300.

Визначити середньомісячний залишок обігових коштів.

Розв’язання.

В цій задачі використаємо формулу середньої хронологічної, оскільки маємо показники моментні ( залишки обігових коштів на початок місяця ).

Середнє значення моментного показника розраховується за формулою хронологічної середньої:

.

5. Податкова дисципліна підприємств різних видів діяльності характеризується даними:

Таблиці 12.

Вид діяльностіКількість підприємців, які сплачують податки
Всього, чол.% до всіх зареєстрованих
Виробнича1860
Торгівельна2870
Посередницька4455

Визначити у середньому за всіма видами діяльності частку підприємців, які сплачують податки.

Розв’язання. Запишемо логічну формулу:

Але ми не маємо даних щодо загальної чисельності підприємців. Тобто використати середню арифметичну ми не можемо. В цьому випадку потрібно застосувати формулу середньої гармонічної: або .

6. У таблиці наведений розподіл населення України за рівнем середньодушового сукупного доходу у 1998 р.

Таблиця 13.

Усе населення, млн.50,3
У тому числі із середньодушовим доходом на місяць, грн.
До 30,00,6
30,1 – 60,07,3
60,1 – 90,014,2
90,1 – 120,012,0
120,1 – 150,07,0
150,1 – 180,03,9
180,1 – 210,02,3
210,1 – 240,01,1
240,1 – 270,00,8
270,1 – 300,00,4
Понад 300,00,7

Обчислити показники, що характеризують центр розподілу: середній рівень доходу, модальний та медіанний дохід.

Розв’язання.

Обчислення середньої арифметичної інтервального ряду розподілу:

1. якщо варіаційний інтервальний ряд розподілу має відкриті інтервали, то, перш за все, їх треба закрити за розмірами інтервалів, розташованих поруч.

2. знаходимо середину інтервалів: до нижньої границі інтервалу додаємо верхню і ділимо на 2.

3. знаходимо середню, використовуючи замість середньої величини за кожною групою середину інтервалу.

Таблиця 14.

Середина інтервалуЧисельність населення, млн.Сукупний дохід, млн. грн.Кумулятивна частота
15,050,69,030,6
45,057,3328,8657,9
75,0514,21065,7122,1
105,05121260,634,1
135,057945,3541,1
165,053,9643,69545
195,052,3448,61547,3
225,051,1247,55548,4
255,050,8204,0449,2
285,050,4114,0249,6
315,050,7220,53550,3
Разом50,35488

Середній рівень доходу:

Модальний дохід:

Медіанний дохід:

Модальний інтервал – ( 60,1 – 90,1 ), медіанний інтервал –

( 90,1 – 120,1 ). Середньодушовий дохід складає 109,11 грн., переважна частина населення мала дохід на душу населення 82,77 грн., а половина всього населення мала середньодушовий дохід менший 90,35 грн.

Показники варіації

Кредитні ставки комерційних банків під короткострокові позики становили:

Таблиця 15.

Кредитна ставка, %Сума наданих кредитів, млн. гр. од.
I кварталII квартал

До 35

35 – 45

45 – 55

55 і більше

11

5

8

6

6

8

10

6

Разом3030

За кожний квартал визначити середню кредитну ставку, середнє лінійне відхилення, дисперсію та середньоквадратичне відхилення.

Порівняти варіацію кредитної ставки комерційних банків в Iта II кварталі.

Розв’язання.

Наведемо необхідні для розрахунку формули:

Середня арифметична або середнє лінійне відхилення або дисперсія або середньоквадратичне відхиленняКоефіцієнт варіації

Таблиця 16.

I кварталII квартал
Кредитна ставка, %

Сума наданих кредитів, млн. гр. од.

Fi

Кредитна ставка, %

Середня кредитна ставка, %

Xi

Xi fi|xi – x |fi(xi – x)2 fiКредитна ставка, %

Сума наданих кредитів, млн. гр. од.

Fi

Кредитна ставка, %

Середня кредитна ставка, %

Xi

Xi fi|xi – x |fi(xi – x)2 fi
Гр. 1Гр. 2Гр. 3Гр. 4Гр. 5 = гр. 2 .гр. 4Гр. 6Гр. 7Гр. 8Гр. 9Гр. 10Гр. 11Гр. 12 = гр. 9 .гр. 11Гр. 13Гр. 14
До 351125-3530330,00143,001859,00До 35625-3530180,0092,001410,67
35 – 45535-4540200,0015,0045,0035 – 45835-4540320,0042,67227,56
45 – 55845-5550400,0056,00392,0045 – 551045-5550500,0046,67217,78
55 і більше655-6560360,00102,001734,0055 і більше655-6560360,0088,001290,67
Разом301290,00316,004030,00Разом301360,00269,333146,67

I квартал:

II квартал:

Варіація кредитної ставки в II кварталі менша, оскільки значення коефіцієнта варіації в II кварталі менше.

Вибіркове спостереження

1. За результатами обстеження 100 зареєстрованих безробітних ( 2 % вибірка ), з яких 40 проходять перенавчання за новою професією, середня тривалість перерви в роботі становить 3 місяці, а дисперсія дорівнює 2,25. Визначити довірчий інтервал середньої тривалості перерви в роботі та частки безробітних, які проходять перенавчання за новою професією та відносні похибки цих показників.

Розв’язання.

Визначимо межі середньої тривалості перерви в роботі з імовірністю 0,954 ( t = 2).

Гранична похибка , де Довірчий інтервал , тобто

Це дає підставу стверджувати з імовірністю 0,954, що середня тривалість перерви в роботі становить не менш як 2,7 і не більш як 3,3 місяця.

Для того, щоб визначити граничну похибку частки безробітних, які перенавчаються, обчислимо дисперсію частки: σ2 = 0,4(1-0,4)=0,24. Частка р = 40 / 100 = 0,4.

Гранична похибка Довірчий інтервал

Отже, з такою самою імовірністю можна стверджувати, що частка безробітних, які перенавчаються, у генеральній сукупності становить не менше як 20,2 % і не більш як 39,8 %.

Відносна похибка середньої тривалості перерви в роботі

Відносна похибка частки безробітних, які перенавчаються, становить Таким чином, відносна похибка частки більш ніж в два рази перевищує похибку середньої перерви в роботі.

2. На лісовому масиві в 400 га передбачається визначити загальний запас деревини. Пробні площі становлять 0,1 га. За даними попередніх обстежень дисперсія виходу деревини з 0,1 га становила 9. Скільки пробних площ необхідно обстежити, щоб похибка вибірки з імовірністю 0,954 не перевищила 1 м3 ?

Розв’язання.

Всього на даному масиві 4000 ділянок. Достатній обсяг вибірки пробних ділянок визначимо, виразивши з формули граничної похибки невідомий показник:

Методи аналізу взаємозв’язків

1. Маємо дані щодо кредитового обороту обласних філій банку та кількості їх клієнтів. Керівництво банку вважає, що між цими показниками існує певна залежність, і хоче знати, як функціонально кредитовий оборот філії залежить від кількості клієнтів банку. Потрібно перевірити, чи лінійною є залежність між даними показниками, побудувати модель лінійної парної регресії, яка б характеризувала дану залежність, а також:

А) виконати перевірку статистичної значимості оцінок параметрів, знайдених за методом найменших квадратів, та знайти інтервали довіри для параметрів b 0 , b 1 ;

Б) знайти коефіцієнти еластичності, пояснити їх зміст;

В) знайти коефіцієнти кореляції та детермінації, за допомогою знайдених коефіцієнтів описати вплив розглядуваного фактору на результат;

Г) виконати перевірку моделі на адекватність;

Д) знайти інтервальні прогнози індивідуального значення для будь-якого значення незалежної змінної.

Для десяти філій маємо зафіксовані значення показників y, x :

Таблиця 17.

Обласні філії ї банкуКредитовий оборот, млн. грн. , уЧисельність клієнтів банку, х
17,46
27,25
38,67
49,58
54,64
67,35
78,67
89,87
974
104,83

Розв’язання.

Важливою задачею є вибір раціонального типу регресійної моделі. Конкретна аналітична форма зв’язку між економічними показниками згідно з простою регресійною моделлю вибирається на підставі змістовного тлумачення цього зв’язку.

Якщо регресійна модель вимірює зв’язок між двома змінними, то кожну пару спостережень над цими змінними можна зобразити у двовимірній системі координат:

Аналіз зображеної множини точок дозволяє зробити висновок про наявність лінійного зв’язку між кількістю клієнтів банку та кредитовим оборотом, тобто для характеристики даної залежності варто обрати лінійну функцію.

Нехай залежність між кредитовим оборотом та чисельністю клієнтів банку описується простою лінійною моделлю y=β0 +β1 x+u, де y – кредитовий оборот; х – чисельність клієнтів банку; u – стохастична складова, яка вводиться до моделі з метою урахувати наявність впливу факторів, які не входять до моделі, β 0 , β 1 – параметри моделі.

Згідно з гіпотезою про лінійний зв’язок через кореляційне поле точок можна провести принаймні кілька прямих ліній, які різняться своїми параметрами b 0 таb 1 . Щоб певна пряма адекватно описувала фактичну залежність, необхідно обрати такий метод оцінювання параметрів моделі, щоб відхилення фактичних значень від розрахункових били мінімальними.

У цьому разі мінімізації підлягає сума квадратів відхилень: Це є сутністю методу найменших квадратів.

Розрахункові значення кредитового обороту можна знайти, скориставшись такою моделлюпарної лінійної регресії: =b 0 + b 1 x.

Щоб оцінити параметри моделі b 0 та b 1 методом 1МНК, запишемо систему нормальних рівнянь

Параметри регресії розраховуються за формулами:

,

Параметр b1 вказує на скільки одиниць у середньому зміниться у зі зміною х на одиницю, а параметр b 0 – чому дорівнюєу, якщо х =0 ( при умові, що змінна х може набувати нульових значень ).

Необхідні розрахунки:

Таблиця 18.

Обласні філії банку

Кредитовий оборот, млн. грн. , уЧисельність клієнтів банку, хХ*уХ2Урозр.(y-y розр.)2(x-xсер )2(y-yсер. )2(x-xсер )(у-усер )(y розр. – yсер. )2
17,4644,4367,87050,2213630,160,0064-0,0320,15249025
27,2536256,89430,0934760,360,07840,1680,34304449
38,6760,2498,84670,0608711,961,25441,5681,86786889
49,5876649,8230,1042975,764,08044,8485,489649
54,6418,4165,9181,737212,568,29444,6082,439844
67,3536,5256,89430,1646230,360,03240,1080,34304449
78,6760,2498,84670,0608711,961,25441,5681,86786889
89,8768,6498,84670,908741,965,38243,2481,86786889
97428165,9181,1706532,560,23040,7682,439844
104,8314,494,94180,0201086,767,18246,9686,44245924
Сума74,856442,73384,54221324,427,79623,8223,25398214

Маємо:

Модель лінійної парної регресії має вигляд: у=0,98х+2 . Оскільки вільний член b 0 =2≠0 , то величина кредитового обороту не є строго пропорційною до кількості клієнтів банку. Кількісна оцінка параметра b 1 = 0,98показує, що граничне збільшення кредитового обороту при зростанні чисельності клієнтів банку на одного становить 0,98 млн. грн.

Еластичність кредитового обороту щодо кількості клієнтів банку визначається коефіцієнтом еластичності

Значення цього коефіцієнта слід тлумачити так: при збільшенні кількості клієнтів банку на 1% кредитовий оборот гранично зросте на 0,73 %.

Параметри регресії у невеликих за обсягом сукупностях здатні до випадкових коливань. Тому здійснимо перевірку їх істотності або статистичної значимості за допомогою t – критерію Стьюдента:

Де Оцінки дисперсій помилок та параметрів відповідно; Значення критерію для кожного з параметрів.

Критичне значення критерію Стьюдента для рівня значимості α= 0,05 ( задається дослідником ) та n – k = 10-2 ступенів вільності ( k – кількість параметрів ) знаходимо за допомогою таблиць t – розподілу Стьюдента. Оскільки t кр. < t фак. , то коефіцієнт регресії вважається статистично значимим, тобто з ймовірністю 0, 95 вплив чисельності клієнтів банку на кредитовий оборот визнається істотним.

Для перетину b 0 критичне значення більше фактичного значення критерію Стьюдента, тобто оцінка перетину статистично не значима.

Для того, щоб визначити, як оцінки параметрів пов’язані з параметрами, потрібно побудувати інтервали довіри для параметрів узагальненої регресійної моделі, тобто інтервали в які з заданою ймовірністю потрапляють їхні оцінки.

Довірчі межі коефіцієнта регресії : Зі ймовірністю 0,95 .

Довірчі межі вільного члена: зі ймовірністю 0,95 .

Щоб відповісти на питання наскільки значним є вплив змінної х на у, знайдемо значення коефіцієнта кореляції, значення якого знаходиться між -1 та +1:

Значення лінійного коефіцієнта кореляції 0,91 близьке до одиниці, тому можна зробити висновок про досить тісний прямий ( r > 0) зв’язок між кількістю клієнтів банку та величиною кредитового обороту.

Загальну дисперсію результативної ознаки можна розкласти на дві частини – дисперсію, що пояснює регресію, та дисперсію помилок:

Поділивши обидві частини на загальну дисперсію, отримаємо:

Перша частина цього виразу являє собою частину дисперсії, яку не можна пояснити через регресійний зв’язок, друга – частину дисперсії, яку можна пояснити, виходячи з регресії. Вона називається коефіцієнтом детермінації і використовується як критерій адекватності моделі, бо є мірою пояснювальної сили незалежної змінної:

Постільки значення коефіцієнта детермінації близьке до одиниці, то можна вважати, що побудована модель адекватна тобто зв’язок між кредитовим оборотом та чисельністю клієнтів банку істотний. ( ).

Інший критерій істотності зв’язку – критерій Фішера. Він використовується найчастіше і дає відповідь на питання щодо адекватності моделі, коли значення коефіцієнта детермінації має не явно виражене граничне значення, наприклад, 0,5: 0,45: 0,44 і ін.

Перевірка моделі на адекватність за F – критерієм Фішера складається з таких етапів:

1. Розраховуємо величину F – критерію:

В цій формулі n, k – кількість спостережень та кількість параметрів відповідно.

2. Задаємо рівень значимості, наприклад, α = 0,05. Тобто, ми вважаємо, що можлива помилка для нас становить 0,05, це означає, що ми можемо помилитися не більш, ніж у 5%випадків, а в 95% випадків наші висновки будуть правильними.

3. На цьому етапі за статистичними таблицями F – розподілу Фішера з ( k -1, n – k ) ступенями вільності та рівнем значимості 100(1-α )% знаходимо критичне значення : F кр = 5,32,

4. Оскільки, F кр < F факт, то зі ймовірністю 0,95 ми стверджуємо, що побудована нами модель є адекватною тобто зв’язок істотний.

2. За даними про рівень ефективності економіки та надійність ділового партнерства для семи країн східної Європи оцінити щільність зв’язку між цими ознаками.

Таблиця 19.

КраїнаABCDKMP
Інтегральні показникиЕфективність економіки ( max = 10 )5,97,14,23,44,92,72,9
Надійність ділового партнерства ( max = 100 )54,954,845,336,935,826,424,8

Розв’язання.

Для оцінки щільності зв’язку між ознаками порядкової (рангової) шкали використовують коефіцієнт рангової кореляції r, який за змістом ідентичний лінійному коефіцієнту кореляції. Найбільш поширена формула Спірмена

, де dj – відхилення рангів факторної (Rx ) та результативної (R y ) ознак; n – кількість рангів.

Визначимо для кожної країни значення рангів таким чином, щоб ранг країни з найменшим значенням показника був присвоєний найнижчий ранг і т. д. В нашому випадку сума квадратів відхилень рангів становить , а коефіцієнт рангової кореляції

Таблиця 20.

КраїнаІнтегральні показники.Ранги показниківВідхилення рангів, dj
Ефективності економіки (max=10)Надійності ділового партнерства (mах = 100 )RxRy
А5,954,96711
В7,154,87611
С4,245,345-11
D3,436,934-11
К4,935,85324
М2,726,412-11
Р2,924,82111
Разом010

Значення коефіцієнта рангової кореляції свідчить про наявність прямого і досить помітного зв’язку між зазначеними параметрами ризику іноземного інвестування економіки. Критичне значення коефіцієнта рангової кореляції для α =0,05 та n =7 становить , що значно менше фактичного. Отже, істотність зв’язку доведена з імовірністю 0,95.

3. За даними опитування 200 інвесторів побудовано комбінаційний розподіл респондентів за віком та схильністю до ризику. До групи ризикових віднесено респондентів, які мають намір придбати цінні папери, незважаючи на ризик, обережні не уявляють ризику без гарантій, не ризикові уникають ризику взагалі.

Таблиця 21.

Вік, роківТип інвестораРазом
РизиковийОбережнийНе ризиковий
До 302412440
30 – 50205030100
50 і старші6183660
Разом508070200

Проаналізувати комбінаційний розподіл робітників, оцінити щільність зв’язку між віком інвесторів та схильністю до ризику за допомогою коефіцієнта взаємної спряженості. Перевірити істотність зв’язку з імовірністю 0,95, зробити висновок.

Розв’язання.

Концентрація частот навколо діагоналі з верхнього лівого кута у правий нижній свідчить про наявність стохастичного зв’язку.

Для оцінки щільності зв’язку обчислимо коефіцієнт спряженості Чупрова, тому що кількість груп за факторною ознакою – віком та результативною – тип інвестора щодо схильності до ризику однакова: mx = 3, m y = 3. Обчислимо значення квадратичної спряженості Пірсона :

Фактичне значення показника значно перевищує критичне, яке ми знайдемо за таблицями для заданої імовірності 0,95 та числа ступенів свободи

K = ( mx – 1 )( my – 1 ) = ( 3 – 1 )( 3 – 1 ) = 4 Отже, істотність зв’язку між віком респондентів та схильністю їх до ризику доведена з імовірністю 0,95.

Коефіцієнт взаємної спряженості: тобто зв’язок між ознаками помірний.

Ряди динаміки

1. Вивантаження вагонів за відділенням залізниці (тис. ум. ваг.) характеризується даними:

Таблиця 22.

МісяціВивантаженоМісяціВивантажено
Січень40,4Липень40,8
Лютий36,3Серпень44,8
Березень40,6Вересень49,4
Квітень38,0Жовтень48,9
Травень42,2Листопад46,4
Червень48,5Грудень40,2

Провести згладжування ряду динаміки методом тричленної та чотиричленної плинної середньої. Зробити висновок про тенденцію обсягів вивантаження вагонів за відділенням залізниці.

Розв’язання.

Тенденція – деякий загальний напрямок розвитку. Очевидно, що в окремі місяці вивантаження вагонів зменшувалося в порівнянні з раніше досягнутим рівнем.

Для виявлення загальної тенденції розвитку іноді використовують так звані плинні середні, тобто середні укрупнених інтервалів, утворених шляхом послідовного виключення початкового члена інтервалу і заміни його черговим членом ряду динаміки.

Рухливі тричленні середні вивантаження вагонів за відділенням залізниці ( тис. ум. ваг. ):

Таблиця 23.

МісяціВивантаженоПлинна тримісячна сумаПлинна середня
Січень40,4
Лютий36,3117,339,1
Березень40,6114,938,3
Квітень38120,840,3
Травень42,2128,742,9
Червень48,5131,543,8
Липень40,8134,144,7
Серпень44,813545,0
Вересень49,4142,147,4
Жовтень47,9143,747,9
Листопад46,4139,546,5
Грудень45,2

У даному прикладі як укрупнений інтервал узятий період у три місяці. Перша рухлива середня розрахована з даних про вивантаження вагонів за січень, лютий, березень, друга – з даних за лютий, березень, квітень і т. д. Конкретні значення рухливих середніх відносять до середини інтервалу. Новий ряд динаміки чітко показує, що обсяг вивантаження вагонів поступово збільшується, чого не можна було сказати на основі місячних даних.

МісяціВивантаженоПлинні чотиричленні сумиПлинні чотиричленні середніЦентровані плинні середні
Січень40,4
Лютий36,3
Березень40,6155,338,839,1
Квітень38,0157,139,340,8
Травень42,2169,342,342,4
Червень48,5169,542,443,2
Липень40,8176,344,145,0
Серпень44,8183,545,945,8
Вересень49,4182,945,746,4
Жовтень47,9188,547,147,2
Листопад46,4188,947,2
Грудень45,2

Таблиця 24.

При парному числі членів ряду, що входять в укрупнений інтервал, середина його не збігається з конкретним періодом чи датою. Так, при чотиричленному інтервалі середина першого буде знаходитися між другим і третім членами ряду, середина другого між третім і четвертим і т. д.

При розрахунку рухливих середніх з парного числа членів ряду виконується так зване центрування рухливих середніх, тобто віднесення їх до визначеного періоду чи дати. З цією метою з рухливих середніх обчислюються у свою чергу рухливі двочленні середні. Середина цього нового інтервалу, що охоплює первинні рухливі середні, обчислені з парного числа членів ряду динаміки, завжди збігається з конкретним періодом чи датою.

В цьому випадку новий ряд динаміки також показує, що обсяг вивантаження вагонів поступово збільшується.

2. Динаміка експорту цукру ( тис. т ) характеризується даними:

Таблиця 25.

Рік19992000200120022003
Експорт, тис. т3739434852

A) описати тенденцію зростання експорту цукру лінійним трендом, пояснити зміст параметрів трендового рівняння;

B) припустивши, що виявлена тенденція збережеться, визначити очікувані обсяги експорту в 2004 році;

C) з імовірністю 0,95 визначити довірчі інтервали прогнозного рівня.

Розв’язання.

Більш вживаним прийомом вивчення загальної тенденції в рядах динаміки є аналітичне вирівнювання. При вивченні загальної тенденції методом аналітичного вирівнювання виходять з того, що зміни рівнів ряду динаміки можуть бути з тим чи іншим ступенем точності наближення виражені визначеними математичними функціями. В нашому прикладі ми побудуємо лінійний тренд, який характеризуватиме тенденцію зміни експорту цукру.

Лінійний тренд має вигляд уt =a+bt, де уt – рівні ряду, звільнені від коливань, вирівняні по прямій; а – початковий рівень ряду в момент чи період, прийнятий за початок відліку часу; b – середній абсолютний приріст (середня зміна за одиницю часу), константа тренда.

Розраховуються параметри трендових рівнянь методом найменших квадратів. Для лінійної функції параметри знаходять із системи рівнянь:

, .

Система рівнянь спрощується, якщо початок відліку часу (t =0 ) перенести в середину динамічного ряду. Тоді значення t, розміщені вище середини, будуть негативними, а нижче – позитивними. При непарному числі членів ряду змінної t присвоюється значення з інтервалом одиниця: -2, -1, 0, 1, 2; при парному – з інтервалом два: -5, -3, -1, 1, 3, 5. В розглядуваному прикладі п’ять рівнів ряду, тому маємо наступні розрахунки:

Таблиця 26.

РікЕкспорт, тис. тTTytY розр. t( yt – y розр. t )2
199937-2-74361
200039-1-3939,90,81
2001430043,80,64
20024814847,70,09
200352210451,60,16
Сума2190392192,7

В обох випадках at = 0, а система рівнянь приймає вид: , .

Значення можна визначити за формулою для непарної кількості членів ряду

Звідси, ,

Отже, тобто середній рівень експорту цукру становив 43,8 тис. т. Щорічно експорт цукру зростає у середньому на 3,9 тис. т. За умови, що комплекс причин, який формує тенденцію, ближчим часом не зміниться, можна продовжити тенденцію за межі динамічного ряду. Очікуваний обсяг експорту цукру в 2004 році становить у2004 = 43,8 + 3,9 . 3 = 55,5 тис. т.

Це точкова оцінка прогнозу. Інтервальна оцінка прогнозу, тобто довірчі інтервали, визначаються з деякою імовірністю за формулою ± tsp, де sp – помилка прогнозу, t – довірче число (відношення Стьюдента), v – період випередження.

Помилка прогнозу для обсягу експорту цукру в 2004 році: ,

Де – оцінка дисперсії залишків, n – кількість спостережень, k – кількість параметрів рівняння.

Критичне значення двостороннього t – критерію для імовірності 0,95 та числа ступенів свободи ( n – 2 ) = 5 – 2 = 3 становить

Tsp = 3,18 . 1,38 = 4,39 і довірчий інтервал прогнозного рівня 55,5 ± 4,39 тис. т. Це означає, що в 2004 році можна з імовірністю 0,95 очікувати обсяг експорту цукру не менше 51,11 тис. т але не більше 59,89 тис. т.

Індекси

1. Маємо дані за споживчим ринком міста про середні ціни та обсяги реалізації продукції:

Таблиця 27.

МісяцьТовар АТовар В
Ціна за одиницю, грн.Кількість проданого товару, кгЦіна за одиницю, грн.Кількість проданого товару, кг
Березень1,550003,84000
Квітень1,460003,94500

Обчислити:

A) індивідуальні індекси цін на кожний товар;

B) загальні індекси цін, обсягів та товарообігу на всі товари в цілому, причому перші два за схемами індексів Пааше та Ласпейреса;

C) показати взаємозв’язок індексів;

D) абсолютний приріст товарообігу в цілому та за рахунок факторів: рівня цін та обсягів реалізованих товарів.

Розв’язання.

Для розвязання задачі перенесемо дані таблицю 17 в таблицю 18. Туди ж записуватимемо розрахункові дані, необхідні для обчислення індексів.

Таблиця 28.

ТоварЦіна за одиницю, грн.Кількість проданого товару, кгP0 q0P1 q1P0 q1P 1 q 0
БерезеньКвітеньБерезеньКвітень
P 0P1Q0Q1
Гр. 1Гр. 2Гр. 3Гр. 4Гр. 5Гр. 6 = гр. 2 .гр. 4Гр. 7 = гр. 3 .гр. 5Гр. 8 = гр. 2 .гр. 5Гр. 9 = гр. 3 .гр. 4
А1,51,4500060007500840090007000
В3,83,94000450015200175501710015600
Всього90001050022700259502610022600

Індивідуальні індекси цін на кожний товар:

Ціна товару А в квітні порівняно з березнем зменшилася на 7 %, тоді як ціна товару В зросла на 3 %.

Загальний індекс товарообігу

Загальний індекс цін на обидва товари в цілому за схемою індексів Пааше:

В загальному ціни зменшилися на 0,6 %.

Загальний індекс цін на обидва товари в цілому за схемою індексів Ласпейреса:

В загальному ціни зменшилися на 0,4 %.

Загальний індекс обсягу реалізованих товарів в цілому за схемою індексів Пааше:

В загальному обсяг реалізації збільшився на 14,8 %.

Загальний індекс обсягу реалізованих товарів в цілому за схемою індексів Ласпейреса:

В загальному обсяг реалізації збільшився на 15,0 %.

В даному прикладі індекси Ласпейреса мають дещо більше значення ніж індекси Пааше.

Відомо, що Індекс товарообігу дорівнює добутку індексу цін, розрахованому як індекс Пааше, та індексу обсягу, розрахованому як індекс Ласпейреса, і навпаки. Перевірте це самостійно.

Абсолютну зміну товарообігу в цілому та за рахунок факторів можна як різницю між чисельником та знаменником відповідного індексу.

За рахунок зміни цін на товари величина товарообігу зменшилась на 150 грн., а за рахунок зміни обсягів – збільшилася на 3400 грн., що в загальному склало збільшення товарообігу на 3250 грн.

2. Дані про динаміку випуску та цін трьох товарів – представників продукції галузі вміщено в таблиці:

Таблиця 29.

Товари – представникиПриріст цін, %Вартість випуску, тис. грн.
19961999
А+5,010001600
В+1,515001100
С+3,530002500

Знайти:

A) зведені індекси цін та обсягів за трьома товарами;

B) середньорічний приріст цін у цілому за трьома товарами.

Розв’язання.

Таблиця 30.

Товари – представникиПриріст цін, %

Індекси цін

Вартість випуску, тис. грн.

1996

1999

А+5,01,0510001600
В+1,51,01515001100
С+3,51,03530002500
Всього45005200

Використаємо для обчислення індексу цін формулу середньозваженого гармонічного індексу:

Отже, ціни зросли на 3,5 %.

Вартість товарів збільшилась на 15,6 5. Використовуючи зв’язок між індексами, знайдемо індекс обсягу:

Обсяги товарів збільшились на 11,6 5. Цей індекс можна було знайти як середній арифметичний індекс з індивідуальних індексів обсягу для кожного товару з вагами – товарообігом базисного періоду. Проте нам не відомі індивідуальні індекси обсягів, і для обчислення шуканої величини ми використовуємо зв’язок між індексами.

Середній темп приросту: Де Середньорічний темп росту. Період з 1996 по 1999 рік складається з трьох років, тобто n =3, підкореневий вираз – базисний темп росту цін, в якості якого ми використовуємо обчислений індекс – 1,035. Таким чином,

В середньому з кожним роком ціни зростали на 1,153 %.

3. За наведеними в таблиці даними обчислити:

A) індекси середньої матеріаломісткості продукції змінного та фіксованого складу;

B) індекс впливу структурних зрушень;

C) зміну загального обсягу матеріальних витрат і в тому числі за рахунок окремих факторів.

Таблиця 31.

ПоказникиПідприємство № 1Підприємство № 2
Базисний періодЗвітний періодБазисний періодЗвітний період
1. Вартість виробленої продукції, тис. грн.582,8570,1633,4712,5
2. Матеріальні витрати, тис. грн.376,2342,4410,2541,6

Розв’язання.

Таблиця 32.

ПідприємстваВартість виробленої продукції, тис грн.Матеріальні витрати, тис грн.Матеріаломісткість виробленої продукції, грн.MM0. Q1
Базисний, Q0Звітний, Q1Базисний, M0Звітний, M1Базисний, MM0Звітний, MM1
№ 1582,8570,1376,2410,20,650,72368,00
№ 2633,4712,5342,4541,60,540,76385,16
Разом1216,21282,6718,6951,8753,16

Спочатку обчислимо матеріаломісткість, розділивши величину матеріальних витрат на вартість виробленої продукції. Дані розрахунків запишемо в таблицю.

Тис грн. )

Тис грн. )

Тис грн. )

Середня матеріаломісткість продукції збільшилась на 25,6 %, за рахунок збільшення матеріаломісткості на окремих підприємствах – на 26,4 %, а за рахунок змін в обсягах виробництва – на 0,6 % зменшилася. При цьому в цілому матеріальні витрати збільшилися на 233,2 тис грн., за рахунок збільшення матеріаломісткості – на 198, 6 тис грн., а за рахунок змін обсягів виробництва – на 34, 6 тис грн.


Зведення та групування даних