Проверка гипотезы о законе распределения генеральной совокупности X по критерию Пирсона

Федеральное агентство по образованию РФ

Сибирская государственная автомобильно-дорожная академия (СибАДИ)

Кафедра: “Высшая математика” РАСЧЕТНО-ГРАФИЧЕСКАЯ РАБОТА Тема: “Проверка гипотезы о законе распределения генеральной совокупности X по критерию Пирсона” Выполнила: студентка 23ЭУТ

Хасянова А. Ф.

Проверил: Матвеева С. В

Дата_______________

Оценка_____________

Омск-2010

Содержание

1. Введение. Исходные данные

2. Вариационный ряд

3. Интервальный вариационный ряд

4. Построение гистограммы плотности относительных частот. Выдвижение гипотезы о законе распределения генеральной совокупности Х

5. Оценки числовых характеристик и параметров выдвинутого закона

6. Теоретическая функция плотности рассматриваемого закона распределения “Построение ее на гистограмме”

7. Проверка критерия Пирсона

Вывод

1. Исходные данные варианта №20

Дана выборка из генеральной совокупности случайной величины Х. Данные представлены в таблице 1.

Таблица 1

79,02

79,70

74,68

20,47

11,70

44,64

40,75

8,59

96,42

6,17

91,75

93,29

77,57

81,25

76,59

51,84

6,17

42,79

80,87

92,81

48,04

14,70

100,64

69,83

94,56

70,42

47,93

47,48

66,79

42,12

20,27

51,36

62,51

66,86

87,99

99,29

5,96

60,38

62,53

75,50

46,55

83,53

55,65

59,26

77,05

101,10

29,93

102,21

86,11

45,92

90,93

24,30

9,76

90,25

36,72

84,96

20,50

81,99

56,29

31,75

43,61

68,70

80,47

100,66

29,98

48,88

40,37

67,46

91,46

59,11

90,75

4,64

36,53

32,39

6,99

8,41

30,85

37,30

64,44

25,60

18,00

84,27

98,88

36,39

34,64

49,49

10,53

50,97

39,40

3,59

100,39

18,57

9,27

10,89

65,91

35,62

75,45

37,86

89,74

4,57

Выборка содержит 100 наблюдаемых значений, поэтому выборка имеет объем n=100.

2. Построение вариационного ряда

Операция расположения значений случайной величины по не убыванию называется ранжированием. Последовательность элементов х(1) ≤ х(2) ≤…≤ х(k) называется вариационным рядом, элементы которого называют вариантами.

Проранжировав статистические данные, получаем вариационный ряд (табл. 2).

Таблица 2

3,59

9,76

24,30

36,53

44,64

51,84

66,68

77,05

84,96

93,29

4,57

10,53

25,60

36,72

45,92

55,65

66,79

77,75

86,11

94,56

4,64

10,89

29,93

37,30

46,55

56,29

67,46

79,02

87,99

96,42

5,96

11,70

29,98

37,86

47,48

59,11

68,78

79,70

89,74

98,88

6,17

14,70

30,85

39,40

47,93

59,26

69,83

80,47

90,25

99,29

6,17

18,00

31,75

40,37

48,04

60,38

70,42

80,87

90,75

100,39

6,99

18,57

32,39

40,75

48,88

62,51

74,68

81,25

90,93

100,46

8,41

20,27

34,64

42,12

49,49

62,53

75,45

81,99

91,46

100,66

8,59

20,47

35,62

42,79

50,97

64,44

75,50

83,53

91,75

101,10

9,27

20,50

36,39

43,61

51,36

65,71

76,59

84,27

92,81

102,21

3. Построение интервального вариационного ряда

Опытные данные объединяем в группы так, чтобы в каждой отдельной группе значения вариант будут одинаковы, и тогда можно определить число, показывающее, сколько раз встречается соответствующая варианта в определенной (соответствующей) группе.

Численность отдельной группы сгруппированного ряда опытных данных называется выборочной частотой соответствующей варианты x(i) и обозначается mi; при этом , где n – объем выборки.

Отношение выборочной частоты данной варианты к объему выборки называется относительной выборочной частотой и обозначается Pi*,

Т. е. – число (частота) попаданий значений X в i-й разряд, n – объем выборки.

Т. к. согласно теореме Бернулли имеем, что т. е. выборочная относительная частота сходится по вероятности соответствующей вероятности, тогда из условия:

Интервальным вариационным рядом распределения называется упорядоченная совокупность частичных интервалов значений С. В. с соответствующими им частотами или относительными частотами.

Для построения интервального вариационного ряда выполняем следующие действия.

1. Находим размах выборки R = xmax – xmin. Имеем R = 102,21-3,59=98,62 .

2. Определяем длину частичного интервала ∆ – шаг разбиения по формуле Стерджеса: где n – объем выборки, К – число частичных интервалов. ,

3. ∆=10

4. Определяем начало первого частичного интервала

После разбиения на частичные интервалы просматриваем ранжированную выборку и определяем, сколько значений признака попало в каждый частичный интервал, включая в него те значения, которые ≥ нижней границы и меньше верхней границы. Строим интервальный вариационный ряд (табл. 3). Таблица 3

Разряды

Mi

=

1

[3.5-13.5)

14

0.14

0.014

8.5

2

[13.5-23.5)

6

0.06

0.006

18.5

3

[23.5-33.5)

7

0.07

0.007

28.5

4

[33.5-43.5)

12

0.12

0.012

38.5

5

[43.5-53.5)

12

0.12

0.012

48.5

6

[53.5-63.5)

7

0.07

0.007

58.5

7

[63.5-73.5)

8

0.08

0.008

68.5

8

[73.5-83.5)

12

0.12

0.012

78.5

9

[83.5-93.5)

13

0.13

0.013

88.5

10

[93.5-103.5)

9

0.09

0.009

98.5

Контроль

=100

=1

Где -плотность относительной частоты

-середина частичных интервалов

4. Построение гистограммы

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины , а высоты равны отношению – плотность частоты (или – плотность частности).

По данным таблицы 4 строим гистограмму (рис. 1).

Гистограмма частот является статистическим аналогом дифференциальной функции распределения (плотности) случайной величины Х. Площадь гистограммы равна единице.

Выдвижение гипотезы о законе распределения генеральной совокупности

По данным наблюдений статистическое среднее и выборочное среднее квадратическое отклонение у* по значению почти совпадают. Учитывая данный факт, а также вид гистограммы можно предположить, что случайная величина имеет равномерное распределение.

По виду гистограммы выдвигаем гипотезу о равномерном законе распределения генеральной совокупности Х.

5. Оценка числовых характеристик и параметров закона распределения

Оценками математической статистики называют приближенные значения числовых характеристик или параметров законов распределения генеральной совокупности Х вычисленные на основе выборки.

Оценка называется точечной, если она определяется числом или точкой на числовой оси.

Оценка (как точечная, так и интервальная) является случайной величиной, так как она вычисляется на основе экспериментальных данных и является функцией выборки.

При вычислении точечных оценок для удобства берут не сами элементы выборки, а середины частичных интервалов из интервального вариационного ряда (табл. 1) и применяют формулы:

Где n – объем выборки, – i-й элемент выборки

Составим таблицу для нахождения и

Таблица 4

I

1

8.5*14=119

2

18.5*6=111

3

28.5*7=199.5

4

38.5*12=462

5

48.5*12=582

6

58.5*7=409.5

7

68.5*8=548

8

78.5*12=942

9

88.5*13=1150.5

10

98.5*9=886.5

6. Равномерный закон

Интервальный вариационный генеральный совокупность

Выдвинута гипотеза о распределении генеральной совокупности Х по равномерному закону

Найдем функцию плотности равномерного закона вычислив оценки параметров и

,

Т. к М(x)= , , D(x)=

Таблица 5

I

1

2

3

4

5

6

7

8

9

10

186

После того, как найдены значения функции плотности для каждого разряда, нанесем их прямо на гистограмму, получая тем самым кривую функции плотности

7 Проверка гипотезы о законе распределения генеральной совокупности по критерию Пирсона

В качестве меры расхождения между статистическим и гипотетическим (теоретическим) распределениями возьмем критерий Пирсона К = ч2.

Пирсон доказал, что значение статистического критерия не зависит от функции и от числа опытов n, а зависит от числа частичных интервалов интервального вариационного ряда. При увеличении ч2, и находится по формуле:

К = или К =

Дальнейшие вычисления, необходимые для определения расчетного значения выборочной статистики , проведем в таблице 5.

Таблица 6

I

/

1

0.14

14

0.1029

10.29

13.76/10.37=1.33

2

0.06

6

0.1

10

16/10=1.6

3

0.07

7

0.1

10

16/10=1.6

4

0.12

12

0.1

10

16/10=1.6

5

0.12

12

0.1

10

16/10=1.6

6

0.07

7

0.1

10

16/10=1.6

7

0.08

8

0.1

10

16/10=1.6

8

0.12

12

0.1

10

16/10=1.6

9

0.13

13

0.1

10

16/10=1.6

10

0.09

9

0.1149

11.49

6.3/11.49=0.548

01.86

Чтобы найти значение Надо воспользоваться табличными распределениями в которых значение сл. величины находят по заданному уровню значимости и вычисленному числу степеней свободы

R – число частичных интервалов в таблице 1 но если в некоторых из интервалов значения То надо объединить расположенные рядом интервалы так, чтобы тогда число

R-это число из необъединенных интервалов

I – число неизвестных параметров

В рассматриваемом эмпирическом распределении не имеются частоты, меньшие 5. Случайная величина ч2 (мера расхождения) независимо от вида закона распределения генеральной совокупности при (n ≥ 50) имеет распределение ч2 с числом степеней свободы

1) К =

Уровень значимости б =1-=0,05

,

Найдем по таблице значений критическое значение для б = 0,05 и =9

Имеем =16.9. Так как то предполагаемая гипотеза о показательном законе распределения генеральной совокупности не противоречит опытным данным и принимается на уровне значимости б.

2)=,

=

3) M(x)= ,

M(x)=

4) D(x)=

D(x.1)=

5) Таким образом, критическая область для гипотезы задается неравенством ; P()= Это означает, что нулевую гипотезу можно считать правдоподобной и гипотеза Но принимается

Вывод: В ходе расчетно-графической работы мы установили, что генеральная совокупность X распределена по равномерному закону, проверив это по критерию Пирсона. Определили параметры и числовые характеристики закона и построили для них доверительные интервалы.


Зараз ви читаєте: Проверка гипотезы о законе распределения генеральной совокупности X по критерию Пирсона