КОНТРОЛЬНАЯ РАБОТА 1
Задание 1
По территориям региона за некоторый год приводятся данные о среднедушевом прожиточном минимуме в день на одного трудоспособного жителя страны (региона) в рублях, обозначаемые х, и среднедневная заработная плата в рублях – у. Соответственно: х – 78, 82, 87, 79, 89, 106, 67, 88, 73, 87, 76, 115; у – 133, 148, 134, 154, 162, 195, 139, 158, 152, 162, 159, 173.
1. Построить линейное уравнение парной регрессии у от х.
2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
3. Оценить статистическую значимость параметров регрессии и корреляции и самого уравнения регрессии в целом.
Решение:
Поле корреляции
Для оценки параметров ? и ? – используют МНК (метод наименьших квадратов).
Система нормальных уравнений.
a•n + b?x = ?y
a?x + b?x2 = ?y•x
Для наших данных система уравнений имеет вид
12a + 1027 b = 1869
1027 a + 89907 b = 161808
Из первого уравнения выражаем а и подставим во второе уравнение:
Получаем эмпирические коэффициенты регрессии: b = 0.9204, a = 76.9765
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 0.9204 x + 76.9765
Для расчета параметров регрессии построим расчетную таблицу (табл. 1)
x
y
x2
y2
x • y
78
133
6084
17689
10374
82
148
6724
21904
12136
87
134
7569
17956
11658
79
154
6241
23716
12166
89
162
7921
26244
14418
106
195
11236
38025
20670
67
139
4489
19321
9313
88
158
7744
24964
13904
73
152
5329
23104
11096
87
162
7569
26244
14094
76
159
5776
25281
12084
115
173
13225
29929
19895
1027
1869
89907
294377
161808
1. Параметры уравнения регрессии.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
1.1. Коэффициент корреляции
Ковариация.