Составление уравнения линейной регрессии
Наряду с корреляционным анализом для характеристики взаимосвязей между определенными параметрами используется понятие регрессии. Регрессия — это математическое отражение зависимости величины одного показателя от другого.
Если зависимость описывается уравнением прямой типа у = ах + b, то говорят о линейной регрессии. Если же функциональная связь между параметрами подчиняется какому-либо другому закону, то в этих случаях регрессия будет нелинейной.Для проведения любого регрессионного анализа нужно переместиться в статистический модуль Multiple regression (Множественная регрессия) и открыть нужный файл. После этого в диалоговом окне Multiple regression нужно нажать кнопку Variables. Открывается второе окно, где нужно указать номер столбца, содержащего значения независимой переменной (аргумента), и номер столбца, содержащего значения зависимой переменной (функции). В примере (см. рис. III.78) значения аргументов содержатся в столбце РОСТ (указываем номер 1 в строке Independent variable list), а значения функции — в столбце ВЕС (указываем номер 2 в строке Dependent var. (or list for batch), после чего нажимаем кнопку OK). Кроме того, в окне Multiple regression нужно установить следующие параметры:
? в строке Input file — флажок Raw Data;
? в строке MD deletion — флажок Casewise;
? в строке Mode — флажок Standard;
? установить флажок Perform default analysis;
Произведя эти установки, следует нажать кнопку ОК.
Появляется новое окно Multiple Regression Results, в котором нужно нажать кнопку Regression Summary, после чего откроется суммарная таблица вывода, в которой приведен ряд параметров (рис. III.80). В строке над названиями столбцов из приведенных параметров наибольший интерес представляют следующие: коэффициент корреляции R (в данной таблице R = 0,97667517), RI — степень точности описания модели процесса (RI = 0,95389439), р — уровень значимости критерия Фишера (р = 0,00000). Модель является достоверной лишь в тех случаях, когда р < 0,05.
Коэффициент RI можно трактовать следующим образом:? если RI > 0,95, то предложенная модель хорошо описывает процесс;
? если RI < 0,95, но > 0,8, то модель удовлетворительно описывает процесс;
? если RI < 0,8, то модель недостаточно хорошо описывает процесс и требуется внести уточнения.
Рис. III.80. Суммарная таблица вывода
В нашем примере р < 0,05, a RI > 0,95, что свидетельствует о том, что между переменными РОСТ и ВЕС существует достоверная линейная связь, а предложенная модель линейной регрессии точно описывает взаимосвязь между ними.
Теперь обратимся к числовым значениям, которые содержатся в строках и столбцах. В строке Intercept содержатся параметры, характеризующие свободный член уравнения, а в расположенной под ней строке РОСТ — независимую переменную. Из приведенных показателей наибольшее значение представляют те, которые расположены в столбцах В и р-level. В столбце В строки Intercept приводится значение свободного члена, а в этом же столбце строки РОСТ — коэффициент, стоящий перед независимой переменной. Так как и в первом, и во втором случаях значения р в столбце р-level < 0,05, то оба из этих коэффициентов достоверны, и уравнение линейной регрессии примет следующий вид: ВЕС = —111,126 + 1,06 • РОСТ. Если же какой-либо из указанных коэффициентов является недостоверным (значение р в столбце р-іеѵеі > 0,05), то он не включается в уравнение линейной регрессии.