Простая линейная регрессия



Если коэффициент корреляции измеряет выраженность линейной связи между переменными, то в регрессионном анализе строится линейное уравнение, описывающее статистическую зависимость переменной y от переменной x. В результате аналитик может прогнозировать значение переменной y, более того, если он способен изменять значение переменной x, он может в некоторой степени управлять переменной y. Например, если y – уровень продаж, а x – затраты на рекламу, то можно управлять уровнем продаж, подбирая оптимальное значение переменной x. Понятно, что способность управлять ограничена, поскольку на уровень продаж влияют не только затраты на рекламу, но и многие другие показатели, которыми труднее управлять, достаточно упомянуть цену! Кроме того, необходимо, чтобы была справедлива исходная гипотеза о виде зависимости переменных, а это часто не так.

В результате линейного регрессионного анализа получаются оценки коэффициентов a и b уравнения регрессии: y=a+bx. Уравнение определяет прямую, наиболее близко проходящую ко всем точкам с координатами xi ,yi . Эти точки, как и ранее, соответствуют анализируемым наблюдениям.

В учебниках используются разные термины для переменных x и y. Нам придется пользоваться самым неудачным вариантом: переменная x будет называться независимой, а переменная y – зависимой, поскольку таков был выбор разработчиков SPSS. Эти термины создают путаницу, так как часто приходится изучать зависимость независимых переменных, будьте к этому готовы…

Коэффициент а определяет смещение прямой, определяемой уравнением регрессии, коэффициент b определяет угол наклона прямой b =tg(a), где a - угол между линией регрессии и осью ОХ.

Коэффициент регрессии b определяет силу связи между переменными x и y, поскольку он показывает, на сколько единиц, в среднем, изменится отклик y, если предиктор x изменится ровно на единицу. Чем больше b, тем связь сильнее. Однако имейте в виду, что значение b зависит от единиц, в которых измерены переменные. Например, уменьшение x в 1000 раз (раньше x измеряли в рублях, а потом в тысячах рублей) увеличит b в тысячу раз, хотя сила связи останется той же самой.

Величина параметра а называется константой регрессии (свободным членом).