Функциональная и статистическая зависимость



Пример функциональной зависимости переменных: y=f(x). Это правило, в соответствии с которым по значениям переменной x однозначно определяются значения другой переменной y. Функция f – краткое обозначение правила. Именно функциональную зависимость все мы изучали в школе. Ее обычно иллюстрируют графиком функции. Например, функциональная зависимость может иметь вид y=ln(x). В рассматриваемом примере график может иметь следующий вид

функциональная зависимость

В данном примере зависимость даже взаимно однозначная: не только по аргументу x можно определить значение y, но и по y можно определить х. Но это верно не для всех функций, например синус не взаимно однозначная, если x определен на всей числовой оси.

Статистическая зависимость двух переменных – обобщение функциональной зависимости. В этом случае одному и тому же значению x могут соответствовать разные значения y. Например, один и тот же товар (например, мобильный телефон) продается в разных магазинах по разной цене, то есть одному и тому же товару соответствуют разные цены. В чем же тогда зависимость? По определению, статистическая зависимость – это функциональная зависимость среднего значения переменной y от значения переменной x. Заметим, что если применять вероятностную модель, то вместо среднего значения мы говорили бы о математическом ожидании случайной величины y. Откуда появляется среднее значение? Проводятся эксперименты (или наблюдается явление) при одном и том же значении x, при этом регистрируются разные значения y, затем эти значения усредняются. На практике не всегда заметно, что одному и тому же значению переменной x может соответствовать много значений y, например, когда не проводились повторные наблюдения при одном значении x.

При изучении взаимного влияния нескольких переменных, в частности при проведении корреляционного или регрессионного анализа, очень полезно анализировать диаграммы рассеяния. На диаграмме рассеяния каждому наблюдению соответствует точка. Координаты точки равны значениям переменных для этого наблюдения, первая координата равна значению первой переменной, вторая координата – значению второй переменной, и так далее.