Статистические гипотезы: основные понятия



Процедура прикладного статистического анализа должна включать в себя проверку статистических гипотез.

Проверка статистических гипотез – один из методов отвечать на вопросы, связанные с распределением какой-либо случайной величины. Важно отметить, что правильно формулировать вопросы очень сложно. Корректно отвечать на них, используя данные, имеющиеся в распоряжении аналитика – не легче. Поэтому список вопросов, на которые умеет отвечать теория проверки статистических гипотез,  ограничен,  в данной главе будут рассмотрены три процедуры.

Основное условие применения статистических тестов – задаваемый вопрос должен касаться какой-либо характеристики массового явления. Конечно, возможно обсуждение нескольких характеристик одновременно, но это усложняет задачу.

Второе условие – независимость наблюдений между собой. Например, при проведении опроса, опрашиваемые выбираются случайным образом, и можно предполагать, что их ответы не зависят друг от друга. Из этого правила имеются два исключения: - анализ временного ряда, например, в задачах прогнозирования. В этом случае обычно поздние значения зависят от предыдущих. Во-вторых, при повторных наблюдениях одних и тех же объектов.

Третье условие – вопрос должен быть относительно простым и четко сформулированным. Для прикладных статистиков третье ограничение может выглядеть и так: вопрос должен принадлежать списку «допустимых» вопросов.

На практике часто приходится на основе результатов обследований, испытаний и т. д. проверять различные предположения о характеристиках массового явления. Приведем некоторые примеры.

  1. В обычных условиях зафиксирован некоторый уровень продаж. Руководство компании ожидает, что в результате рекламной компании уровень продаж увеличился. На основе данных о продажах нужно, во-первых, определить, существенно ли это увеличение, и во-вторых, компенсировало оно затраты на рекламу или нет (т.е. окупились ли затраты на рекламу).
  2. При появлении нового варианта упаковки товара, требуется проверить предположение, что товар в новой упаковке имеет в данном регионе больший уровень продаж, чем вариант в старой упаковке.
  3. Верно ли, что основной конкурент действует на том же сегменте рынка, что и фирма «Х»? При ответе на этот вопрос может потребоваться проверить, одинаково ли распределение по возрасту у покупателей товаров фирмы «Х» и ее основного конкурента.
  4. Фирма изучает постоянных покупателей своей продукции, для того, чтобы увеличить их лояльность и количество. В рамках этой задачи аналитик проверяет, зависит ли лояльность потребителя от его пола, возраста, уровня образования. Этот вопрос может быть переформулирован и так: проверить гипотезы о независимости а) уровня лояльности и пола потребителей; б) уровня лояльности и возраста потребителей; в)  уровня лояльности и уровня образования потребителей.

Далее может возникнуть необходимость проверить, различаются ли средние значения изучаемых показателей у лояльных и не лояльных покупателей.