Описательные статистики



Начинающему аналитику очень трудно принять решение, с чего начать анализ данных. И нас часто спрашивают, что нужно сделать на первом шаге, что делать дальше? На первом шаге мы советуем строить диаграммы. Очень часто, глядя на «картинку» аналитик понимает, по какому пути нужно двигаться при проведении исследования. Следующим этапом статистического анализа любых  данных, как правило, является анализ основных статистических параметров, называемых описательными статистиками. Цель предлагаемых процедур – ознакомиться с данными, выявить имеющиеся особенности, выдвинуть гипотезы, которые помогут выбрать модель, описывающую данные. Этот вид анализа проводится различно в зависимости от того, в какой шкале измерены переменные.

Описательные статистики качественных переменных

Для качественных переменных проводят частотный анализ.

Вспомним, что при анализе переменных, измеренных в качественной шкале, запрещены многие операции. Например, нельзя вычислять среднее арифметическое. Более того, качественные переменные нельзя складывать. Нарушителям запрета придется встретиться с уравнениями вроде «Москва» + «Пекин»=«Хельсинки». Нельзя даже сравнивать разные значения одной переменной. Например, рассмотрим переменную «Любимый сорт пива респондента», сравнивая два ответа «пиво Пит» и «пиво «Бочкарев», при этом  нельзя сказать, какое из этих двух значений больше. С другой стороны, можно сравнивать содержание алкоголя в разных сортах пива, или объемы продаж сортов, но в этом случае изучаются уже другие переменные, измеряемые в количественной шкале.

Для анализа переменных, измеренных в номинальной шкале, существует ограниченный набор приемов. В первую очередь сравнивают количество наблюдений в разных группах. Например, сравнивается количество мужчин и количество женщин среди покупателей продукта, сравнивается количество лиц с высшим образованием и без него среди покупателей.

Заметим, что характеристика «количество наблюдений» зависит от объема выборки (например, от количества опрошенных). Это не6удобно, так как затрудняется сравнение показателей в выборках разного объема. Поэтому обычно вычисляют проценты (или доли, или частоты), которые составляют представители групп. Например, говорят о проценте женщин или о проценте лиц с высшим образованием среди покупателей.

Описательные статистики количественных переменных

При анализе количественных переменных аналитика могут интересовать такие характеристики как их среднее значение, минимальное значение, максимальное значение и т.д.