Кластерный анализ. Классификация при сегментировании данных



Иерархический кластерный анализ используется для классификации набора объектов, когда заранее не известно число групп, на которые этот набор нужно разбить. Группы, на которые разбита выборка, называются кластерами.

Кластер – калька английского слова «cluster», которое переводится как «сгусток», «гроздь (винограда)», «скопление (звезд)» и т.п.

Отличием кластерного анализа от метода к-средних является то, что при кластерном анализе НЕ задается заранее число групп, на которые разбивается набор объектов.

Приведем примеры задач, решаемых с помощью кластерного анализа.

1. Определение групп потребителей. Вариантами этой задачи являются следующие проблемы:

– По результатам опроса потенциальных покупателей найти и описать/понять различные рыночные сегменты.

– Прежде, чем фирма определится, какие сегменты рынка создают для нее наибольшие возможности, надо решить, какие сегменты уже существуют.

– Для разбиения потребителей на группы можно выбирать разные наборы характеристики объектов, например возраст, образование, место жительства, тип личности, и так далее. Несложно разделить покупателей на сегменты по одной (или по каждой) характеристике. Кластерный анализ может помочь выявить уже сложившееся разбиение потребителей на «группы со схожими потребностями в отношении конкретного товара или услуги, достаточными ресурсами, а также готовностью и возможностью покупать» учитывая все выбранные показатели одновременно.

2. На рынке присутствует большой выбор товаров одного назначения под разными торговыми марками. Надо разбить товары на группы схожих товаров.

Иногда такое разбиение известно и получается без применения статистической техники. Например, компьютеры бывают «для дома», «для офиса», «серверы» и «специализированные». Кластерный анализ применяется, если нет классификации, признанной всеми. (Но результат будет зависеть от  выбора набора показателей.)

3. Страховая компания может интересоваться тем, на какие группы разделяются потенциальные покупатели. Результаты классификации используются, чтобы для разных групп определять оптимальные цены на услуги, оптимальные тарифы.