Unha das ferramentas para resolver problemas económicos é a análise de cluster. Con el, os clústeres e outros obxectos da matriz de datos clasifícanse en grupos. Esta técnica pode usarse en Excel. Vexamos como se fai isto na práctica.
Usando análise de clúster
Coa axuda da análise de clúster, é posible levar a cabo a mostraxe cuxa base se investiga. A súa tarefa principal é dividir unha matriz multidimensional en grupos homoxéneos. Como criterio para agrupar, utilízase o coeficiente de correlación de pares ou a distancia euclidiana entre obxectos por un parámetro dado. Os valores máis próximos agrúpanse.
Aínda que a maioría das veces este tipo de análise emprégase na economía, tamén se pode usar en bioloxía (para a clasificación de animais), psicoloxía, medicina e en moitas outras áreas da actividade humana. Pódese aplicar a análise de clúster mediante o conxunto de ferramentas de Excel para este propósito.
Exemplo de uso
Temos cinco obxectos, que se caracterizan por dous parámetros estudados - x e y.
- Aplique a estes valores a fórmula de distancia euclidiana, que se calcula a partir do modelo:
= ROOT ((x2-x1) ^ 2 + (y2-y1) ^ 2
- Este valor calcúlase entre cada un dos cinco obxectos. Os resultados do cálculo colócanse na matriz de distancia.
- Nós miramos, entre os valores que a distancia é a mínima. No noso exemplo, estes son obxectos. 1 e 2. A distancia entre eles é de 4,123106, que é menor que entre outros elementos desta poboación.
- Combinamos estes datos nun grupo e formamos unha nova matriz onde os valores 1,2 é un elemento separado. Ao compilar a matriz, deixe os valores máis pequenos da táboa anterior para o elemento combinado. De novo miramos, entre os elementos a distancia é mínima. Esta vez é 4 e 5así como un obxecto 5 e grupo de obxectos 1,2. A distancia é de 6,708204.
- Engadimos os elementos especificados ao clúster común. Formamos unha nova matriz co mesmo principio que o tempo anterior. É dicir, buscamos os valores máis pequenos. Así, vemos que o noso conxunto de datos pódese dividir en dous grupos. No primeiro cluster están os elementos máis próximos - 1,2,4,5. No segundo cluster, no noso caso só hai un elemento. 3. Está relativamente lonxe doutros obxectos. A distancia entre os clusters é 9,84.
Isto completa o procedemento para dividir a poboación en grupos.
Como podes ver, aínda que en xeral a análise de clúster pode parecer complicada, pero en realidade non é tan difícil comprender os matices deste método. O principal é comprender o patrón básico de asociación en grupos.