Lección 40 ª

 


 

 

 

 

 

 

 

 

 LECCIÓN 40: ANALISIS DE CONGLOMERADOS NO JERARQUICO.

 

Análisis de conglomerados de K medias

 

                               Centros iniciales de los conglomerados

 

 

Conglomerado

  

1

2

3

4

Puntua(DIST)

-,00150

-,16629

2,54097

-1,06087

Puntua(M16A)

,66697

-,88063

-1,20918

2,13028

Puntua(M65A)

-,56897

,50804

1,80299

-2,14521

Puntua(TACTIV)

,30740

-,85507

-2,01755

1,80202

Puntua(AGRI)

-,91368

-,98207

1,46590

-1,39395

Puntua(IND)

-,87756

2,32399

-1,62352

1,88052

Puntua(CONS)

2,23162

-,99370

,04481

-,62465

Puntua(SERV)

,74746

-,65590

-,16274

,15892

Puntua(EMP)

,02780

-1,30587

2,54899

-1,67523

Puntua(ASAL)

,01608

1,51985

-2,40261

1,79448

 

En este procedimiento, el historial de iteraciones se limita a registrar los distintos cambios producidos entre los centros de los grupos:

 

                                      Historial de iteraciones(a)

 

Iteración

Cambio en los centros de los conglomerados

  

1

2

3

4

1

2,066

1,500

2,405

1,625

2

,140

,793

,167

,288

3

,151

,370

,017

,195

4

,007

,053

,002

,016

5

,000

,008

,000

,001

6

1,415E-05

,001

1,667E-05

,000

7

6,433E-07

,000

1,667E-06

9,411E-06

8

2,924E-08

2,201E-05

1,667E-07

7,842E-07

9

1,329E-09

3,144E-06

1,667E-08

6,535E-08

10

6,042E-11

4,492E-07

1,667E-09

5,446E-09

a  Se han detenido las iteraciones debido a que se ha alcanzado el número máximo de iteraciones. Las iteraciones no han logrado la convergencia. El cambio máximo de coordenadas absolutas para cualquier centro es de 2,246E-07. La iteración actual es 10. La distancia mínima entre los centros iniciales es de 5,034.

 

Naturalmente, no se ha producido la convergencia del procedimiento debido a que la exigencia que habíamos impuesto es muy fuerte, en el sentido de que solo admitiremos que el algoritmo ha llegado al final cuando no se producen más cambios.

 

La clasificación individual de cada paso en el conjunto general de observaciones se almacena en una nueva variable, llamada qcl_1 (se puede comprobar su aparición en la hoja de datos), y su distancia al centro del conglomerado al que pertenece en otra nueva variable, llamada qcl_2. En el visor de resultados aparece la siguiente tabla:

 

                          Pertenencia a los conglomerados

 

Número de caso

NOMBRE

Conglomerado

Distancia

1

Albalate de Zorita

1

1,753

2

Albares

2

1,675

3

Alcolea del Pinar

3

2,473

4

Almoguera

1

2,029

5

Almonacid de Zorita

4

2,273

6

Alovera

4

1,383

7

Anguita

3

2,002

8

Atienza

1

2,020

9

Azuqueca de Henares

4

1,993

10

Brihuega

1

1,228

11

Budia

1

1,761

12

Cabanillas del Campo

4

1,429

13

Casar (El)

4

2,058

14

Checa

3

2,864

15

Chiloeches

4

1,753

16

Cifuentes

4

1,347

17

Cogolludo

1

1,147

18

Corduente

3

1,878

19

Driebes

1

2,288

20

Espinosa de Henares

2

1,539

21

Fontanar

4

,897

22

Galve de Sorbe

3

3,412

23

Guadalajara

4

2,585

24

Horche

1

2,074

25

Humanes

2

1,181

26

Illana

3

2,316

27

Jadraque

1

1,799

28

Mandayona

2

2,488

29

Maranch¢n

3

2,380

30

Mazuecos

1

2,685

31

Molina de Arag¢n

1

3,020

32

Mond‚jar

1

1,853

33

Pareja

1

1,576

34

Pastrana

1

1,406

35

Saced¢n

1

2,156

36

Sigenza

1

2,426

37

Tendilla

1

2,244

38

Torija

1

2,649

39

Torrej¢n del Rey

2

1,991

40

Torremocha del Campo

3

1,998

41

T¢rtola de Henares

2

,936

42

Trillo

4

1,618

43

Uceda

1

2,072

44

Villanueva de Alcor¢n

1

2,138

45

Villel de Mesa

3

2,478

46

Yebra

1

2,105

47

Yunquera de Henares

4

1,718

 

La matriz anterior nos muestra, caso por caso, el conglomerado de pertenencia de cada caso, así como la distancia existente del centroide con cada uno de los casos en cuestión.

 

                                 Centros de los conglomerados finales

 

 

Conglomerado

  

1

2

3

4

Puntua(DIST)

-,00150

-,58219

1,28281

-,72915

Puntua(M16A)

-,00205

-,35036

-1,25000

1,21775

Puntua(M65A)

,01606

,23309

1,29293

-1,21564

Puntua(TACTIV)

-,08009

-,35687

-1,02114

1,18304

Puntua(AGRI)

-,23552

-,04608

1,55759

-,79964

Puntua(IND)

-,33632

1,03388

-1,05731

,94321

Puntua(CONS)

,58182

-,40709

-,61347

-,38676

Puntua(SERV)

,31316

-,84244

-,49230

,26445

Puntua(EMP)

,13855

-,34911

1,41540

-1,23214

Puntua(ASAL)

-,16448

,26434

-1,33063

1,25852

 

Por último, se presentan las distancias entre los centroides de los conglomerados resultantes:

 

             Distancias entre los centros de los conglomerados finales

 

Conglomerado

1

2

3

4

1

 

2,287

3,811

3,454

2

2,287

 

4,315

3,244

3

3,811

4,315

 

6,722

4

3,454

3,244

6,722

 

 

                                                                                         ANOVA

 

 

Conglomerado

Error

F

Sig.

  

Media cuadrática

gl

Media cuadrática

gl 

 

Puntua(DIST)

 

 

 

 

 

 

7,564

3

,542

43

13,955

,000

 

Puntua(M16A)

10,370

3

,346

43

29,951

,000

Puntua(M65A)

10,544

3

,334

43

31,555

,000

Puntua(TACTIV)

8,560

3

,473

43

18,112

,000

Puntua(AGRI)

10,015

3

,371

43

26,994

,000

Puntua(IND)

9,545

3

,404

43

23,638

,000

Puntua(CONS)

4,379

3

,764

43

5,729

,002

Puntua(SERV)

3,089

3

,854

43

3,617

,020

Puntua(EMP)

11,955

3

,236

43

50,718

,000

Puntua(ASAL)

11,448

3

,271

43

42,238

,000

Las pruebas F sólo se deben utilizar con una finalidad descriptiva puesto que los conglomerados han sido elegidos para maximizar las diferencias entre los casos en diferentes conglomerados. Los niveles críticos no son corregidos, por lo que no pueden interpretarse como pruebas de la hipótesis de que los centros de los conglomerados son iguales.

 

Y se indica el número de casos que han resultado incluidos en cada conglomerado:

 

Número de casos en cada conglomerado

 

Conglomerado

1

21,000

  

2

6,000

  

3

9,000

  

4

11,000

Válidos

47,000

Perdidos

,000

 

Finalmente, tenemos cuatro conglomerados resultantes, y el total de casos pertenecientes a cada conglomerado, además tenemos 47 casos válidos y ningún caso perdido.  El conglomerado con mayor número de casos es el 1 con 21 y el conglomerado menor es el 2 con 6 casos. Si quisiéramos saber el orden o jerarquía de los conglomerados resultantes, tendríamos en este caso que aplicar una técnica de análisis de conglomerado jerárquico.