|
|
|
|
LECCIÓN 40: ANALISIS DE CONGLOMERADOS NO JERARQUICO.
Análisis de
conglomerados de K medias
Centros
iniciales de los conglomerados
|
|
Conglomerado
|
|
1
|
2
|
3
|
4
|
|
Puntua(DIST)
|
-,00150
|
-,16629
|
2,54097
|
-1,06087
|
|
Puntua(M16A)
|
,66697
|
-,88063
|
-1,20918
|
2,13028
|
|
Puntua(M65A)
|
-,56897
|
,50804
|
1,80299
|
-2,14521
|
|
Puntua(TACTIV)
|
,30740
|
-,85507
|
-2,01755
|
1,80202
|
|
Puntua(AGRI)
|
-,91368
|
-,98207
|
1,46590
|
-1,39395
|
|
Puntua(IND)
|
-,87756
|
2,32399
|
-1,62352
|
1,88052
|
|
Puntua(CONS)
|
2,23162
|
-,99370
|
,04481
|
-,62465
|
|
Puntua(SERV)
|
,74746
|
-,65590
|
-,16274
|
,15892
|
|
Puntua(EMP)
|
,02780
|
-1,30587
|
2,54899
|
-1,67523
|
|
Puntua(ASAL)
|
,01608
|
1,51985
|
-2,40261
|
1,79448
|
En este procedimiento, el
historial de iteraciones se limita a registrar los distintos cambios
producidos entre los centros de los grupos:
Historial
de iteraciones(a)
|
Iteración
|
Cambio en los centros de los conglomerados
|
|
1
|
2
|
3
|
4
|
|
1
|
2,066
|
1,500
|
2,405
|
1,625
|
|
2
|
,140
|
,793
|
,167
|
,288
|
|
3
|
,151
|
,370
|
,017
|
,195
|
|
4
|
,007
|
,053
|
,002
|
,016
|
|
5
|
,000
|
,008
|
,000
|
,001
|
|
6
|
1,415E-05
|
,001
|
1,667E-05
|
,000
|
|
7
|
6,433E-07
|
,000
|
1,667E-06
|
9,411E-06
|
|
8
|
2,924E-08
|
2,201E-05
|
1,667E-07
|
7,842E-07
|
|
9
|
1,329E-09
|
3,144E-06
|
1,667E-08
|
6,535E-08
|
|
10
|
6,042E-11
|
4,492E-07
|
1,667E-09
|
5,446E-09
|
a Se han detenido las
iteraciones debido a que se ha alcanzado el número máximo de iteraciones. Las iteraciones no han
logrado la convergencia. El cambio máximo de coordenadas absolutas para
cualquier centro es de 2,246E-07. La iteración actual es 10. La distancia
mínima entre los centros iniciales es de 5,034.
Naturalmente,
no se ha producido la convergencia del procedimiento debido a que la
exigencia que habíamos impuesto es muy fuerte, en el sentido de que solo
admitiremos que el algoritmo ha llegado al final cuando no se producen más
cambios.
La clasificación individual de
cada paso en el conjunto general de observaciones se almacena en una nueva
variable, llamada qcl_1 (se puede comprobar su aparición en la hoja de
datos), y su distancia al centro del conglomerado al que pertenece en otra
nueva variable, llamada qcl_2. En el visor de resultados aparece la
siguiente tabla:
Pertenencia
a los conglomerados
|
Número de caso
|
NOMBRE
|
Conglomerado
|
Distancia
|
|
1
|
Albalate de Zorita
|
1
|
1,753
|
|
2
|
Albares
|
2
|
1,675
|
|
3
|
Alcolea del Pinar
|
3
|
2,473
|
|
4
|
Almoguera
|
1
|
2,029
|
|
5
|
Almonacid de Zorita
|
4
|
2,273
|
|
6
|
Alovera
|
4
|
1,383
|
|
7
|
Anguita
|
3
|
2,002
|
|
8
|
Atienza
|
1
|
2,020
|
|
9
|
Azuqueca de Henares
|
4
|
1,993
|
|
10
|
Brihuega
|
1
|
1,228
|
|
11
|
Budia
|
1
|
1,761
|
|
12
|
Cabanillas del Campo
|
4
|
1,429
|
|
13
|
Casar (El)
|
4
|
2,058
|
|
14
|
Checa
|
3
|
2,864
|
|
15
|
Chiloeches
|
4
|
1,753
|
|
16
|
Cifuentes
|
4
|
1,347
|
|
17
|
Cogolludo
|
1
|
1,147
|
|
18
|
Corduente
|
3
|
1,878
|
|
19
|
Driebes
|
1
|
2,288
|
|
20
|
Espinosa de Henares
|
2
|
1,539
|
|
21
|
Fontanar
|
4
|
,897
|
|
22
|
Galve de Sorbe
|
3
|
3,412
|
|
23
|
Guadalajara
|
4
|
2,585
|
|
24
|
Horche
|
1
|
2,074
|
|
25
|
Humanes
|
2
|
1,181
|
|
26
|
Illana
|
3
|
2,316
|
|
27
|
Jadraque
|
1
|
1,799
|
|
28
|
Mandayona
|
2
|
2,488
|
|
29
|
Maranch¢n
|
3
|
2,380
|
|
30
|
Mazuecos
|
1
|
2,685
|
|
31
|
Molina de Arag¢n
|
1
|
3,020
|
|
32
|
Mond‚jar
|
1
|
1,853
|
|
33
|
Pareja
|
1
|
1,576
|
|
34
|
Pastrana
|
1
|
1,406
|
|
35
|
Saced¢n
|
1
|
2,156
|
|
36
|
Sigenza
|
1
|
2,426
|
|
37
|
Tendilla
|
1
|
2,244
|
|
38
|
Torija
|
1
|
2,649
|
|
39
|
Torrej¢n del Rey
|
2
|
1,991
|
|
40
|
Torremocha del Campo
|
3
|
1,998
|
|
41
|
T¢rtola de Henares
|
2
|
,936
|
|
42
|
Trillo
|
4
|
1,618
|
|
43
|
Uceda
|
1
|
2,072
|
|
44
|
Villanueva de Alcor¢n
|
1
|
2,138
|
|
45
|
Villel de Mesa
|
3
|
2,478
|
|
46
|
Yebra
|
1
|
2,105
|
|
47
|
Yunquera de Henares
|
4
|
1,718
|
La
matriz anterior nos muestra, caso por caso, el conglomerado de pertenencia de
cada caso, así como la distancia existente del centroide con cada uno de los
casos en cuestión.
Centros
de los conglomerados finales
|
|
Conglomerado
|
|
1
|
2
|
3
|
4
|
|
Puntua(DIST)
|
-,00150
|
-,58219
|
1,28281
|
-,72915
|
|
Puntua(M16A)
|
-,00205
|
-,35036
|
-1,25000
|
1,21775
|
|
Puntua(M65A)
|
,01606
|
,23309
|
1,29293
|
-1,21564
|
|
Puntua(TACTIV)
|
-,08009
|
-,35687
|
-1,02114
|
1,18304
|
|
Puntua(AGRI)
|
-,23552
|
-,04608
|
1,55759
|
-,79964
|
|
Puntua(IND)
|
-,33632
|
1,03388
|
-1,05731
|
,94321
|
|
Puntua(CONS)
|
,58182
|
-,40709
|
-,61347
|
-,38676
|
|
Puntua(SERV)
|
,31316
|
-,84244
|
-,49230
|
,26445
|
|
Puntua(EMP)
|
,13855
|
-,34911
|
1,41540
|
-1,23214
|
|
Puntua(ASAL)
|
-,16448
|
,26434
|
-1,33063
|
1,25852
|
Por último, se presentan las
distancias entre los centroides de los conglomerados resultantes:
Distancias
entre los centros de los conglomerados finales
|
Conglomerado
|
1
|
2
|
3
|
4
|
|
1
|
|
2,287
|
3,811
|
3,454
|
|
2
|
2,287
|
|
4,315
|
3,244
|
|
3
|
3,811
|
4,315
|
|
6,722
|
|
4
|
3,454
|
3,244
|
6,722
|
|
ANOVA
|
|
Conglomerado
|
Error
|
F
|
Sig.
|
|
Media cuadrática
|
gl
|
Media cuadrática
|
gl
|
|
Puntua(DIST)
|
|
|
|
|
|
|
|
7,564
|
3
|
,542
|
43
|
13,955
|
,000
|
|
|
Puntua(M16A)
|
10,370
|
3
|
,346
|
43
|
29,951
|
,000
|
|
Puntua(M65A)
|
10,544
|
3
|
,334
|
43
|
31,555
|
,000
|
|
Puntua(TACTIV)
|
8,560
|
3
|
,473
|
43
|
18,112
|
,000
|
|
Puntua(AGRI)
|
10,015
|
3
|
,371
|
43
|
26,994
|
,000
|
|
Puntua(IND)
|
9,545
|
3
|
,404
|
43
|
23,638
|
,000
|
|
Puntua(CONS)
|
4,379
|
3
|
,764
|
43
|
5,729
|
,002
|
|
Puntua(SERV)
|
3,089
|
3
|
,854
|
43
|
3,617
|
,020
|
|
Puntua(EMP)
|
11,955
|
3
|
,236
|
43
|
50,718
|
,000
|
|
Puntua(ASAL)
|
11,448
|
3
|
,271
|
43
|
42,238
|
,000
|
Las pruebas F sólo se
deben utilizar con una finalidad descriptiva puesto que los conglomerados han
sido elegidos para maximizar las diferencias entre los casos en diferentes
conglomerados. Los niveles críticos no son corregidos, por lo que no pueden
interpretarse como pruebas de la hipótesis de que los centros de los
conglomerados son iguales.
Y se indica el número de casos que han resultado
incluidos en cada conglomerado:
Número de casos en cada conglomerado
|
Conglomerado
|
1
|
21,000
|
|
2
|
6,000
|
|
3
|
9,000
|
|
4
|
11,000
|
|
Válidos
|
47,000
|
|
Perdidos
|
,000
|
Finalmente, tenemos cuatro
conglomerados resultantes, y el total de casos pertenecientes a cada
conglomerado, además tenemos 47 casos válidos y ningún caso perdido. El conglomerado con mayor número de casos
es el 1 con 21 y el conglomerado menor es el 2 con 6 casos. Si quisiéramos
saber el orden o jerarquía de los conglomerados resultantes, tendríamos en
este caso que aplicar una técnica de análisis de conglomerado jerárquico.
|