Análisis Discriminante. Aspectos conceptuales

En primer lugar, supongamos que disponemos de un conjunto de individuos clasificados en distintos grupos de acuerdo con la observación de una determinada “característica” que los diferencia. Parece lógico pensar que esa característica observada que los diferencia pudiera estar relacionada con otras características más fácilmente observables, de forma que si dispusiéramos de ellas y conociéramos la relación existente entre éstas y aquéllas (por ejemplo, mediante algún tipo de función “predictiva”) podríamos tratar de anticipar su comportamiento más probable, con cierta fiabilidad, sin necesidad de esperar a observarla. Ello lógicamente es tanto más interesante cuanto mayor es el coste asociado a la observación final de la característica que expresa finalmente la clasificación real, tanto más cuando la observación de esta característica conlleve la desaparición de la propia unidad observada (caso de que la característica sea, por ejemplo, la muerte).

Introduzcamos como ilustración el siguiente ejemplo simplificado. Imaginemos que a una inmobiliaria llegan una serie de compradores potenciales interesándose por la compra de vivienda. Pensemos que el acto final de acabar comprando o no la vivienda en cuestión puede ponerse en relación con (depende de) una serie de características de los individuos que manifiestan el interés de comprar como pueden ser la propia posesión (o no) de una primera vivienda, su proximidad a un posible enlace matrimonial o convivencia, sus ahorros y capacidad de endeudamiento, etc.; y supongamos hipotéticamente que pensásemos que la decisión de compra, de una forma simplificada, estaría básicamente relacionada con sólo dos características fácilmente observables como son la cantidad de dinero que pensaban dejar para pagar a plazos por la compra de la vivienda (X1) y el número de años que tardarían en pagarla (X2).

Si en los archivos de la inmobiliaria existen 49 casos de situaciones anteriores similares en las que, además de conocer estas dos características, también se conoce la decisión final sobre la compra que adoptaron los correspondientes clientes, ¿podríamos establecer un procedimiento que nos permitiera saber, en base a esa experiencia acumulada por la inmobiliaria, si sería muy probable que un nuevo cliente, que dice que aplazaría 75 mil euros de pesetas a pagar en 5 años para adquirir la vivienda, ¿terminase comprando la vivienda? O, ¿si por el contrario, sería más probable que no la comprara?

 

Los métodos de Análisis Discriminante, junto a los más recientes basados en Modelos de Respuestas Cualitativas, son las técnicas estadísticas empleadas por excelencia para resolver este tipo de problemas y sus generalizaciones.

 

Dado un conjunto de individuos, de los que se conocen sus características, clasificados en K grupos diferentes, el Análisis Discriminante (AD) trata de establecer las relaciones óptimas existentes entres aquéllas características de los individuos y sus grupos de pertenencia; lo que permitiría clasificar (identificar) nuevos individuos, a partir de sus características observadas, en uno de aquellos grupos y mediante una regla de decisión óptima que permitirá predecir la clasificación de los nuevos individuos de la forma más fiable posible con respecto a la realidad.

La pertenencia de un individuo a un grupo se modeliza mediante una variable categórica que toma tantos valores como grupos haya y que también se conoce como variable grupo o variable independiente.

Las características observadas a partir de las que se va a proceder a la identificación de los individuos se conocen como variables clasificadoras, variables criterios, variables predictoras o variables explicativas, exigiéndoseles generalmente en el Análisis Discriminante estar medidas en escalas de intervalo.

Y para obtener la relación óptima existente entre las características de los individuos y sus grupos de pertenencia pueden plantearse varias opciones. La opción que parte del establecimiento de un modelo similar al de regresión que nos permite explicar la variable categórica en función de las demás variables clasificadoras y la resolución de los problemas teóricos que plantea, conduce a los mencionados Modelos de Respuesta Cualitativa.

 

En palabras del autor César Pérez López, “el análisis discriminante es una técnica estadística que permite asignar o clasificar nuevos individuos dentro de grupos previamente reconocidos o definidos. Para ilustrar el concepto, consideremos un ejemplo típico en el campo de la medicina. Supongamos que se dispone de una muestra de pacientes en los que se ha medido un conjunto de variables relativas al diagnóstico de una enfermedad (presión sanguínea, edad, peso, etc.) y que con esta información o por comprobación posterior, el investigador ha dividido la muestra en dos (o más) grupos diagnósticos. La finalidad del análisis discriminante es que cuando llegue un nuevo enfermo en el que son medidas las mismas variables, sus valores permitan asignar dicho paciente a un grupo de diagnóstico con la máxima probabilidad, cuantificación a la vez el valor de ésta probabilidad. El análisis discriminante puede aplicarse a todos los campos de la ciencia en los que el objeto de investigación sea la clasificación de individuos, a través de un perfil observado. El análisis discriminante se conoce en ocasiones como análisis de clasificación, ya que su objetivo fundamental es producir una regla o un esquema de clasificación que permita a un investigador predecir la población a la que es más probable que tenga que pertenecer una nueva observación (supuestas conocidas varias poblaciones a las que pueden pertenecer las observaciones)”.

Ahora, nos concentraremos en las técnicas tradicionalmente empleadas para el Análisis Discriminante iniciadas por Fisher en 1936, y que desarrollamos a continuación.

¿Te gustó? Pues comparte ;-)
Este sitio usa cookies para personalizar el contenido y los anuncios, ofrecer funciones de redes sociales y analizar el tráfico. Ninguna cookie será instalada a menos que se desplace exprésamente más de 600px. Leer nuestra Política de Privacidad y Política de Cookies. Las acepto | No quiero aprender cursos gratis. Sácame