Diseña un sitio como este con WordPress.com
Comenzar

¿Culpables de dependencia?

Estas variables cualitativas han sido acusadas de mantener una relación dependiente. ¿Qué pruebas tienen contra ellas?

En general, las variables son cada una de las propiedades, rasgos o cualidades que poseen los elementos de una población y que son objeto de estudio.

Los valores que toman las variables cualitativas son establecidos en clases o categorías que, normalmente, no son cuantificables.

Su señoría, X dice que, en su opinión, las personas se clasifican según el nivel de ingresos (bajo o alto), mientras que Y lo hace según su percepción sobre la calidad del sistema democrático (mala o buena). Disponemos de datos de 60 personas (fij).

Según X, 36 de las 60 personas tienen un nivel de ingresos bajo, mientras que 24 tienen un nivel de ingresos alto. Según Y, 40 personas tienen una mala percepción de la democracia, mientras que 20 tienen una buena percepción.

Ahora bien, si centramos nuestra atención a las 36 personas con un nivel de ingresos bajo, el 83.33% (30 de 36) tienen una mala percepción, mientras que el 16,66% (6 de 36) tienen una buena percepción. Este cálculo puede realizarse también para las 24 personas con un nivel de ingresos alto.

Si comparamos las dos filas, se observa que el 83.33% de las personas con un nivel de ingresos bajo tienen una mala percepción, mientras que, si el nivel de ingresos es alto, solo el 42% tienen una mala percepción. En el caso de la buena percepción ocurre lo contrario. ¡¿Dependientes?!

Lo siento, señor fiscal, usted no puede concluir, así, tan rápidamente, que el nivel de ingresos tiene algún efecto en la percepción de estas personas sobre la calidad democrática.

Escúchenme atentamente. Nuestra situación es la que es y no sabemos qué asociación se esconde entre X e Y. Ahora bien, a partir de ahora, y tal como está establecido en nuestro sistema, razonaré suponiendo que X e Y son inocentes, independientes, o llámenle como ustedes quieran.

Si las variables fueran independientes podríamos obtener el número de personas clasificadas en cada una de las categorías. Por ejemplo, el 60% de 40 (o el 66.66% de 36) serían las personas con bajo nivel de ingresos y mala percepción.

Y… más fácilmente…

Esto es, por tanto, el número de personas esperadas en dichas condiciones si las variables fueran independientes.  Se llaman frecuencias esperadas (en caso de independencia) y las denotaremos eij.

Fíjense entonces que, por un lado, tenemos información de lo que ocurre en la realidad y, por otro lado, de lo que debería ocurrir si las variables fueran independientes. Y, ciertamente, ocurrirían cosas diferentes.

Ustedes se preguntarán, ¿y entonces qué?

Pues entonces, debemos valorar si estas diferencias (en conjunto) son “significativas” o no, si son suficientes para declarar culpables de dependencia a X e Y.

Una idea podría ser sumar las diferencias, pero… no nos sirve porque unas contrarrestarán a otras y siempre sumarán 0. Así que idea descartada.

Otra idea sería sumar los cuadrados de estas diferencias, pero… si tenemos muchos datos estos cuadrados podrían ser muy grandes dependiendo del número de datos. Así que idea descartada.

Yo, Karl Pearson, propongo sumar el resultado de dividir estas diferencias al cuadrado por su correspondiente frecuencia esperada, de forma que se obtenga un valor relativo. Llamen χ2 a esta suma, que, en nuestro caso, vale 11.25.

Karl Pearson (1857-1936) fue historiador, escribió sobre folklore, fue un socialista convencido, abogado, matemático aplicado, biómetra, estadístico, maestro y biógrafo. Pero sin duda su contribución más importante es al nacimiento de la Estadística Aplicada. Y fue él quien propuso el uso de χ2.

Ahora bien, ¿qué significa χ2=11.25  Evidentemente solo si χ2=0, se tendría una total independencia entre las variables (fij=eij ∀ i,j). ¿Qué tenemos en este caso? Cuanto más grande sea χ2 menos verosímil será, menos sentido tendrá, que X e Y sean independientes.  Pero… ¿cómo de grande?

Resulta ser que, si el número de datos (n) es mayor que 30 y todas las frecuencias esperadas son mayores o iguales que 5, la distribución de χ2 se aproxima a una χ2 con (n-1)(k-1) grados de libertad, donde k es el mínimo entre el número de filas y el número de columnas (en nuestro caso, k=2).

La clave está entonces en esta distribución teórica. Será ella quien nos proporcione la “evidencia estadística”. No se equivoquen, no quiero convertir esto en una clase de Cálculo de Probabilidades, pero es necesario tener en cuenta un último detalle. Ustedes y yo sabemos que puedo dictar una sentencia equivocada…

Como es lógico, quiero ser muy prudente, así que consideraré un riesgo pequeño, pongamos del 5%, es decir, solo estoy dispuesto a equivocarme un 5% de las veces que dicte sentencia. No soportaría condenar a estas pobres variables si realmente no lo merecen. Aún así, nunca estaré del todo seguro.

Tal y como han podido comprobar, en nuestro caso, una χ2 tiene un grado de libertad, lo cual indica (usando una tabulación adecuada) que el límite es establecido en un valor de 3.8415. En otras palabras, y en este caso, cualquier valor de χ2 mayor a este, me obliga a sospechar de la culpabilidad de estas dos variables.

Y es evidente entonces que, con un riesgo del 5% (aún sin estar seguro del todo), el valor obtenido de 11.25 me conduce a no apoyar la independencia de las variables.

Es decir, que los valores de una de las variables ejercen efecto sobre los valores de la otra (y viceversa). Es más, apoyo mi decisión con la V de Cramer, un valor de entre 0 y 1, que, dada su lejanía al 0, parece confirmar esta decisión.

Así pues, he aquí las pruebas y yo, Karl Pearson, declaro a estas dos variables…

¡CULPABLES DE DEPENDENCIA!

Estos procedimientos estadísticos son conocidos como “contrastes de hipótesis” y enlaces hay mil, pero por poner alguno:

http://www.psicothema.es/pdf/430.pdf

http://www3.uji.es/~epifanio/DOCENCIA/etig/t2.pdf

Sobre la prueba de la Chi-cuadrado:

https://www.youtube.com/watch?v=XvPEeQAjTW8

https://www.youtube.com/watch?v=qAHXnbp1lHY

Si habéis llegado hasta aquí, muchísimas gracias. Soy consciente de lo controvertido de los contraste de hipótesis, pero este planteamiento me gusta. Los gifs, junto el texto, pueden ser consultados también en mi blog:

¡Nos vemos pronto!

Anuncio publicitario

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Crea un blog o un sitio web gratuitos con WordPress.com.

Subir ↑

La de Maldita Melena

Blog personal de Natalia Robles Mures

El sitio tranquilo

No sé vender mi producto

Messiánico de Alfredo N. Avila

Disfruta y comparte mis letras. Contenido diario... Sígueme para más inspiraciones literarias.

Qué vamos a hacer hoy

Matemáticas + Actividades en familia por Córdoba y en casa

Bits&Science

Ciencia natural y formal... con humor.

John Aranda

Blog de literatura, música, poesía y filosofía.

Letras & Poesía

La plataforma líder de literatura independiente

A %d blogueros les gusta esto: