Diseña un sitio como este con WordPress.com
Comenzar

La verosimilitud probabilística, prácticamente magia

Según la @RAEInforma, verosímil es aquello que tiene apariencia de verdadero, o que es creíble por no ofrecer carácter alguno de falsedad. El concepto de verosimilitud es de gran importancia en probabilidad y estadística. Prácticamente magia.
#HilosDC6

Imagina que estás frente a una urna cuyo contenido permanece oculto, pero te dicen que:

1) hay cuatro bolas,

2) cada una de ellas puede ser blanca o negra.

El problema es que se niegan a decirte cuántas bolas hay de cada color.

Supón que para ti es de vital importancia “conocer” esa información.

O, al menos, aproximarte a ella.

Sin mayor información, convendrás conmigo en que sería imposible tomar una “decisión”.

Nota que es suficiente saber cuántas bolas blancas hay dentro de la urna y que esto es equivalente a saber qué proporción de bolas son blancas.

Si llamamos p a la proporción de bolas blancas, p puede ser igual a:

0: si solo hay bolas negras.

1/4: si hay una bola blanca y tres bolas negras.

2/4: si hay dos bolas blancas y dos bolas negras.

3/4: si hay tres bolas blancas y una bola negra.

1: si solo hay bolas blancas.

Imagina que te dejan extraer dos bolas con reemplazamiento. Y ocurre lo siguiente:

Sacas la primera bola, observas que es blanca ⚪️.

La devuelves a la urna 📥.

Sacas la segunda bola, que resulta ser negra ⚫️.

En cada extracción, la probabilidad de sacar una bola blanca es el número de bolas blancas entre el número total de bolas. Exactamente p, exactamente lo que necesitamos «conocer».

Y, si eso es así, la probabilidad de extraer una bola negra es 1-p.

Lo que está claro es que p puede valer 0, 1/4, 2/4, 3/4 ó 1.

Tu objetivo es elegir uno de esos valores, es decir, dar una estimación de p a la que llamaremos p*.

¿Bajo qué criterio? ¿Qué tal si vemos cuán posible es obtener nuestro resultado bajo cada uno de dichos valores?

Más concretamente, ¿con qué probabilidad extraerías primero blanca y luego negra si p=0, o p=1/4, o p=2/4… etc.? ¿Cuál de los valores de p es más verosímil?

Pues bien, dos de las posibilidades se pueden descartar ya…

En la urna hay alguna bola blanca y alguna bola negra, si no… ¡¿cómo podrías haber extraído una de cada?!

Así pues, no puede ser que p=0 ni tampoco que p=1, ya que estaríamos diciendo que o bien que todas las bolas son negras o bien que todas las bolas son blancas.


Te quedan, por tanto, tres posibilidades p=1/4, p=2/4 y p=3/4.

Veamos qué ocurre si p=1/4, es decir, si hay una sola bola blanca y tres bolas negras en la urna. En este caso, la probabilidad de extraer blanca y luego negra, es igual a:

P(B, N)=P(B)P(N)=p(1-p)=(1/4)*(3/4)=3/16.

El cálculo de esta probabilidad tiene en cuenta que el resultado de la segunda extracción no depende de la primera (recuerda que devolvimos la primera bola a la urna) y además la probabilidad de extraer una bola blanca se mantiene intacta. Una muestra aleatoria simple, vaya.

En otras palabras, P(B,N)=3/16=0.1875 quiere decir que tu resultado (blanca y negra, en ese orden) se obtendrá en el 18.75% de casos si hay una bola blanca y tres negras en la urna.

Observa que, lógicamente, será el mismo número de casos en que saldrá primero negra y luego blanca.

Veamos ahora qué pasaría si p=2/4 (=1/2). Bajo este supuesto, en la urna hay dos bolas blancas y dos bolas negras y la probabilidad de extraer blanca y luego negra, es igual a:

P(B, N)=P(B)P(N)=p(1-p)=(2/4)*(2/4)=4/16 (=1/4).

Finalmente, si p=3/4, en la urna hay tres bolas blancas y una bola negra, y la probabilidad de extraer una blanca y luego una negra es igual a:

P(B, N)=P(B)P(N)=p(1-p)=(3/4)*(1/4)=3/16.

Recapitulemos:

p=0: La probabilidad de obtener el resultado es 0, así que no puede ser.

p=1/4: La probabilidad correspondiente es 3/16=0.1875.

p=2/4: La probabilidad correspondiente es 4/16=0.25.

p=3/4: La probabilidad correspondiente es 3/16=0.1875.

p=1: La probabilidad correspondiente es 0, tampoco puede ser.

Observa que si p=2/4, la probabilidad calculada es 0.25, lo cual implica que, bajo este supuesto, tu resultado se repetirá más veces que si p=1/4 ó p=3/4 (siempre y cuando lo repitas un número considerable de veces).

En este sentido, estarías en condiciones de afirmar que, en caso de ser necesario escoger uno de los posibles valores, el más verosímil, teniendo en cuenta el resultado de tus dos extracciones, es p*=2/4.

Fíjate que, en el fondo, lo que has hecho ha sido maximizar la función:

P(B,N)=p(1-p), donde p∈{0,1/4,2/4,3/4,1}.

¿Quiere decir esto que en la urna hay exactamente dos bolas blancas y dos bolas negras?

No, solo quiere decir que esa situación es la más verosímil, la que aparentemente tiene más visos de ser cierta con la información de que dispones.

De hecho, hay casos en que, bajo estas circunstancias, ni siquiera podrás identificar.

Date cuenta que, si únicamente extraes dos bolas, tus estimaciones serán:

Blanca + blanca: p*=1.

Blanca + negra (y negra + blanca): p*=2/4 (=1/2).

Negra + negra: p*=0.

Cualquiera de estos resultados puede ocurrir incluso si hay tres bolas blancas y una negra (o una blanca y tres negras), y, sin embargo, en ningún caso podrás concluir que p*=3/4 ó p*1/4.

A fin de poder afinar más, sería necesario realizar más extracciones (al menos cuatro).

Por ejemplo, si extraes cuatro bolas y resultan ser tres blancas y una negra, la probabilidad de obtener dicho resultado sería p³(1-p), que alcanza su máximo en p=3/4.

En este caso, tu estimación sería p*=3/4 y, por tanto, sería “correcta”.

Bien. Cuando necesitamos estimar el parámetro (desconocido) de una distribución (en este caso, la proporción de bolas blancas que hay en la urna), lo que hacemos es extraer una muestra de tamaño n que corresponde a realizar n veces el experimento (sacar n bolas de la urna).

Después calculamos la probabilidad de obtener dicha muestra cuando el parámetro toma los posibles valores. En general, esta probabilidad se conoce como “función de verosimilitud” y depende del parámetro a estimar.

Finalmente, se “estima” el valor del parámetro desconocido como aquel valor que maximiza la función de verosimilitud y corresponde, por tanto, al valor del parámetro bajo el cual se obtiene dicha muestra con mayor probabilidad.

Estas ideas son solo una breve pincelada de aquello que subyace en el método de máxima verosimilitud que sirve para “construir” estimadores con “buenas” propiedades (asintóticamente normales, insesgados, de mínima varianza, y consistentes).

Si has leído hasta aquí, muchísimas gracias. Hay quien considera la estadística como una rama menor de las matemáticas. Sin embargo, la estadística se agarra a la realidad de una forma prácticamente mágica.

Anuncio publicitario

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Crea un blog o un sitio web gratuitos con WordPress.com.

Subir ↑

La de Maldita Melena

Blog personal de Natalia Robles Mures

El sitio tranquilo

No sé vender mi producto

Messiánico de Alfredo N. Avila

Disfruta y comparte mis letras. Contenido diario... Sígueme para más inspiraciones literarias.

Qué vamos a hacer hoy

Matemáticas + Actividades en familia por Córdoba y en casa

Bits&Science

Ciencia natural y formal... con humor.

John Aranda

Blog de literatura, música, poesía y filosofía.

Letras & Poesía

La plataforma líder de literatura independiente

A %d blogueros les gusta esto: