Definición (axiomática) de la probabilidad y sus propiedades

Definición (axiomática) de la probabilidad

Durante el siglo XX, un matemático ruso, Andrei Kolmogorov, propuso una definición de probabilidad, que es la que seguimos utilizando hoy en día.

Si hacemos un determinado experimento, que tiene un espacio muestral $$\Omega$$, definimos la probabilidad como una función que asocia a cada suceso $$A$$ una determinada probabilidad, $$P(A)$$, que cumple las siguientes propiedades:

La probabilidad de cualquier suceso $$A$$ es positiva o cero. Es decir, $$P(A)\geq 0$$. La probabilidad mide, en cierta manera, lo difícil que es que ocurra un suceso $$A$$: como menor sea la probabilidad, más difícil es que ocurra.
La probabilidad del suceso seguro es $$1$$. Es decir, $$P(\Omega)=1$$. Así pues, la probabilidad siempre es mayor que $$0$$ y menor que $$1$$: probabilidad cero quiere decir que no hay ninguna posibilidad de que pase (es un suceso imposible), y probabilidad $$1$$, que siempre pasa (es un suceso seguro).
La probabilidad de la unión de un conjunto cualquiera de sucesos incompatibles dos a dos es la suma de las probabilidades de los sucesos. Esto es, si tenemos, por ejemplo, los sucesos $$A, B, C$$, y son incompatibles dos a dos, entonces $$P(A\cup B \cup C)=P(A)+P(B)+P(C).$$

Nota: En matemáticas, un axioma es un resultado que se acepta sin que necesite demostración. En este caso, decimos que ésta es la definición axiomática de la probabilidad porque definimos la probabilidad como una función que cumple estos tres axiomas. También podríamos haber escogido unos axiomas diferentes, y entonces para nosotros la probabilidad sería otra cosa.

Principales propiedades de la probabilidad

$$P(A)+P(\overline{A})=1$$.

Esto es, las probabilidades de los sucesos complementarios suman 1. Muchas veces utilizaremos esta propiedad para calcular probabilidad del complementario: $$P(\overline{A})=1-P(A)$$.

Veamos por qué. Sabemos que, por un lado, $$A$$ y $$\overline{A}$$ son incompatibles, y por el otro, $$A\cup \overline{A}= \Omega$$, puesto que uno es el contrario del otro. Esto es otra manera de entender lo que ya sabíamos, que el suceso $$A\cup \overline{A}$$ es un suceso seguro, y por tanto, por el axioma 2, $$P(A \cup \overline{A})=1$$, es decir, siempre ocurre. Entonces, por el axioma 3, $$P(A \cup \overline{A})=P(A)+P(\overline{A})$$. Pero $$P(A \cup \overline{A})=P(\Omega)=1$$, por lo que $$P(A)+P(\overline{A})=1$$.

Esta propiedad, que nos resulta muy útil, se puede generalizar:

Si tenemos tres o más sucesos, incompatibles dos a dos, y tales que su unión es todo el espacio muestral, es decir, $$A, B, C$$ incompatibles dos a dos tales que $$A\cup B \cup C = \Omega$$, entonces $$P(A)+P(B)+P(C)=1$$, por los axiomas 2 y 3.

Decimos en este caso que $$A,B,C$$ forman un sistema completo de sucesos. Observemos que siempre que expresamos $$\Omega$$ como conjunto de sucesos elementales, en realidad estamos dando un sistema completo de sucesos.

Como consecuencia, $$P(\emptyset)=0$$, es decir, la probabilidad del suceso imposible es $$0$$, puesto que, como sabemos que el suceso contrario al suceso imposible es el suceso seguro, entonces podemos sustituir esto en la igualdad de la propiedad, $$P(\emptyset)+P(\Omega)=1$$. Por lo tanto, como por el segundo axioma de la probabilidad $$P(\Omega)=1$$, tenemos que $$P(\emptyset)+1=1$$, por lo que $$P(\emptyset)=0$$.

Si $$A\subset B$$, entonces $$P(A) \leq P(B)$$.

La notación "si $$A\subset B$$" quiere decir "si el suceso $$A$$ está incluido en el suceso $$B$$", es decir, si todos los resultados posibles que cumplen $$A$$ también cumplen $$B$$.

Esta propiedad es bastante lógica: si al tirar un dado, queremos comparar la probabilidad de $$A =$$"sacar un $$2$$" con $$B =$$"sacar un número par", entonces, la probabilidad de $$A$$ tiene que ser más pequeña o igual que la de $$B$$, puesto que si sacamos un $$2$$, estamos sacando un número par. En otras palabras, cuando se cumple $$A$$, también se cumple $$B$$, por lo que debería ser más difícil cumplir $$A$$ que cumplir $$B$$. Es decir, $$P(A) \leq P(B)$$.

$$P(A\cup B)=P(A)+P(B)-P(A\cap B)$$.

Este resultado, que es muy importante recordar, es consecuencia de una propiedad en la Teoría de conjuntos: dados dos conjuntos, $$A$$ y $$B$$, puedes expresar su unión como $$A\cup B = (A-B)\cup (A\cap B) \cup (B-A),$$ que son incompatibles dos a dos. Entonces, por el axioma 3, $$P(A\cup B)=P(A-B)+P(A\cap B)+P(B-A)$$.

También en Teoria de conjuntos se ve que $$A=(A-B) \cup (A\cap B)$$, que son dos sucesos incompatibles, y por tanto, por el axioma 3, $$P(A)=P(A-B)+P(A\cap B)$$, es decir, $$P(A-B)=P(A)-P(A\cap B)$$.

Análogamente,

$$B=(B-A) \cup (B\cap A) = (B-A) \cup (A\cap B)$$, por lo que $$P(B-A)=P(B)-P(A\cap B)$$.

Sustituyendo estas probabilidades en la igualdad, encontramos

$$P(A\cup B)= P(A-B)+P(A\cap B)+P(B-A)=$$ $$=P(A)-P(A\cap B)+P(A\cap B)+(P(B)-P(A\cap B))=$$ $$=P(A)+P(B)-P(A\cap B)$$

Con todo lo que sabemos hasta ahora, podemos resolver ya muchos problemas de probabilidad. Veamos algunos ejemplos.

Un dado de seis caras está trucado, de forma que la probabilidad de que salga cada cara es proporcional al número de ésta.

1 ¿Cuál es la probabilidad de sacar un 6?

En este caso, nos dicen que la probabilidad de que salga cada cara no es la misma, por lo que no podemos aplicar directamente la regla de Laplace. Si observamos el enunciado, nos dice que la probabilidad de que salga cada cara es proporcional al número de ésta, esto quiere decir, si decimos que la probabilidad de que salga un $$1$$ es $$k$$, que desconocemos, entonces:

$$P(\{1\})=k, \ P(\{2\})=2k, \ P(\{3\})=3k, \ P(\{4\})=4k,$$

$$\ P(\{5\})=5k, P(\{6\})=6k.$$

Ahora, como $$\{1\},\{2\},\{3\},\{4\},\{5\},\{6\}$$ forman un sistema completo de sucesos, necesariamente

$$$P(\{1\})+P(\{2\})+P(\{3\})+P(\{4\})+P(\{5\})+P(\{6\})=1$$$

Por lo tanto, $$$k+2k+3k+4k+5k+6k=1$$$ que es una ecuación que ya sabemos resolver: $$$21k=1$$$ por lo que $$$k=\dfrac{1}{21}$$$

Así pues, la probabilidad de sacar un $$6$$ es $$P(\{6\})=6k=6\cdot \dfrac{1}{21}=\dfrac{6}{21}.$$

2 ¿Cuál es la probabilidad de sacar un número impar?

Los casos favorables al suceso $$A =$$"sacar un número impar" son: $$\{1\},\{3\},\{5\}$$. Por lo tanto, como son sucesos incompatibles,

$$$P(A)=P(\{1\})+P(\{3\})+P(\{5\})=k+3k+5k=9k=9\cdot \dfrac{1}{21}=\dfrac{9}{21} $$$

Mañana hay examen. Esther ha estudiado mucho, y tan sólo tiene probabilidad $$\dfrac{1}{5}$$ de suspender.

David ha estudiado menos, y tiene probabilidad $$\dfrac{1}{3}$$ de suspender. Sabemos que la probabilidad de que suspendan los dos es de $$\dfrac{1}{8}$$.

¿Cuál es la probabilidad de que suspenda como mínimo uno de los dos?

Lo primero que debemos hacer es expresar el problema como sabemos, con sucesos. Definimos los sucesos $$A =$$"Esther suspende", $$B =$$"David suspende".

Por el enunciado, sabemos que $$P(A)=\dfrac{1}{5}$$ , $$P(B)=\dfrac{1}{3}$$, y que $$P(A\cap B)=\dfrac{1}{8}$$.

Podríamos pensar que si Esther tiene probabilidad $$\dfrac{1}{5}$$ de suspender, y David $$\dfrac{1}{3}$$ de suspender, entonces la probabilidad de que suspenda como mínimo uno de los dos, es decir, $$P(A\cup B)$$, debería ser $$\dfrac{1}{5} + \dfrac{1}{3} = \dfrac{8}{15}$$, pero esto es falso.

Si lo contamos de esta manera, estamos suponiendo que los sucesos $$A$$ y $$B$$ son incompatibles, es decir, que no pueden suceder a la vez, cuando el enunciado nos dice que pueden suspender los dos a la vez.

Por lo tanto, la manera correcta de calcular esta probabilidad es utilizando la fórmula que hemos encontrado antes: $$$P(A\cup B)=P(A)+P(B)-P(A\cap B)$$$

Sustituyendo por los resultados que conocemos, tenemos que $$$P(A\cup B)=\dfrac{1}{5}+\dfrac{1}{3}-\dfrac{1}{8}=\dfrac{24}{120}+\dfrac{40}{120}-\dfrac{15}{120}=\dfrac{49}{120}$$$

o lo que es lo mismo, un $$40,8\widehat{3}\%$$.

Así la probabilidad de que suspenda como mínimo uno de los dos es de $$40,8\widehat{3}\%$$.