El teorema del límite central

Jueves, 17 de diciembre de 2009 a las 13:00

En un cierto sentido, se podría firmar que la Estadística, junto con la Aritmética, son las ramas más “cotidianas” de las Matemáticas, ya que ambas responden a necesidades prácticas muy concretas. Y esto es algo que se pone de manifiesto en su desarrollo histórico, ya que no ha seguido la tendencia habitual de las Matemáticas puras, generadora de sus propia teoría y problemas, con independencia de sus aplicaciones prácticas, sino que ha actuado, en cierta medida, a “demanda”: la Aritmética, por ejemplo, para paliar los problemas planteados por las necesidades básicas de “hacer bien las cuentas”; y la Estadística y el Cálculo de Probabilidades, indisolublemente unido a ella, nacieron ante una necesidad general de poder futurizar. El estudio de las leyes que rigen las Probabilidades surge, por tanto, ante una necesidad tan banal o lúdica como controlar los juegos de azar, y la Estadística ante la necesidad de prever acontecimientos futuros por parte de las grandes compañías aseguradoras.

La Ciencia Estadística, como aplicación práctica, persigue dos objetivos fundamentales; uno se refiere al pasado y el otro al futuro. El primero de ellos hace uso de la Estadística Descriptiva, que trata de explicar porqué las cosas son como son. El segundo, que se vale de la Inferencia Estadística, trata de saber cómo pueden llegar a ser las cosas.

En cualquiera de los casos planea siempre la sombra del azar. Cuando algo se rige por una ley determinista como espacio = velocidad x tiempo, no es necesario acudir a la Estadística, pues conociendo los parámetros velocidad y tiempo de un móvil, sabremos siempre el espacio que ha recorrido. Sólo en circunstancias en las que esta ley no se cumpla de forma inexorable (vientos racheados, pendientes o cualquier otro factor que induzca la aparición de una aceleración que nos es desconocida) deberemos empezar a tomar muestras de diferentes espacios recorridos en distintas circunstancias para tratar de encontrar una ley que nos permita predecir cuál va a ser, en promedio, el espacio recorrido por un móvil. Y se da la circunstancia de que el azar interviene en la casi totalidad de los hechos y acontecimientos que rodean a la actividad humana, de ahí la importancia de los Análisis Estadísticos.

Lo primero que se hace para llevar a cabo un análisis de estas características es confeccionar una tabla de datos. Por ejemplo, si queremos conocer la relación que existe entre el peso y la altura de una determinada población, haremos una encuesta en un grupo determinado de individuos que formará lo que llamaremos una “muestra”. Representaremos los datos en un par de ejes de coordenadas y nos encontraremos frente a una curva. El estudio de esta curva nos puede aportar datos interesantes. Por ejemplo, nos puede decir hasta qué punto los hechos que estamos analizando son resultado del más puro azar o bien intervienen factores deterministas (aunque no conozcamos su verdadera naturaleza). También podemos prever, siguiendo la evolución de la curva, que sucederá en diferentes circunstancias.

Pero el problema es que la curva que aparezca puede tener, en principio, cualquier forma, y en Matemáticas, o más concretamente en el Análisis Matemático, que es la rama que se dedica ala estudio de las funciones, la forma de la curva es decisiva. En otras palabras, que hay curvas difíciles, hasta intratables, y otras que, en cambio, son muy cómodas de manejar. En estadística, la más preferida y deseada, es la que se corresponde con la llamada “distribución normal”. Tanto es así que, en términos muy coloquiales, se podría afirmar que una distribución de probabilidades cuanto más normal sea mejor.

La distribución normal

Campana Gauss

La distribución normal recibe, en la mayoría de países, el nombre de Distribución de Gauss (excepto en Francia, que se la conoce como Distribución de Laplace). Cualquier estudiante de un primer curso de estadística la reconoce enseguida por su típica forma de una campana (por lo que también recibe el nombre de Campana de Gauss).

Puede estar situada más a la derecha o a la izquierda del eje de ordenadas, o puede ser más alargada o más achatada, pero conservando siempre su característica forma de campana.

En el caso más general, la ecuación de esta curva tiene un aspecto tan poco alentador como

¿Y por qué una curva de aspecto tan complicado es tan deseable? Por varias razones. Primero, porque depende sólo de dos parámetros  de los que hablaremos más adelante. Segundo, porque es perfectamente simétrica respecto a la recta vertical que pasa por su punto máximo. Tiene, además, dos puntos de inflexión perfectamente localizados y sus dos ramas, la de la izquierda y la de la derecha, son asintóticas al eje de coordenadas (el eje horizontal). Recordemos que esto último significa que la curva se aproxima indefinidamente a dicha recta, pero sin llegar a tocarla nunca. Y lo que es más importante, el área total encerrada bajo esta curva vale uno, lo que permite calcular una tabla de valores sumamente práctica.

Distribución normal tipificada

El cambio de variable que viene dado por

convierte a la ecuación anterior en

función que recibe el nombre de “función de densidad” y que se corresponde con una distribución normal tipificada. La campana de Gauss se caracteriza entonces por ser simétrica respecto al eje de ordenadas (eje Y), tener un máximo en el punto x= 0, dos puntos de inflexión en las abcisas -1 y +1 y las correspondientes ramas asintóticas al eje X.

Media y desviación

El vértice de la campana se corresponde con lo que se denomina el “valor medio”, y la anchura nos muestra la frecuencia con que aparecen las desviaciones de dicha media, de forma que cuanto más estrecha sea la campana, más raras serán las desviaciones con respecto a la media.

A pesar de que todo esto se encuentra envuelto en una cierta complejidad matemática, no debe asustarnos, ya que la utilización práctica es muy sencilla y para la mayoría de los cálculos no se requieren conocimientos de Análisis Matemático, a pesar de que están involucradas integrales indefinidas. Es sabido cómo a partir de una pequeña muestra de datos estadísticos puede obtenerse información sobre el conjunto de la población, tiene aplicaciones en terrenos tan variados como la intención de voto de un sector determinado de la población, el riesgo de una inversión bursátil o la predicción de parámetros biológicos en el desarrollo de una especie. La utilización de la distribución normal en los análisis estadísticos es tan frecuente que los alumnos de los primeros cursos de Estadística empiezan a creer que la distribución de cualquier fenómeno aleatorio que tenga lugar en el Universo responde a una distribución normal. Lo que en realidad ocurre es que, en determinadas condiciones, la media muestral de un conjunto de variables aleatorias tiende a ser normal cuando el tamaño de la muestra es lo suficientemente grande. Esto es precisamente lo que, en términos muy generales, afirma el Teorema del Límite Central.

La máquina de Galton

La máquina de Galton esta formada por una tabla vertical en la que hay una serie de filas de clavos que se encuentran intercalados unos con otros. A través de un embudo se dejan caer bolitas de acero, de manera que cada bolita, al encontrarse con un clavo, tiene probabilidad ½ de caer a la izquierda o a la derecha. Las bolitas forman pequeños montones en el suelo de la máquina, de manera que las superficies dibujan una curva. En principio esta curva tiene una forma cualquiera, pero cuando el número de bolitas es lo suficientemente grande, la distribución de las bolitas adopta la forma de la campana de Gauss (en la máquina original se emplearon 800 bolitas).

Máquina de Galton

Este resultado no es sorprendente si tenemos en cuenta que para que una de las bolitas se ubique, por ejemplo, en la celda que está en el extremo de la derecha, debe caer siempre hacia la derecha, mientras que una que llegue al centro, debe caer una vez a la derecha y otra a la izquierda, lo que es una sucesión de resultados más probable.

La máquina de Galton ilustra de forma intuitiva lo que sucede cuando tenemos la suma de un gran número de variables aleatorias independientes, cada una de las cuales contribuye en pequeña medida a la totalidad.

El fisiólogo Sir Francis Galton (1822-1917), que era primo y amigo de Darwin, llevó a cabo estudios sobre la herencia y las aplicaciones matemáticas a la misma. Observando que las personas muy altas solían tener hijos bajos y viceversa, las personas muy bajas solían tener hijos altos, afirmó que este suceso se debía a una ley de retorno a la media en cada generación. Hoy en día se sabe que este fenómeno es debido a que los valores extremos de una distribución se deben, en gran parte, al azar.

Teorema del Límite Central

El Teorema del Límite Central afirma que dada una suma Sn de variables aleatorias mutuamente independientes, la función de distribución de Sn se puede aproximar por una función normal de densidad.  Este teorema nació como una idea intuitiva, como el resultado de diferentes experiencias, de las que la máquina de Galton es un buen ejemplo, pero rápidamente pasó a ser una conjetura matemática.

La función normal de distribución que hemos visto tuvo un precedente en la binomial que Bernouilli desarrolló es su conocido Teorema Áureo, una función que años más tarde Poisson bautizaría como Ley de los Grandes Números. En 1733, el matemático francés De Moivre hizo una generalización de dicho teorema.  No sólo fue el primero en obtener la característica forma de campana de la función, sino que también conjeturó, en 1733, el Teorema del Límite Central. Éste fue un resultado que, a pesar de no haber sido demostrado de forma rigurosa, fue aceptado durante mucho tiempo.

En la primera mitad del siglo XIX abundaban en las cortes europeas los jugadores profesionales. Uno de ellos, conocido como el “caballero de Mére” le planteó a De Moivre una serie de problemas en torno a los resultados de sucesos en los que intervenía el azar. Fue entonces cuando De Moivre obtuvo la ecuación de la distribución normal, como un caso límite de otra distribución llamada binomial.

Gauss, por su parte, construyó una Teoría de Errores, aplicada a las observaciones astronómicas, que se basaba en dicho teorema, así como también a algunos de los resultados importantes a los que llegó Laplace en el Cálculo de Probabilidades.

Una primera formulación clara del teorema no apareció hasta 1812, fecha en que Laplace llevó a cabo los primeros intentos de demostración. Aunque realmente el primero en iniciar un estudio riguroso fue el matemático ruso P. L. Chebyshev, siendo sus alumnos Markov, y especialmente Lyapunov, quienes resolvieron la cuestión de manera definitiva en 1901. Aunque la demostración completa del enunciado, tal y como lo conocemos actualmente, vino de la mano del matemático finlandés Jarl Waldemar Lindeberg (1876-1932) en 1930. Dicho enunciado dice: “La suma de un gran número de variables aleatorias independientes sigue aproximadamente una distribución normal”.

El nombre de “normal” lo utilizó por primera vez el matemático belga Quetelet (1796-1874), cuando llevaba a cabo la ingente tarea de  recoger datos sobre las medidas corporales de miles de soldados escoceses.

La importancia del teorema

Pocas conjeturas se han mantenido como ciertas durante tanto tiempo y con el absoluto beneplácito de la comunidad matemática como la del Teorema del Límite Central. Ello fue debido, por una parte, a que nadie dudaba de su veracidad, y por otra, a la enorme utilidad que representaba su afirmación. La mayoría de los fenómenos que se dan en la naturaleza y en las sociedades humanas siguen una distribución normal. Se aplica de la misma forma para establecer sondeos electorales o sondeos  petrolíferos. La psicología se sustenta como ciencia gracias a las medidas que establece en torno a parámetros como determinadas percepciones sensoriales o cocientes intelectuales. Todas las teorías que construye en torno a dichos resultados se vendrían abajo si el Teorema del Límite Central no fuera cierto.

Propiedades de la distribución normal:

La distribución normal posee ciertas propiedades importantes que conviene destacar:

i. Tiene una única moda, que coincide con su media y su mediana.

ii. La curva normal es asintótica al eje de abscisas.  Por ello, cualquier valor entre y es teóricamente posible.  El área total bajo la curva es, por tanto, igual a uno.

iii. Es simétrica con respecto a su media .  Según esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor.

iv. La distancia entre la línea trazada en la media y el punto de inflexión de la curva es igual a una desviación típica ().  Cuanto mayor sea , más aplanada será la curva de la densidad.

v. El área bajo la curva comprendida entre los valores situados aproximadamente a dos desviaciones estándar de la media es igual a 0,95.  En concreto, existe un 95% de posibilidades de observar un valor comprendido en el intervalo
().

vi. La forma de la campana de Gauss depende de los parámetros  y .

La media indica la posición de la campana, de modo que para diferentes valores de  la gráfica es desplazada a lo largo del eje horizontal.  Por otra parte, la desviación estándar determina el grado de apuntamiento de la curva.  Cuanto mayor sea el valor de , más se dispersarán los datos en torno a la media, y la curva será más plana.  Un valor pequeño de este parámetro indica, por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribución.