domingo, 27 de diciembre de 2009

Distribución T-Student

En probabilidad y estadística, la distribución t (de Student) es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño. Surge, en la mayoría de los estudios estadísticos prácticos, cuando la desviación típica de una población se desconoce y debe ser estimada a partir de los datos de una muestra.

Existen dos versiones de la prueba t-Student: una que supone que las varianzas poblacionales son iguales y otra versión que no asume esto último. Para decidir si se puede suponer o no la igualdad de varianza en las dos poblaciones, se debe realizar previamente la prueba F-Snedecor de comparación de dos varianzas.

Un poco de historia.

La prueba t-Student fue desarrollada en 1899 por el químico inglés William Sealey Gosset (1876-1937), mientras trabajaba en técnicas de control de calidad para las destilerías Guiness en Dublín . Debido a que en la destilería, su puesto de trabajo no era inicialmente de estadístico y su dedicación debía estar exclusivamente encaminada a mejorar los costes de producción, publicó sus hallazgos anónimamente firmando sus artículos con el nombre de "Student".

La distribución t de Student es la distribución de probabilidad del cociente:


donde
Z tiene una distribución normal de media nula y varianza 1
V tiene una distribución chi-cuadrado con ν grados de libertad
Z y V son independientes


Si μ es una constante no nula, el cociente  es una variable aleatoria que sigue la distribución t de Student no central con parámetro de no-centralidad μ.



Intervalos de confianza derivados de la distribución t de Student 

El procedimiento para el cálculo del intervalo de confianza basado en la t de Student consiste en estimar la desviación típica de los datos S y calcular el error estándar de la media= S/(raíz cuadrada de n), siendo entonces el intervalo de confianza para la media = x media +- t (alfa/2) multiplicado por (S/(raíz cuadradada de n)).

Es este resultado el que se utiliza en el test de Student: puesto que la diferencia de las medias de muestras de dos distribuciones normales se distribuye también normalmente, la distribución t puede usarse para examinar si esa diferencia puede razonablemente suponerse igual a cero.
para efectos prácticos el valor esperado y la varianza son :
E(t(n))= 0 y Var (t(n-1)) = n/(n-2) para > 3

Fuentes:
www.seh-lelha.org/stat1.htm
http://es.wikipedia.org/wiki/Distribución_t_de_Student
http://virtual.uptc.edu.co/ova/estadistica/docs/libros/tstudent.pdf


Actualizado:

Aquí tenéis un ejemplo práctico. 

Colts: ¿Una temporada perfecta?


Está llegando el final de la regular season de la NFL y los Colts, junto con los Saints son las grandes sensaciones de la temporada (sin olvidarnos a los Vikings de Favre). N.O con una marca de 13-1 ya no pueden optar a la temporada perfecta, pero Indianápolis Colts sí. Algo inimaginable para un equipo con entrenador nuevo (Jim Caldwell) después de la retirada de Dungy. Además, alguna lesión inoportuna como la de A. Gonzalez no auguraban una temporada como la que están teniendo. 14-0 es la marca hasta el momento y no descartemos una temporada perfecta por parte de los Colts.


¿La última oportunidad de conquistar otro trofeo para Manning? Puede ser. 12 años en la liga, 33 años en su carnet. Después de una temporada, la 2008, en donde sus números bajaron hasta guarismos similares a los de 2003, Payton se ha levantado y está dispuesto a añadir otro anillo a sus manos. Este año ha recuperado un rate superior a 100 y un 6.2% de TD. Podría superar su récord de yardas en una temporada y está contando con una gran defensa que sólo le ha ocasionado 10 sacks.

El sueño de todos, una final Payton vs Favre, dos QBs en sus últimos (¿último puede acompañar a Favre?) años en la liga. Sus últimas oportunidades para sumar un nuevo título.

Colts cerca de la temporada perfecta, y Payton... ¿de la retirada perfecta?

imágenes obtenidas de NFL.com

sábado, 5 de diciembre de 2009

Motor de búsqueda de contenidos estadísticos


Hace ya bastante tiempo aproveché la oportunidad que nos presta google con su aplicación Búsqueda personalizada de Google. Esta utilidad nos permite utilizar la potencia de Google para crear una aplicación de búsqueda personalizada para nuestro sitio web.
Es por ello que creé un motor de búsqueda centrado en contenidos estadísticos. Actualmente hay indexados 25 sitios webs.
Os animo a todos que conozcáis contenido estadístico interesante que lo indexéis al motor.

Aquí os dejo la dirección web.