viernes, 28 de junio de 2019

F de Fisher



Distribución f de Fisher. Recibió este nombre en honor a Sir Ronald Fisher, uno de los fundadores de la estadística moderna. Se usa como estadística de prueba en varias situaciones. Se emplea para probar si dos muestras provienen de poblaciones que poseen varianzas iguales. La cual es útil para determinar si una población normal tiene una mayor variación que la otra También se aplica cuando se trata de comparar simultáneamente varias medias poblacionales. La comparación simultánea de varias medias poblacionales se conoce como análisis de varianza.
Características de la distribución F.
• Existe una "familia" de distribuciones F. Un miembro específico de la familia se determina por dos parámetros:
• Los grados de libertad en el numerador y en el denominador
• La distribución F es una distribución continua.
• La distribución F tiene un sesgo positivo F no puede ser negativa
• A medida que aumentan los valores, la curva se aproxima al eje x, pero nunca lo toca
• Esta relacionada con el cociente de varianzas
Ejemplo
Una muestra de adolescentes podría dividirse en masculina y femenina, por un lado, y aquellos que están y no están actualmente estudiando para un examen de estadística, por el otro. Nuestra hipótesis es, por ejemplo, que la proporción de individuos que estudian es más alta entre las mujeres que entre los hombres, y queremos comprobar si la diferencia de proporciones que observamos es significativa. Los datos pueden verse así:

Hombres
Mujeres
Total
Estudiando
1
9
10
No Estudiando
11
3|
14
Total
12
12
24

La pregunta que hacemos acerca de estos datos es: sabiendo que 10 de estos 24 adolescentes son estudiosos, y que 12 de los 24 son mujeres, y asumiendo la hipótesis nula de que hombres y mujeres tienen la misma probabilidad de estudiar, ¿cuál es la probabilidad de que estos 10 ¿Los estudiosos se distribuirían tan desigualmente entre las mujeres y los hombres? Si tuviéramos que elegir 10 de los adolescentes al azar, ¿cuál es la probabilidad de que 9 o más de ellos estén entre las 12 mujeres, y solo 1 o menos entre los 12 hombres?

Antes de proceder con la prueba de Fisher, primero introducimos algunas anotaciones. Representamos las celdas por las letras a, b, c y d , llamamos los totales a través de las filas y los totales marginales de las columnas, y representamos el gran total por n . Entonces la mesa ahora se ve así:

Hombres
Mujeres
Total
Estudiando
A
B
A+B
No Estudiando
C
D
C+D
Total
A+C
B+D
A+B+C+D=n



Dónde (n/k) es el coeficiente binomial y el símbolo! indica el operador factorial. Con los datos anteriores, esto da:

Prueba de Chi Cuadrado


Es una prueba no paramétrica de las más utilizadas, establecida pos Helmert en 1875 y redescubierto por Karl Pearson en el (1900).
Esta prueba se denomina como Ji-Cuadrado, derivada de la letra griega mayúscula J que se escribe X que se lee CHI, el cuadrado se debe a que la suma de las diferencias de los valores observados y esperados será igual a cero (0) por lo que se elevan al cuadrado.
Formula:
Dónde:
X = valor estadístico de ji cuadrada.
fo = frecuencia observada.
fe = frecuencia esperada.



EJERCICIO

Un investigador quiere estudiar si hay asociación entre la práctica deportiva y la sensación de bienestar. Extrae una muestra aleatoria de 100 sujetos. Los datos aparecen a continuación.
Sensación de Bienestar
Práctica deportiva
Total
no
20
25
45
No
10
45
55
Total
30
70
100


Contraste la hipótesis de independencia entre bienestar y práctica de deporte (alfa = 0,01).

Sensación de
Bienestar
Práctica deportiva
Total
no
20
25
45
No
10
45
55
Total
30
70
100
Calculemos las frecuencias esperadas:
Sensación de bienestar
Práctica deportiva
No
(45x30)/100=13,5
(45x70)/100=31,5
No
(55x30)/100=16,5
(55x70)/100=38,5

Calculemos Chi-cuadrado:
1) Hagamos otra tabla, donde restamos a las frecuencias absolutas las frecuencias esperadas.
2) Este valor elevado al cuadrado.
3) Dividido por la frecuencia esperadas.
Sensación de bienestar
Práctica deportiva
No
3,1296
1,3413
No
2,5606
1,0974


Tenemos:

Ahora calculemos el valor de la tabla Chi-cuadrado

1) grados de libertad, son:
  K = (número de fila-1)x(número de columnas-1)
     = (2-1)x(2-1) = 1
2)  El valor alfa 0,01
3)  El valor que buscamos

Tenemos:             
Por tanto:

Las variables no son independientes. La práctica deportiva y la sensación de bienestar estás asociadas.


Una distribución binomial


Una distribución binomial es una distribución de probabilidad discreta que describe el número de éxitos al realizar n experimentos independientes entre sí, acerca de una variable aleatoria.
Existen una gran diversidad de experimentos o sucesos que pueden ser caracterizados bajo esta distribución de probabilidad. Imaginemos el lanzamiento de una moneda en el que definimos el suceso “sacar cara” como el éxito. Si lanzamos 5 veces la moneda y contamos los éxitos (sacar cara) que obtenemos, nuestra distribución de probabilidades se ajustaría a una distribución binomial.

PROPIEDADES DE LA DISTRIBUCIÓN BINOMIAL
Para que una variable aleatoria se considere que sigue una distribución binomial, tiene que cumplir las siguientes propiedades:
  • En cada ensayo, experimento o prueba solo son posibles dos resultados (éxito o fracaso).
  • La probabilidad del éxito ha de ser constante. Esta se representa mediante la letra p. La probabilidad de que salga cara al lanzar una moneda es 0,5 y esta es constante dado que la moneda no cambia en cada experimento y las probabilidades de sacar cara es constate.
  • La probabilidad de fracaso ha de ser también constate. Esta se representa mediante la letra q = 1-p. Es importante fijarse que mediante esa ecuación, sabiendo p o sabiendo q, podemos obtener la que nos falte.
  • El resultado obtenido en cada experimento es independiente del anterior. Por lo tanto lo que ocurra en cada experimento no afecta a los siguientes.
  • Los sucesos son mutuamente excluyentes, es decir, no pueden ocurrir los 2 al mismo tiempo. No se puede ser hombre y mujer al mismo tiempo o que al lanzar una moneda salga cara y cruz al mismo tiempo.
  • Los sucesos son colectivamente exhaustivos, es decir, al menos uno de los 2 ha de ocurrir. Si no se es hombre, se es mujer y si se lanza una moneda, si no sale cara ha de salir cruz.
  • La variable aleatoria que sigue una distribución binomial se suele representar como X~(n,p). n representa el número de ensayos o experimentos y p la probabilidad de éxito.

Formula de la distribución binomial
La fórmula para calcular la distribución normal es:

Donde:
n    = número de ensayos/experimentos
x    = número de éxitos
p    = probabilidad de éxito
q    = probabilidad de fracaso (1-p)
Es importante resaltar que la expresión entre corchetes no es una expresión matricial, sino que es un resultado de una combinatoria sin repetición. Este se obtiene con la siguiente formula:





EJEMPLO
Imaginemos que un 80% de personas en el mundo han visto el partido de la final del último mundial de futbol. Tras el evento, 4 amigos se reúnen a conversar, ¿Cuál es la probabilidad de que 3 de ellos hayan visto?
Definamos las variables del experimento:
n    = 4 (es el total de la muestra que tenemos)
x    = número de éxitos, que en este caso es igual a 3, dado que buscamos la probabilidad de que 3 de los 4 amigos lo hayan visto.
p    = probabilidad de éxito (0,8)
q    = probabilidad de fracaso (0,2). Este resultado se obtiene al restar 1-p.
Tras definir todas nuestras variables, simplemente sustituimos en la formula.

El numerador del factorial se obtendría de multiplicar 4*3*2*1 = 24 y en el denominador tendríamos 3*2*1*1 = 6. Por lo tanto el resultado del factorial sería 24/6=4.
Fuera del corchete tenemos dos números. El primero sería 0,8^3=0,512 y el segundo 0,2 (dado que 4-3 = 1 y cualquier número elevado a 1 es el mismo).
Por tanto nuestro resultado final sería: 4*0,512*0,2 = 0,4096. Si multiplicamos por 100 tenemos que hay una probabilidad del 40,96% de que 3 de los 4 amigos hayan visto el partido de la final del mundial.


PARA RESOLVER
La última novela de cierto afamado autor ha tenido un importante éxito, hasta el punto de que el  80 %  de los lectores ya la han leído. Un grupo de cuatro amigos son aficionados a la lectura:
a)    Describir la variable que indica el número de individuos del grupo que han leído dicha novela.
b)    ¿Cuál es la probabilidad de que en el grupo hayan leído la obra dos personas?  ¿Y al menos dos?

F de Fisher

Distribución f de Fisher. Recibió este nombre en honor a Sir Ronald Fisher, uno de los fundadores de la estadística moderna. Se usa como...