lunes, 24 de junio de 2019

1. Prueba de Hipótesis


1.1.    Introducción

 Dentro de este tema tenemos que empezar por definir que es una hipótesis y que es prueba de hipótesis.
     Hipótesis:  es una proposición o supuesto sobre los parámetros de una o más poblaciones.
     Prueba de hipótesis:  es un procedimiento basado en la evidencia muestral y la teoría

de probabilidad; se emplea para determinar si la hipótesis es una afirmación razonable. 
 La prueba de hipótesis se realiza mediante un procedimiento sistemático de cinco paso.



     Siguiendo este procedimiento sistemático, al llegar al paso cinco se puede o no rechazar la hipótesis, pero debemos de tener cuidado con esta determinación ya que en la consideración de estadística no proporciona evidencia de que algo sea verdadero. Esta prueba aporta una clase de prueba más allá de una duda razonable.

1.1.   Objetivo de la prueba de hipótesis

     El propósito de la prueba de hipótesis no es cuestionar el valor calculado del estadístico (muestral), sino hacer un juicio con respecto a la diferencia entre estadístico de muestra y un valor planteado del parámetro.

1.2.   Procedimiento sistemático para una prueba de hipótesis

1.      Paso 1,  Plantear la hipótesis nula Ho y la hipótesis alternativa H1
     Cualquier investigación estadística implica la existencia de hipótesis o afirmaciones acerca de las poblaciones que se estudian.
     La hipótesis nula (Ho) se refiere siempre a un valor especificado del parámetro de población, no a una estadística de muestra. La letra H significa hipótesis y el subíndice cero no hay diferencia. Por lo general hay un "no" en la hipótesis nula que indica que "no hay cambio" Podemos rechazar o aceptar Ho. La hipótesis nula es una afirmación que no se rechaza a menos que los datos muéstrales proporcionen evidencia convincente de que es falsa.
La hipótesis alternativa (H1) es cualquier hipótesis que difiera de la hipótesis nula. Es una afirmación que se acepta si los datos maestrales proporcionan evidencia suficiente de que la hipótesis nula es falsa. Se le conoce también como la hipótesis de investigación.
·         Tipos de pruebas
a)      Prueba bilateral o de dos extremos: la hipótesis planteada se formula con la igualdad

Ejemplo     H0: µ = 200
                    H1: µ ≠ 200 

b)     Pruebas unilateral o de un extremo: la hipótesis planteada se formula con ≥o≤

Ejemplo  H0: µ ≥ 200 H0: µ ≤ 200
                 H1: µ < 200 H1: µ > 200



2.      Paso 2,  Seleccionar el nivel de significancia.

     Nivel de significancia: Probabilidad de rechazar la hipótesis nula cuando es verdadera. Se le denota mediante la letra griega α, también es denominada como nivel de riesgo, este término es más adecuado ya que se corre el riesgo de rechazar la hipótesis nula, cuando en realidad es verdadera. Este nivel está bajo el control de la persona que realiza la prueba. Si suponemos que la hipótesis planteada es verdadera, entonces, el nivel de significación indicará la probabilidad de no aceptarla, es decir, estén fuera de área de aceptación.


     La distribución de muestreo de la estadística de prueba se divide en dos regiones, una región de rechazo (conocida como región crítica) y una región de no rechazo (aceptación). Si la estadística de prueba cae dentro de la región de aceptación, no se puede rechazar la hipótesis nula. La región de rechazo puede considerarse como el conjunto de valores de la estadística de prueba que no tienen posibilidad de presentarse si la hipótesis nula es verdadera.

3.      Paso 3, Cálculo del valor estadístico de prueba
      Valor determinado a partir de la información muestral, que se utiliza para determinar si se rechaza la hipótesis nula., existen muchos estadísticos de prueba para nuestro caso utilizaremos los estadísticos Z y T. La elección de uno de estos depende de la cantidad de muestras que se toman, si las muestras son de la prueba son iguales a 30 o más se utiliza el estadístico Z, en caso contrario se utiliza el estadístico T. 
 
4.      Paso 4, Formular la regla de decisión
     Se establece las condiciones específicas en la que se rechaza la hipótesis nula y las condiciones en que no se rechaza la hipótesis nula. La región de rechazo define la ubicación de todos los valores que son tan grandes o tan pequeños, que la probabilidad de que se presenten bajo la suposición de que la hipótesis nula es verdadera, es muy remota.
Valor crítico: Es el punto de división entre la región en la que se rechaza la hipótesis nula y la región en la que no se rechaza la hipótesis nula.


5.      Paso 5, Tomar una decisión.
En este último paso de la prueba de hipótesis, se calcula el estadístico de prueba, se compara con el valor crítico y se toma la decisión de rechazar o no la hipótesis nula. Tenga presente que en una prueba de hipótesis solo se puede tomar una de dos decisiones: aceptar o rechazar la hipótesis nula. Siempre existe la posibilidad de rechazar la hipótesis nula cuando no debería haberse rechazado (error tipo I). También existe la posibilidad de que la hipótesis nula se acepte cuando debería haberse rechazado (error de tipo II)

·         Tipos de errores
     Cualquiera sea la decisión tomada a partir de una prueba de hipótesis, ya sea de aceptación del Ho o de la H1, puede incurrirse en error:

     Un error tipo I, Se presenta si la hipótesis nula Ho es rechazada cuando es verdadera y debía ser aceptada. La probabilidad de cometer un error tipo I se denomina con la letra alfa α

    Un error tipo II, Se denota con la letra griega β se presenta si la hipótesis nula es aceptada cuando de hecho es falsa y debía ser rechazada. 
 En cualquiera de los dos casos se comete un error al tomar una decisión equivocada La única forma de reducir ambos tipos de errores es incrementar el tamaño de la muestra, lo cual puede ser o no ser posible


2. Distribuciones Continuas





Una variable aleatoria continua es una función X que asigna a cada resultado posible de un experimento un número real. Si X puede asumir cualquier valor en algún intervalo I (el intervalo puede ser acotado o desacotado), se llama una variable aleatoria continua.  En conclusión la distribución de probabilidad continua es aquella que todo cualquier valor dentro de un determinado rango.


Ejemplos
El peso de una persona (0-200 kg)     
El tiempo que demora un viaje (0 horas – 36 horas)      
La distancia de una carretera (0 kilómetros – 4000 kilómetros)
El precio de los artículos del supermercado (0 pesos – 4000 pesos)
La velocidad de un avión (0 Km/h – 900 km/h)






3. Distribución Normal en prueba de hipótesis




     La distribución normal (en ocasiones llamada distribución gaussiana) es la distribución continua que se utiliza más comúnmente en estadística. La distribución normal es de vital importancia en estadística por tres razones principales:
·         Muchas variables continuas comunes en el mundo de los negocios tienen distribuciones que se asemejan estrechamente a la distribución normal.

1.- Muchas variables continuas comunes en el mundo de los negocios tienen distribuciones que se asemejan estrechamente a la distribución normal.

2.- La distribución normal sirve para acercarse a diversas distribuciones de probabilidad discreta, como la distribución binomial y la distribución de Poisson.

3.- La distribución normal proporciona la base para la estadística inferencial clásica por su relación con el teorema de límite central.

4.- La distribución normal tiene importantes propiedades teóricas:

5.- Tiene una apariencia de forma de campana (y, por ende, es simétrica).


6.- Sus medidas de tendencia central (media, mediana y moda) son todas idénticas su «50% central» es igual a 1.33 desviaciones estándar. 

7..- Esto significa que el rango intercuartil está contenido dentro de un intervalo de dos tercios de una desviación estándar por debajo de la media y de dos tercios de una desviación estándar por encima de la media.

8.- Su variable aleatoria asociada tiene un rango infinito (-∞ < X < ∞).





3.1. Distribución de Medias


La Prueba de Hipótesis para medias usando Distribución Normal se usa cuando se cumplen las siguientes dos condiciones:


A partir de esto, se determinan los 5 pasos esenciales dentro de la prueba de Hipótesis:











La fórmula a utilizar dentro de esta distribución es la siguiente:

3.1.1.   Ejercicio

           Jamestown Steel Company fabrica y arma escritorios y otros muebles para oficina en diferentes plantas en el oeste del estado de Nueva York. La producción semanal del escritorio modelo A325 en la planta de Fredonia tiene una distribución normal, con una media de 200 y una desviación estándar de 16. Hace poco, con motivo de la expansión del mercado, se introdujeron nuevos métodos de producción y se contrató a más empleados. El vicepresidente de fabricación pretende investigar si hubo algún cambio en la producción semanal del escritorio modelo A325 tomando una muestra de 50 escritorios con una media de 203,5. En otras palabras, ¿la cantidad media de escritorios que se produjeron en la planta de Fredonia es diferente de 200 escritorios semanales con un  nivel de significancia de 0.01? 








      Paso 4: Calcular ZC



Pasó 5: Toma de decisiones
   Como 1.55 no cae en la región de rechazo, H0 no se rechaza. Por lo tanto la media de la población no es distinta de 200. Se debe de informa al vicepresidente de fabricación que la evidencia de la muestra no indica que la tasa de producción en la planta de Fredonia haya cambiado de 200 semanales.

3.1.2.     Ejercicio Planteado

     El colegio Vicente Rocafuerte realizo un censo a sus estudiantes de 5to año de especialización “Contabilidad”, en la cual se determinó un peso promedio de 60 kg el año pasado, con una desviación estándar de 15 Kg. A inicios de este año se tomó una muestra de 100 estudiantes con un promedio de 62 Kg, al nivel del 5% determine si hay evidencia estadistica suficiente para para afirmar que el peso promedio ya no es igual a 60 kg. 















Paso 4: Calcular ZC





Pasó 5: Toma de decisiones

    Como 1.33 no cae en la región de rechazo, H0 no se rechaza es decir se acepta esta hipótesis. Por lo tanto la media de la población no es distinta de 60. 

3.2. Distribución de Proporciones



Las pruebas de proporciones son adecuadas cuando los datos que se están analizando constan de cuentas o frecuencias de elementos de dos o más clases. El objetivo de estas pruebas es evaluar las afirmaciones con respecto a una proporción (o Porcentaje) de población. En muchos aspectos, las pruebas de proporciones se parecen a las pruebas de medias, excepto que, en el caso de las primeras, los datos muéstrales se consideran como cuentas en lugar de como mediciones. Por ejemplo, las pruebas para medias y proporciones se pueden utilizar para evaluar afirmaciones con respecto a:
1.      Un parámetro de población único (prueba de una muestra)
2.      La igualdad de parámetros de dos poblaciones (prueba de dos muestras), y
3.       La igualdad de parámetros de más de dos poblaciones (prueba de k muestras).
Dentro de esta distribución se utilizara la siguiente formula:

3.2.1.      Ejercicio


Suponga que a partir de las elecciones anteriores en un estado, para que sea electo un candidato a gobernador, es necesario que gane por lo menos 80% de los votos de la zona norte. El gobernador de turno está interesado en evaluar sus posibilidades de volver al cargo y hace planes para llevar a cabo una encuesta de 2 000 votantes registrados en esa región, de los cuales 1500 le darían el voto. Aplique el procedimiento para probar hipótesis y evalúe las posibilidades de que el gobernador se reelija.



























Paso 5: Toma de Decisiones

      
El valor calculado de z (2.54) se encuentra en la región de rechazo, por lo que la hipótesis nula se rechaza en el nivel 0.05.El gobernador no puede confiar en la reelección porque el valor p es inferior al nivel de significancia. 


3.2.2.      Ejercicio Planteado

La empresa “Amazon” afirma en su publicidad de marketing que al menos el 70% de sus envíos llegan al día siguiente a sus destinos, para constatar la calidad de este servicio, se selecciona aleatoriamente 150 envíos y se observa que 40 no llegaron al día siguiente a su destino, con un nivel de significación del 1% se puede aceptar la  afirmación de la empresa?

 





















Paso 5: Toma de Decisiones

    El valor calculado de z (0,83) no se encuentra en la región de rechazo, por lo que la hipótesis nula se acepta en el nivel 0.01.

3.3. Diferencia de dos Medias


     Puede comparar las medias de dos o más grupos para determinar si la diferencia entre los grupos es significativa estadística-mente, es decir, si se debe a algo más que al azar.
3.3.1.     Diferencia de media de la distribución normal
Este método se utiliza para comparar las medias de dos distribuciones muéstrales distintas y formular una inferencia con respecto a la diferencia de estas.

Suponga que se tienen dos poblaciones distintas, la primera con media µ1y desviación estándar σ1, y la segunda con media µ2y desviación estándar σ2. Y después, se elige una muestra aleatoria de tamaño n1 de la primera población y una muestra independiente aleatoria de tamaño n2 de la segunda población; se calcula la media muestral para cada muestra y la diferencia entre dichas medias. La colección de todas esas diferencias se llama distribución muestral de las diferencias entre medias.
La fórmula que se utilizará para el cálculo de probabilidad del estadístico de diferencia de medias es:





·       Etapas del contraste de hipótesis

Especialización del nivel de error.
     Nivel de significación: α=0,05.
Zona de Rechazo/aceptación de la(s) H0
La zona de rechazo de H0 está formada por todos los valores de la distribución muestral cuya probabilidad, si H0 es verdadera, sea ≤ 0,05.
Puesto que H1 indica la dirección de la diferencia, la zona de rechazo está situada solamente en el extremo de la distribución que incluye todos los valores de diferencias cuya probabilidad sea ≤ 0,05.

3.3.2.     Ejercicio                
1)     En un colegio generalmente se dice que el rendimiento de la escuela básica es inferior al de la escuela media. Se le ha preguntado al jefe de notas sobre los respectivos promedios y desviación típica y tan sola recuerda estos últimos 0,7 y 086 respectivamente. Frente a lo anterior se plantea la realización de dos muestras de tamaño 20 y 80 en cada escuela, obteniendo promedio de 3,32 y 3,50 ¿Al nivel 5% se podrá aceptar lo que generalmente se dice?


Datos
u1 = 332
u2 = 350
o1 = 0.70
o2 = 0.86
n1 = 20  
n2 = 28
µ1=
µ2=
α=0,05.

Paso 1: Plantear la hipótesis.
H0: µ1= µ2
H1: µ1< µ2


Paso 2: Determinar el nivel de significancia
      α=0,05= 1,96


Datos
= 332
2 = 350
= 0.70
= 0.86
n1 = 20  
n2 = 28
µ1=
µ2=
α=0,05.

Paso 1: Plantear la hipótesis.
H0: µ1= µ2
H1: µ1< µ2


Paso 2: Determinar el nivel de significancia
      α=0,05= 1,96


Paso 3: Establecer el estadístico de prueba




Paso 4: Calcular Zc

                       

Zc=-0.80



Paso5: Toma de Decisiones


Se acepta la hipótesis nula Zc > Z tabla esta en el aérea de aceptación.


3.3.2.     Ejercicio Planteado   
Una cadena de almacenes ofrece dos planes de cuenta de cargo disponibles para sus clientes con cuenta corriente de crédito. El departamento de finanzas  desea información acerca de cada plan, a fin de estudiar  sus diferencias. Se considero que una de las variables a estudiar debía ser el saldo mensual promedio. Se tomaron dos muestras  de tamaño de 36  y 40 cuentas de cada plan, con los siguientes resultados: promedios de $96  y $111 mil dólares respectivamente siendo sus desviaciones estándar de $15  y $18 mil dolores ¿ Al nivel  del 5%  se podrá afirmar que existe diferencia en el comportamiento  de estos planes 



       
Datos
u1 = 96000
u2 = 111000
o1 = 15000
o2 = 18000
n1 = 36
n2 = 40
α=0,05
Paso 1: Plantear la hipótesis.
H0: µ1= µ2
H1: µ1≠ µ2


Paso 2: Determinar grado de significancia
      α=0,05= 1,96

Paso 3: determinar el estadístico de prueba


Paso 4: Calcular Zc   


Zc=3,96


Paso 5: Toma de Decisiones  
Al nivel del 5% se rechaza  la hipótesis nula ya que el valor calculado es menor que el  z de la tabla dicho valor está en la zona de rechazo.