sábado, 17 de septiembre de 2011

Ejercicios de Hipotesis (Parte I)


Uso de valores P para la toma de decisiones

Al probar hipótesis en las que la estadística de prueba es discreta, la región crítica se puede elegir de forma arbitraria y determinar su tamaño. Si es demasiado grande, se puede reducir al hacer un ajuste en el valor crítico. Puede ser necesario aumentar el tamaño de la muestra para compensar la disminución que ocurre de manera automática en la potencia de la prueba (probabilidad de rechazar Ho dado que una alternativa específica es verdadera).

Por generaciones enteras de análisis estadístico, se ha hecho costumbre elegir un nivel de significancia de 0.05 ó 0.01 y seleccionar la región crítica en consecuencia. Entonces, por supuesto, el rechazo o no rechazo estricto de Ho dependerá de esa región crítica. En la estadística aplicada los usuarios han adoptado de forma extensa la aproximación del valor P. La aproximación se diseña para dar al usuario una alternativa a la simple conclusión de "rechazo" o "no rechazo".
La aproximación del valor P como ayuda en la toma de decisiones es bastante natural pues casi todos los paquetes de computadora que proporcionan el cálculo de prueba de hipótesis entregan valores de P junto con valores de la estadística de la prueba apropiada.

  • Un valor P es el nivel (de significancia) más bajo en el que el valor observado de la estadística de prueba es significativo.
  • El valor P es el nivel de significancia más pequeño que conduce al rechazo de la hipótesis nula Ho.
  • El valor P es el mínimo nivel de significancia en el cual Ho sería rechazada cuando se utiliza un procedimiento de prueba especificado con un conjunto dado de información. Una vez que el valor de P se haya determinado, la conclusión en cualquier nivel particular resulta de comparar el valor P con
:
  1. Valor P Þ rechazar Ho al nivel .
  2. Valor P > Þ No rechazar Ho al nivel
.
Ensayo Unilateral Derecho:

Ensayo Unilateral Izquierdo:
Ensayo Bilateral:


Ejemplos:

  1. Calcular el valor de P para el primer ejemplo de ensayo de hipótesis en donde se quería probar que la edad media de los habitantes de Estados Unidos es superior a 70 años.
Solución:

  1. Ensayo de hipótesis
  2. Ho; = 70 años.
    H1; > 70 años.
  3. Regla de decisión:
  4. Si P 0.05 se rechaza Ho.
    Si P > 0.05 No se rechaza Ho.
  5. Cálculos:

  6. Esta es el valor de Z que se utilizará para calcular el valor de P, como es un ensayo unilateral derecho se calculará el área a la derecha de este valor.
  7. Justificación y decisión:


Como el valor de P es 0.217 y es menor al valor del nivel de significancia de 0.05 por lo tanto se rechaza H0, y se concluye que la edad media de los habitantes es mayor a 70 años.
  1. Calcular el valor de P para el ejemplo 7 de esta sección en donde se tiene dos máquinas y se quiere ver si tienen la misma cantidad promedio de llenado en las botellas de plástico.
Solución:
  1. Ensayo de hipótesis
Ho; 1-2 = 0
H1; 1-2 0 Si se cae en Ho se podrá probar que el volumen de llenado es el mismo en las dos máquinas.
  1. Regla de Decisión:
Si P 0.05 Se rechaza Ho
Si P > 0.05 No se rechaza Ho
  1. Cálculos:
Como este es un ensayo bilateral se procederá a calcular el valor de P mediante el valor de la ZR, positiva y negativa y luego se sumarán las áreas.

Como el valor de P es mayor al de , se no se rechaza H0, y se concluye que las maquinas tienen el mismo llenado promedio.

  1. Se afirma que un automóvil se maneja en promedio más de 20,000 kilómetros por año. Para probar esta afirmación, se pide a una muestra de 100 propietarios de automóviles que lleven un registro de los kilómetros que viajen. ¿Está de acuerdo con esta afirmación si la muestra aleatoria tiene un promedio de 23,500 kilómetros y una desviación estándar de 3900 kilómetros? Utilice un valor P para su conclusión.
Solución:

En este ejercicio no nos manejan ningún valor de , por lo que se procederá a plantear el ensayo y luego calcular z para poder conocer el valor de P y llegar a una conclusión.

  1. Ensayo de hipótesis
  2. Ho; = 20,000 kilómetros.
    H1; > 20,000 kilómetros.
  3. Cálculos:
  4. Decisión.
  5. Se observa que este valor de Z es muy grande, ni siquiera se encuentra en la tabla, entonces quiere decir que el área a la derecha de ese valor es cero y este sería el valor de P, por lo que no apoya a la hipótesis nula y se concluye que los automóviles se manejan en promedio más de 20,000 kilómetros por año.
  6. Se estudia la fracción de circuitos integrados defectuosos producidos en un proceso de fotolitografía. Para ello se somete a prueba una muestra de 300 circuitos, en la que 13 son defectuosos. Utilice los datos para probar
    Ho: P=0.05 contra H1: P
0.05. Utilice un valor de P para su conclusión.
Solución:

  1. Ensayo de hipótesis


Ho; P = 0.05
H1; P 0.05

  1. Cálculos:
  2. Decisión:


Este valor de P de 0.596 es muy grande por lo que se concluye que la fracción defectuosa de circuitos integrados es de 0.05, o sea no se rechaza Ho.


Al evaluar un procedimiento de prueba de hipótesis, también es importante examinar la probabilidad del error tipo II, el cual se denota por . Esto es,

= P(error tipo II) = P(aceptar Ho/ Ho es falsa)

Para calcular se debe tener una hipótesis alternativa específica; esto es, debe tenerse un valor particular del parámetro. Por ejemplo, supóngase que es importante rechazar la hipótesis nula Ho: = 50 cada vez que la rapidez promedio de combustión es mayor que 52 cm/s o menor que 48 cm/s. Para ello, puede calcularse la probabilidad de un error tipo II para los valores = 52 y = 48, y utilizar este resultado para averiguar algo con respecto a la forma en que se desempeñará la prueba. De manera específica, ¿cómo trabajará el procedimiento de prueba si se desea detectar, esto es, rechazar Ho, para un valor medio de = 52 ó = 48? Dada la simetría, sólo es necesario evaluar uno de los dos casos, esto es, encontrar la probabilidad de aceptar la hipótesis nula Ho: = 50 cuando el valor verdadero es = 52.

Para hacer este cálculo se tendrá un tamaño de muestra de 10 y una desviación estándar de la población de 2.5 cm/s. Además se evaluará el error tipo II con un nivel de significancia de 0.06.

Ho: = 50

H1: 50

Como ya sabemos se trata de un ensayo bilateral por lo que se tendrá que calcular el valor del estadístico de la siguiente manera:

Para facilitar los cálculos se redondearán estos números a 48.5 y 51.5
Para poder comprender mejor el cálculo del error tipo II se delimitará el área de la región de aceptación con dos líneas ya que es bilateral y se evaluará la probabilidad de caer en esa área cuando la media tiene un valor de 52 y de 48.

Como se puede observar en cada calculo del valor se tuvieron que evaluar los dos valores de z. En el primer calculo de se tiene un valor de z=-4.43, esto quiere decir que no existe área del lado izquierdo del 48.5, por lo que sólo será el área que corresponda a la z=-0.63. Lo mismo pasa con el segundo cálculo de . Como las medias de 52 y 48 son equidistantes del 50 por este motivo los valores del error tipo II son los mismos.

En caso que no estén equidistantes se tienen que calcular por separado y calcular los valores correspondientes de z porque en ocasiones se tiene un área que no está dentro de la región de aceptación, la cual no se tiene que tomar en cuenta para evaluar al error tipo II.
A continuación se procederá a generar algunas curvas características de operación para evaluar al error tipo II, entre más se aleja el valor verdadero de la media de la media de la hipótesis nula, menor es la probabilidad del error tipo II para un tamaño de muestra y nivel de significancia dadas. A medida que el tamaño de la muestra aumenta la probabilidad de cometer el error tipo II disminuye. Esto se observará en los ejercicios siguientes.
Ejemplos:

  1. Generar una curva característica de operación para el ejercicio número 1 de la sección de ensayo de hipótesis con las siguientes medias supuestas:

= 70.5, 71, 71.5, 72, 72.5, 73, 73.5, y 74.

2. Datos:
=70 años
= 8.9 años
= 71.8 años
n = 100
= 0.05
3. Ensayo de hipótesis
Ho; = 70 años.
H1; > 70 años.
Se calculará el estadístico límite:

En la mayoría de los libros de estadística existen las curvas características de operación para diferentes tamaños de muestra y éstas se proporcionan tanto para = 0.05 como para = 0.01 (son las más comunes). Para poder utilizar las curvas se define un parámetro llamado d, que estandariza para cualquier valor de y :


Si se quisiera consultar en un libro, ¿cuál es la probabilidad de cometer el error tipo II ó cuando la media verdadera es de 72?; se tendría que calcular el valor de d y buscar en las curvas la que pertenezca a un tamaño de muestra de 100 con un = 0.05.

Este valor se encuentra en el eje de las x. Si se transforma la curva característica de operación con el valor de d quedaría de la siguiente manera:


Se comentó anteriormente que si el tamaño de la muestra aumenta los dos tipos de errores y disminuyen. Para probar esto y específicamente en lo que se refiere al error tipo II se realizará el ejercicio anterior suponiendo que en lugar de tener 100 personas, el tamaño de la muestra aumenta a 150 personas.

Se calculará el estadístico límite:


  1. Generar una curva característica de operación (CCO) para el ejercicio 5 de ensayo de hipótesis. Suponer los siguientes valores de P; 0.04, 0.03, 0.025, 0.02 y 0.01. Enseguida se proporciona la información necesaria para realizar la CCO:
  2. Datos:
    P= 0.05
    p = 4/200 = 0.02
    n = 200
    = 0.05
    Ensayo de hipótesis
    Ho; P = 0.05
    H1; P < 0.05
    Solución:
    Se procederá a calcular el estadístico límite pL:
    En una distribución muestral de proporciones, para graficar la CCO, se necesita calcular el valor de np, que es el que irá en el eje de las x para estandarizar la curva.
  3. Genere un CCO para el ejercicio número 6 de la sección anterior. Suponga las siguientes diferencias de medias: 1-2 =2, 4, 6, 7, 9, 12 y 14.
  4. Datos:
    1=2= 8

    n1=n2= 10
    = 0.05
    Ensayo de hipótesis
    Ho; 1-2 = 0
    H1; 1-2 > 0
    Para graficar la curva se utilizará el valor de d, el cual para una distribución muestral de diferencia de medias tiene la siguiente fórmula:
    En los libros de estadística lo que se acostumbra en algunos de los ejercicios es preguntar sólo un punto de la CCO, por lo que a continuación se resolverán dos problemas tipo.
  5. Se require que la tensión de ruptura de un hilo utilizado en la fabricación de material de tapicería se al menos de 100 psi. La experiencia ha indicado que la desviación estándar de la tensión de ruptura es de 2 psi. Se prueba una muestra aleatoria de nueve especímenes, y la tensión de ruptura promedio observada en ella es de 98 psi. ¿Cual es la probabilidad de aceptar la hipótesis nula con un = 0.05 si la tensión promedio de ruptura verdadera de la fibra es 104 psi?
  6. Solución:
    Ensayo de hipótesis:
    Ho; = 100
    H1; > 100
    Se calcula el estadístico límite:
  7. Del ejercicio número 7 de la sección anterior encontrar el error tipo II ó
suponiendo que la diferencia verdadera entre las medias de las máquinas es fe 0.03
Datos:

1= 0.020
2= 0.025


n1=n2 = 10
= 0.05
Solución:
Ensayo de hipótesis
Ho; 1-2 = 0
H1; 1-2 0
Por ser bilateral se calcularon dos valores de z, y como se puede observar del lado izquierdo de –0.019 ya no se encuentra área, por lo que el error tipo II sólo será el área a la izquierda del valor de la diferencia del estadístico límite 0.019.

  1. En un estudio para estimar la proporción de residentes de cierta ciudad y sus suburbios que están a favor de la construcción de una planta de energía nuclear, se encuentra que 63 de 100 residentes urbanos están a favor de la construcción mientras que sólo 59 de 125 residentes suburbanos la favorecen. ¿Hay una diferencia significativa entre la proporción de residentes urbanos y suburbanos que favorecen la construcción de la planta nuclear? Use un valor de P para su conclusión.
  2. Una compañía petrolera afirma que un quinto de las casas en cierta ciudad se calientan con petróleo. ¿Tenemos razón en dudar de esta afirmación si, en una muestra aleatoria de 1000 casas en esta ciudad, se encuentra que 136 se calientan con petróleo? Utilice un nivel de significancia de 0.01.
  3. Se sabe que la duración, en horas, de un foco de 75 watts tiene una distribución aproximadamente normal, con una desviación estándar de 25 horas. Se toma una muestra aleatoria de 20 focos, la cual resulta tener una duración promedio de 1014 horas.

  1. ¿Existe evidencia que apoye la afirmación de que la duración promedio del foco es mayor que 1000 horas? Utilice un = 0.05.
  2. ¿Cual es el valor P para la prueba?
  3. ¿Cuál es el valor de
para la prueba del inciso a) si la verdadera duración promedio del foco es de 1050 horas?
  1. Se estudia la tasa de combustión de dos propelentes sólidos utilizados en los sistemas de escape de emergencia de aeroplanos. Se sabe que la tasa de combustión de los dos propelentes tiene aproximadamente la misma desviación estándar de 3 cm/s. Se prueban dos muestras aleatorias de 20 especímenes cada una, obteniéndose medias de 18 y 24 cm/s respectivamente.

  1. Pruebe la hipótesis de que los dos combustibles sólidos tienen la misma rapidez promedio de combustión. Utilice un = 0.05.
  2. ¿Cuál es el valor de P de la prueba?
  3. ¿Cuál es el valor de
para la prueba del inciso a) si la verdadera diferencia en la rapidez promedio de combustión es 2.5 cm/s?
  1. Un artículo publicado en Fortune afirma que casi la mitad de todos los ingenieros continúan sus estudios académicos después de obtener la licenciatura. Un artículo publicado en Engineering Horizons indica que 117 de 484 recién graduados planean continuar sus estudios.

  1. ¿Los datos publicados en Engineering Horizons son consistentes con los publicados en Fortune?
  2. Encuentre el valor de P de la prueba.

  1. En un invierno con epidemia de gripe, una compañía farmacéutica bien conocida estudió 2000 bebes para determinar si la nueva medicina de la compañía era efectiva después de dos días. Entre 120 bebes que tenían gripe y se les administró la medicina, 29 se curaron dentro de dos días. Entre 280 bebés que tenían gripe pero que no recibieron la medicina, 56 se curaron dentro de dos días. ¿Hay alguna indicación significativa que apoye la afirmación de la compañía de la efectividad de la medicina? Calcule el valor P.
  2. Se lanza 20 veces una moneda, con un resultado de cinco caras. ¿Esta es suficiente evidencia para rechazar la hipótesis de que la moneda esta balanceada a favor de la alternativa de que las caras ocurren menos de 50% de las veces.? Realice la prueba con un nivel de significancia de 0.03 y cite un valor P.
  3. Se supone que los neumáticos para automóvil de cierto tipo recién comprados deben llenarse a una presión de 30 lb/pulg2. Se representa con el verdadero promedio de presión. Encuentre el valor P asociado con cada valor del estadístico z dado para probar Ho; = 30 contra H1; 30.
  4. a) 2.10 b) –1.75 c) –0.55 d) 1.41 e) –5.3
  5. Se realizó un experimento para comparar la resistencia a la fractura del acero con níquel maragizado, con el acero de pureza comercial del mismo tipo. Para 32 especímenes, la resistencia promedio muestral fue de 65.6 para el acero de alta pureza, mientras que se obtuvo una media muestral de 59.8 en 38 especímenes del acero comercial. Debido que el acero de alta pureza es más costoso, su uso para cierta aplicación puede justificarse sólo si su resistencia a la fractura excede la del acero de pureza comercial en más de 5. Suponga que ambas distribuciones de resistencias son normales.

  1. Si se supone que 1 = 1.2 y 2 = 1.1, pruebe las hipótesis pertinentes usando = 0.001.
  2. Calcule para la prueba del inciso anterior cuando 1-
2 = 6.
  1. Se cree que la portada y la naturaleza de la primera pregunta de encuestas por correo influyen en la tasa de respuesta. Un artículo probó esta teoría al experimentar con diferentes diseños de portadas. Una portada sencilla, y la otra utilizó la figura de un paracaidista. Los investigadores especularon que la tasa de devolución sería menor para la portada sencilla.

Portada
Número de envíos
Número de devoluciones
Sencilla
207
104
Paracaidista
213
109


¿Esta información apoya la hipótesis de los investigadores? Haga la prueba con un nivel de significancia de 0.10, calculando primero un valor P.
Respuesta a los Problemas propuestos
  1. z= 2.40; sí, P=0.01
  2. P<0.0001; concluir que menos de 1/5 de las casas se calientan con petróleo.
  3. a) z = 2.50; se rechaza Ho b) P = 0.0062 c) 0
  4. a) Se Rechaza Ho, z= -6.32 b) 0 c) 0.248
  5. a) Se rechaza Ho, z= -11.36 b) valor P = 0
  6. No se rechaza Ho, z= 0.93, valor de P = 0.1762
  7. Rechazar Ho. Valor P = 0.0207
  8. a) 0.0358 b) 0.0802 c) 0.5824 d) 0.1586 e) 0
  9. a) z=2.89, no se debe usar el acero de alta pureza o se no se rechaza Ho.
    b) 0.2981
  10. Valor P = 0.4247, no se rechaza Ho.

1 comentario: