sábado, 17 de septiembre de 2011

Teoria de Hipotesis Simple y Compuesta.

Hipótesis estadística:

hipótesis estadística a una afirmación respecto a una característica de una población. Contrastar una hipótesis es comparar las predicciones que se deducen de ella con la realidad que observamos: si hay coincidencia, dentro del margen de error admisible, mantendremos la hipótesis; en caso contrario, la rechazaremos. Rechazar una hipótesis implica sustituirla por otra capaz de explicar los datos observados.

Las siguientes afirmaciones son hipótesis estadísticas:

• El tabaco produce cáncer de pulmón.
• Disminuir los impuestos disminuye el fraude fiscal.
• Las mujeres son más apasionadas que los hombres.

Estas tres hipótesis no se refieren a individuos particulares, sino al conjunto de elementos de una o varias poblaciones. En estos ejemplos vemos que el contraste de hipótesis requiere, como pasos previos:

• Especificar la población de interés
• Definir la variable a que nos referimos y como medirla.
• Relacionar la hipótesis con los parámetros de la o las poblaciones.

Tipo de hipótesis

Las hipótesis estadísticas más habituales pueden clasificarse en dos grupos, según que:

• Especifiquen un valor concreto o un intervalo para un parámetro de la distribución de una variable.
• Establezcan la igualdad de algún parámetro en las distribuciones de una variable en dos o más poblaciones.

Un ejemplo del primer tipo es establecer que el tiempo medio diario invertido en desplazamiento por los estudiantes de una universidad es de 45 minutos. Del segundo, que el tiempo medio invertido es el mismo para los estudiantes de mañana y de la tarde.
Aunque la metodología para realizar el contraste es análoga en ambos casos, es importante distinguir entre ellos porque:

• El contraste de una hipótesis respecto a un parámetro está muy relacionado con la construcción de intervalos de confianza, y tiene frecuentemente una respuesta satisfactoria en términos de estimación.
• La comparación dedos o más poblaciones requiere en general un diseño experimental que asegure la homogeneidad de las comparaciones.

Al realizar una investigación, el investigador usualmente se plantea una hipótesis; si estudia a toda la población podrá aceptar o rechazar dicha hipótesis con toda certeza, pero si no puede estudiar la población total sino una muestra, entonces deberá seguir un proceso por medio del cual decidirá si aceptar o no su hipótesis con un riesgo conocido de estar equivocado. En eso consiste el proceso de Contraste de Hipótesis, aspecto cuyo aprendizaje reviste gran importancia no solo para quienes realizan investigación sino también para los profesionales que, para actualizar sus conocimientos, requieren de lecturas de artículos científicos en su especialidad. En este material se hace una breve explicación de los fundamentos del contraste de hipótesis y se exponen los elementos que deben ser considerados para seleccionar la prueba estadística adecuada a los datos, acompañando la lectura de ejercicios que deberán ser resueltos y discutidos con el facilitador para asegurar el aprendizaje deseado. Se anexa a la guía un material complementario donde se presentan varios casos de investigaciones con sus datos respectivos y se detallan para cada uno de ellos, todos los pasos realizados para verificar si la hipótesis planteada puede o no ser aceptada.

Hipótesis simples y compuestas

Llamaremos hipótesis simples
a aquellas que especifican un único valor para el parámetro (por ejemplo m=m0).

Llamaremos hipótesis compuestas a las que especifican un intervalo de valores (por ejemplo: m>m0 ; a< m μ2

- Hipótesis Nula (Ho): es la negación de las diferencias planteadas en la hipótesis alternativa.
Ho: "No existe diferencia significativa entre el promedio de años de trabajo en los controladores aéreos que padecen de HAD y el promedio de años de trabajo en aquellos que no tienen HAD"
Ho: μ1 = μ2 o también Ho: μ1 - μ2 = 0

Con las pruebas de contraste de hipótesis, el investigador lo que trata es de rechazar la hipótesis nula, pues así confirma su hipótesis de investigación.

b) Fijar los niveles de confianza y de significación a emplear.

Este paso ya fue expuesto anteriormente. El nivel de significación no es más que la probabilidad de rechazar una hipótesis nula que es verdadera.

c) Escoger la prueba de significación a emplear e interpretarla:

Muchas de las investigaciones que se realizan pretenden comparar un valor o medida obtenido de una muestra, con un valor teórico; o bien, comparar dos o más grupos para saber si existe diferencia entre ellos.

Se toma una muestra de cada grupo poblacional y a cada uno se le calculan las medidas de resumen que se desean comparar.

Si la hipótesis de investigación plantea que los grupos difieren en cuanto a la variable estudiada, la hipótesis nula expresará que no existe diferencia significativa entre los grupos, resumidos bien sea por promedios, porcentajes, etc; es decir: la hipótesis nula plantea que la diferencia observada en la muestra obedece al azar y no se da igualmente en la población (la diferencia no es significativa).

Para poder rechazar esa hipótesis se debe realizar una prueba estadística de significación.
Muchas de estas pruebas se basan en el supuesto de que la población estudiada tiene una distribución normal y, por lo tanto, las propiedades de la curva normal son aplicables.
Este tipo de prueba consiste, en líneas generales, en lo siguiente:

1) Se calcula un valor con la (s) muestra (s) y ese valor se lleva a puntaje Z usando las fórmulas indicadas

2) Se fija un nivel de significación α el cual determina en la curva normal dos zonas: una zona de aceptación de la hipótesis nula y una zona de rechazo de la hipótesis nula.


Ejemplo:

Se desea saber con un 95% de certeza si el promedio de 74 pulsaciones por minuto observado en una muestra de 36 individuos normales se diferencia significativamente del valor de 70 pulsaciones, considerado como normal. El error estándar de la media es 2,11.
Nótese que lo que se desea saber es si esa muestra formada procede de la población cuyo promedio se conoce, o por el contrario, procede de otra población.
Datos:

x = 74
μ 0 = 70
n = 36
σ x = 2,11

Procedimiento:
• Se calcula la diferencia entre los 2 valores y se transforma en puntaje Z, utilizando la fórmula:

Zc = x - μ0 / σ x Zc = 74 - 70 / 2.11 = 1.90

• Se definen las zonas de aceptación y rechazo
• Se definen las zonas de aceptación y rechazo de la hipótesis nula:

Como se desea una certeza de un 95%, el nivel de significación es 0,05 y para este nivel Zo: 1,96.

• Puesto que el valor de Z calculada cae dentro de los límites de la zona de aceptación de Ho, esta hipótesis no puede ser rechazada no existe diferencia significativa entre el promedio y el valor teórico con el cual se compara.

Errores de tipo I y de tipo II.

Al realizar un contraste se puede cometer uno de los dos errores siguientes:

Error tipo I,
se rechaza la hipótesis nula H0 cuando es cierta.
Error tipo II, se acepta la hipótesis nula H0 cuando es falsa.

Debe tenerse en cuenta que sólo se puede cometer uno de los dos tipos de error y, en la mayoría de las situaciones, se desea controlar controlar la probabilidad de cometer un error de tipo I.
Se denomina nivel de significación de un contraste a la probabilidad de cometer un error tipo I, se denota por y, por tanto,
(1.7)

Fijar el nivel de significación equivale a decidir de antemano la probabilidad máxima que se está dispuesto a asumir de rechazar la hipótesis nula cuando es cierta. El nivel de significación lo elige el experimentador y tiene por ello la ventaja de tomarlo tan pequeño como desee (normalmente se toma = 0'05, 0'01 o0'001).

La selección de un nivel de significación conduce a dividir en dos regiones el conjunto de posibles valores del estadístico de contraste:

La región de Rechazo, con probabilidad , bajo H0.
La región de Aceptación, con probabilidad 1 - , bajo H0.

Si el estadístico de contraste toma un valor perteneciente a la región de aceptación, entonces no existen evidencias suficientes para rechazar la hipótesis nula con un nivel de significación y el contraste se dice que estadísticamente no es significativo. Si, por el contrario, el estadístico cae en la región de rechazo entonces se asume que los datos no son compatibles con la hipótesis nula y se rechaza a un nivel de significación . En este supuesto se dice que el contraste es estadísticamente significativo.

Por tanto, resolver un contraste estadístico es calcular la región de aceptación y la región de rechazo y actuar según la siguiente regla de decisión:
Se obtiene la muestra = y se calcula el estadístico del contraste .
(1.8)

Según la forma de la región de rechazo, un contraste de hipótesis, paramétrico o no,
se denomina

Contraste unilateral o contraste de una cola es el contraste de hipótesis cuya región de rechazo está formada por una cola de la distribución del estadístico de contraste, bajo H0.

Contraste bilateral o contraste de dos colas es el contraste de hipótesis cuya región de rechazo está formada por las dos colas de la distribución del estadístico de contraste, bajo H0.

Ejemplo 1.1. Test de hipótesis estadística.

“La distribución del tamaño en Kb de los ficheros que resultan al digitalizar imágenes con un determinado programa puede suponerse normal. El programa ha sido mejorado en su última versión (versión B) hasta el punto de que quienes lo comercializan garantizan una disminución en el tamaño medio de los ficheros resultantes superior a 6 Kb con respecto a la versión anterior (versión A).

Si rechazamos una hipótesis cuando debiera ser aceptada, diremos que se ha cometido un error de tipo I.

Por otra parte, si aceptamos una hipótesis que debiera ser rechazada, diremos que se cometió un error de tipo II.

En ambos casos, se ha producido un juicio erróneo.

Para que las reglas de decisión (o no contraste de hipótesis) sean buenos, deben diseñarse de modo que minimicen los errores de la decisión; y no es una cuestión sencilla, porque para cualquier tamaño de la muestra, un intento de disminuir un tipo de error suele ir acompañado de un crecimiento del otro tipo. En la práctica, un tipo de error puede ser más grave que el otro, y debe alcanzarse un compromiso que disminuya el error más grave.

La única forma de disminuir ambos a la vez es aumentar el tamaño de la muestra que no siempre es posible.

Niveles de Significación.

Al contrastar una cierta hipótesis, la máxima probabilidad con la que estamos dispuesto a correr el riesgo de cometerán error de tipo I, se llama nivel de significación.
Esta probabilidad, denota a menudo por se, suele especificar antes de tomar la muestra, de manera que los resultados obtenidos no influyan en nuestra elección.

En la práctica, es frecuente un nivel de significación de 0,05 ó 0,01, si bien se une otros valores. Si por ejemplo se escoge el nivel de significación 0,05 (ó 5%) al diseñar una regla de decisión, entonces hay unas cinco (05) oportunidades entre 100 de rechazar la hipótesis cuando debiera haberse aceptado; Es decir, tenemos un 95% de confianza de que hemos adoptado la decisión correcta. En tal caso decimos que la hipótesis ha sido rechazada al nivel de significación 0,05, lo cual quiere decir que tal hipótesis tiene una probabilidad 0,05 de ser falsa.
Prueba de Uno y Dos Extremos.

Cuando estudiamos ambos valores estadísticos es decir, ambos lados de la media lo llamamos prueba de uno y dos extremos o contraste de una y dos colas.

Con frecuencia no obstante, estaremos interesados tan sólo en valores extremos a un lado de la media (o sea, en uno de los extremos de la distribución), tal como sucede cuando se contrasta la hipótesis de que un proceso es mejor que otro (lo cual no es lo mismo que contrastar si un proceso es mejor o peor que el otro) tales contrastes se llaman unilaterales, o de un extremo. En tales situaciones, la región crítica es una región situada a un lado de la distribución, con área igual al nivel de significación.

No hay comentarios:

Publicar un comentario en la entrada