¿Hay que tener hipótesis antes de hacer los análisis estadísticos?

Quizá la pregunta sería mejor si hay que tener hipótesis antes de realizar un estudio o de recoger unos datos, o si por el contrario las hipótesis no son necesarias. En este post te explico si es necesario o imprescindible contar con hipótesis, en qué caso las hipótesis no son necesarias, y lo que es más importante, cuál es el motivo por el que contar con hipótesis es importante.




El primer paso para responder a estas preguntas es tener claro qué es una hipótesis. Una hipótesis es un enunciado que representa una predicción con respecto al resultado que se espera obtener en un estudio determinado. Se diferencia del objetivo del estudio, puesto que el objetivo responde a la pregunta de qué se va a investigar, mientras que la hipótesis responde a la pregunta de qué se espera encontrar.

Por ejemplo, el objetivo de un estudio podría ser:

  • Conocer el efecto del consumo de pasas sobre la memoria de pacientes con deterioro cognitivo leve.


La hipótesis de este estudio podría ser:

  • El consumo diario de 30 gr. de pasas durante 3 meses mejora la memoria de pacientes con deterioro cognitivo leve.


Una vez tenemos claro qué es una hipótesis, podemos pasar a contestar a la pregunta de este post ¿Hay que tener hipótesis antes de hacer análisis estadísticos?


La respuesta es: no siempre. Hay un caso en el que las hipótesis no son necesarias, y es en el caso en el que estemos realizando un estudio de tipo exploratorio. Y, ¿qué es un estudio exploratorio?


Los estudios exploratorios son estudios que pretenden darnos una visión global de un tema específico que se esté estudiando. Se trata de investigaciones que estudian temas sobre los que no se cuenta con mucha información, por lo que es difícil aventurar hipótesis previas. Los estudios exploratorios aportan información muy relevante, sobre todo para el diseño posterior de estudios que permitan confirmar o refutar hipótesis.


Por ejemplo, un investigador puede estar interesado en averiguar cuáles son las características de crianza infantil relacionadas con el desarrollo de depresión en la etapa adulta. En un estudio inicial, en lugar de fijarse en ciertas características de crianza específicas (apego, divorcio, bullying), recoge datos en general sobre la infancia de pacientes con depresión y personas sin depresión, y realiza análisis para ver qué características aparecen con más frecuencia en el grupo de pacientes con depresión que en el grupo de personas sin depresión.


Una vez tiene estas características identificadas, elabora un modelo o teoría de la relación entre la crianza infantil y la depresión, y a continuación elabora una serie de hipótesis que validará y refutará en un estudio posterior. Por lo tanto el estudio exploratorio, sin hipótesis, le servirá para generar hipótesis en un estadio posterior. Este estudio posterior servirá para confirmar/refutar hipótesis y al final su teoría.



¿Por qué los resultados del estudio exploratorio inicial no son válidos para confirmar/refutar directamente la teoría? O dicho de otro modo ¿Por qué hay que aventurar hipótesis antes de realizar un estudio científico para que las conclusiones no sean sólo exploratorias?


La respuesta a esta pregunta está relacionada con el famoso error Tipo I, que es rechazar la hipótesis nula (de nulidad de efectos) cuando realmente la hipótesis nula es cierta. Es decir, el error Tipo I representa meter la pata de forma que afirmamos que se ha producido un efecto o hemos encontrado una relación en nuestro estudio cuando realmente dicho efecto (o relación) no existe.


La probabilidad de cometer el error tipo I en un análisis estadístico es del 5%, si fijamos el nivel de significación en 0,05. Es decir, si la p que obtenemos es menor a 0,05, entonces rechazamos la hipótesis nula y confiamos en que hay un efecto, porque la probabilidad de que no haya un efecto es menor al 5% (lee este post para más información de cómo se interpreta la p de un test estadístico). La probabilidad de no cometer este error es entonces del 95% (en el 95% de los casos estaremos en lo cierto).


Pero esto sirve sólo para UN test estadístico. Volvamos ahora al ejemplo del estudio exploratorio de las características de crianza y la depresión en la edad adulta. Imaginemos que el investigador relaciona cuatro características de forma independiente con padecer depresión en la edad adulta: depresión en los padres, divorcio de los padres, estilo de apego y padecer bullying en la etapa escolar. Por cada análisis aislado, la probabilidad de no cometer el error Tipo I (afirmar que hay un efecto o relación cuando no la hay) es del 95%. Pero repito, esto es sólo para cada análisis aislado. Para los cuatro análisis en conjunto, la probabilidad de no cometer error Tipo I ha cambiado del 95% al:


(0,95) x (0,95) x (0,95) x (0,95) = 0,814 (81,4%)!!!

Pero lo que es peor, esto significa que la probabilidad de que hayamos cometido el error de afirmar que hay un efecto o relación que realmente no existe ha cambiado del 5% al:


1 - 0,814 = 0,186 (18,6%)!!!

Es decir, la probabilidad de equivocarnos y lanzar al mundo la información de que un efecto determinado existe cuando no existe en realidad, ya no es del 5%, que es asumible, sino que es casi del 19%!!. Esta probabilidad de error en nuestras conclusiones no es asumible en el conocimiento científico y conduce a problemas (pudiendo ser incluso vergonzantes) de replicabilidad.



Por lo tanto, para llevar a casa. ¿Es posible no elaborar hipótesis? Sí, siempre y cuando tengas claro que tu estudio se moverá en el terreno exploratorio. Si tu estudio no es exploratorio y quieres confirmar la presencia de un determinado efecto o relación, el ejercicio de formular hipótesis es imprescindible si quieres proteger a la ciencia e incluso protegerte a ti mismo de resultados espurios que sólo añaden ruido al conocimiento científico.


En cualquier caso, lo que no es aceptable es formular hipótesis una vez los análisis estadísticos se han realizado. Esta es una mala práctica científica que conduce a problemas graves de replicabilidad. Si hemos hecho un estudio, en el que no habíamos planteado hipótesis de inicio, así es como lo debemos informar y reconocer el resultado como exploratorio.