No basta con el solapamiento de los intervalos de confianza. Dos valores medios pueden ser estadísticamente diferentes aún solapándose sus intervalos de confianza (90-95%). Estrictamente, habría que aplicar tests de contraste de hipótesis a todos los datos crudos de las dos muestras, pero una regla del pulgar es utilizar intervalos de confianza más anchos (83%). Si con esa confianza, los intervalos solapan, entonces podemos afirmar que las medias son estadísticamente similares. Más info en [1, 2, 3, 4, 5, 6, 7].
Bondad de ajuste y Fiabilidad de modelo
¿Qué modelo funciona mejor: a*tanh(b*t) ó a*(1-exp(-b*t))? ¿a*x^(-b) ó a*exp(-b*x)? ¿Tiene sentido ajustar una tendencia decreciente poco pandeada con una exponencial? La línea recta es una exponencial de curvatura cero.
El que estemos seguros de que dos series de datos están (co)relacionadas, no quiere decir que la relación sea tan estrecha como para estimar valores de Y desconocidos a partir de valores de X conocidos; eso dependerá de la incertidumbre de estimación que aceptemos. Si las incertidumbres en los coeficientes de ajuste son altas, puede ser un indicador de que el modelo matemático usado en el ajuste puede ser físicamente no válido. Por ello la raíz cuadrada de la suma de residuos elevados al cuadrado, normalizada por el número de grados de libertad es el mejor indicador de la dispersión de datos en un ajuste [1].
Causalidad y Casualidad
En octubre de 2012 fue noticia un artículo en la prestigiosa revista New England Journal of Medicine que correlacionó con un aceptable coeficiente de correlación el consumo anual per cápita de chocolate en un país con el número de ganadores de un Premio Nobel.
¿Qué significa un coeficiente de correlación de -0.995? Pues que los valores de x e y están altamente relacionados. Pero esto no tiene por qué darle necesariamente sentido físico a una dependencia funcional entre x e y. La existencia de una correlación no indica necesariamente una relación causa-efecto. Esta confusión entre estadística descriptiva y artefacto puramente casual ha de evitarse. No obstante, se puede someter el coeficiente de correlación a test de significancia, con diferentes grados de confianza.
Sobre cifras significativas
¿Las cifras significativas son las cifras decimales de una medida?
NO deben confundirse cifras significativas con cifras decimales. Las cifras significativas son representativas del nivel de resolución y fluctuación estadística de la medida.
¿Por qué aproximamos 0.255 a 0.26 y no hacemos lo mismo con 0.25 y 0.3? ¿Qué ganamos con ello?
No perder más del 2-5% de información.
¿Es lo mismo redondear que expresar un número con cifras significativas? ¿Cuándo se aplican las reglas de redondeo al valor experimental de una magnitud: antes o después de expresar correctamente el error asociado?
El error se redondea según el criterio de dos cifras significativas (si las hubiera) y conforme este error, se escriben las cifras significativas del valor.
¿Cuál es el error de una media si la desviación estándar es 0.016 y la sensibilidad de las medidas es 0.01?
Siguiendo el criterio de máximos, el error será 0.016 que, aunque tenga más cifras significativas que la sensibilidad o incertidumbre experimental, tiene sentido probabilístico. Por el mismo razonamiento, es posible obtener de un ajuste lineal (o no lineal) un corte con la ordenada con un error menor que la sensibilidad de la medida directa Y.
Repetibilidad y reproducibilidad
Repetir una medida en un experimento consiste en variar deliberadamente las condiciones del experimento para volver a las iniciales en las que se realizó la medida anterior, sin cambiar de instrumento, materiales ni operador y en un corto intervalo de tiempo. Debemos asegurarnos que los resultados son mutuamente independientes. Si el grado de acuerdo entre los resultados es bueno, el experimento tiene alta repetibilidad. Sin embargo, reproducir un experimento consiste en llevarlo a cabo con el mismo método, con idénticos materiales y condiciones, pero en diferentes laboratorios, con diferentes operadores y utilizando distintos equipos.