viernes, 2 de noviembre de 2012

Estadística muy pero muy básica (1.2)



Antes de partir en nuestro camino hacia la comprensión del error total, y alcanzar el estado de Seis Sigma, tomaremos algunas herramientas necesarias, los tres estadígrafos en que se basa todo. Son sencillos y bastante conocidos, se llaman:
  
Media
Desviación Estándar
Coeficiente de Variación


EL Concepto

Imaginemos...
...un conjunto de números que recogimos al azar entre muchas medidas.

Si son pocos, es fácil darse cuenta de como se comportan, ¿Están lejos unos de otros? ¿Cercanos? ¿A qué valor se aproximan?

En cambio, si los datos son muchos, muchísimos. Con sólo fijarnos en un par de propiedades, sabremos predecir cómo se comportan.


Media: Pretende indicar un valor central para los datos. También conocida como media aritmética o promedio.


Desviación estándar (DS): Un índice que indica cuán dispersos están los datos. Es mayor a mayor dispersión.

Coeficiente de Variación (CV%): Indica cuánto representa esta dispersión, dentro de  la media. Se expresa en porcentaje, de acuerdo a la fórmula que sigue más abajo.

  
Fórmulas…


La más relevante para nosotros, es la que define el Coeficiente de Variación (CV%)


CV% = DE / Media * 100

Comparto las fórmulas que uno no necesita aprender de memoria. Pueden ser demasiados datos y las planillas de cálculo o software lo harán por nosotros.

Media:




Desviación Estándar:


La Aplicación

Tomemos 2 conjuntos de datos:

Conjunto de datos A = {60, 180}
Conjunto de datos B = {118, 122}

Ambos conjuntos tienen 2 datos. La media de ambos es 120. Pero la dispersión es muy diferente.


DS (A) = 84.5
DS (B) = 2.83

Bien, esto era evidente. Consideremos otro conjunto de datos


Conjunto de datos C = {10,14}


Entendemos que estos datos provienen de valores de naturaleza diferentes, de hecho la media es distinta. Pero ¿Cuál es la dispersión en B y C?


DS (B) = 2.83
DS (C) = 2.83


De lo anterior podríamos concluir a simple vista, que en ambos conjuntos los datos están igual de dispersos. Pero sus medias son diferentes.

Ejemplo:

Nos pondremos en la situación de que vamos a un concurso televisivo en el cual debemos responder a algunas preguntas para ganar dinero.

Ya alcanzamos la etapa del concurso en que el pozo es de 120 mil dólares. El conductor nos preguntará acerca de lo que deseamos hacer con el dinero, y probablemente nosotros responderemos cosas como -"mejoraría mi laboratorio clínico", "Tomaría un curso de control de calidad", o quizá "Me dedicaría a recorrer el mundo". 

"Recuerde que, si se retira ahora, se lleva 60 mil. Si continúa y la respuesta es incorrecta, tendrá el piso de 12 mil dólares. Pero si responde correctamente a esta última pregunta ¡Seeeee lleeeeeva los 120 miiiiil!".

-"Me quedo"- una voz un tanto temblorosa delata nuestros nervios.

Suena la música. Llega el momento de responder, las cámaras sobre nosotros. Y la respuesta a la última pregunta es... ¡¡¡Correcta Señores!!! Acabamos de ganar 120 mil dólares. Caen papeles brillantes, la gente aplaude con pasión. Nos tomamos la fotografía con el cheque, saludamos familiares, etc. Mas tarde (siempre estas cosas ocurren más tarde) nos enteramos que debemos cancelar un pequeño impuesto fijo de 4 mil. Decimos bueno, hay que aportar al país. Y así volvemos a casa con felices 116 mil dólares.

Muy bien. Volvamos a la silla. Si la la respuesta hubiese sido incorrecta, nuestro premio sería 12 mil dólares, no está mal, después de todo un premio es un premio. Claro que tras las luces aparece el señor recaudador para hacernos saber que el impuesto fijo para estos casos es de… ¡4 mil dólares!. Injusto. ¿Quién me ayudó a responder? ¿Financiaron mi educación?... Tenemos la sensación de que se quedan con nuestro dinero.

Esta claro que la percepción es distinta porque obviamente 4 mil dólares es una cifra mucho más relevante dentro de los 12 mil. Cuando nuestro premio era de 120 mil diríamos que casi no se percibía. Pero ahora resulta ser muy trascendente.

Regresamos a casa con 8 mil dólares. Y pensamos en eso de que el dinero no hace la felicidad, pero al menos podremos darnos algún gusto, cómo contratar más ancho de banda  y una pantalla grande para disfrutar del sitio SimpleQC.com.


En nuestros conjunto de datos B, la media es 120, y la desviación estándar 2.83. si observamos los valores, se distancian 4 unidades uno del otro.

En el conjunto de datos C, es la misma situación. La diferencia es que los valores se mueven en torno a 12, y no a 120.

Sin embargo una diferencia de 4 unidades representa mucho más para 12, que que para 120.

Qué si realizo a un mismo espécimen (suero) algunos ensayos por duplicado. Digamos que obtengo una diferencia de 4 mg/dL en el resultado. Si la prueba fuese glucosa, no influye tanto... imagínate si fuese calcio.

Así es como entendemos que para comparar la variabilidad de valores que son de naturaleza distinta,  o de orden diferente,  No importa cuánto es la desviación estándar, sino que importa cuánto representa.

El coeficiente de variación cumple esa función, ya que considera de que tamaño son los valores que estamos analizando.

Revisemos el CV de los grupos de datos B y C:

CV% (B) = 2.36%

CV %(C) = 23.57%


Estos números muestran claramente, que la dispersión en el grupo C es mucho mas relevante que en el grupo B... ¡Es diez veces superior!


Así es como el CV% viene a ser la misma desviación estándar, pero normalizada. Por lo tanto es un excelente resumen de los datos.

Teniendo estos tres fundamentales en nuestra mente. Ya estamos preparados para emprender el viaje hacia el Error Total.





No hay comentarios:

Publicar un comentario

Déjanos tu comentario y será publicado a la brevedad.