15 de marzo de 2010

Tablas de contingencia (2)

Meses atrás publicamos un artículo explicando la herramienta de tablas de contingencia integrada a Sistema Elvis. A continuación profundizamos el tema y explicamos más en detalle el uso de las mismas.

La herramienta de tablas de contingencia es sencilla de usar una vez que uno se familiariza con su funcionamiento, pero es importante entender su lógica de procesamiento de los datos para sacarle el mayor beneficio posible.

Quienes ya las saben usar en Excel (allí aparecen como "pivot tables" o "tablas dinámicas"), encontrarán muy útil el poder generar este tipo de reportes sin tener que abandonar el sistema ni importar la información a la planilla de cálculo.

Para acceder a la herramienta; vaya al menú REPORTES, opción TABLAS DE CONTINGENCIA.

Comprender la estructura de los datos que analiza, y de qué manera lo hace, facilita el datamining* y aumenta el rendimiento del business intelligence* aplicado al sistema.

El datawarehouse* de Sistema Elvis está organizado en torno a dos cubos de información* (un cubo de información es un conjunto de datos crudos organizados a través de varias dimensiones).

El primer paso para crear una tabla de contingencia es definir sobre cuál cubo se trabajará. Cada cubo almacena un “universo” de datos diferente:


CONTACTOS



El universo de datos corresponde a la información de los contactos cargados en el fichero. Los datos de cada perfil y domicilio componen las diferentes dimensiones de análisis posibles.
VISITAS



El universo de datos corresponde a las visitas cargadas en el sistema a lo largo del tiempo. Aquí se suman los datos de la visita propiamente dicha a las dimensiones de análisis ya disponibles en el cubo anterior.

Seleccione el cubo a utilizar desde el menú correspondiente:

En el segundo paso corresponde definir las dimensiones* o perspectivas de análisis a través de las cuáles queremos recortar el cubo. Sistema Elvis permite definir hasta 4 dimensiones (2 horizontales y 2 verticales).

Veamos un ejemplo concreto: supongamos que queremos analizar si hay una correlación* (vínculo) entre los productos que nuestros visitadores están promocionando y la especialidad de cada profesional visitado. En este caso tenemos 2 dimensiones: productos promocionados y especialidad del profesional.

Defina las dimensiones de acuerdo al aspecto que desea que tenga la tabla de contingencia:

De esta manera se genera la tabla de contingencia que mostrará si existe o no la correlación planteada.


DERMAPEDIAALERG
CREMA ANTIALERGIA

11

3

25

CREMA ANTIPASPADURAS

14

66

2

CREMA ANTIGRANOS

48

0

1

CREMA ANTIHONGOS

73

6

6


De ser necesario, se podrían agregar hasta 2 dimensiones más. Por ejemplo, se podría haber definido una segunda fila con el campo MATERIALES DE LA VISITA para agregar al análisis la relación entre la especialidad y los productos promocionados en relación al material que se entregó en las visitas.

Finalmente, es posible aplicar, de la misma manera que en el fichero, filtros combinados a las tablas de contingencia:

Algunos puntos importantes a tener en cuenta:
  • Recuerde que puede generar las tablas de contingencia sobre cualquier ciclo histórico.
  • Puede definir si quiere contar o sumar los campos.
  • Los resultados pueden mostrarse como valores o como porcentajes.
Recuerde que las tablas de contingencia se emplean para registrar y analizar la relación entre variables de caracter cualitativo ya sean nominales u ordinales. Para análisis de caracter más cuantitativo, le recomendamos utilizar la herramienta de AGRUPADOS incluída en el menú de REPORTES de Sistema Elvis.

*Anexo de definiciones:

Datawarehouse (almacén de datos):
En el contexto de la informática, un almacén de datos (del inglés data warehouse) es una colección de datos orientada a un determinado proceso de gestión que varía en el tiempo y ayuda a la toma de decisiones en la entidad en la que se utiliza.


Cubo: Un cubo OLAP (OnLine Analytical Processing o procesamiento Analítico En Línea) es una base de datos multidimensional, en la cual el almacenamiento físico de los datos se realiza en vectores multidimensionales. Los cubos OLAP se pueden considerar como una ampliación de las dos dimensiones de una hoja de cálculo tradicional.

Datamining: La minería de datos consiste en la extracción de información que reside de manera implícita en los datos. Dicha información es previamente desconocida y podrá resultar útil para algún proceso. En otras palabras, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos.

Dimensión: Las dimensiones de un cubo son atributos relativos a las variables, son las perspectivas de análisis de las variables (forman parte de la tabla de dimensiones). Son catálogos de información complementaria necesaria para la presentación de los datos a los usuarios, como por ejemplo: descripciones, nombres, zonas, rangos de tiempo.

Dato: El dato (del latín datum), es una representación simbólica (numérica, alfabética, algorítmica etc.), atributo o característica de una entidad. El dato no tiene valor semántico (sentido) en sí mismo, pero convenientemente tratado (procesado) se puede utilizar en la realización de cálculos o toma de decisiones.

Business intelligence: El término inteligencia empresarial se refiere al uso de datos en una empresa para facilitar la toma de decisiones. Abarca la comprensión del funcionamiento actual de la empresa, bien como la anticipación de acontecimientos futuros, con el objetivo de ofrecer conocimientos para respaldar las decisiones empresariales.

Correlación: En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación lineal entre dos variables aleatorias. Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación si al aumentar los valores de A lo hacen también los de B y viceversa. Es importante aclarar que una correlación entre dos variables no implica, por sí misma, una relación de causalidad.