Análisis de Correlación Guía de conceptos clave, fórmulas y ejercicios
Análisis de Correlación
Unidad 7. Correlación
Antes de calcular números, debemos entender el concepto fundamental de la unidad. En el mundo real, pocas cosas ocurren de forma aislada. La mayoría de los fenómenos están conectados entre sí.
Piensa en la relación entre "Calor" y "Venta de Helados". Cuando aumenta el calor, generalmente aumenta la venta de helados. Existe una "correlación" entre ambos eventos. No significa necesariamente que uno cause al otro, pero sí que se mueven juntos.
Objetivo: Determinar si existe correlación en una fábrica de zapatos.
El ingeniero nota que los días de lluvia, los empleados llegan más tarde.
Variable A: Cantidad de lluvia. Variable B: Retardos.
Existe una posible correlación. Ahora necesitamos herramientas matemáticas (temas 7.1 y 7.2) para confirmarlo.
1. Publicidad vs Ventas
Situación: Una tienda gasta más en Facebook Ads y nota que sus ventas suben.
Interpretación: Existe correlación positiva visible.
2. Edad vs Tecnología
Situación: Se observa que a mayor edad, menor velocidad de escritura en el celular.
Interpretación: Existe correlación inversa visible.
3. Suerte vs Dados
Situación: Un jugador usa calcetines rojos para ganar en los dados.
Interpretación: No existe correlación (es superstición/azar).
Ver respuesta
Ver respuesta
Ver respuesta
Ver respuesta
Ver respuesta
7.1 Correlación Simple
Es el nivel más básico de análisis. Aquí estudiamos la relación entre solamente dos variables: Una independiente (X) y una dependiente (Y).
Tipos de Correlación Simple
- Positiva: Si X sube, Y sube. (Directamente proporcional).
- Negativa: Si X sube, Y baja. (Inversamente proporcional).
- Nula: Los puntos están dispersos sin orden. No hay relación.
Un maestro quiere ver si estudiar más horas mejora la calificación.
Alumno A: (2 horas, 6.0 calif)
Alumno B: (5 horas, 9.0 calif)
Se colocan los puntos en el plano. Eje horizontal = Horas, Eje vertical = Calificación.
Al ver que los puntos forman una línea que "sube" hacia la derecha, concluimos que es una Correlación Simple Positiva.
1. Velocidad vs Tiempo de Viaje
Datos: A mayor velocidad (X), menor tiempo para llegar (Y).
Tipo: Correlación Negativa
2. Estatura vs Inteligencia
Datos: Se midió a 100 personas y su IQ. Los puntos están por todos lados.
Tipo: Correlación Nula
3. Fertilizante vs Cosecha
Datos: Más kilos de abono (X) resultan en más kilos de fruta (Y).
Tipo: Correlación Positiva
Ver respuesta
Ver respuesta
Ver respuesta
Ver respuesta
Ver respuesta
7.2 Coeficiente de Pearson
Ya sabemos ver la correlación en una gráfica (7.1), pero ¿cómo la medimos con precisión? Necesitamos un número exacto.
Escala de Interpretación (r)
- +1.00: Correlación Positiva Perfecta.
- 0.00: Ausencia de correlación.
- -1.00: Correlación Negativa Perfecta.
- Valores cercanos a 0.8 o -0.8 se consideran "Fuertes".
Calcular r para estos datos: (1, 2), (2, 4), (3, 5). n=3.
| x | y | xy | x² | y² |
|---|---|---|---|---|
| 1 | 2 | 2 | 1 | 4 |
| 2 | 4 | 8 | 4 | 16 |
| 3 | 5 | 15 | 9 | 25 |
| Σ6 | Σ11 | Σ25 | Σ14 | Σ45 |
3(25) - (6)(11) = 75 - 66 = 9
Tras resolver el denominador, el resultado es r = 0.98.
Interpretación: Relación positiva muy fuerte.
1. Resultado r = -0.95
Contexto: Precio vs Ventas.
Interpretación: Muy Fuerte e Inversa.
El precio impacta muchísimo en las ventas de forma negativa.
2. Resultado r = 0.15
Contexto: Anuncios en radio vs Ventas web.
Interpretación: Débil / Nula.
La estrategia no está funcionando, la relación es casi inexistente.
3. Resultado r = 1.00
Contexto: Metros de cable vs Peso del cable.
Interpretación: Perfecta.
Es una relación física exacta, sin variación aleatoria.
Ver respuesta
Ver respuesta
Ver respuesta
Ver respuesta
Ver respuesta
7.3 Correlación Múltiple
Tradicionalmente estudiamos cómo una variable afecta a otra (X → Y). Pero en la vida real y en la ingeniería, un resultado casi siempre depende de muchos factores al mismo tiempo.
Donde Y es el resultado, las β son los pesos de cada variable, y las X son los factores.
¿Cómo se mide?
Usamos el Coeficiente de Determinación Múltiple (R2). Este número nos dice qué porcentaje del resultado es explicado por nuestras variables.
Imagina que queremos predecir el precio (Y). No depende solo del tamaño. Depende de:
- X1: Metros cuadrados de construcción.
- X2: Número de habitaciones.
- X3: Antigüedad de la casa.
Un ingeniero tiene la siguiente ecuación para predecir unidades/hora (Y):
Y = 10 + 5(Operarios) - 2(Años_Maquina)
Calculamos producción con 8 operarios y máquina de 3 años.
Y = 10 + 5(8) - 2(3)
Y = 10 + 40 - 6 = 44 unidades
1. Agricultura (Maíz)
Fórmula: Y = 20 + 0.5(Agua) + 2(Fertilizante)
Datos: 100L de agua, 50kg fertilizante.
Cálculo: Y = 20 + 50 + 100
Resultado: 170 Toneladas
2. Ventas Online
Fórmula: Y = 500 + 10(Anuncios) - 5(Precio)
Datos: 20 Anuncios, Precio de $30.
Cálculo: Y = 500 + 200 - 150
Resultado: 550 Unidades
3. Calificación Escolar
Fórmula: Y = 2 + 0.6(Estudio) + 0.5(Participación)
Datos: 5 horas estudio, 4 participaciones.
Cálculo: Y = 2 + 3 + 2
Resultado: Nota 7.0
Ver respuesta
Ver respuesta
Ver respuesta
Ver respuesta
Ver respuesta
7.4 Tablas de Correlación
En procesos industriales complejos, tenemos muchísimos datos. Hacer gráficos de uno por uno es ineficiente. Necesitamos un "mapa" que nos diga todo de un vistazo.
Cada celda de la tabla se calcula usando el Coeficiente de Pearson (r).
| Variables | Temperatura | Presión | Defectos |
|---|---|---|---|
| Temperatura | 1.00 | 0.85 | 0.92 |
| Presión | 0.85 | 1.00 | 0.20 |
| Defectos | 0.92 | 0.20 | 1.00 |
El gerente le pide que analice la tabla anterior y decida qué variable ajustar para reducir defectos.
Miramos "Defectos".
Temp (0.92) vs Presión (0.20).
Acción: Controlar la Temperatura.
1. Logística (Camiones)
Datos: Distancia vs Gasolina (r = +0.98)
Interpretación:
Relación directa casi perfecta. Más distancia implica obligatoriamente más gasolina.
2. Seguridad Industrial
Datos: Capacitación vs Accidentes (r = -0.85)
Interpretación:
Correlación inversa fuerte. Más capacitación reduce significativamente los accidentes.
3. Recursos Humanos
Datos: Estatura vs Desempeño (r = +0.02)
Interpretación:
Correlación nula. La estatura no tiene ninguna relación con el desempeño.
Ver respuesta
Ver respuesta
Ver respuesta
Ver respuesta
Ver respuesta
7.5 Correlación Cualitativa
Hasta ahora hemos hablado de números. ¿Pero qué pasa cuando los datos son cualidades o categorías?
Herramientas diferentes
Usamos métodos como la correlación por rangos de Spearman. La fórmula utiliza las diferencias de rango (d):
Dos jueces ordenan 3 marcas de café. ¿Coinciden?
Diferencias (d): 0, -1, 1.
0 + 1 + 1 = 2.
rs = 1 - (12/24) = 0.5 (Coincidencia moderada).
1. Concurso de Canto
Situación: Jueces coinciden en todo el orden.
Suma diferencias: 0.
Resultado: rs = 1.0
Correlación cualitativa perfecta positiva.
2. Entrevista de Trabajo
Situación: Experiencia vs Test Psicológico.
Cálculo: Resultado de -0.15.
Resultado: rs = -0.15
Correlación muy débil inversa. No hay relación clara.
3. Gustos Opuestos
Situación: Grupo A y B tienen gustos opuestos.
Cálculo: Resultado de -0.90.
Resultado: rs = -0.90
Correlación cualitativa fuerte negativa.
Ver respuesta
Ver respuesta
Ver respuesta
Ver respuesta
Ver respuesta
Resumen General de la Unidad 7
A continuación se presenta un cuadro sinóptico para diferenciar rápidamente cuándo usar cada método y qué significan sus resultados.
| Tema | ¿Qué mide? | Tipo de Datos | Herramienta/Símbolo |
|---|---|---|---|
| 7.1 Correlación Simple | Relación visual entre 2 variables. | Numéricos (Pares X,Y). | Diagrama de Dispersión. |
| 7.2 Coeficiente de Pearson | Fuerza matemática lineal exacta. | Numéricos. | r (De -1 a +1). |
| 7.3 Correlación Múltiple | Muchos factores influyendo en un resultado. | Numéricos (Multivariado). | R² (Coeficiente de determinación). |
| 7.4 Tablas de Correlación | Resumen de todas las relaciones posibles. | Numéricos (Matriz). | Matriz de Pearson. |
| 7.5 Correlación Cualitativa | Relación entre cualidades o jerarquías. | Categóricos / Rangos. | rs (Spearman). |
Pearson (r)
Numerador / Denominador
Mide relación lineal.
Spearman (rs)
1 - [6Σd² / n(n²-1)]
Mide relación de rangos.
Regresión Múltiple
Y = β0 + β1X1 + ...
Predice resultados complejos.
No existe una "mejor" correlación. Todo depende de tus datos:
- Si tienes números y buscas linealidad → Pearson.
- Si tienes rangos o cualidades → Spearman.
- Si tienes muchas variables afectando una cosa → Múltiple.