Análisis de Correlación Guía de conceptos clave, fórmulas y ejercicios

08.12.2025
Unidad 7: Correlación - Guía Didáctica

Análisis de Correlación

Guía de conceptos clave, fórmulas y ejercicios
Elaborado por: Ing. Victor Manuel Garcia Rios
Material Elaborado con fines didácticos

Unidad 7. Correlación

Antes de calcular números, debemos entender el concepto fundamental de la unidad. En el mundo real, pocas cosas ocurren de forma aislada. La mayoría de los fenómenos están conectados entre sí.

Definición General: La correlación es una medida estadística que describe el tamaño y la dirección de una relación entre dos o más variables. Nos dice si el cambio en una variable está asociado con el cambio en otra.
Analogía Cotidiana:

Piensa en la relación entre "Calor" y "Venta de Helados". Cuando aumenta el calor, generalmente aumenta la venta de helados. Existe una "correlación" entre ambos eventos. No significa necesariamente que uno cause al otro, pero sí que se mueven juntos.

Caso Práctico: Identificando Relaciones

Objetivo: Determinar si existe correlación en una fábrica de zapatos.

Paso 1: Observación

El ingeniero nota que los días de lluvia, los empleados llegan más tarde.

Paso 2: Hipótesis

Variable A: Cantidad de lluvia. Variable B: Retardos.

Paso 3: Conclusión Preliminar

Existe una posible correlación. Ahora necesitamos herramientas matemáticas (temas 7.1 y 7.2) para confirmarlo.

3 Ejercicios Conceptuales

1. Publicidad vs Ventas

Situación: Una tienda gasta más en Facebook Ads y nota que sus ventas suben.

Interpretación: Existe correlación positiva visible.

2. Edad vs Tecnología

Situación: Se observa que a mayor edad, menor velocidad de escritura en el celular.

Interpretación: Existe correlación inversa visible.

3. Suerte vs Dados

Situación: Un jugador usa calcetines rojos para ganar en los dados.

Interpretación: No existe correlación (es superstición/azar).

Autoevaluación: Conceptos Básicos
1. ¿La correlación implica siempre causalidad?
Ver respuesta
No. Dos cosas pueden relacionarse sin que una cause la otra.
2. ¿Para qué sirve la correlación en Ingeniería?
Ver respuesta
Para predecir resultados y controlar variables de un proceso.
3. Si dos variables no tienen relación, ¿cómo se llama?
Ver respuesta
Correlación nula o incorrelación.
4. ¿Es la correlación una herramienta cualitativa o cuantitativa?
Ver respuesta
Puede ser ambas, pero en estadística nos enfocamos en medirla numéricamente (cuantitativa).
5. ¿Qué letra se usa comúnmente para la variable independiente?
Ver respuesta
La letra X.

7.1 Correlación Simple

Es el nivel más básico de análisis. Aquí estudiamos la relación entre solamente dos variables: Una independiente (X) y una dependiente (Y).

Definición: Análisis que busca determinar la relación lineal entre dos variables. Se suele visualizar mediante un Diagrama de Dispersión (puntos en un plano cartesiano).

Tipos de Correlación Simple

  • Positiva: Si X sube, Y sube. (Directamente proporcional).
  • Negativa: Si X sube, Y baja. (Inversamente proporcional).
  • Nula: Los puntos están dispersos sin orden. No hay relación.
Caso Práctico: Diagrama de Dispersión

Un maestro quiere ver si estudiar más horas mejora la calificación.

Paso 1: Recopilar Pares de Datos (X, Y)

Alumno A: (2 horas, 6.0 calif)
Alumno B: (5 horas, 9.0 calif)

Paso 2: Graficar

Se colocan los puntos en el plano. Eje horizontal = Horas, Eje vertical = Calificación.

Paso 3: Análisis Visual

Al ver que los puntos forman una línea que "sube" hacia la derecha, concluimos que es una Correlación Simple Positiva.

3 Ejercicios Resueltos

1. Velocidad vs Tiempo de Viaje

Datos: A mayor velocidad (X), menor tiempo para llegar (Y).

Tipo: Correlación Negativa

2. Estatura vs Inteligencia

Datos: Se midió a 100 personas y su IQ. Los puntos están por todos lados.

Tipo: Correlación Nula

3. Fertilizante vs Cosecha

Datos: Más kilos de abono (X) resultan en más kilos de fruta (Y).

Tipo: Correlación Positiva

Autoevaluación: 7.1 Simple
1. En un diagrama de dispersión, ¿qué eje ocupa la variable dependiente (Y)?
Ver respuesta
El eje vertical.
2. Si los puntos forman una línea hacia abajo (de izquierda a derecha), ¿qué correlación es?
Ver respuesta
Correlación Negativa o Inversa.
3. ¿Cuántas variables intervienen en la correlación simple?
Ver respuesta
Exactamente dos (X e Y).
4. ¿Qué es un diagrama de dispersión?
Ver respuesta
Una gráfica de puntos que representa los valores observados de las variables.
5. Ejemplo de correlación nula en la industria:
Ver respuesta
Color de la pintura de la máquina vs Número de piezas defectuosas.

7.2 Coeficiente de Pearson

Ya sabemos ver la correlación en una gráfica (7.1), pero ¿cómo la medimos con precisión? Necesitamos un número exacto.

Definición: Es una medida estadística (representada por la letra r) que calcula la intensidad y dirección de la relación lineal entre dos variables.
r =
nΣxy - (Σx)(Σy) √[nΣx2 - (Σx)2][nΣy2 - (Σy)2]

Escala de Interpretación (r)

  • +1.00: Correlación Positiva Perfecta.
  • 0.00: Ausencia de correlación.
  • -1.00: Correlación Negativa Perfecta.
  • Valores cercanos a 0.8 o -0.8 se consideran "Fuertes".
Caso Práctico: Cálculo Manual Simplificado

Calcular r para estos datos: (1, 2), (2, 4), (3, 5). n=3.

Paso 1: Tabla de sumatorias
xyxy
12214
248416
3515925
Σ6Σ11Σ25Σ14Σ45
Paso 2: Sustitución en Numerador

3(25) - (6)(11) = 75 - 66 = 9

Paso 3: Cálculo Final

Tras resolver el denominador, el resultado es r = 0.98.

Interpretación: Relación positiva muy fuerte.

3 Ejercicios de Interpretación de r

1. Resultado r = -0.95

Contexto: Precio vs Ventas.

Interpretación: Muy Fuerte e Inversa.

El precio impacta muchísimo en las ventas de forma negativa.

2. Resultado r = 0.15

Contexto: Anuncios en radio vs Ventas web.

Interpretación: Débil / Nula.

La estrategia no está funcionando, la relación es casi inexistente.

3. Resultado r = 1.00

Contexto: Metros de cable vs Peso del cable.

Interpretación: Perfecta.

Es una relación física exacta, sin variación aleatoria.

Autoevaluación: 7.2 Pearson
1. ¿Qué significa r = 0?
Ver respuesta
Que no existe relación lineal entre las variables.
2. ¿Puede el coeficiente de Pearson valer 1.5?
Ver respuesta
No. El rango máximo es de -1 a +1. Si da 1.5, hay un error de cálculo.
3. ¿Qué relación es más fuerte: r = 0.6 o r = -0.8?
Ver respuesta
r = -0.8 (Se mira el valor absoluto).
4. ¿La letra 'n' en la fórmula qué representa?
Ver respuesta
El número total de pares de datos observados.
5. ¿Pearson funciona bien para relaciones curvas (no lineales)?
Ver respuesta
No, Pearson mide específicamente la relación lineal (línea recta).

7.3 Correlación Múltiple

Tradicionalmente estudiamos cómo una variable afecta a otra (X → Y). Pero en la vida real y en la ingeniería, un resultado casi siempre depende de muchos factores al mismo tiempo.

Definición: Es una medida estadística que indica qué tan fuerte es la relación entre una variable dependiente (resultado) y dos o más variables independientes (causas) actuando en conjunto.
Y = β0 + β1X1 + β2X2 + ... + βkXk + ε

Donde Y es el resultado, las β son los pesos de cada variable, y las X son los factores.

¿Cómo se mide?

Usamos el Coeficiente de Determinación Múltiple (R2). Este número nos dice qué porcentaje del resultado es explicado por nuestras variables.

Ejemplo Teórico: El Precio de una Casa

Imagina que queremos predecir el precio (Y). No depende solo del tamaño. Depende de:

  • X1: Metros cuadrados de construcción.
  • X2: Número de habitaciones.
  • X3: Antigüedad de la casa.
Caso Práctico Principal: Predicción de Producción

Un ingeniero tiene la siguiente ecuación para predecir unidades/hora (Y):

Y = 10 + 5(Operarios) - 2(Años_Maquina)

Paso 1: Identificar las variables

Calculamos producción con 8 operarios y máquina de 3 años.

Paso 2: Sustitución

Y = 10 + 5(8) - 2(3)

Paso 3: Cálculo Final

Y = 10 + 40 - 6 = 44 unidades

3 Ejercicios Adicionales Resueltos

1. Agricultura (Maíz)

Fórmula: Y = 20 + 0.5(Agua) + 2(Fertilizante)

Datos: 100L de agua, 50kg fertilizante.

Cálculo: Y = 20 + 50 + 100

Resultado: 170 Toneladas

2. Ventas Online

Fórmula: Y = 500 + 10(Anuncios) - 5(Precio)

Datos: 20 Anuncios, Precio de $30.

Cálculo: Y = 500 + 200 - 150

Resultado: 550 Unidades

3. Calificación Escolar

Fórmula: Y = 2 + 0.6(Estudio) + 0.5(Participación)

Datos: 5 horas estudio, 4 participaciones.

Cálculo: Y = 2 + 3 + 2

Resultado: Nota 7.0

Autoevaluación: 5 Ejercicios de Repaso
1. En la ecuación Y = 10 + 2X, ¿qué representa la Y?
Ver respuesta
La variable dependiente (o el resultado predicho).
2. Calcula el valor de Y si Y = 4 + 3(X1) + 2(X2), dado X1=2 y X2=5.
Ver respuesta
Y = 4 + 3(2) + 2(5) = 4 + 6 + 10 = 20.
3. ¿Qué indica un R² de 0.95 en una correlación múltiple?
Ver respuesta
Indica que el 95% de la variación del resultado se explica por las variables independientes. Es una relación muy fuerte.
4. Verdadero o Falso: La correlación múltiple solo puede tener 2 variables independientes.
Ver respuesta
Falso. Puede tener dos o más.
5. Si añadimos una variable irrelevante al modelo, ¿qué suele pasar con el R²?
Ver respuesta
Suele mantenerse igual o aumentar muy poco, pero no disminuye.

7.4 Tablas de Correlación

En procesos industriales complejos, tenemos muchísimos datos. Hacer gráficos de uno por uno es ineficiente. Necesitamos un "mapa" que nos diga todo de un vistazo.

Definición: También llamada "Matriz de Correlación", es una tabla donde se cruzan todas las variables contra todas. Los números dentro indican qué tan conectadas están dos variables específicas.

Cada celda de la tabla se calcula usando el Coeficiente de Pearson (r).

r =
Σ(xi - x̄)(yi - ȳ) √[Σ(xi - x̄)2 Σ(yi - ȳ)2]
Ejemplo Visual: Tablero de Control
Variables Temperatura Presión Defectos
Temperatura 1.00 0.85 0.92
Presión 0.85 1.00 0.20
Defectos 0.92 0.20 1.00
Caso Práctico Principal: Interpretación de la Matriz

El gerente le pide que analice la tabla anterior y decida qué variable ajustar para reducir defectos.

Paso 1: Ubicar columna objetivo

Miramos "Defectos".

Paso 2: Comparar

Temp (0.92) vs Presión (0.20).

Paso 3: Conclusión

Acción: Controlar la Temperatura.

3 Ejercicios Adicionales Resueltos

1. Logística (Camiones)

Datos: Distancia vs Gasolina (r = +0.98)

Interpretación:

Relación directa casi perfecta. Más distancia implica obligatoriamente más gasolina.

2. Seguridad Industrial

Datos: Capacitación vs Accidentes (r = -0.85)

Interpretación:

Correlación inversa fuerte. Más capacitación reduce significativamente los accidentes.

3. Recursos Humanos

Datos: Estatura vs Desempeño (r = +0.02)

Interpretación:

Correlación nula. La estatura no tiene ninguna relación con el desempeño.

Autoevaluación: 5 Ejercicios de Repaso
1. ¿Qué valor aparece siempre en la diagonal de una matriz de correlación?
Ver respuesta
1.00 (Toda variable tiene correlación perfecta consigo misma).
2. Si ves un coeficiente de -0.90 entre "Precio" y "Demanda", ¿qué significa?
Ver respuesta
Que existe una relación inversa muy fuerte.
3. ¿Qué relación es más fuerte: r = 0.50 ó r = -0.80?
Ver respuesta
r = -0.80. La fuerza se mide por el valor absoluto.
4. Si encuentras un valor de 0.05, ¿vale la pena invertir recursos?
Ver respuesta
No, es una correlación casi nula.
5. ¿La matriz de correlación nos dice cuál es la causa y cuál el efecto?
Ver respuesta
No. Solo nos dice que están relacionadas numéricamente.

7.5 Correlación Cualitativa

Hasta ahora hemos hablado de números. ¿Pero qué pasa cuando los datos son cualidades o categorías?

Definición: Es el análisis de la relación entre variables que no son numéricas (variables categóricas o nominales). Aquí no preguntamos "¿cuánto?", sino "¿cuál?".

Herramientas diferentes

Usamos métodos como la correlación por rangos de Spearman. La fórmula utiliza las diferencias de rango (d):

rs = 1 -
6 Σ d2 n (n2 - 1)
Caso Práctico Principal: Cata de Café

Dos jueces ordenan 3 marcas de café. ¿Coinciden?

Paso 1: Tabla

Diferencias (d): 0, -1, 1.

Paso 2: Suma Cuadrados

0 + 1 + 1 = 2.

Paso 3: Fórmula

rs = 1 - (12/24) = 0.5 (Coincidencia moderada).

3 Ejercicios Adicionales Resueltos

1. Concurso de Canto

Situación: Jueces coinciden en todo el orden.

Suma diferencias: 0.

Resultado: rs = 1.0

Correlación cualitativa perfecta positiva.

2. Entrevista de Trabajo

Situación: Experiencia vs Test Psicológico.

Cálculo: Resultado de -0.15.

Resultado: rs = -0.15

Correlación muy débil inversa. No hay relación clara.

3. Gustos Opuestos

Situación: Grupo A y B tienen gustos opuestos.

Cálculo: Resultado de -0.90.

Resultado: rs = -0.90

Correlación cualitativa fuerte negativa.

Autoevaluación: 5 Ejercicios de Repaso
1. ¿Qué método usarías para relacionar "Nivel de satisfacción" con "Antigüedad"?
Ver respuesta
Correlación de Spearman.
2. Si la suma de las diferencias al cuadrado (Σd²) es 0, ¿cuánto vale el coeficiente Spearman?
Ver respuesta
1.0 (Coincidencia perfecta).
3. Si dos jueces tienen opiniones totalmente opuestas, ¿esperas un coeficiente positivo o negativo?
Ver respuesta
Negativo (cercano a -1).
4. En la fórmula de Spearman, ¿qué representa la "n"?
Ver respuesta
El número de pares de datos.
5. ¿Es correcto usar Pearson para relacionar "Color de Ojos" con "Ciudad de Nacimiento"?
Ver respuesta
No. Se usaría Chi-cuadrada u otro método para atributos.

Resumen General de la Unidad 7

A continuación se presenta un cuadro sinóptico para diferenciar rápidamente cuándo usar cada método y qué significan sus resultados.

Tabla Comparativa de Métodos
Tema ¿Qué mide? Tipo de Datos Herramienta/Símbolo
7.1 Correlación Simple Relación visual entre 2 variables. Numéricos (Pares X,Y). Diagrama de Dispersión.
7.2 Coeficiente de Pearson Fuerza matemática lineal exacta. Numéricos. r (De -1 a +1).
7.3 Correlación Múltiple Muchos factores influyendo en un resultado. Numéricos (Multivariado). (Coeficiente de determinación).
7.4 Tablas de Correlación Resumen de todas las relaciones posibles. Numéricos (Matriz). Matriz de Pearson.
7.5 Correlación Cualitativa Relación entre cualidades o jerarquías. Categóricos / Rangos. rs (Spearman).
Formulario Rápido

Pearson (r)

Numerador / Denominador

Mide relación lineal.

Spearman (rs)

1 - [6Σd² / n(n²-1)]

Mide relación de rangos.

Regresión Múltiple

Y = β0 + β1X1 + ...

Predice resultados complejos.

Conclusión Final:
No existe una "mejor" correlación. Todo depende de tus datos:
  • Si tienes números y buscas linealidad → Pearson.
  • Si tienes rangos o cualidades → Spearman.
  • Si tienes muchas variables afectando una cosa → Múltiple.

Material de apoyo docente - Estadística Aplicada

Maestro Víctor Manuel García Ríos
Todos los derechos reservados 2022
Creado con Webnode Cookies
¡Crea tu página web gratis! Esta página web fue creada con Webnode. Crea tu propia web gratis hoy mismo! Comenzar