Guía de Estudio: Estadística Inferencial para la Toma de Decisiones
Guía de Estudio: Estadística Inferencial para la Toma de Decisiones
Proyecto Integrador - Fase 2
1. Introducción: De la Descripción a la Inferencia
En la Fase 1 describimos "lo que pasó" (medias, gráficos). En esta Fase 2, usaremos esos datos para hacer Inferencias; es decir, conclusiones sobre toda la población basándonos en nuestra pequeña muestra de 19-20 ciudades.
Para resolver el proyecto, dominarás tres pilares:
- Estimación: ¿Entre qué valores está el precio real?
- Pruebas de Hipótesis: ¿Podemos afirmar que las ventas superan la meta?
- Relación: ¿El precio afecta la cantidad vendida?
2. Temas Clave y Fórmulas
A. Estimación por Intervalos (Intervalos de Confianza)
Uso en el proyecto: Determinar el precio verdadero del Modelo A.
Un promedio muestral (x) no es suficiente porque tiene error. Un Intervalo de Confianza (IC) nos da un rango donde, con alta probabilidad (ej. 95%), se encuentra el verdadero promedio poblacional (μ).
- ¿Qué distribución usar?
- Si n ≥ 30: Usamos Z (Normal).
- Si n < 30 (NUESTRO CASO): Usamos t-Student.
Donde s es la desviación estándar muestral y n el tamaño de la muestra.
B. Prueba de Hipótesis (La base de la decisión)
Uso en el proyecto: Validar afirmaciones del gerente.
Es un proceso para determinar si hay suficiente evidencia para rechazar una creencia establecida.
- Hipótesis Nula (H0): Es el "status quo", la igualdad o la afirmación de que "no hay diferencia".
- Hipótesis Alternativa (H1): Es lo que queremos probar (que es mayor, menor o diferente).
- Nivel de Significancia (α): El riesgo de equivocarnos (usualmente 0.05 o 5%).
Regla de Oro para Decidir:
- • Si Valor P (p-value) < α → Rechazamos H0 (Hay evidencia significativa).
- • Si Valor P (p-value) > α → No Rechazamos H0 (No hay suficiente evidencia).
C. Prueba de Hipótesis para Comparar Dos Medias
Uso en el proyecto: ¿Es el Modelo A más caro que el B?
Queremos saber si la diferencia numérica entre dos promedios es real o fruto del azar.
- Caso Varianzas Desiguales: En la vida real (y en este proyecto), raramente dos productos tienen la misma variabilidad exacta. Usaremos la Prueba t para dos muestras suponiendo varianzas desiguales.
D. Prueba F para Varianzas (Razón de Varianzas)
Uso en el proyecto: ¿Qué precio es más inestable?
Compara la dispersión (variabilidad) de dos grupos.
Si F es cercano a 1, las varianzas son similares. Si F es muy grande, una varianza es significativamente mayor que la otra.
E. Coeficiente de Correlación de Pearson (r)
Uso en el proyecto: Relación Precio vs. Volumen.
Mide la fuerza y dirección de una relación lineal entre dos variables cuantitativas.
- Rango: Va de -1 a +1.
- +1: Correlación positiva perfecta (Sube precio, sube volumen).
- -1: Correlación negativa perfecta (Sube precio, baja volumen).
- 0: No hay relación lineal.
3. Hoja de Ruta para Resolver los Ejercicios
Aquí se explica qué herramienta estadística aplica para cada inciso del proyecto:
| Inciso del Proyecto | Herramienta a Utilizar | Función sugerida en Excel |
|---|---|---|
| 1. Estimar precio promedio (Modelo A) | Intervalo de Confianza (t-Student) | =INTERVALO.CONFIANZA.T(...) |
| 2. Prueba Ventas > 200 (Modelo B) | Prueba t para una muestra (Cola derecha) | Calcular t manual o usar Análisis de Datos. |
| 3. Diferencia de Precios (A vs B) | Prueba t para dos muestras (varianzas desiguales) | =PRUEBA.T(matriz1, matriz2, 2, 3) |
| 4. Comparar Variabilidad | Prueba F para dos muestras | =PRUEBA.F(matriz1, matriz2) |
| 5. Tamaño de Muestra | Fórmula de despeje de n | n = (Z · s / E)² (Cálculo manual) |
| 6. Relación Precio-Volumen | Correlación de Pearson | =COEF.DE.CORREL(...) |
4. Ejemplo Práctico (Mini-Caso)
Problema: Un gerente cree que se venden más de 50 unidades diarias. La muestra de 15 días da un promedio (x) de 54 unidades con desviación (s) de 8.
Paso 1: Plantear Hipótesis
- H0: μ ≤ 50 (Se venden 50 o menos).
- H1: μ > 50 (Se venden más de 50 - Lo que quiere probar el gerente).
Paso 2: Calcular Estadístico t
Paso 3: Decisión (con tabla t o software)
- Valor crítico (t de tabla para α=0.05, gl=14) = 1.761.
- Como 1.94 > 1.761 (cae en zona de rechazo), Rechazamos H0.
Conclusión: "Existe evidencia estadística para afirmar que las ventas promedio son superiores a 50 unidades".
5. Glosario de Términos Importantes
- Población: El conjunto total de todas las posibles ventas (desconocido).
- Muestra: Las 20 ciudades que tenemos en la tabla (conocido).
- Grados de Libertad (gl): Generalmente n-1. Ajusta la precisión de la prueba t.
- Valor Atípico (Outlier): Un dato tan extremo (error o anomalía) que debe borrarse antes de hacer inferencia, o arruinará los cálculos (recuerden la Ciudad 19 del Modelo A).