Cálculo de Varianza — Poblacional y Muestral, Paso a Paso
En pocas palabras
La varianza mide cuánto se dispersan los datos respecto a su media. La varianza poblacional se calcula como σ² = Σ(xᵢ − μ)² / N, y la varianza muestral como s² = Σ(xᵢ − x̄)² / (n − 1). La raíz cuadrada de la varianza es la desviación estándar (σ o s), que se expresa en las mismas unidades que los datos originales. Dato clave: se divide por n−1 (corrección de Bessel) en la varianza muestral porque una muestra tiende a subestimar la dispersión real de la población.
📊 Simulacion
Varianza de conjuntos de datos ejemplo — Tabla de referencia
Ejemplos pre-calculados para verificar sus cálculos y entender cómo varía la dispersión.
| Conjunto de datos | n | Media | Varianza (σ²) | Varianza (s²) | Desv. Est. (σ) |
|---|---|---|---|---|---|
| {2, 4, 6, 8, 10} | 5 | 6.00 | 8.00 | 10.00 | 2.83 |
| {5, 5, 5, 5, 5} | 5 | 5.00 | 0.00 | 0.00 | 0.00 |
| {1, 2, 3, 4, 5} | 5 | 3.00 | 2.00 | 2.50 | 1.41 |
| {10, 20, 30, 40, 50} | 5 | 30.00 | 200.00 | 250.00 | 14.14 |
| {3, 7, 7, 19} | 4 | 9.00 | 32.00 | 42.67 | 5.66 |
| {100, 101, 102, 103, 104} | 5 | 102.00 | 2.00 | 2.50 | 1.41 |
| {−3, −1, 0, 1, 3} | 5 | 0.00 | 4.00 | 5.00 | 2.00 |
Observación: {1,2,3,4,5} y {100,101,102,103,104} tienen la misma varianza. La varianza mide dispersión, no magnitud.
Tabla de coeficientes de variación por contexto
| CV | Interpretación | Ejemplo típico |
|---|---|---|
| < 10% | Muy baja dispersión | Peso de tornillos industriales |
| 10–20% | Dispersión moderada | Notas de un examen |
| 20–30% | Alta dispersión | Ingresos de una empresa estacional |
| > 30% | Muy alta dispersión | Rendimientos de acciones |
¿Cómo se calcula la varianza paso a paso?
El cálculo de la varianza sigue una secuencia lógica de 5 pasos. Cada paso construye sobre el anterior.
Los 5 pasos
- Calcular la media (μ o x̄) = suma de todos los valores / número de datos.
- Restar la media a cada dato: desviación = xᵢ − media.
- Elevar al cuadrado cada desviación: (xᵢ − media)².
- Sumar todos los cuadrados: Σ(xᵢ − media)².
- Dividir por N (poblacional) o n−1 (muestral).
Varianza muestral: s² = Σ(xᵢ − x̄)² / (n − 1)
Paso 1: Media = (4+8+6+5+3+2+8+9+5+10)/10 = 60/10 = 6.0
Pasos 2-3 (tabla):
| xᵢ | xᵢ − 6 | (xᵢ − 6)² |
|---|---|---|
| 4 | −2 | 4 |
| 8 | 2 | 4 |
| 6 | 0 | 0 |
| 5 | −1 | 1 |
| 3 | −3 | 9 |
| 2 | −4 | 16 |
| 8 | 2 | 4 |
| 9 | 3 | 9 |
| 5 | −1 | 1 |
| 10 | 4 | 16 |
Paso 5a: σ² = 64/10 = 6.40 (poblacional)
Paso 5b: s² = 64/9 = 7.11 (muestral)
Desviación estándar: σ = √6.40 = 2.53
σ² = (Σxᵢ²/N) − μ²
Más estable numéricamente para cálculos a mano con números grandes.
¿Cuál es la diferencia entre varianza poblacional y muestral?
La diferencia radica en el denominador: N para la población completa, n−1 para una muestra. Esta corrección (llamada corrección de Bessel) es fundamental en estadística inferencial.
| Criterio | Varianza poblacional (σ²) | Varianza muestral (s²) |
|---|---|---|
| Fórmula | Σ(xᵢ − μ)² / N | Σ(xᵢ − x̄)² / (n − 1) |
| Símbolo | σ² (sigma) | s² |
| ¿Cuándo usar? | Cuando tiene TODOS los datos | Cuando tiene una MUESTRA |
| Grados de libertad | N | n − 1 |
| Sesgo | Exacta para la población | Insesgada (estimador correcto) |
| Ejemplo | Notas de TODOS los alumnos | Encuesta a 100 de 5.000 alumnos |
Al usar x̄ (estimada de la muestra) en lugar de μ (la media real), se pierde 1 grado de libertad. Dividir por n subestimaría la varianza real. La corrección de Bessel (n−1) produce un estimador insesgado: E[s²] = σ².
Σ(xᵢ − 9)² = 36 + 4 + 4 + 100 = 144
σ² (poblacional) = 144/4 = 36
s² (muestral) = 144/3 = 48
Diferencia: la muestral es un 33% mayor. Para n grande (n > 30), la diferencia se vuelve despreciable.
Impacto de la corrección según n
| n | Factor poblacional (1/N) | Factor muestral (1/(n−1)) | Diferencia relativa |
|---|---|---|---|
| 5 | 0.200 | 0.250 | +25% |
| 10 | 0.100 | 0.111 | +11% |
| 30 | 0.033 | 0.034 | +3.4% |
| 100 | 0.010 | 0.0101 | +1% |
| 1000 | 0.001 | 0.001001 | +0.1% |
¿Qué relación tiene la varianza con la desviación estándar?
La desviación estándar es simplemente la raíz cuadrada de la varianza. Su ventaja principal es que se expresa en las mismas unidades que los datos originales, lo que facilita la interpretación.
σ = √σ² (poblacional)
s = √s² (muestral)
| Propiedad | Varianza | Desviación estándar |
|---|---|---|
| Unidad | Unidad² (ej: cm²) | Misma unidad (ej: cm) |
| Interpretación | Difícil (cuadrática) | Intuitiva (misma escala) |
| Cálculos algebraicos | Más fácil (aditiva) | Requiere raíz cuadrada |
| Sensibilidad a outliers | Muy alta (cuadrática) | Alta (pero menos que la varianza) |
| Regla empírica | No se aplica directamente | 68-95-99.7% (distribución normal) |
La regla empírica (68-95-99.7)
Para datos con distribución aproximadamente normal:
| Rango | % de datos | Interpretación |
|---|---|---|
| μ ± 1σ | ~68% | Alrededor de 2/3 de los datos |
| μ ± 2σ | ~95% | La gran mayoría |
| μ ± 3σ | ~99.7% | Prácticamente todos |
• 68% miden entre 168 y 182 cm (175 ± 7)
• 95% miden entre 161 y 189 cm (175 ± 14)
• 99.7% miden entre 154 y 196 cm (175 ± 21)
Un hombre de 200 cm está a (200−175)/7 = 3.57σ de la media: estadísticamente muy inusual (< 0.02%).
¿Cómo interpretar el valor de la varianza?
La varianza por sí sola puede ser difícil de interpretar (está en unidades cuadradas). La clave está en comparar y en usar el coeficiente de variación para normalizar.
Guía de interpretación
| Situación | Varianza baja | Varianza alta |
|---|---|---|
| Producción industrial | Bueno (consistencia) | Malo (defectos) |
| Inversiones | Bajo riesgo | Alto riesgo (volatilidad) |
| Notas de examen | Nivel homogéneo | Gran disparidad entre alumnos |
| Investigación | Mediciones precisas | Mucho ruido/variabilidad |
CV = (σ / |μ|) × 100%
Permite comparar dispersiones de variables con diferentes escalas o unidades.
Fábrica A: Peso de tornillos: media = 5.00 g, σ = 0.02 g → CV = 0.4%
Fábrica B: Peso de vigas: media = 500 kg, σ = 5 kg → CV = 1.0%
Aunque σ de la Fábrica B (5 kg) es 250 veces mayor que la de A (0.02 g), la Fábrica A tiene mejor consistencia relativa (CV más bajo).
Fondo A: rentabilidad media 8%, σ = 2% → CV = 25%
Fondo B: rentabilidad media 12%, σ = 6% → CV = 50%
El Fondo B rinde más, pero su riesgo relativo es el doble. El ratio de Sharpe (rentabilidad/riesgo) ayuda a decidir: A = 8/2 = 4, B = 12/6 = 2. Fondo A es mejor ajustado al riesgo.
Propiedades matemáticas de la varianza
Estas propiedades son esenciales para manipular varianzas en cálculos teóricos y en aplicaciones como regresión lineal, control de calidad y teoría de la probabilidad.
| # | Propiedad | Fórmula |
|---|---|---|
| 1 | Siempre no negativa | Var(X) ≥ 0 (= 0 solo si todos los datos son iguales) |
| 2 | Constante sumada | Var(X + c) = Var(X) |
| 3 | Escalar multiplicado | Var(c·X) = c² · Var(X) |
| 4 | Suma de independientes | Var(X + Y) = Var(X) + Var(Y) si X,Y independientes |
| 5 | Fórmula alternativa | Var(X) = E[X²] − (E[X])² |
| 6 | Desigualdad de Chebyshev | P(|X − μ| ≥ kσ) ≤ 1/k² |
Var(X₁ + X₂ + ... + Xₙ) = Var(X₁) + Var(X₂) + ... + Var(Xₙ)
si las variables son independientes.
(Si no son independientes, se añaden los términos de covarianza: + 2·Cov(Xᵢ,Xⱼ))
Nueva varianza = 1.1² × 100 = 1.21 × 100 = 121
Nuevo σ = 1.1 × 10 = 11
Si además suma 5 puntos: Var no cambia (propiedad 2), sigue siendo 121.
Aplicaciones de la varianza en la vida real
La varianza no es solo un ejercicio académico. Es una herramienta fundamental en múltiples disciplinas profesionales.
| Campo | Aplicación | Qué mide la varianza |
|---|---|---|
| Finanzas | Análisis de riesgo | Volatilidad de un activo (σ² anualizada) |
| Control de calidad | Gráficos de control (6σ) | Estabilidad del proceso productivo |
| Meteorología | Predicción | Variabilidad de temperatura/precipitación |
| Educación | Psicometría | Discriminación de un examen |
| Machine Learning | Análisis PCA | Varianza explicada por cada componente |
| Medicina | Ensayos clínicos | Variabilidad en la respuesta al tratamiento |
Var(portafolio) = Σᵢ Σⱼ wᵢ wⱼ σᵢⱼ
donde wᵢ son los pesos y σᵢⱼ las covarianzas.
La diversificación reduce la varianza total si las covarianzas son bajas.
❓ Preguntas frecuentes
¿Qué es la varianza en estadística?
La varianza es una medida de dispersión que cuantifica cuánto se alejan los datos de su media. Se calcula como el promedio de los cuadrados de las desviaciones. Una varianza de 0 significa que todos los datos son iguales; a mayor varianza, mayor dispersión.
¿Cómo se calcula la varianza paso a paso?
1) Calcule la media de los datos. 2) Reste la media a cada dato (desviación). 3) Eleve al cuadrado cada desviación. 4) Sume todos los cuadrados. 5) Divida por N (poblacional) o n−1 (muestral). El resultado es la varianza.
¿Cuál es la diferencia entre varianza poblacional y muestral?
La varianza poblacional (σ²) divide por N (todos los datos de la población). La muestral (s²) divide por n−1 (corrección de Bessel) para ser un estimador insesgado de la varianza real. En la práctica, casi siempre se usa la muestral porque trabajamos con muestras.
¿Qué relación hay entre varianza y desviación estándar?
La desviación estándar es la raíz cuadrada de la varianza: σ = √(σ²). La ventaja de la desviación estándar es que se expresa en las mismas unidades que los datos (cm, kg, €), mientras que la varianza usa unidades cuadradas (cm², kg², €²).
¿Qué es el coeficiente de variación?
El coeficiente de variación (CV) es la desviación estándar dividida por la media, expresado en porcentaje: CV = (σ/μ)×100%. Permite comparar la dispersión de conjuntos de datos con diferentes escalas o unidades. Un CV < 10% indica baja dispersión.
¿Qué es la corrección de Bessel y por qué se usa?
La corrección de Bessel consiste en dividir por n−1 en lugar de n al calcular la varianza muestral. Se usa porque al estimar la media con x̄ se pierde 1 grado de libertad, y dividir por n subestimaría la varianza real de la población. Dividir por n−1 produce un estimador insesgado: E[s²] = σ².
¿Cómo interpretar una varianza alta o baja?
Varianza baja indica datos concentrados cerca de la media (homogeneidad). Varianza alta indica datos dispersos (heterogeneidad). La interpretación depende del contexto: en manufactura, baja varianza es deseable (consistencia); en inversiones, alta varianza implica más riesgo.
¿Se puede calcular la varianza de datos agrupados?
Sí. Para datos agrupados en intervalos con frecuencias: σ² = [Σfᵢ(mᵢ − μ)²] / N, donde fᵢ es la frecuencia del intervalo i y mᵢ es la marca de clase (punto medio). Es una aproximación porque se pierde la información exacta de cada dato individual.
Ingeniero y docente universitario. Expertos verificados en finanzas, fiscalidad y matematicas.
Ultima actualizacion: marzo 2026
📚 Fuentes:: Khan Academy — Varianza y desviación estándar · NIST — Measures of Dispersion · MIT OpenCourseWare — Probability and Statistics · Walpole, Myers — Probability and Statistics for Engineers · Wikipedia — Varianza