🧮CALCURIS

Cálculo de Varianza — Poblacional y Muestral, Paso a Paso

En pocas palabras

La varianza mide cuánto se dispersan los datos respecto a su media. La varianza poblacional se calcula como σ² = Σ(xᵢ − μ)² / N, y la varianza muestral como s² = Σ(xᵢ − x̄)² / (n − 1). La raíz cuadrada de la varianza es la desviación estándar (σ o s), que se expresa en las mismas unidades que los datos originales. Dato clave: se divide por n−1 (corrección de Bessel) en la varianza muestral porque una muestra tiende a subestimar la dispersión real de la población.

📊 Simulacion

Varianza de conjuntos de datos ejemplo — Tabla de referencia

Ejemplos pre-calculados para verificar sus cálculos y entender cómo varía la dispersión.

Conjunto de datosnMediaVarianza (σ²)Varianza (s²)Desv. Est. (σ)
{2, 4, 6, 8, 10}56.008.0010.002.83
{5, 5, 5, 5, 5}55.000.000.000.00
{1, 2, 3, 4, 5}53.002.002.501.41
{10, 20, 30, 40, 50}530.00200.00250.0014.14
{3, 7, 7, 19}49.0032.0042.675.66
{100, 101, 102, 103, 104}5102.002.002.501.41
{−3, −1, 0, 1, 3}50.004.005.002.00

Observación: {1,2,3,4,5} y {100,101,102,103,104} tienen la misma varianza. La varianza mide dispersión, no magnitud.

Tabla de coeficientes de variación por contexto

CVInterpretaciónEjemplo típico
< 10%Muy baja dispersiónPeso de tornillos industriales
10–20%Dispersión moderadaNotas de un examen
20–30%Alta dispersiónIngresos de una empresa estacional
> 30%Muy alta dispersiónRendimientos de acciones

¿Cómo se calcula la varianza paso a paso?

El cálculo de la varianza sigue una secuencia lógica de 5 pasos. Cada paso construye sobre el anterior.

Los 5 pasos

  1. Calcular la media (μ o x̄) = suma de todos los valores / número de datos.
  2. Restar la media a cada dato: desviación = xᵢ − media.
  3. Elevar al cuadrado cada desviación: (xᵢ − media)².
  4. Sumar todos los cuadrados: Σ(xᵢ − media)².
  5. Dividir por N (poblacional) o n−1 (muestral).
Varianza poblacional: σ² = Σ(xᵢ − μ)² / N
Varianza muestral: s² = Σ(xᵢ − x̄)² / (n − 1)
Ejemplo completo: Datos: {4, 8, 6, 5, 3, 2, 8, 9, 5, 10} (n = 10)

Paso 1: Media = (4+8+6+5+3+2+8+9+5+10)/10 = 60/10 = 6.0

Pasos 2-3 (tabla):
xᵢxᵢ − 6(xᵢ − 6)²
4−24
824
600
5−11
3−39
2−416
824
939
5−11
10416
Paso 4: Σ = 4+4+0+1+9+16+4+9+1+16 = 64
Paso 5a: σ² = 64/10 = 6.40 (poblacional)
Paso 5b: s² = 64/9 = 7.11 (muestral)
Desviación estándar: σ = √6.40 = 2.53
Fórmula alternativa (computacional):
σ² = (Σxᵢ²/N) − μ²
Más estable numéricamente para cálculos a mano con números grandes.
Verificación: La suma de las desviaciones (sin elevar al cuadrado) siempre es 0. Si no le da cero, ha cometido un error en la media o en las restas. En el ejemplo: (−2)+(2)+(0)+(−1)+(−3)+(−4)+(2)+(3)+(−1)+(4) = 0 ✓

¿Cuál es la diferencia entre varianza poblacional y muestral?

La diferencia radica en el denominador: N para la población completa, n−1 para una muestra. Esta corrección (llamada corrección de Bessel) es fundamental en estadística inferencial.

CriterioVarianza poblacional (σ²)Varianza muestral (s²)
FórmulaΣ(xᵢ − μ)² / NΣ(xᵢ − x̄)² / (n − 1)
Símboloσ² (sigma)
¿Cuándo usar?Cuando tiene TODOS los datosCuando tiene una MUESTRA
Grados de libertadNn − 1
SesgoExacta para la poblaciónInsesgada (estimador correcto)
EjemploNotas de TODOS los alumnosEncuesta a 100 de 5.000 alumnos
¿Por qué n − 1?
Al usar x̄ (estimada de la muestra) en lugar de μ (la media real), se pierde 1 grado de libertad. Dividir por n subestimaría la varianza real. La corrección de Bessel (n−1) produce un estimador insesgado: E[s²] = σ².
Ejemplo numérico: Datos: {3, 7, 7, 19} (n = 4), media = 9
Σ(xᵢ − 9)² = 36 + 4 + 4 + 100 = 144
σ² (poblacional) = 144/4 = 36
s² (muestral) = 144/3 = 48
Diferencia: la muestral es un 33% mayor. Para n grande (n > 30), la diferencia se vuelve despreciable.

Impacto de la corrección según n

nFactor poblacional (1/N)Factor muestral (1/(n−1))Diferencia relativa
50.2000.250+25%
100.1000.111+11%
300.0330.034+3.4%
1000.0100.0101+1%
10000.0010.001001+0.1%
Regla práctica: En la mayoría de los problemas de estadística aplicada, use la varianza muestral (s², divisor n−1). Solo use la poblacional (σ²) si está seguro de tener datos de TODA la población (caso raro en la práctica).

¿Qué relación tiene la varianza con la desviación estándar?

La desviación estándar es simplemente la raíz cuadrada de la varianza. Su ventaja principal es que se expresa en las mismas unidades que los datos originales, lo que facilita la interpretación.

Desviación estándar:
σ = √σ² (poblacional)
s = √s² (muestral)
PropiedadVarianzaDesviación estándar
UnidadUnidad² (ej: cm²)Misma unidad (ej: cm)
InterpretaciónDifícil (cuadrática)Intuitiva (misma escala)
Cálculos algebraicosMás fácil (aditiva)Requiere raíz cuadrada
Sensibilidad a outliersMuy alta (cuadrática)Alta (pero menos que la varianza)
Regla empíricaNo se aplica directamente68-95-99.7% (distribución normal)

La regla empírica (68-95-99.7)

Para datos con distribución aproximadamente normal:

Rango% de datosInterpretación
μ ± 1σ~68%Alrededor de 2/3 de los datos
μ ± 2σ~95%La gran mayoría
μ ± 3σ~99.7%Prácticamente todos
Ejemplo — Estaturas: Estaturas de hombres adultos: media μ = 175 cm, σ = 7 cm.
• 68% miden entre 168 y 182 cm (175 ± 7)
• 95% miden entre 161 y 189 cm (175 ± 14)
• 99.7% miden entre 154 y 196 cm (175 ± 21)
Un hombre de 200 cm está a (200−175)/7 = 3.57σ de la media: estadísticamente muy inusual (< 0.02%).
Cuidado: La regla 68-95-99.7 solo es exacta para distribuciones normales. Para distribuciones asimétricas (ingresos, precios de vivienda), se debe usar el teorema de Chebyshev: al menos 1 − 1/k² de los datos están dentro de k desviaciones estándar (garantizado para cualquier distribución).

¿Cómo interpretar el valor de la varianza?

La varianza por sí sola puede ser difícil de interpretar (está en unidades cuadradas). La clave está en comparar y en usar el coeficiente de variación para normalizar.

Guía de interpretación

SituaciónVarianza bajaVarianza alta
Producción industrialBueno (consistencia)Malo (defectos)
InversionesBajo riesgoAlto riesgo (volatilidad)
Notas de examenNivel homogéneoGran disparidad entre alumnos
InvestigaciónMediciones precisasMucho ruido/variabilidad
Coeficiente de variación (CV):
CV = (σ / |μ|) × 100%
Permite comparar dispersiones de variables con diferentes escalas o unidades.
Ejemplo comparativo:
Fábrica A: Peso de tornillos: media = 5.00 g, σ = 0.02 g → CV = 0.4%
Fábrica B: Peso de vigas: media = 500 kg, σ = 5 kg → CV = 1.0%
Aunque σ de la Fábrica B (5 kg) es 250 veces mayor que la de A (0.02 g), la Fábrica A tiene mejor consistencia relativa (CV más bajo).
Ejemplo — Inversiones:
Fondo A: rentabilidad media 8%, σ = 2% → CV = 25%
Fondo B: rentabilidad media 12%, σ = 6% → CV = 50%
El Fondo B rinde más, pero su riesgo relativo es el doble. El ratio de Sharpe (rentabilidad/riesgo) ayuda a decidir: A = 8/2 = 4, B = 12/6 = 2. Fondo A es mejor ajustado al riesgo.
Error frecuente: Comparar varianzas de datos con escalas diferentes. Si los datos de un grupo están en metros y los de otro en centímetros, las varianzas diferirán por un factor de 10.000 (= 100²). Use siempre el coeficiente de variación para comparar grupos con unidades o magnitudes diferentes.

Propiedades matemáticas de la varianza

Estas propiedades son esenciales para manipular varianzas en cálculos teóricos y en aplicaciones como regresión lineal, control de calidad y teoría de la probabilidad.

#PropiedadFórmula
1Siempre no negativaVar(X) ≥ 0 (= 0 solo si todos los datos son iguales)
2Constante sumadaVar(X + c) = Var(X)
3Escalar multiplicadoVar(c·X) = c² · Var(X)
4Suma de independientesVar(X + Y) = Var(X) + Var(Y) si X,Y independientes
5Fórmula alternativaVar(X) = E[X²] − (E[X])²
6Desigualdad de ChebyshevP(|X − μ| ≥ kσ) ≤ 1/k²
Propiedad 4 (la más útil en la práctica):
Var(X₁ + X₂ + ... + Xₙ) = Var(X₁) + Var(X₂) + ... + Var(Xₙ)
si las variables son independientes.
(Si no son independientes, se añaden los términos de covarianza: + 2·Cov(Xᵢ,Xⱼ))
Ejemplo — Propiedad 3: Si las notas tienen media 65 y varianza 100 (σ = 10), y el profesor multiplica todas las notas por 1.1:
Nueva varianza = 1.1² × 100 = 1.21 × 100 = 121
Nuevo σ = 1.1 × 10 = 11
Si además suma 5 puntos: Var no cambia (propiedad 2), sigue siendo 121.
Error clásico de examen: Afirmar que Var(X + Y) = Var(X) + Var(Y) siempre. Esto solo es cierto si X e Y son independientes. En general: Var(X + Y) = Var(X) + Var(Y) + 2·Cov(X,Y). La covarianza puede ser positiva o negativa.

Aplicaciones de la varianza en la vida real

La varianza no es solo un ejercicio académico. Es una herramienta fundamental en múltiples disciplinas profesionales.

CampoAplicaciónQué mide la varianza
FinanzasAnálisis de riesgoVolatilidad de un activo (σ² anualizada)
Control de calidadGráficos de control (6σ)Estabilidad del proceso productivo
MeteorologíaPredicciónVariabilidad de temperatura/precipitación
EducaciónPsicometríaDiscriminación de un examen
Machine LearningAnálisis PCAVarianza explicada por cada componente
MedicinaEnsayos clínicosVariabilidad en la respuesta al tratamiento
Ejemplo — Six Sigma: En manufactura, el estándar «6 Sigma» exige que la variación del proceso sea tan pequeña que 6 desviaciones estándar quepan entre la media y el límite de especificación. Esto equivale a 3.4 defectos por millón de unidades producidas. Si σ = 0.001 mm y la tolerancia es ±0.006 mm, el proceso es 6σ.
Varianza en finanzas (Markowitz):
Var(portafolio) = Σᵢ Σⱼ wᵢ wⱼ σᵢⱼ
donde wᵢ son los pesos y σᵢⱼ las covarianzas.
La diversificación reduce la varianza total si las covarianzas son bajas.
Limitación: La varianza trata por igual las desviaciones positivas y negativas (ambas se elevan al cuadrado). En finanzas, esto es problemático: una «desviación positiva» (ganancia inesperada) no es un riesgo. Por eso se desarrollaron medidas como la semivarianza, el Value at Risk (VaR) y el Expected Shortfall.

❓ Preguntas frecuentes

¿Qué es la varianza en estadística?

La varianza es una medida de dispersión que cuantifica cuánto se alejan los datos de su media. Se calcula como el promedio de los cuadrados de las desviaciones. Una varianza de 0 significa que todos los datos son iguales; a mayor varianza, mayor dispersión.

¿Cómo se calcula la varianza paso a paso?

1) Calcule la media de los datos. 2) Reste la media a cada dato (desviación). 3) Eleve al cuadrado cada desviación. 4) Sume todos los cuadrados. 5) Divida por N (poblacional) o n−1 (muestral). El resultado es la varianza.

¿Cuál es la diferencia entre varianza poblacional y muestral?

La varianza poblacional (σ²) divide por N (todos los datos de la población). La muestral (s²) divide por n−1 (corrección de Bessel) para ser un estimador insesgado de la varianza real. En la práctica, casi siempre se usa la muestral porque trabajamos con muestras.

¿Qué relación hay entre varianza y desviación estándar?

La desviación estándar es la raíz cuadrada de la varianza: σ = √(σ²). La ventaja de la desviación estándar es que se expresa en las mismas unidades que los datos (cm, kg, €), mientras que la varianza usa unidades cuadradas (cm², kg², €²).

¿Qué es el coeficiente de variación?

El coeficiente de variación (CV) es la desviación estándar dividida por la media, expresado en porcentaje: CV = (σ/μ)×100%. Permite comparar la dispersión de conjuntos de datos con diferentes escalas o unidades. Un CV < 10% indica baja dispersión.

¿Qué es la corrección de Bessel y por qué se usa?

La corrección de Bessel consiste en dividir por n−1 en lugar de n al calcular la varianza muestral. Se usa porque al estimar la media con x̄ se pierde 1 grado de libertad, y dividir por n subestimaría la varianza real de la población. Dividir por n−1 produce un estimador insesgado: E[s²] = σ².

¿Cómo interpretar una varianza alta o baja?

Varianza baja indica datos concentrados cerca de la media (homogeneidad). Varianza alta indica datos dispersos (heterogeneidad). La interpretación depende del contexto: en manufactura, baja varianza es deseable (consistencia); en inversiones, alta varianza implica más riesgo.

¿Se puede calcular la varianza de datos agrupados?

Sí. Para datos agrupados en intervalos con frecuencias: σ² = [Σfᵢ(mᵢ − μ)²] / N, donde fᵢ es la frecuencia del intervalo i y mᵢ es la marca de clase (punto medio). Es una aproximación porque se pierde la información exacta de cada dato individual.

✅ Verificado por Carlos Rodriguez

Ingeniero y docente universitario. Expertos verificados en finanzas, fiscalidad y matematicas.

Ultima actualizacion: marzo 2026

📚 Fuentes:: Khan Academy — Varianza y desviación estándar · NIST — Measures of Dispersion · MIT OpenCourseWare — Probability and Statistics · Walpole, Myers — Probability and Statistics for Engineers · Wikipedia — Varianza

Mas informacion sobre nuestro equipo · Contactenos