Calculadora de Desviación Estándar 2026: σ Poblacional vs s Muestral + z-score
Lo esencial
Esta calculadora calcula la desviación estándar poblacional σ (dividiendo por N) o muestral s (dividiendo por n−1, corrección de Bessel), la varianza σ²/s², el coeficiente de variación CV y el z-score de cada dato con detección automática de outliers (|z|>3). Visualización Chart.js de la curva normal con las bandas 68-95-99.7. Actualizada el 18 de abril de 2026.
- σ poblacional : σ = √(Σ(xᵢ − μ)²/N) — cuando conoces toda la población
- s muestral : s = √(Σ(xᵢ − x̄)²/(n−1)) — cuando trabajas con una muestra (Bessel)
- Regla empírica : 68% en ±1σ, 95% en ±2σ, 99,7% en ±3σ
- Aplicaciones : Six Sigma (Cp, Cpk, DPMO), volatilidad financiera (×√252), SPC Shewhart
- Compatible con Excel STDEV.P / STDEV.S, Python numpy.std, R sd()
🔢 Calculadora de desviación estándar
Introduce los datos separados por coma, espacio o salto de línea. Elige entre σ (poblacional, divide por N) o s (muestral, divide por n−1 = corrección de Bessel). Se calcula automáticamente media, varianza, CV y z-score de cada valor.
Fórmulas clave de la desviación estándar
Seis fórmulas cubren el 95 % de los usos estadísticos en Bachillerato, universidad, calidad industrial y finanzas. La primera diferencia entre σ y s se reduce a un detalle aparentemente trivial — el denominador — pero tiene consecuencias profundas en inferencia estadística.
σ = √( (1/N) · Σᵢ₌₁ᴺ (xᵢ − μ)² )
s = √( (1/(n−1)) · Σᵢ₌₁ⁿ (xᵢ − x̄)² )
σ² = (1/N)·Σ(xᵢ − μ)² · s² = (1/(n−1))·Σ(xᵢ − x̄)²
CV = (σ / μ) × 100 % — adimensional, útil para comparar dispersiones de magnitudes distintas
z = (xᵢ − μ) / σ — valor tipificado. |z| > 3 se considera outlier en distribución normal
P(μ ± 1σ) ≈ 68 % · P(μ ± 2σ) ≈ 95 % · P(μ ± 3σ) ≈ 99,7 %
El término "standard deviation" fue acuñado por el estadístico británico Karl Pearson en su artículo "Contributions to the Mathematical Theory of Evolution" publicado en 1894 en Philosophical Transactions of the Royal Society. Antes se usaban expresiones como "error medio" o "error probable". Ronald A. Fisher formalizó el concepto de grados de libertad en 1925 (Statistical Methods for Research Workers), justificando matemáticamente por qué la desviación muestral divide entre n−1 y no entre n.
¿σ o s? Cuándo usar cada una y por qué Bessel corrige con n−1
La pregunta aparece en casi todos los exámenes universitarios de estadística y es la principal fuente de confusión incluso entre profesionales. La regla es simple : depende de qué estás calculando.
Si conoces toda la población : σ (divide entre N)
Cuando tus datos abarcan el universo completo que te interesa — las notas de los 30 alumnos de una clase concreta, las alturas de los 12 jugadores de un equipo, los rendimientos de todos los meses de vida de un fondo — usas σ y divides entre N. No hay incertidumbre de muestreo : ya lo sabes todo.
Si trabajas con una muestra : s (divide entre n−1)
Cuando los datos son una muestra tomada de una población más grande que no conoces completamente — 100 bombillas de una producción de 50 000, 40 pacientes de un ensayo clínico que extrapolarás a toda la población — usas s y divides entre n−1. Esto se llama corrección de Bessel, en honor al astrónomo y matemático alemán Friedrich Wilhelm Bessel (1784-1846).
¿Por qué n−1 y no n?
Cuando calculas x̄ a partir de la muestra, ya has "gastado" un grado de libertad : la suma de las desviaciones (xᵢ − x̄) siempre es exactamente cero por construcción. Solo n−1 de esas desviaciones son independientes. Dividir entre n en vez de entre n−1 subestima sistemáticamente la dispersión — produce un estimador sesgado. Dividir entre n−1 produce un estimador insesgado de la varianza poblacional.
La diferencia práctica
Para n=10 la diferencia entre dividir por 10 o por 9 es del 10 %. Para n=100 es del 1 %. Para n=1000 es del 0,1 %. Por eso : en muestras grandes da casi lo mismo, en muestras pequeñas importa mucho. Excel refleja la distinción con dos funciones distintas : STDEV.P (pobl.) y STDEV.S (muestral). Python numpy usa el parámetro ddof : numpy.std(x, ddof=0) es σ, ddof=1 es s. R por defecto calcula s con sd() — siempre divide entre n−1.
Distribución normal y regla empírica 68-95-99,7
La distribución normal o gaussiana — llamada así por Carl Friedrich Gauss, aunque Abraham de Moivre la dedujo primero en 1733 — es la distribución de probabilidad más importante de la estadística. Su forma de campana queda completamente descrita por dos parámetros : la media μ (centro) y la desviación estándar σ (anchura). En una distribución normal se cumple con extraordinaria precisión :
| Intervalo | % de datos dentro | Interpretación práctica |
|---|---|---|
| μ ± 1σ | ≈ 68,27 % | "Normal" — comportamiento típico |
| μ ± 2σ | ≈ 95,45 % | Intervalo de confianza estándar |
| μ ± 3σ | ≈ 99,73 % | Fuera = señal de alarma (Six Sigma) |
| μ ± 6σ | ≈ 99,9999998 % | 3,4 defectos por millón (DPMO) |
Para distribuciones que no son normales, la desigualdad de Chebyshev (Pafnuty Chebyshev, 1867) garantiza que al menos el 75 % de los datos caen dentro de μ ± 2σ y al menos el 88,9 % dentro de μ ± 3σ — sea cual sea la forma de la distribución. Es una cota más débil que la regla empírica pero universalmente válida.
z-score : tipificar para comparar
El z-score transforma cualquier dato en número de desviaciones estándar respecto a la media. z = 0 es exactamente la media, z = +1 está 1σ por encima, z = −2 está 2σ por debajo. En una distribución normal, un valor con |z| > 3 tiene menos de 0,27 % de probabilidad de ocurrir por azar y se considera un outlier que merece investigación. Esta calculadora marca en rojo cualquier dato con |z| > 3.
Tres ejemplos numéricos resueltos
Ejemplo 1 · Notas de un examen (muestra, s). Las notas de 8 alumnos seleccionados al azar de una clase grande son : 4, 6, 7, 7, 8, 8, 9, 10. Calcular la desviación estándar.
Media x̄ = 59/8 = 7,375. Suma de (xᵢ − x̄)² = 11,25² + 1,375² + ... = 22,875. Como es muestra, dividimos entre n−1 = 7 : s² = 22,875/7 = 3,268. s = √3,268 = 1,808. CV = 1,808/7,375 × 100 = 24,5 % (dispersión moderada).
Ejemplo 2 · Alturas de un equipo (población, σ). Las alturas en cm de los 5 jugadores titulares de un equipo : 178, 182, 185, 190, 195. Son toda la población (no una muestra).
Media μ = 930/5 = 186 cm. Σ(xᵢ − μ)² = 64 + 16 + 1 + 16 + 81 = 178. σ² = 178/5 = 35,6. σ = √35,6 = 5,97 cm. El 68 % de los jugadores estarían entre 180 y 192 cm (μ ± 1σ).
Ejemplo 3 · Volatilidad de un fondo (muestra, s). Rendimientos mensuales de un fondo en 12 meses (%) : 2,1 · −0,8 · 3,4 · 1,2 · −2,1 · 4,5 · 0,3 · −1,5 · 2,8 · 1,9 · −0,4 · 3,1.
Media x̄ = 1,21 %. Desviación muestral s = 2,12 % mensual. Volatilidad anualizada = s · √12 = 2,12 × 3,464 = 7,34 % anual. Si el activo libre de riesgo rinde 2 % y el fondo 14,5 % anual : ratio de Sharpe = (14,5 − 2)/7,34 = 1,70 — excelente (Sharpe > 1 se considera bueno, > 2 excepcional).
Tres aplicaciones profesionales de la desviación estándar
1 · Six Sigma : capacidad de proceso (Cp, Cpk, DPMO)
La metodología Six Sigma, desarrollada en Motorola por Bill Smith en 1986 y popularizada por Jack Welch en General Electric, se basa enteramente en σ. El objetivo es que el proceso de fabricación tenga una dispersión tal que 6σ quepa dentro de los límites de especificación (tolerancia), lo que equivale a 3,4 defectos por millón de oportunidades (DPMO).
- Cp = (USL − LSL) / (6σ) — capacidad potencial. Cp ≥ 1,33 es aceptable, Cp ≥ 2 es excelente.
- Cpk = mín[(USL − μ)/(3σ), (μ − LSL)/(3σ)] — tiene en cuenta el descentrado del proceso.
- DPMO : 3σ = 66 807 defectos/millón, 4σ = 6 210, 5σ = 233, 6σ = 3,4.
Ejemplo : un proceso fabrica ejes de diámetro objetivo 25 mm, tolerancia ±0,3 mm (USL=25,3, LSL=24,7). Medidos 100 ejes : μ = 25,02 mm, s = 0,08 mm. Cp = 0,6/(6·0,08) = 1,25. Cpk = mín[(25,3−25,02)/0,24; (25,02−24,7)/0,24] = mín[1,17; 1,33] = 1,17. Proceso capaz pero descentrado.
2 · Volatilidad financiera : σ anualizada y ratio de Sharpe
En finanzas la desviación estándar de los rendimientos ES la volatilidad. Se anualiza multiplicando por la raíz del número de periodos : para datos diarios se asume que un año tiene ≈ 252 días bursátiles, así que σ_anual = σ_diaria · √252. Para datos mensuales σ_anual = σ_mensual · √12.
- Ratio de Sharpe = (R_p − R_f) / σ_p — ingreso extra por unidad de riesgo (William Sharpe, Premio Nobel 1990).
- VaR paramétrico al 95 % : VaR = μ − 1,645·σ. Si el 95 % de los días el rendimiento es ≥ VaR, hay 5 % de probabilidad de perder más de ese umbral.
- El CFA Institute usa este marco como base de toda la asignatura de Gestión de Carteras.
3 · Control estadístico de procesos (SPC) : cartas Shewhart
Walter A. Shewhart inventó en 1924 en Bell Labs la carta de control X̄-R : se grafica la media de pequeñas muestras de producción contra el tiempo, con líneas a ±3σ (límite de control superior UCL y límite inferior LCR). Cualquier punto fuera de ±3σ señala que el proceso está fuera de control y requiere intervención inmediata.
Las Western Electric Rules (1956) amplían la regla básica con señales adicionales : 2 de 3 puntos consecutivos fuera de ±2σ, 4 de 5 fuera de ±1σ, 8 puntos consecutivos del mismo lado de la media, etc. Montgomery (2019, Introduction to Statistical Quality Control) y NIST/SEMATECH (Engineering Statistics Handbook) son las referencias técnicas estándar.
Errores comunes que invalidan un análisis estadístico
- Confundir σ y s — usar STDEV.P en Excel cuando los datos son muestra (subestima la dispersión, intervalos de confianza demasiado estrechos).
- Olvidar la corrección de Bessel — dividir entre n en vez de entre n−1 en muestras pequeñas (n<30) sesga sistemáticamente el resultado.
- Ignorar las unidades — σ tiene las mismas unidades que los datos originales. σ² (varianza) tiene unidades al cuadrado. CV es adimensional (porcentaje).
- Aplicar la regla 68-95-99,7 a distribuciones no normales — vale solo para la gaussiana. Para distribuciones sesgadas (ingresos, tiempos de espera), usar Chebyshev.
- Descartar outliers sin análisis — un punto con |z|>3 puede ser un error de medida… o el dato más importante del conjunto. Siempre investigar antes de eliminar.
- Confundir desviación estándar con error estándar de la media — SEM = σ/√n. El SEM mide la precisión con la que se estima la media, no la dispersión de los datos.
Desviación estándar en Excel, Python, R y SPSS
Todos los paquetes estadísticos profesionales implementan las dos versiones. La diferencia crítica está en los valores por defecto : R y Excel (funciones clásicas) asumen muestra (n−1), numpy asume población (N). Cuidado con el ddof.
Microsoft Excel y Google Sheets
=STDEV.P(A1:A100)— desviación poblacional σ (divide entre N)=STDEV.S(A1:A100)— desviación muestral s (divide entre n−1) · es la que deberías usar en el 95 % de los casos=VAR.P()/=VAR.S()— las mismas variantes para la varianza- Aliases antiguos (hoja heredada) :
DESVEST.P(ES) oSTDEVP,DESVESToSTDEV(muestral)
Python (numpy y pandas)
import numpy as np datos = [12, 15, 18, 22, 25, 28, 30, 35, 38, 42] np.std(datos, ddof=0) # σ poblacional = 9.79 np.std(datos, ddof=1) # s muestral = 10.33 import pandas as pd pd.Series(datos).std() # por defecto ddof=1 → muestral
R
datos <- c(12, 15, 18, 22, 25, 28, 30, 35, 38, 42) sd(datos) # siempre muestral (divide entre n-1) = 10.33 var(datos) # varianza muestral = 106.76
SPSS, Stata, Minitab
SPSS — procedimiento Analyze → Descriptive Statistics → Descriptives, reporta s muestral por defecto. Stata — comando summarize var, detail. Minitab — Stat → Basic Statistics → Display Descriptive Statistics, estándar para auditorías Six Sigma en industria. Khan Academy ofrece un curso completo gratuito en es.khanacademy.org/math/statistics-probability.
🤔 Preguntas frecuentes
¿Cuál es la fórmula de la desviación estándar?
Para una población : σ = √(Σ(xᵢ − μ)²/N). Para una muestra : s = √(Σ(xᵢ − x̄)²/(n−1)), aplicando la corrección de Bessel. La varianza es el cuadrado de la desviación estándar (σ² y s²).
¿Cuál es la diferencia entre desviación estándar muestral y poblacional?
La poblacional (σ) divide entre N y se usa cuando conoces todos los individuos de la población. La muestral (s) divide entre n−1 y se usa cuando trabajas con una muestra de una población más grande. La corrección de Bessel (n−1) compensa el sesgo de estimar la media a partir de la propia muestra.
¿Por qué la desviación muestral divide entre n−1 y no entre n?
Porque al calcular x̄ desde la muestra se pierde un grado de libertad (la suma de desviaciones respecto a x̄ siempre da cero). Solo n−1 de las n desviaciones son independientes. Dividir entre n produciría un estimador sesgado que subestima la varianza poblacional. Ronald Fisher formalizó este argumento en 1925.
¿Qué es mejor usar varianza o desviación estándar?
La varianza es matemáticamente más cómoda (es aditiva, permite derivar fórmulas) pero sus unidades son al cuadrado de los datos — poco intuitivas. La desviación estándar tiene las mismas unidades que los datos originales, por lo que es la que se reporta en informes y se compara directamente con la media.
¿Cómo se interpreta una desviación estándar alta?
Una σ alta significa que los datos están muy dispersos respecto a la media — hay mucha variabilidad. Una σ baja indica que los valores están concentrados alrededor de la media. El coeficiente de variación (CV = σ/μ × 100) permite comparar dispersiones entre conjuntos con medias distintas : CV < 10 % baja, 10-30 % moderada, > 30 % alta.
¿Cómo calcular la desviación estándar en Excel?
Usa =STDEV.S(rango) para muestra (caso más frecuente, divide entre n−1) o =STDEV.P(rango) para población (divide entre N). En versiones antiguas o en Google Sheets también funcionan STDEV y STDEVP. La versión muestral S es la correcta en el 95 % de los análisis.
¿Qué significa la regla 68-95-99,7?
En una distribución normal, el 68,27 % de los datos caen dentro de μ ± 1σ, el 95,45 % dentro de μ ± 2σ y el 99,73 % dentro de μ ± 3σ. Es la "regla empírica" o "regla 3-sigma". Para distribuciones no normales, la desigualdad de Chebyshev da cotas más débiles pero universales.
¿Cómo se calcula el z-score de un valor?
z = (x − μ) / σ. Mide a cuántas desviaciones estándar se encuentra x de la media. z=0 es exactamente la media, z=+1,5 está una vez y media σ por encima, z=−2 está dos σ por debajo. Valores con |z| > 3 se consideran outliers (probabilidad < 0,27 % en una normal).
¿Cómo se calcula la volatilidad anualizada de una acción?
Se calcula la desviación estándar muestral (s) de los rendimientos diarios, mensuales o semanales y se multiplica por la raíz del número de periodos al año. Para datos diarios : σ_anual = σ_diaria × √252 (252 días bursátiles). Mensuales : × √12. Semanales : × √52. Es el input central del ratio de Sharpe y del VaR paramétrico.
¿Qué relación hay entre Six Sigma y la desviación estándar?
Six Sigma es una metodología de calidad cuyo objetivo es que 6σ quepan dentro de los límites de especificación del proceso. Eso equivale a 3,4 defectos por millón de oportunidades (DPMO). Los índices Cp y Cpk comparan la anchura de la tolerancia (USL − LSL) con 6σ. Cp ≥ 1,33 se considera aceptable, Cp ≥ 2 es nivel Six Sigma.
Ingeniero y docente universitario. Especialista en matemáticas aplicadas, estadística descriptiva e inferencial, control estadístico de procesos (SPC), metodología Six Sigma y aplicaciones financieras (volatilidad, VaR, ratio de Sharpe).
Última actualización : 18 de abril de 2026
📚 Fuentes : Wolfram MathWorld — Standard Deviation · Khan Academy — Statistics & Probability · NIST/SEMATECH e-Handbook of Statistical Methods · ASQ — Six Sigma Body of Knowledge · Pearson, K. (1894) Contributions to the Mathematical Theory of Evolution, Phil. Trans. Royal Society · Fisher, R. A. (1925) Statistical Methods for Research Workers · Montgomery, D. C. (2019) Introduction to Statistical Quality Control, 8ª ed., Wiley