Almacenamiento digital explicado: de bits a terabytes
Compras un disco duro de 1 TB, lo conectas y tu computadora dice que tiene capacidad de 931 GB. No 1,000 GB. Ni siquiera 999 GB. Revisas la caja, revisas el recibo y te preguntas si alguien cometió un error. Nadie cometió un error. El disco contiene exactamente la cantidad de bytes anunciada. El problema es que la palabra "gigabyte" tiene dos significados distintos según quién la use.
Esta brecha entre lo que esperabas y lo que muestra tu pantalla se remonta a un conflicto entre dos sistemas de conteo que ha persistido durante décadas, generado demandas judiciales y confundido a millones de personas. Así es como funciona.
El bit, el byte y su origen
Cada dato en una computadora se reduce a dígitos binarios: unos y ceros. Un único dígito binario es un bit. En 1956, Werner Buchholz, un informático que trabajaba en la supercomputadora IBM Stretch, acuñó el término byte para describir un grupo de bits procesados como una unidad. Deliberadamente escribió mal "bite" para que nadie lo confundiera con "bit" en la documentación escrita. Los primeros bytes variaban en tamaño (algunos sistemas usaban bytes de 6 bits), pero el byte de 8 bits finalmente se impuso y se volvió universal.
Ocho bits dan 256 valores posibles (2 elevado a la potencia de 8). Eso es suficiente para representar un único carácter de texto, un número pequeño o los datos de color de un píxel. Todo lo demás en el almacenamiento digital se construye hacia arriba desde esa base de 8 bits.
Dos formas de contar: decimal vs. binario
Aquí comienza la confusión. En matemáticas cotidianas, "kilo" significa 1,000. Un kilogramo son 1,000 gramos. Un kilómetro son 1,000 metros. Entonces un kilobyte debería ser 1,000 bytes, ¿verdad?
En el sistema decimal (base 10), lo es. Pero las computadoras operan en binario (base 2), y la potencia de 2 más cercana a 1,000 es 1,024 (que es 2 elevado a la potencia de 10). Los primeros ingenieros informáticos usaban "kilobyte" para referirse a 1,024 bytes porque era suficientemente cercano a 1,000 y se ajustaba perfectamente a la arquitectura binaria. El mismo patrón se repitió en la escala: "megabyte" significaba 1,024 × 1,024 (1,048,576) bytes, y "gigabyte" significaba 1,024 × 1,024 × 1,024 (1,073,741,824) bytes.
Para cantidades pequeñas, la diferencia es mínima. A nivel de kilobyte, es solo del 2.4%. Pero la brecha se acumula. Cuando llegas a los terabytes, el valor binario (1,099,511,627,776 bytes) es casi un 10% mayor que el valor decimal (1,000,000,000,000 bytes). Ese 10% son tus "69 GB perdidos" en un disco de 1 TB.
| Unidad | Decimal (SI) | Binario | Diferencia |
|---|---|---|---|
| Kilobyte | 1,000 bytes | 1,024 bytes | 2.4% |
| Megabyte | 1,000,000 bytes | 1,048,576 bytes | 4.9% |
| Gigabyte | 1,000,000,000 bytes | 1,073,741,824 bytes | 7.4% |
| Terabyte | 1,000,000,000,000 bytes | 1,099,511,627,776 bytes | 10.0% |
¿Necesitas convertir entre estas unidades? El conversor de gigabytes a megabytes maneja las matemáticas decimales, y el conversor de terabytes a gigabytes funciona para capacidades mayores.
La solución de la IEC: KiB, MiB, GiB
En diciembre de 1998, la Comisión Electrotécnica Internacional (IEC) intentó resolver este problema. Publicó el estándar IEC 60027-2, que introdujo un nuevo conjunto de prefijos para múltiplos binarios: kibibyte (KiB) para 1,024 bytes, mebibyte (MiB) para 1,048,576 bytes, gibibyte (GiB) para 1,073,741,824 bytes y tebibyte (TiB) para 1,099,511,627,776 bytes. Los nombres combinan las dos primeras letras del prefijo SI con "bi" para binario: kibi, mebi, gibi, tebi.
Bajo este sistema, los prefijos SI antiguos (kilo, mega, giga, tera) significarían exactamente lo que significan en el resto de la ciencia: potencias de 1,000. Un gigabyte sería siempre 1,000,000,000 bytes. Un gibibyte sería siempre 1,073,741,824 bytes. Limpio e inequívoco.
La realidad es que la adopción ha sido lenta. Las distribuciones de Linux adoptaron los prefijos IEC hace años. macOS los incorporó en 2009, por eso un Mac muestra un disco de 1 TB como "1 TB" en lugar de "931 GB". Windows sigue usando la interpretación binaria antigua etiquetándola como "GB", lo que mantiene viva la confusión para la mayor parte de los usuarios de escritorio. La mayoría de las personas nunca ha escuchado la palabra "gibibyte".
Por qué tu disco muestra menos de lo anunciado
Los fabricantes de discos usan la definición decimal. Cuando Western Digital, Seagate o Samsung imprimen "1 TB" en una caja, se refieren a 1,000,000,000,000 bytes. Esto es técnicamente correcto según los estándares SI. Sin embargo, tu sistema operativo puede dividir ese recuento de bytes entre 1,024 en cada nivel en lugar de 1,000. El resultado: 1,000,000,000,000 dividido entre 1,024, luego entre 1,024, luego entre 1,024 nuevamente, equivale aproximadamente a 931 GB según lo que muestra el sistema operativo.
Esta discrepancia no fue puramente académica. A principios de la década de 2000, demandas colectivas apuntaron a fabricantes de discos incluyendo Western Digital y Seagate. Los demandantes argumentaban que anunciar discos en gigabytes decimales era engañoso porque los sistemas operativos reportaban menos espacio. Western Digital llegó a un acuerdo en 2006, ofreciendo software de respaldo gratuito a aproximadamente un millón de clientes afectados. Seagate alcanzó un acuerdo similar, ofreciendo reembolsos en efectivo o software gratuito. Los discos siempre contenían cada byte impreso en la etiqueta. El debate era sobre las expectativas del consumidor, no sobre datos faltantes.
¿Qué cabe realmente en un disco?
Los recuentos abstractos de bytes no significan mucho sin contexto. Aquí hay una guía aproximada de cómo se ven los archivos reales, usando medidas estándar decimales de megabytes a kilobytes y gigabytes a terabytes.
| Tipo de archivo | Tamaño típico | Por 1 GB | Por 1 TB |
|---|---|---|---|
| Documento de texto (5 págs.) | 50 KB | ~20,000 docs | ~20 millones |
| Canción MP3 (4 min) | 4 MB | ~250 canciones | ~250,000 canciones |
| Foto JPEG (12 MP) | 3-5 MB | ~250 fotos | ~250,000 fotos |
| Foto RAW | 25-50 MB | ~25 fotos | ~25,000 fotos |
| Película 1080p (2 horas) | 1.5-4 GB | ~1 película | ~300 películas |
| Película 4K (2 horas) | 8-15 GB | película parcial | ~80 películas |
Estos números varían con la compresión, la configuración de calidad y los códecs. Una transmisión 1080p muy comprimida de un servicio de streaming podría ser de 1.5 GB, mientras que una copia Blu-ray de la misma película podría ser de 30 GB o más.
La jerarquía: de bits a petabytes
Como referencia, aquí está la escala completa de unidades de almacenamiento comunes en notación decimal:
- 1 byte = 8 bits
- 1 kilobyte (KB) = 1,000 bytes
- 1 megabyte (MB) = 1,000 KB = 1 millón de bytes
- 1 gigabyte (GB) = 1,000 MB = 1 mil millones de bytes
- 1 terabyte (TB) = 1,000 GB = 1 billón de bytes
- 1 petabyte (PB) = 1,000 TB = 1 cuatrillón de bytes
Los dispositivos de consumo actuales llegan a unos pocos terabytes para SSDs y hasta aproximadamente 30 TB para discos duros empresariales. Los proveedores de nube como Google, Amazon y Microsoft gestionan almacenamiento medido en exabytes (1,000 PB). El conversor de gigabytes a megabytes es útil cuando necesitas comparar tamaños de archivos en diferentes escalas.
El resumen breve
Los fabricantes de discos cuentan en potencias de 1,000. Algunos sistemas operativos cuentan en potencias de 1,024. La IEC creó nuevos prefijos (KiB, MiB, GiB) para eliminar la ambigüedad, pero el mundo ha sido lento en adoptarlos. Tu disco de 1 TB contiene exactamente 1 billón de bytes. Si eso aparece como "1 TB" o "931 GB" en pantalla depende enteramente de qué definición aplica tu sistema operativo a la palabra "gigabyte."
Nadie te está engañando. Todos los bytes están ahí. Solo las etiquetas no se han puesto al día con las matemáticas.
Fuentes: IEC 60027-2, NIST, IEEE, Werner Buchholz / IBM (1956)