Pular para o conteúdo principal

Armazenamento digital explicado: de bits a terabytes

6 min de leitura
Armazenamento digitalTecnologiaMediçãoInformática

Armazenamento Digital Explicado: De Bits a Terabytes

Você compra um HD de 1 TB, conecta ao computador e ele mostra que tem capacidade de 931 GB. Não 1.000 GB. Nem 999 GB. Você confere a caixa, confere o recibo e se pergunta se houve um erro. Não houve erro nenhum. O disco contém exatamente a quantidade de bytes anunciada. O problema é que a palavra "gigabyte" tem dois significados diferentes dependendo de quem a usa.

Essa diferença entre o que você esperava e o que aparece na tela tem origem em um conflito entre dois sistemas de contagem que persiste há décadas, gerou ações judiciais e confundiu milhões de pessoas. Veja como funciona.

O Bit, o Byte e Suas Origens

Cada dado em um computador se reduz a dígitos binários: uns e zeros. Um único dígito binário é um bit. Em 1956, Werner Buchholz, cientista da computação que trabalhava no supercomputador IBM Stretch, cunhou o termo byte para descrever um grupo de bits processados como uma única unidade. Ele grafou propositalmente de forma diferente de "bite" (morder) para que ninguém o confundisse com "bit" em documentação escrita. Os primeiros bytes variavam em tamanho (alguns sistemas usavam bytes de 6 bits), mas o byte de 8 bits acabou prevalecendo e se tornou universal.

Oito bits fornecem 256 valores possíveis (2 elevado à potência 8). Isso é suficiente para representar um único caractere de texto, um número pequeno ou os dados de cor de um pixel. Tudo o mais no armazenamento digital se constrói a partir dessa base de 8 bits.

Duas Formas de Contar: Decimal vs. Binário

É aqui que começa a confusão. Na matemática cotidiana, "kilo" significa 1.000. Um quilograma tem 1.000 gramas. Um quilômetro tem 1.000 metros. Então um quilobyte deveria ter 1.000 bytes, certo?

No sistema decimal (base 10), sim. Mas os computadores operam em binário (base 2), e a potência de 2 mais próxima de 1.000 é 1.024 (que é 2 elevado à potência 10). Os primeiros engenheiros de computação usaram "quilobyte" para significar 1.024 bytes porque era próximo o suficiente de 1.000 e se encaixava perfeitamente na arquitetura binária. O mesmo padrão se repetiu na escala: "megabyte" significava 1.024 × 1.024 (1.048.576) bytes, e "gigabyte" significava 1.024 × 1.024 × 1.024 (1.073.741.824) bytes.

Para pequenas quantidades, a diferença é mínima. No nível do quilobyte, é de apenas 2,4%. Mas a diferença se acumula. Quando chegamos ao terabyte, o valor binário (1.099.511.627.776 bytes) é quase 10% maior do que o valor decimal (1.000.000.000.000 bytes). Esses 10% são os "69 GB que faltam" no seu HD de 1 TB.

UnidadeDecimal (SI)BinárioDiferença
Quilobyte1.000 bytes1.024 bytes2,4%
Megabyte1.000.000 bytes1.048.576 bytes4,9%
Gigabyte1.000.000.000 bytes1.073.741.824 bytes7,4%
Terabyte1.000.000.000.000 bytes1.099.511.627.776 bytes10,0%

Precisa converter entre essas unidades? O conversor de gigabytes para megabytes faz a matemática decimal, e o conversor de terabytes para gigabytes funciona para capacidades maiores.

A Solução da IEC: KiB, MiB, GiB

Em dezembro de 1998, a Comissão Eletrotécnica Internacional (IEC) tentou resolver essa bagunça. Publicou a norma IEC 60027-2, que introduziu um novo conjunto de prefixos para múltiplos binários: kibibyte (KiB) para 1.024 bytes, mebibyte (MiB) para 1.048.576 bytes, gibibyte (GiB) para 1.073.741.824 bytes e tebibyte (TiB) para 1.099.511.627.776 bytes. Os nomes combinam as duas primeiras letras do prefixo SI com "bi" de binário: kibi, mebi, gibi, tebi.

Nesse sistema, os prefixos SI antigos (kilo, mega, giga, tera) significariam exatamente o que significam em qualquer outro contexto científico: potências de 1.000. Um gigabyte seria sempre 1.000.000.000 bytes. Um gibibyte seria sempre 1.073.741.824 bytes. Claro e sem ambiguidade.

A realidade é que a adoção tem sido lenta. As distribuições Linux adotaram os prefixos IEC há anos. O macOS mudou em 2009, razão pela qual um Mac mostra um HD de 1 TB como "1 TB" em vez de "931 GB". O Windows ainda usa a interpretação binária antiga, mas a rotula como "GB", o que mantém a confusão viva para a maior parte dos usuários de desktop. A maioria das pessoas nunca ouviu a palavra "gibibyte".

Por Que Seu Disco Mostra Menos do Que o Anunciado

Os fabricantes de discos usam a definição decimal. Quando a Western Digital, a Seagate ou a Samsung imprime "1 TB" em uma caixa, significa 1.000.000.000.000 bytes. Isso é tecnicamente correto pelos padrões SI. No entanto, seu sistema operacional pode dividir essa contagem de bytes por 1.024 em cada nível, em vez de por 1.000. O resultado: 1.000.000.000.000 dividido por 1.024, depois por 1.024, depois por 1.024 novamente, resulta em aproximadamente 931 GB conforme exibido pelo SO.

Essa discrepância não foi apenas teórica. No início dos anos 2000, ações coletivas miram os fabricantes de discos rígidos, incluindo Western Digital e Seagate. Os demandantes argumentaram que anunciar discos em gigabytes decimais era enganoso porque os sistemas operacionais relatavam menos espaço. A Western Digital chegou a um acordo em 2006, oferecendo software de backup gratuito a cerca de um milhão de clientes afetados. A Seagate chegou a um acordo semelhante, fornecendo reembolsos em dinheiro ou software gratuito. Os discos sempre continham cada byte impresso no rótulo. O argumento era sobre as expectativas do consumidor, não sobre dados ausentes.

O Que Realmente Cabe em um Disco?

Contagens abstratas de bytes não significam muito sem contexto. Veja um guia aproximado sobre como são os arquivos reais, usando medidas decimais padrão de megabytes para quilobytes e gigabytes para terabytes.

Tipo de ArquivoTamanho TípicoPor 1 GBPor 1 TB
Documento de texto (5 páginas)50 KB~20.000 docs~20 milhões
Música MP3 (4 min)4 MB~250 músicas~250.000 músicas
Foto JPEG (12 MP)3–5 MB~250 fotos~250.000 fotos
Foto RAW25–50 MB~25 fotos~25.000 fotos
Filme 1080p (2 h)1,5–4 GB~1 filme~300 filmes
Filme 4K (2 h)8–15 GBfilme parcial~80 filmes

Esses números variam conforme a compressão, as configurações de qualidade e os codecs. Um stream 1080p fortemente comprimido de um serviço de streaming pode ter 1,5 GB, enquanto um rip de Blu-ray do mesmo filme pode ter 30 GB ou mais.

A Hierarquia: De Bits a Petabytes

Para referência, aqui está a escala completa das unidades de armazenamento comuns em notação decimal:

  • 1 byte = 8 bits
  • 1 quilobyte (KB) = 1.000 bytes
  • 1 megabyte (MB) = 1.000 KB = 1 milhão de bytes
  • 1 gigabyte (GB) = 1.000 MB = 1 bilhão de bytes
  • 1 terabyte (TB) = 1.000 GB = 1 trilhão de bytes
  • 1 petabyte (PB) = 1.000 TB = 1 quatrilhão de bytes

Os dispositivos de consumo atualmente chegam a alguns terabytes para SSDs e até cerca de 30 TB para HDs empresariais. Provedores de nuvem como Google, Amazon e Microsoft gerenciam armazenamento medido em exabytes (1.000 PB). O conversor de gigabytes para megabytes é útil quando você precisa comparar tamanhos de arquivos em diferentes escalas.

O Resumo

Os fabricantes de discos contam em potências de 1.000. Alguns sistemas operacionais contam em potências de 1.024. A IEC criou novos prefixos (KiB, MiB, GiB) para eliminar a ambiguidade, mas o mundo tem sido lento em adotá-los. Seu HD de 1 TB armazena exatamente 1 trilhão de bytes. Se isso aparece como "1 TB" ou "931 GB" na tela depende inteiramente de qual definição seu SO aplica à palavra "gigabyte".

Ninguém está enganando você. Os bytes estão todos lá. Os rótulos é que ainda não acompanharam a matemática.


Fontes: IEC 60027-2, NIST, IEEE, Werner Buchholz / IBM (1956)