Zum Hauptinhalt springen

Digitale Speicherung erklärt: Von Bits bis Terabytes

6 Min. Lesezeit
Digitaler SpeicherTechnologieMessungInformatik

Digitale Speicherung erklärt: Von Bits zu Terabytes

Sie kaufen eine 1-TB-Festplatte, schließen sie an, und Ihr Computer zeigt an, dass sie 931 GB fasst. Nicht 1.000 GB. Nicht einmal 999 GB. Sie überprüfen die Packung, den Kassenbon, und fragen sich, ob ein Fehler passiert ist. Es ist kein Fehler passiert. Das Laufwerk enthält genau so viele Bytes, wie beworben. Das Problem ist, dass das Wort „Gigabyte" je nach Verwendungskontext zwei verschiedene Dinge bedeutet.

Diese Lücke zwischen Erwartung und Bildschirmanzeige geht auf einen Konflikt zwischen zwei Zählsystemen zurück, der seit Jahrzehnten anhält, Klagen ausgelöst und Millionen von Menschen verwirrt hat. So funktioniert es.

Das Bit, das Byte und ihre Herkunft

Jedes Datenstück auf einem Computer lässt sich auf binäre Ziffern reduzieren: Einsen und Nullen. Eine einzelne binäre Ziffer ist ein Bit. Im Jahr 1956 prägte Werner Buchholz, ein Informatiker, der am IBM-Stretch-Supercomputer arbeitete, den Begriff Byte, um eine Gruppe von Bits zu beschreiben, die als Einheit verarbeitet werden. Er schrieb „bite" bewusst falsch, damit niemand es in schriftlichen Dokumenten mit „bit" verwechseln würde. Frühe Bytes variierten in der Größe (manche Systeme verwendeten 6-Bit-Bytes), aber das 8-Bit-Byte setzte sich letztlich durch und wurde universell.

Acht Bits ergeben 256 mögliche Werte (2 hoch 8). Das reicht aus, um ein einzelnes Textzeichen, eine kleine Zahl oder Farbdaten eines einzelnen Pixels darzustellen. Alles andere im digitalen Speicher baut auf dieser 8-Bit-Grundlage auf.

Zwei Zählweisen: Dezimal und Binär

Hier beginnt die Verwirrung. Im Alltag bedeutet „Kilo" 1.000. Ein Kilogramm sind 1.000 Gramm. Ein Kilometer sind 1.000 Meter. Also sollte ein Kilobyte 1.000 Bytes sein, oder?

Im dezimalen (Basis-10-)System ist es das. Computer arbeiten jedoch binär (Basis 2), und die nächste saubere Zweierpotenz zu 1.000 ist 1.024 (was 2 hoch 10 ist). Frühe Computeringenieure verwendeten „Kilobyte" für 1.024 Bytes, weil es nah genug an 1.000 war und sauber auf die Binärarchitektur passte. Das gleiche Muster wiederholte sich auf der gesamten Skala: „Megabyte" bedeutete 1.024 × 1.024 (1.048.576) Bytes, und „Gigabyte" bedeutete 1.024 × 1.024 × 1.024 (1.073.741.824) Bytes.

Bei kleinen Mengen ist der Unterschied winzig. Auf Kilobyte-Ebene beträgt er nur 2,4 %. Doch die Lücke potenziert sich. Auf Terabyte-Ebene ist der binäre Wert (1.099.511.627.776 Bytes) fast 10 % größer als der dezimale Wert (1.000.000.000.000 Bytes). Diese 10 % sind Ihre „fehlenden" 69 GB auf einer 1-TB-Festplatte.

EinheitDezimal (SI)BinärUnterschied
Kilobyte1.000 Bytes1.024 Bytes2,4 %
Megabyte1.000.000 Bytes1.048.576 Bytes4,9 %
Gigabyte1.000.000.000 Bytes1.073.741.824 Bytes7,4 %
Terabyte1.000.000.000.000 Bytes1.099.511.627.776 Bytes10,0 %

Für Umrechnungen zwischen diesen Einheiten: Der Gigabytes-zu-Megabytes-Umrechner übernimmt die dezimale Berechnung, und der Terabytes-zu-Gigabytes-Umrechner funktioniert für größere Kapazitäten.

Die IEC-Lösung: KiB, MiB, GiB

Im Dezember 1998 versuchte die International Electrotechnical Commission (IEC), dieses Durcheinander zu lösen. Sie veröffentlichten die Norm IEC 60027-2, die eine neue Reihe von Präfixen für binäre Vielfache einführte: Kibibyte (KiB) für 1.024 Bytes, Mebibyte (MiB) für 1.048.576 Bytes, Gibibyte (GiB) für 1.073.741.824 Bytes und Tebibyte (TiB) für 1.099.511.627.776 Bytes. Die Namen kombinieren die ersten beiden Buchstaben des SI-Präfixes mit „bi" für binär: kibi, mebi, gibi, tebi.

In diesem System würden die alten SI-Präfixe (Kilo, Mega, Giga, Tera) genau das bedeuten, was sie überall sonst in der Wissenschaft bedeuten: Zehnerpotenzen. Ein Gigabyte wäre immer 1.000.000.000 Bytes. Ein Gibibyte wäre immer 1.073.741.824 Bytes. Klar und eindeutig.

Die Realität ist, dass die Einführung langsam verlief. Linux-Distributionen übernahmen die IEC-Präfixe vor Jahren. macOS wechselte im Jahr 2009, weshalb ein Mac eine 1-TB-Festplatte als „1 TB" anzeigt und nicht als „931 GB". Windows verwendet weiterhin die alte binäre Interpretation und beschriftet sie dabei mit „GB", was die Verwirrung für den größten Anteil der Desktop-Benutzer aufrechthält. Die meisten Menschen haben das Wort „Gibibyte" noch nie gehört.

Warum Ihr Laufwerk weniger anzeigt als beworben

Festplattenhersteller verwenden die dezimale Definition. Wenn Western Digital, Seagate oder Samsung „1 TB" auf eine Packung drucken, meinen sie 1.000.000.000.000 Bytes. Das ist nach SI-Normen technisch korrekt. Ihr Betriebssystem kann diese Byteanzahl jedoch auf jeder Ebene durch 1.024 statt durch 1.000 teilen. Das Ergebnis: 1.000.000.000.000 geteilt durch 1.024, dann durch 1.024, dann noch einmal durch 1.024 ergibt etwa 931 GB, wie vom Betriebssystem angezeigt.

Diese Diskrepanz war nicht rein akademisch. In den frühen 2000er Jahren richteten sich Sammelklagen gegen Festplattenhersteller, darunter Western Digital und Seagate. Die Kläger argumentierten, dass das Bewerben von Laufwerken in dezimalen Gigabytes irreführend sei, da Betriebssysteme weniger Speicherplatz meldeten. Western Digital einigte sich 2006 und bot etwa einer Million betroffener Kunden kostenlose Backup-Software an. Seagate erzielte eine ähnliche Einigung mit Barerstattungen oder kostenloser Software. Die Laufwerke enthielten stets jeden auf dem Etikett aufgedruckten Byte. Der Streit betraf Verbrauchererwartungen, nicht fehlende Daten.

Was auf ein Laufwerk passt?

Abstrakte Bytezahlen bedeuten ohne Kontext wenig. Hier ein grober Überblick über reale Dateigrößen, mit standardmäßigen dezimalen Megabytes-zu-Kilobytes- und Gigabytes-zu-Terabytes-Messungen.

DateitypTypische GrößePro 1 GBPro 1 TB
Textdokument (5 Seiten)50 KB~20.000 Docs~20 Millionen
MP3-Song (4 Min.)4 MB~250 Songs~250.000 Songs
JPEG-Foto (12 MP)3–5 MB~250 Fotos~250.000 Fotos
RAW-Foto25–50 MB~25 Fotos~25.000 Fotos
1080p-Film (2 Std.)1,5–4 GB~1 Film~300 Filme
4K-Film (2 Std.)8–15 GBTeilfilm~80 Filme

Diese Zahlen verschieben sich je nach Komprimierung, Qualitätseinstellungen und Codecs. Ein stark komprimierter 1080p-Stream von einem Streaming-Dienst kann 1,5 GB umfassen, während ein Blu-ray-Rip desselben Films 30 GB oder mehr betragen kann.

Die Hierarchie: Von Bits zu Petabytes

Zur Orientierung hier die vollständige Leiter gängiger Speichereinheiten in dezimaler Notation:

  • 1 Byte = 8 Bits
  • 1 Kilobyte (KB) = 1.000 Bytes
  • 1 Megabyte (MB) = 1.000 KB = 1 Million Bytes
  • 1 Gigabyte (GB) = 1.000 MB = 1 Milliarde Bytes
  • 1 Terabyte (TB) = 1.000 GB = 1 Billion Bytes
  • 1 Petabyte (PB) = 1.000 TB = 1 Billiarde Bytes

Consumer-Geräte reichen derzeit bei SSDs bis zu einigen Terabytes und bei Enterprise-Festplatten bis zu etwa 30 TB. Cloud-Anbieter wie Google, Amazon und Microsoft verwalten Speicher im Exabyte-Bereich (1.000 PB). Der Gigabytes-zu-Megabytes-Umrechner ist praktisch, wenn Sie Dateigrößen auf verschiedenen Skalen vergleichen müssen.

Kurz zusammengefasst

Festplattenhersteller zählen in Zehnerpotenzen. Manche Betriebssysteme zählen in Zweierpotenzen. Die IEC schuf neue Präfixe (KiB, MiB, GiB), um die Mehrdeutigkeit zu beseitigen, aber die Welt hat ihre Einführung nur langsam vollzogen. Ihre 1-TB-Festplatte enthält exakt 1 Billion Bytes. Ob das auf dem Bildschirm als „1 TB" oder „931 GB" erscheint, hängt vollständig davon ab, welche Definition Ihr Betriebssystem auf das Wort „Gigabyte" anwendet.

Niemand betrügt Sie. Die Bytes sind alle da. Die Bezeichnungen haben nur noch nicht mit der Mathematik Schritt gehalten.


Quellen: IEC 60027-2, NIST, IEEE, Werner Buchholz / IBM (1956)