Standort: science.ORF.at / Meldung: ""Das Magnetband war nie unmodern""

IT-Center des CERN

"Das Magnetband war nie unmodern"

Die Teilchenkollisionen am Europäischen Kernforschungszentrum CERN erzeugen jährlich 20 Millionen Gigabyte an Daten. Das entspricht einem 20 Kilometer hohen Turm von CDs, erklärt IT-Experte Markus Schulz. Für die Archivierung setzt man am CERN auf bewährte Technologie: das gute alte Magnetband.

Daten 15.05.2013

science.ORF.at: Der Rechenbedarf des CERN wird auf ein weltweites Rechnernetzwerk verteilt. Welche Aufgaben hat der "Worldwide LHC Computing Grid" bei den Kollisionsexperimenten mit dem Teilchenbeschleuniger LHC?

Markus Schulz: Jedes der großen Experimente produziert pro Sekunde 300 Megabyte. Das sind allerdings reine Rohdaten. Die müssen wir zunächst in eine Form zurückrechnen, die man verstehen kann. Also etwa: Wo verlief eine Teilchenbahn? Wie groß waren die Signale, die die Teilchen hinterlassen haben?

Im nächsten Verarbeitungsschritt ordnen wir die Teilchenbahnen bestimmten Teilchentypen zu. Daraus kann man auf das Gesamtbild zurückschließen. Es zeigt, was eigentlich bei der Kollision passiert ist.

Markus Schulz

CERN

Zur Person

Markus Schulz ist Leiter der "Grid Deployment Group" des Europäischen Kernforschungszentrums CERN.

Ö1-Sendungshinweis

Über dieses Thema berichtet auch "Wissen aktuell", Mittwoch, 15.5.2013, 13:55 Uhr

Wie viele Daten produzieren Sie pro Jahr?

Ungefähr 15 bis 20 Petabyte. Da wir am Cern nur 20 Prozent der notwendigen Rechenleistung für die Verarbeitung zur Verfügung haben, müssen wir zunächst eine Kopie der Daten zu unseren Partnerzentren transportieren. Das sind elf sogenannte T1-Computerzentren auf der ganzen Welt.

Was passiert in den T1-Centern?

Dort werden die Daten logisch komprimiert. Man kann sich das so vorstellen, wie die Zusammenfassung eines Buches. Die komprimierten Daten sagen nicht mehr: "Hier verlief eine Teilchenbahn mit der Energie X". Sondern: "Das Teilchen an diesem Ort ist mit der Wahrscheinlichkeit Y ein Pion."

IT-Zentrum des CERN

Maximillien Brice, Anna Pantelia

IT-Zentrum des CERN

Wie geht es weiter in der Verarbeitungskette?

Die nächste Ebene sind die sogenannten T2-Center. Hier entsteht die eigentliche Physik und jene Grafiken, die man aus den Medien kennt - bei denen die Physiker mit dem Finger auf eine Stelle zeigen und sagen: "Hier haben wir ein Higgs-Teilchen entdeckt." Dieser Verarbeitungsprozess läuft allerdings nicht nur einmal ab, sondern iterativ. Man kann das mit der Kalibrierung einer Kamera vergleichen - nur dass die Teilchendetektoren wesentlich mehr Kanäle besitzen. Je besser die Kalibrierung, desto besser die Ergebnisse.

Nebenbei benötigen wir ebenso viel Rechenleistung, um die Daten verstehen zu können. Alles, was in den Experimenten passiert, wird nämlich durch physikalische Modelle dargestellt, sogenannte Monte-Carlo-Simulationen. Insgesamt sind in unseren Datencentern rund 300.000 CPUs mit der Verarbeitung der Hochenergiephysik beschäftigt. Wobei ein moderner CPU bis zu acht Prozessorkerne besitzt.

Wäre es nicht ökonomischer gewesen, die gesamte Datenauswertung lokal am CERN anzusiedeln?

Technisch wäre es natürlich machbar gewesen. Aber alle am CERN tätigen Wissenschaftler haben an ihren Heimatinstituten ohnehin Rechenleistung zur Verfügung. Die verteilte Rechnerarchitektur ist zwar teurer, aber sie verteilt die Aufgaben und Kosten auch auf mehr Schultern.

Man darf nicht vergessen: Normalerweise werden Rechner in diesem Bereich alle drei bis vier Jahre erneuert. Das kostet allein im CERN pro Jahr 20 Millionen Franken. Davon abgesehen profitieren auch die Universitäten davon: Rechenzentren sind auch Ausbildungsstätten.

Kabelsalat im IT-Zentrum des CERN

Gerardo Algara-Siller

Rückansicht der Rechner: Kabelsalat

Kommen wir zu den von Ihnen erwähnten 15 bis 20 Petabyte zurück: Kann man diese Größe veranschaulichen?

20 Petabyte entsprechen 4,45 Millionen DVDs, also etwa 1.000 Jahre Film. Auf CDs umgerechnet ergäbe das einen 20 Kilometer hohen Turm.

Die Erfindung des World Wide Web am CERN hat die weltweite Kommunikation revolutioniert. Sehen Sie gegenwärtige andere Spin-off-Technologien, die ähnliches auslösen könnten?

Wenn ich eine gute Antwort auf diese Frage hätte, würde ich mein gesamtes Erspartes in diese Technologie investieren - und sehr früh in Pension gehen! Historisch betrachtet hat das CERN noch etwas sehr Wichtiges erfunden, nämlich eine Form der Zusammenarbeit: Ich meine die Forschung in Kollaborationen.

Was technologische Spin-offs der Zukunft angeht: Sehr wahrscheinlich werden sie nicht im Computing-Bereich liegen. In dieser Hinsicht ist das CERN nicht mehr außergewöhnlich. Die Datenzentren von Google, Microsoft und Amazon sind wesentlich größer. Eine gewisse Besonderheit sehe ich in der Archivierung von Daten - wir behalten die Daten für die Ewigkeit.

Wie speichern Sie die Daten?

Mit Hilfe von Tape-Robotern. Das sind automatisierte Regalsysteme mit sehr cleveren Bandlesegeräten. Momentan hat jede Kassette vier bis fünf Terabyte Speicherplatz. Die Entwicklung der Speicherdichte verläuft aber exponentiell.

Das heißt, wir kopieren die Daten alle paar Jahre um: Was in der einen Genration auf zehn Tapes gespeichert wurde, hat in der nächsten auf nur einem Platz. So halten wir die Zahl der Medien unter Kontrolle. Und wir halten noch eine zweite Kopie außerhalb des CERN bereit, falls es hier einmal brennen sollte.

Die Bandtechnologie feiert in diesem Spezialbereich eine Renaissance?

Keineswegs, sie war nie unmodern. Sie wurde zwar häufig totgesagt. Das liegt daran, dass die Sprünge bei der Speicherdichte seltener passieren - dafür sind sie größer. Die Bänder sehen heute übrigens nicht mehr aus wie Spulen, sondern wie kleine Dosen.

Welche Speicherdichte haben die Magnetbänder?

Pro Fläche sind sie den Hard Discs um den Faktor 200 unterlegen. Was die Speicherdichte pro Volumen betrifft, sind sie hingegen besser. Hard Discs können zurzeit 11,3 Gigabyte pro Kubikzentimeter speichern. Bei den Bändern sind es 14,6 Gigabyte.

Was unterscheidet Bänder und Festplatten sonst noch?

Bei den Festplatten ist der Zugriff auf die Daten sehr einfach, während man bei den Magnetbändern vor- und zurückspulen muss. Dafür sind die Tapes billiger und haben vor allem eine wesentlich angenehmere Art kaputtzugehen. Wenn ein Band defekt ist, kann man zwar diese bestimmte Stelle nicht mehr lesen. Aber die Daten davor und danach bleiben erhalten.

Die Fehler von Hard Drives sind sehr viel schwieriger zu reparieren. Und wenn das nicht gelingt, ist die gesamte Disc weg. Außerdem sind die Hersteller der Tapes auf Archivierungstechnologie spezialisiert. Wer keine haltbaren Medien produziert, ist für immer weg vom Markt.

Aus welchem Material bestehen die Tapes?

Die magnetische Oberfläche besteht aus Bariumferrit, wobei sich die Speichertechnologie von den Festplatten ableitet. Das Trägermaterial ist Aramid. Daraus werden auch schusssichere Westen gefertigt.

Interview: Robert Czepel, science.ORF.at

Mehr zu diesem Thema: