US-Energieministerium entscheidet sich für IBM Big Data-Hochleistungsrechner
IBM-CEO Virginia Rometty. (Foto: IBM)
Armonk – IBM und das US-amerikanische Energieministerium geben den Abschluß eines Vertrages mit einem Volumen von 325 Millionen US-Dollar bekannt. Kernstück des Vertrages ist der Aufbau von zwei der weltweit fortschrittlichsten „datenzentrischen“ Supercomputern an den US-Forschungsstandorten Lawrence Livermore und Oak Ridge. Ziel der Installation sind Forschungsaktivitäten in Wissenschaft, Technik sowie der nationalen Sicherheit.
Das IBM System nutzt eine neuartige, „datenzentrische“ Architektur, bei der die Systemtechnologien quasi um die Daten herum gebaut werden. Die Folge: Daten müssen seltener zwischen Speicher und Prozessoren hin und zurück transportiert werden, wodurch der Energieverbrauch des Gesamtsystems drastisch sinkt.
Neuartige, datenzentrische Systemarchitektur
Die rasant wachsende Datenmenge von täglich 2,5 Milliarden Gigabyte (was ungefähr der Fläche von 250 Millionen Fußballfeldern bedeckt mit Büchern entspricht), macht Big Data-Technologien zu wichtigen Werkzeugen für neue Entdeckungen. Gleichzeitig werden damit aber auch neuartige Computersysteme für die Verarbeitung dieser Datenflut immer wichtiger.
Heute werden in Computern die Daten ständig zwischen Speicher und Prozessor hin und her geschickt, um sie zu bearbeiten oder zu analysieren. Im Umfeld von Big Data trägt dieser Ansatz nicht mehr, weil zu viel Zeit und Energie dafür aufgewendet werden muss. Um dem zu begegnen, wurden bisher immer schnellere Prozessoren eingesetzt, die allerdings aufgrund der Datenmengen immer weniger Kapazitäten zur Bearbeitung und Analyse zur Verfügung stellen konnten, da sie vielmehr mit dem Management und dem Transport der Daten zwischen den einzelnen Systemkomponenten beschäftigt waren.
IBM Forscher haben deshalb in den letzten fünf Jahren eine neuartige, datenzentrische Systemarchitektur entwickelt, in der die notwendigen Komponenten eines Computersystems und damit Rechenleistung dort „angesiedelt“ sind, wo die Daten sitzen. Damit können jetzt Datenanalyse, Modellierung, Visualisierung und Simulation mit bisher unerreichter Geschwindigkeit durchgeführt werden.
Leistungsumfang und Einsatzgebiete
Die beiden Forschungszentren des Energieministeriums erwarten, dass die beiden IBM Supercomputer zu den energieeffizientesten Computersystemen weltweit gehören werden. Im Vergleich zu den bestehenden Systemen der Labore soll ihre Performance bis zu zehn Mal und ihre Energieeffizienz mehr als fünf Mal besser sein. Die beiden auf OpenPOWER basierenden Installationen mit dem Namen „Sierra“ am Lawrence Livermore Institute und „Summit“ in Oak Ridge werden eine Leistung von jeweils mehr als 100 Petaflops erreichen und dabei fünf Petabyte an dynamischen und Flashspeichern nutzen. Der Datendurchsatz wird sich auf mehr als 17 Petabyte pro Sekunde summieren – dies entspricht etwa der Datenmenge von 100 Milliarden Bildern auf Facebook pro Sekunde.
Die Forschungsinstitute bieten Wissenschaftlern aus verschiedenen Fachgebieten sowie Behörden und Unternehmen die Möglichkeit, die Systeme zur Beantwortung unterschiedlichster wissenschaftlicher und technischer Fragestellungen zu nutzen. Durch den neuen Ansatz können die Installationen nicht mehr nur klassisch wissenschaftliche Daten modellieren und simulieren, sondern ihre Rechenleistung auch für hochkomplexe Datensätze beispielsweise aus dem Gesundheitswesen oder der Betriebs- und Finanzwirtschaft zur Verfügung stellen.
Offene Architekur dank OpenPOWER
Die wachsenden Notwendigkeiten, große Datenmengen und verschiedenartige Daten zu erfassen, zu managen und zu analysieren, macht es zunehmend erforderlich, die traditionelle Computerarchitektur durch offene Plattformen zu ergänzen oder zu ersetzen. Organisationen müssen die Herausforderungen, die diese Datenflut an sie stellen, ganzheitlich betrachten: angefangen vom Design eines Computersystems bis hin dazu, wie Daten genutzt werden sollen. Dies bedeutet, dass alle Schritte des Analyseprozesses von der Datengenerierung, über die Aufbereitung bis hin zur Auswertung betrachtet werden. Durch den Einsatz der OpenPOWER-Technologie in einem modular integrierten System werden beide Forschungszentren in der Lage sein, die Supercomputer entsprechend den spezifischen zukünftigen Anforderungen anzupassen.
NVIDIA hat in Zusammenarbeit mit IBM die so genannte NVIDIA NVLink Technologie entwickelt, die es CPUs und GPUs ermöglicht, die Daten fünf bis 12-Mal schneller zwischen den entsprechenden Prozessoren zu bewegen. NVIDIA NVLink werden in IBM POWER CPUs integriert werden und die nächste Generation der NVIDIA GPUs wird auf der NVIDIA Volta (TM) Architektur basieren – und so Sierra und Summit eine bisher unerreichte Leistungskapazität ermöglichen. Gemeinsam mit Mellanox wird IBM ausserdem einen so genannten intelligenten Interconnect implementieren, um die Datenverarbeitung innerhalb der Systeme weiter zu optimieren.
Abkehr vom traditionellen Supercomputing
„Die heutige Ankündigung markiert eine Abkehr vom traditionellen Supercomputing, das mit der wachsenden Datenflut nur noch unzureichend Schritt halten kann. Der datenzentrische Ansatz von IBM ist aus unserer Sicht das neue Paradigma in diesem Bereich: Offene Computerplattformen, die in der Lage sind, mit den wachsenden Datenmengen umzugehen,“ sagt Tom Rosamilia, Senior Vice President, IBM Systems and Technology Group. „Was die beiden Systeme zudem besonders macht: Die Kerntechnologien sind bereits heute für Unternehmen und Organisationen unterschiedlichster Größen und aus unterschiedlichsten Industriezweigen verfügbar.“
IBM bietet heute schon datenzentrische Technologien für seine Kunden an: IBM POWER8, IBM Elastic Storage Server, IBM Elastic Storage Software basierend auf der General Parallel File System-Technologie sowie IBM Platform Computing Software. IBM Research wird zukünftig mit Lawrence Livermore und Oak Ridge zusammenarbeiten, um die bestmöglichen Tools und Technologien für die beiden Computersysteme zu entwickeln, um so die Leistung der Systeme zu optimieren. An der Entwicklung von Applikationen für datenzentrische Systeme werden auch Wissenschaftler des deutschen IBM Forschungs- und Entwicklungszentrum in Böblingen sowie von IBM Research – Zürich in Rüschlikon beteiligt sein. Die Inbetriebnahme beider Rechner ist für 2017 beziehungsweise 2018 geplant. (IBM/mc/hfu)