Systeme & Services

Ein Serverraum mit vielen Servern und abstrakten Motiv darauf

Die verschiedenen Ausbaustufen des Hochleistungsrechners (HPC-System) und des HPC–Datenspeichers an der RWTH Aachen University werden unter dem Namen CLAIX – Cluster Aix-la-Chapelle - zusammengefasst. Dabei ist die Verbindung verschiedener Teile zu einem Gesamtsystem ein wesentlicher Teil unserer Mission und des Betriebskonzeptes, da damit sowohl besondere Fähigkeiten als auch größere Kapazitäten ermöglicht werden, die separate Teilsysteme nicht bieten können.

Tier-2, Tier-3 und WestAI-System CLAIX-2023

Ende 2023 wurde die Ausbaustufe CLAIX-2023 in Betrieb genommen. Diese bietet mit Intel Xeon Sapphire Rapids Prozessoren, DDR5 Arbeitsspeicher, NVIDIA H100 Beschleunigern und einem NDR InfiniBand Netzwerk aktuellste Technologien in einer hocheffizienten wassergekühlten Infrastruktur.

Über 80% der Kapazität von CLAIX wird von Anwendungen im Bereich der Ingenieurswissenschaften und der Naturwissenschaften abgerufen (Stand: Mai 2023). Diesen Anwendungen entsprechend wurde die Architektur von CLAIX entworfen und die Ausschreibung gestaltet. Mit CLAIX-2023 werden auch Anwendungen aus dem Gebiet der künstlichen Intelligenz bzw. des maschinellen Lernens unterstützt, die auch mit klassischen Simulationen gekoppelt werden können. Vom traditionellen SSH-basierten Zugang bis zur interaktiven Nutzung im Browser unterstützt CLAIX unterschiedliche Zugangswege und Nutzungsszenarien und bietet eine Vielzahl an Softwarepaketen an. Für alle Nutzenden von CLAIX gibt es dementsprechend Unterstützungsangebote.

Die Ausbaustufe CLAIX-2023 besteht aus Anteilen der Tier-2 Versorgung in NHR, der Tier-3 Versorgung der RWTH Aachen und des Landes NRW, und des Projekts WestAI.

  • Mit NHR4CES ist die RWTH Mitglied im Verbund des nationalen Hochleistungsrechnen, das von Bund und Ländern gemeinsam gefördert wird. CLAIX steht damit als nationales Tier-2 System über NHR allen Wissenschaftlerinnen und Wissenschaftlern deutscher Hochschulen nach wissenschaftsgeleiteter Prüfung kostenlos zur Verfügung.
  • Der vom Bundesland NRW finanzierte Tier-3 Anteil unterstützt vor allem die Lehre und kleine Rechenzeit-Projekte an der RWTH Aachen sowie für Ingenieurinnen und Ingenieure in NRW. Allen Mitarbeitenden und Studierenden der RWTH Aachen steht außerdem ein Basisrechenzeitkontingent zur Verfügung.
  • Die RWTH betreibt einen Teil der Infrastruktur des vom BMBF geförderten KI-Servicezentrum WestAI und dieser Teil ist in CLAIX integriert. Das resultierten Rechenzeitkontingent steht für alle Aktivitäten in dem Projekt zur Verfügung.

Datenspeicher

Zur Speicherung der Daten werden verschiedene Dateisysteme zur Verfügung gestellt, die sich hinsichtlich der angedachten Nutzungsszenarien unterscheiden. Diese Unterschiede offenbaren sich in Form der Leistungsfähigkeit in verschiedenen Metriken, dem zur Verfügung stehenden Platzangebot sowie den Datensicherungskonzepten. Die Bandbreite reicht dabei von hochverfügbaren Dateisystemen mit Disaster-sicherem Backup für kritische Daten bis hin zur Möglichkeit der Ablage von Petabyte-großen Datenmengen und Zugriffsgeschwindigkeiten von über 100 Gigabyte/sek.

Die technische Beschreibung erläutert Details und Architektur der Datenspeicher.

​Services

Das komplexe HPC-System CLAIX wird von einem umfangreichen und ausgewiesenen Angebot an Beratungs- und Schulungsleistungen begleitet, die aktive und perspektivische Nutzende beim Einsatz von Hochleistungsrechnen in ihren wissenschaftlichen Anwendungsgebieten unterstützen. Das Serviceangebot ist abgestuft und reicht von der direkten Unterstützung in der Nutzung von CLAIX (zum Beispiel Account-Erstellung, Login, Nutzung des Cluster/Batch-Systems oder Installation von Software) über das Angebot der Performanceanalyse und ‑optimierung von Simulationsanwendungen über fachspezifische Beratung bis zur regelmäßigen Durchführung umfangreicher Schulungen und Workshops (zum Beispiel PPCES, aiXcelerate). Spezialisierte Dienstleistungen und Beratungen werden teilweise in Kooperation mit anderen Einrichtungen oder unterstützt durch Projekte erbracht.

Sämtliche Serviceleistungen dienen der effizienten Nutzung des gesamten HPC-Systems der RWTH (Tier-2, Tier-3, Projektanteile und integrative gehostete Systeme). Die Darstellung unserer Services erläutert Details und verlinkt zur Dokumentation auf IT Center Help.