- Investigation of performance variations of shared network resources on the CLAIX2018 cluster at RWTH Aachen University
Dieling, Gianna; Müller, Matthias S. (Thesis advisor); Lankes, Stefan (Thesis advisor); Schürhoff, Daniel (Consultant)
Aachen : RWTH Aachen University (2024)
Masterarbeit
Masterarbeit, RWTH Aachen University, 2023
Kurzfassung
In der heutigen Zeit nimmt die Komplexität der Architektur von Hochleistungsrechnern immer weiter zu, da eine Anpassung an die gestiegenen und unterschiedlichen Leistungsansprüchen von Anwendungen erforderlich ist. Um die maximale Leistung zu erzielen wird daher eine Optimierung der Anwendungen und Anpassung an die komplexe Infrastruktur der Rechensysteme zur besseren Nutzung der vorhandenen Kapazitäten und Ressourcen immer wichtiger. Leistungsschwankungen, die auch ohne eine Änderung des Programms oder irgendwelcher Einstellungen daran auftreten, erschweren es, bei Anpassungen an einer Anwendung zu erkennen, ob die Leistungsabweichung von der Veränderung verursacht werden oder standardmäßig aufgetreten wären. Diesem Problem sind auch die Nutzer:innen des Hochleistungsrechners CLAIX2018 der RWTH Aachen University ausgesetzt. Damit Optimierungen von Anwendungen möglich werden ist es wichtig, Schwankungen zu verringern und das Ausmaß von Abweichungen in den verschiedenen Bereichen, in denen sie auftreten können, zu kennen. In der vorliegenden Arbeit wird daher aus Sicht der Nutzer:innen untersucht, ob und ab welcher Netzwerklast ein Wettbewerb um Ressourcen des Netzwerks zwischen Rechenknoten des Hochleistungsrechners CLAIX2018 zu Leistungsschwankungen von Anwendungen führt. Dafür wird für mehrere Anwendungen untersucht, welche Kombination aus Compiler, Netzwerksoftware und Netzwerkkonfigurationen einer Anwendung die optimale Konfiguration für eine maximale Leistungsausschöpfung darstellt. Zudem wird mit diesen Kombinationen festgestellt, welchen Leistungsschwankungen Anwendungen im geteilten Netzwerk des im Normalbetrieb arbeitenden CLAIX2018, bei Läufen auf derselben oder unterschiedlicher Hardwarekonfiguration, ausgesetzt sind. Darüber hinaus wird für verschiedene Anwendungen ermittelt, ab welcher Netzwerklast eine zweite Anwendung die Leistung einer ersten netzwerkintensiven Anwendung mehr verschlechtert als die gefundenen Standardleistungsschwankungen des Netzwerks. Die Untersuchungen zeigen, dass die Leistungen von Anwendungen zwischen wieder- holten Läufen bei Verwendung des geteilten Netzwerks sowohl auf denselben Hardwarekonfigurationen als auch auf unterschiedlichen beträchtlich schwanken. Auch die Leistungen der Anwendungen, die mit einer zweiten um die Netzwerkressourcen konkurrieren, schwanken. Jedoch gehen diese nicht über die gefundenen typischen Netzwerkleistungsschwankungen hinaus. Vereinzelt sind allerdings die Abweichungen der zweiten Anwendungen, die um die Netzwerkressourcen konkurrieren, höher als die typischen Abweichungen.
Einrichtungen
- Fachgruppe Informatik [120000]
- Lehrstuhl für Hochleistungsrechnen (Informatik 12) [123010]