Erweiterung der Jobplanung eines Workloadmanagers für HPC-Systeme

Abstract (Entwurf)

Die Arbeit behandelt ein Thema aus dem Bereich des High-Performance-Cluster-Computings. Sie erweitert die Benutzung eines Workloadmanagers eines solchen Cluster-Computers um zusätzliche Funktionalität. Speziell wird es um das OpenCCS-Projekt gehen. Statt bei einer Jobplanung neben der Ablaufdauer auch explizit die benötigten Ressourcen anzugeben, kann man nun stattdessen ein Programmablaufmodell übergeben. Aus diesem Modell werden die Ressourcen automatisch abgeleitet und der Job wird wie üblich bearbeitet. Das Programmablaufmodell und die Ableitung der benötigten Ressourcen aus diesem werden in dieser Arbeit als gegeben angesehen, es geht vor allem um die Kapselung einer Schnittstelle.

Gliederung (Entwurf)

  • Einleitung
    • Motivation
    • Problembeschreibung
    • Abgrenzung & vergleichbare Arbeiten
    • Was ist das OpenCCS?
    • Vokabular
      • Cluster
      • Jobplanung
      • Workloadmanager
      • HPC
  • Hauptteil
    • Lösungsansatz und Alternativen
    • Schwierigkeiten
    • Dokumentation der Durchführung
    • Dokumentation der Artefakte
  • Schluss
    • Zusammenfassung
    • Evaluation der Ergebnisse & Fazit
    • Ausblick
  • Anhang
    • Codeanpassungen
    • Docker-Image für OpenCCS & Dokumentation dazu
    • Installationstipps für OpenCCS

Kommentare