OTEGO – Optimierungstechniken für explizite Verfahren zur GPU-beschleunigten Lösung von Anfangswertproblemen gewöhnlicher Differenzialgleichungen

Projektstart: 2016

Geldgeber:

DFG, KONWIHR

Projektbeteiligte

Projektleiter

PD Dr. Matthias Korch

Projektmitarbeiter

Tim Werner, M.Sc.

Projektbeschreibung

Grafikprozessoren (GPUs) werden in zunehmendem Maß eingesetzt, um rechenintensive Anwendungen, unter anderem aus dem Bereich des wissenschaftlichen Rechnens, durch Ausnutzung massiver Parallelität zu beschleunigen. Das Projekt untersucht parallele Implementierungen expliziter Lösungsverfahren für Anfangswertprobleme (AWP) bei Systemen gewöhnlicher Differenzialgleichungen (gDGl) für GPUs. Aufbauend auf der langjährigen Erfahrung der Arbeitsgruppe mit diesen numerischen Verfahren auf herkömmlichen, CPU-gestützten Parallelrechnern und Vorarbeiten zur optimierten Implementierung des grundlegenden Euler-Verfahrens für GPUs ist das Ziel des Projekts die Entwicklung von Optimierungstechniken für die effiziente, skalierbare Implementierung expliziter Lösungsverfahren für GPUs. Darunter fallen insbesondere fortgeschrittenere Lösungsverfahren, die höhere Konvergenzordnungen als das Euler-Verfahren bieten und sich oft durch einen höheren Grad an verfügbarer Parallelität auszeichnen, dessen Verwertbarkeit auf GPUs erforscht werden soll. Die Schwerpunkte liegen dabei auf der Ausnutzung spezifischer Eigenschaften des AWP und der Entwicklung selbstadaptiver Löser, die sich selbst automatisch an das jeweils zu lösende AWP auf der jeweiligen GPU-Hardware anpassen können, indem sie eine effiziente Implementierungsvariante und optimierte Parameter (z.B. Blockgrößen) automatisch auswählen.

Veröffentlichungen

  • M. Korch and T. Werner.
    An in-depth introduction of multi-workgroup tiling for improving the locality of explicit one-step methods for ODE systems with limited access distance on GPUs.
    Concurrency and Computation: Practice and Experience, e6016.
    Wiley, 2020.
    DOI: 10.1002/cpe.6016
  • M. Korch, P. Raithel and T. Werner.
    Implementation and Optimization of a 1D2V PIC Method for Nonlinear Kinetic Models on GPUs.
    In 2020 28th Euromicro International Conference on Parallel, Distributed and Network-Based Processing (PDP 2020).
    IEEE, 2020.
    DOI: 10.1109/PDP50117.2020.00012
  • M. Korch and T. Werner.
    Multi-Workgroup Tiling to Improve the Locality of Explicit One-Step Methods for ODE Systems with Limited Access Distance on GPUs.
    In Parallel Processingand Applied Mathematics. PPAM 2019, LNCS 12043, pages 3–12.
    Springer, 2020.
    DOI: 10.1007/978-3-030-43229-4_1
  • M. Korch and T. Werner.
    Improving locality of explicit one-step methods on GPUs by tiling across stages and time steps
    Future Generation Computer System. Special Issue on Best of SBAC-PAD 2018, volume 102, pages 889–901.
    Elsevier, 2020.
    DOI: 10.1016/j.future.2019.07.075
  • M. Korch and T. Werner.
    Exploiting Limited Access Distance for Kernel Fusion Across the Stages of Explicit One-Step Methods on GPUs.
    In Proceedings of the 30th International Symposium on Computer Architecture and High Performance Computing (SBAC-PAD 2018), pages 148–157.
    IEEE, 2018.
    DOI: 10.1109/CAHPC.2018.8645892
  • M. Korch and T. Werner.
    Accelerating explicit ODE methods on GPUs by kernel fusion.
    Concurrency and Computation: Practice and Experience, 30:e4470.
    Wiley, 2018.
    DOI: 10.1002/cpe.4470
  • M. Korch, T. Rauber, M. Stachowski and T. Werner.
    Influence of Locality on the Scalability of Method- and System-Parallel Explicit Peer Methods.
    In Proceedings of the 2016 Federated Conference on Computer Science and Information Systems (FedCSIS 2016), 9th Workshop on Computer Aspects of Numerical Algorithms (CANA'16), ACSIS 8, pages 685–694.
    IEEE, 2016.
    CANA best paper award.
    DOI: 10.15439/2016F464

Universität Bayreuth -