Gegenstand dieser Dissertation ist die Formulierung von Krylovraumverfahren zur Lösung von linearen Gleichungssystemen mit mehreren rechten Seiten, welche die Eigenschaften moderner Hardware berücksichtigen. Dazu untersuchen wir ein innovatives Blockkrylovraum-Framework, welches es ermöglicht die Berechnungs- und Datentransferkosten der Blockkrylovraummethode an die Hardware anzupassen. Darauf aufbauend formulieren wir mehrere Krylovraummethoden. Für die Block CG und Block BiCGStab Methoden entwickeln wir eine adaptive Stabilisierungsstrategie. Des Weiteren optimieren wir die Methoden bezüglich der Kommunikation auf Systemen mit verteiltem Speicher. Dazu stellen wir mehrere Varianten der Algorithmen vor, welche sich durch ihre Kommunikationseigenschaften unterscheiden. Außerdem entwickeln wir für die GMRes Methode optimierte Varianten der Orthonormalisierung. Für alle optimierten Varianten zeigen wir numerische Tests, welche die Verbesserungen demonstrieren.
Titelaufnahme
- TitelHardware-oriented Krylov methods for high-performance computing
- Verfasser
- Betreuer
- Erschienen
- HochschulschriftMünster (Westfalen), Univ., Diss., 2021
- SpracheEnglisch
- DokumenttypDissertation
- Schlagwörter (DE)
- Schlagwörter (EN)
- URN
- Das Dokument ist frei verfügbar
- Social MediaShare
- Nachweis
- IIIF
In this work, we develop Krylov subspace methods to solve linear systems with multiple right-hand sides, tailored to modern hardware in high-performance computing. To this end, we analyze an innovative block Krylov subspace framework that allows to balance the computational and data-transfer costs to the hardware. Based on the framework, we formulate commonly used Krylov methods. For the CG and BiCGStab methods, we introduce an adaptive stabilization approach as an alternative to a deflation strategy. In addition, we optimize the methods further for distributed memory systems and the communication overhead. For this we present several variants of the algorithms, which differ in their communication properties. For the Block GMRes algorithm, we present optimizations for the orthogonalization. For all optimized method, we present tests that show their superiority.
- Das PDF-Dokument wurde 4 mal heruntergeladen.