Das Ziel dieser Arbeit ist die Steigerung der Performanz für die matrix-freie Berechnung von FEM mit niedriger Ordnung. Dazu betrachtet diese Arbeit den Ansatz der block-strukturierten Gitter. Das Hauptkonzept ist ein zweistufiges Gitter, bestehend aus groben Makro-Elementen, welche bei ihrer Abarbeitung uniform verfeinert werden. Damit werden neue Optimierungen möglich. Zum einen kann die globale Assemblierung optimiert werden, und zum anderen profitieren die Makro-Element-Kernel durch eine Reduzierung der FLOP sowie durch vektorisierte Operationen, neben weiteren Optimierungen. Um einen Vorkonditionierer bereitzustellen, der mit dem matrixfreien Ansatz kompatibel ist, wurde ein einfaches, nicht überlappendes Gebietszerlegungsverfahren auf block-strukturierte Gitter angepasst. Die dargestellten Ansätze sind als Teil des Code-Generierung-Frameworks Dune-Codegen implementiert, um die Nutzbarkeit der Optimierungen zu vereinfachen.
Titelaufnahme
- TitelGenerating block-structured kernels for low order finite element methods : a high-performance oriented view
- Verfasser
- Betreuer
- Erschienen
- HochschulschriftMünster (Westfalen), Univ., Diss., 2021
- AnmerkungA version optimized for digital reading can be found under DOI: 10.5281/zenodo.4724412
- SpracheEnglisch
- DokumenttypDissertation
- Schlagwörter (DE)
- Schlagwörter (EN)
- URN
- Das Dokument ist frei verfügbar
- Social MediaShare
- Nachweis
- IIIF
The aim of this thesis is to increase the performance of matrix-free low order FEM computations. To this end, the block-structured grids approach is considered here. The core concept is to use a two level grid, composed of coarse macro elements which are uniformly refined during their handling. This opens up new optimization possibilities. On the one hand, the global assembly can be optimized, and, on the other hand, the macro element kernels benefit from a reduced FLOP count and vectorized computations, among other optimizations. To provide a preconditioner compatible with the presented matrix-free approach, a simple non-overlapping domain decomposition method is adapted to block-structured grids. The presented approaches are implemented as part of the code generation framework Dune-Codegen to ease the usage of the optimizations. By generating the necessary kernels, the same performance as for handwritten implementations can be reached.
- Das PDF-Dokument wurde 3 mal heruntergeladen.