Kernelgen — прототип распараллеливающего компилятора C/FORTRAN для GPU NVIDIA на основе технологий LLVM

Николай Николаевич Лихогруд ,Дмитрий Николаевич Микушин

doi:10.14529/cmse130403

Abstract

The KernelGen project (http://kernelgen.org/) aims to develop Fortran and C compilers based on the state-of-art open-source technologies for automatic GPU kernels generation from unmodified CPU source code, significantly improving the code porting experiences. Parallelism detection is based on LLVM/Polly and CLooG, extended with mapping of loops onto GPU compute grid, and assisted with runtime alias analysis. PTX assembly code is generated with NVPTX backend. Thanks to integration with GCC frontend by means of DragonEgg plugin, and customized linker, KernelGen features full GCC compatibility, and is able to compile complex applications into hybrid binaries containing both CPU and GPU-enabled executables. In addition to more robust parallelism detection, test kernels produced by KernelGen are up to 60 % faster than generated by PGI compiler for kernels source with manually inserted OpenACC directives.

Highlights

Проект KernelGen имеет цель создать на основе современных открытых технологий компилятор Fortran и C для автоматического портирования приложений на GPU без модификации их исходного кода
Включение бекенда NVPTX для генерации GPU-кода в LLVM позиционировалось компанией NVIDIA как открытие компилятора
The KernelGen project aims to develop Fortran and C compilers based on the state-of-art open-source technologies for automatic GPU kernels generation from unmodified CPU source code, significantly improving the code porting experiences

Summary

Этапы преобразования кода

При разработке системы компиляции на основе существующих наработок значительную роль играет выбор наиболее подходящей базовой инфраструктуры по большому числу критериев: наличие фронтендов для различных языков, полнота и гибкость внутреннего представления, существование базового набора оптимизирующих преобразований и эффективных бекендов для целевых архитектур, динамика развития и поддержка со стороны сообщества разработчиков. Компилятор GCC поддерживает наибольшее число языков программирования, но не имеет бекендов для GPU, когда как LLVM и Open имеют бекенды для NVIDIA PTX ISA. Компилятор Open имеет фронтенды для C, C++ и Fortran, генерирует качественный код, но при этом, к сожалению, имеет сильно сегментированное сообщество разработчиков, развивающих множество отдельных веток кода в интересах коммерческих компаний и исследовательских организаций. Компилятор LLVM не имеет собственного фронтенда для языка Fortran, но способен при помощи плагина DragonEgg [16] использовать фронтенды компилятора GCC. Чтобы обеспечить стандартный процесс сборки, в KernelGen используется схема, напоминающая LTO (link time optimization – инфраструктура компилятора для дополнительной оптимизации кода во время компоновки): код для GPU сначала добавляется в отдельную секцию объектных файлов, затем объединяется и снова разделяется на отдельные ядра на этапе компоновки. В целом, такая модель исполнения имеет много общего с native-режимом Intel MIC, но работает на GPU, где скалярные вычислительные блоки способны достигать высокой эффективности без необходимости векторизации

Компиляция

Компоновка

Модель исполнения

Генерация CUDA-ядер для параллельных циклов

Дополнительные средства времени исполнения

Findings

Тестирование

Full Text

Paper version not known

Open DOI Link

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

R Discovery Prime

R Discovery Prime

Kernelgen — прототип распараллеливающего компилятора C/FORTRAN для GPU NVIDIA на основе технологий LLVM

Abstract

Highlights

Summary

Talk to us

Similar Papers

More From: Bulletin of the South Ural State University. Series "Computational Mathematics and Software Engineering"

Lead the way for us

Journal: Bulletin of the South Ural State University. Series "Computational Mathematics and Software Engineering"	Publication Date: Dec 1, 2013
License type: cc-by

Similar Papers

DSP Processer-in-the-Loop Tests Based on Automatic Code Generation
Qi Zhang ... Wenhui Pei
Inventions | VOL. 7
Qi Zhang, et. al.Qi Zhang ... Wenhui Pei
11 Jan 2022
Inventions | VOL. 7

Parallel Dual-Hand Detection by Using Hand and Body Features for Robot Teleoperation
Qing Gao ... Zhaojie Ju
IEEE Transactions on Human-Machine Systems | VOL. 53
Qing Gao, et. al.Qing Gao ... Zhaojie Ju
01 Apr 2023
IEEE Transactions on Human-Machine Systems | VOL. 53

Simulation of underwater vehicle control based on code generation technology
Lixin Chang ... Liwen Kui
-
Lixin Chang, et. al.Lixin Chang ... Liwen Kui
26 Mar 2021
26 Mar 2021

An automatic OpenCL compute kernel generator for basic linear algebra operations
...
-
, et. al. ...
26 Mar 2012
26 Mar 2012

Editage

Paperpal

R Discovery

Mind the Graph

R Discovery Prime

R Discovery Prime

Kernelgen — прототип распараллеливающего компилятора C/FORTRAN для GPU NVIDIA на основе технологий LLVM

Abstract

Highlights

Summary

Talk to us

Similar Papers

More From: Bulletin of the South Ural State University. Series "Computational Mathematics and Software Engineering"