Сравнение эффективности CPU и GPU реализаций некоторых комбинаторных алгоритмов на задачах обращения криптографических функций

Вадим Германович Булавинцев

doi:10.14529/cmse150306

Abstract

In this work we assess performance of CPU and GPU implementations of some widely-used cryptanalytic combinatorial algorithms. In particular, we analyze obstacles for effective GPU implementation of “smart” combinatorial algorithms. Next, to alleviate performance problems arising from inefficient processing of conditional expressions in SIMD-devices we devise some special control flow graph transformation techniques. Finally, we demonstrate that contemporary GPU’s memory access schemes are incompatible with typical memory access patterns of “smart” combinatorial algorithms studied. We use DES and A5/1 cryptographic functions as test cases.

Highlights

Современные GPU предоставляют выгодное соотношение цены, производительности и энергопотребления
В то же время перспективным направлением в криптоанализе является применение алгоритмов, основанных на различных подходах к «интеллектуальному» сокращению перебора
Поскольку РСЛОСы независимы друг от друга и их длина невелика (19–23 бит), для каждого из них можно сгенерировать соответствующую непериодическую часть порождаемой ими двоичной последовательности

Summary

Описание использованных алгоритмов

В качестве модельных задач для исследования мы выбрали криптоалгоритмы DES и A5/1. На сегодняшний день эти алгоритмы широко распространены и хорошо изучены. Далее приведем описание реализаций на GPU брутфорс-атаки на DES и A5/1, а также реализации алгоритма DPLL, используемого для решения SAT-задач. Для получения ключевого потока выходы РСЛОСов смешиваются друг с другом. Простейший метод криптоанализа в этом случае — полный перебор: для каждого из всех возможных вариантов секретного ключа генерируется соответствующий фрагмент ключевого потока, который сравнивается с заранее известным. Для генератора A5/1, чтобы однозначно определить секретный ключ достаточно фрагмента ключевого потока длиной 64 бит [10]. В худшем случае требуется для каждого из 264 ключей-кандидатов получить 64 бита выхода генератора и сравнить их с известным образцом ключевого потока. Поскольку РСЛОСы независимы друг от друга и их длина невелика (19–23 бит), для каждого из них можно сгенерировать соответствующую непериодическую часть порождаемой ими двоичной последовательности Данные по скорости реализации описанной атаки на GPU приведены табл 3

Криптоанализ алгоритма DES на GPU методом полного перебора

Реализация алгоритма DPLL на GPU

Особенности обработки условных переходов на GPU

Особенности доступа к памяти в GPU

Группировка запросов к памяти

Сравнение характеристик кэш-памяти и основной памяти GPU и CPU

Экспериментальная проверка производительности DPLL на GPU

Сравнение производительности алгоритмов полного перебора и DPLL на CPU и GPU

Full Text

Published version (

Free)

Open DOI Link

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Journal: Bulletin of the South Ural State University. Series "Computational Mathematics and Software Engineering"	Publication Date: Jul 1, 2015
Citations: 2	License type: cc-by

R Discovery Prime

R Discovery Prime

Сравнение эффективности CPU и GPU реализаций некоторых комбинаторных алгоритмов на задачах обращения криптографических функций

Abstract

Highlights

Summary

Talk to us

Similar Papers

More From: Bulletin of the South Ural State University. Series "Computational Mathematics and Software Engineering"

Lead the way for us

Similar Papers

An Optimization Approach for SIMD Alignment in Mathematical Functions
Lei Wang ... Chun-Yan Zhang
-
Lei Wang, et. al.Lei Wang ... Chun-Yan Zhang
01 Jan 2010
01 Jan 2010

EXAGRAPH: Graph and combinatorial methods for enabling exascale applications
Seher Acer ... Sivasankaran Rajamanickam
The International Journal of High Performance Computing Applications | VOL. 35
Seher Acer, et. al.Seher Acer ... Sivasankaran Rajamanickam
30 Sep 2021
The International Journal of High Performance Computing Applications | VOL. 35

MIMO Accelerator: A design flow for a programmable MIMO decoder architecture
Mohamed Ali ... Babak Daneshrad
-
Mohamed Ali, et. al.Mohamed Ali ... Babak Daneshrad
01 Jan 2009
01 Jan 2009

A novel MDCT/IMDCT computing kernel design
Yin-Tsung Hwang ... Shin-Chi Lai
-
Yin-Tsung Hwang, et. al. Yin-Tsung Hwang ... Shin-Chi Lai
01 Jan 2004
01 Jan 2004

Editage

Paperpal

R Discovery

Mind the Graph

R Discovery Prime

R Discovery Prime

Сравнение эффективности CPU и GPU реализаций некоторых комбинаторных алгоритмов на задачах обращения криптографических функций

Abstract

Highlights

Summary

Talk to us

Similar Papers

More From: Bulletin of the South Ural State University. Series "Computational Mathematics and Software Engineering"