Abstract

Increasing complexity of modern microprocessors, combined with semiconductor technology progress slowdown, make a further increase in performance more difficult. Under these circumstances, the relevance of the performance estimations of prospective microprocessors by dint of cycle-accurate simulation prior to their production in silicon is of growing importance. The approach to implementation of cycle-accurate simulator of core memory subsystem for Elbrus architecture, controlled by the existing functional simulator of this architecture, is presented herein. The method for validation of a cycleaccurate simulator by comparison with modeling of the RTL description of the prospective microprocessor is considered. The data on the speed of the cycle-accurate simulator and the main optimization methods, which were used to achieve acceptable performance, are presented. The preliminary estimates of the impact on the performance of some changes in the prospective processor core, including the cache access latency and hardware support for virtualization, obtained with the help of the cycle-accurate simulator are given. These assessments are important for making architectural decisions when designing the prospective Elbrus architecture processors.

Highlights

  • Increasing complexity of modern microprocessors, combined with semiconductor technology progress slowdown, make a further increase in performance more difficult

  • The relevance of the performance estimations of prospective microprocessors by dint of cycle-accurate simulation prior to their production in silicon is of growing importance

  • The preliminary estimates of the impact on the performance of some changes in the prospective processor core, including the cache access latency and hardware support for virtualization, obtained with the help of the cycle-accurate simulator are given. These assessments are important for making architectural decisions when designing the prospective Elbrus architecture processors

Read more

Summary

Взаимодействие функционального и потактового симуляторов

Архитектура связки ФС и ПС представлена на рис. 1. Архитектура связки ФС и ПС представлена на рис. 1. Функциональный симулятор в цикле осущест‐ вляет выборку, декодирование и выполнение широ‐ ких команд. Информация об их исполнении, форми‐ руемая ФС и передаваемая на вход ПС, содержит две группы полей: 1) содержимое ШК в расшифрованном и дополнен‐ ном виде: указатель адреса команды, операции обращения в память, номера регистров-операн‐ дов и регистров назначения, операции передачи управления и пр.; 2) данные об архитектурной динамике: содержи‐ мое таблиц страниц (ТС), информация о преры‐ ваниях и пр. Вторая группа полей критически важна для вы‐ бранной схемы симуляции. Функциональный си‐ мулятор при операциях обращения в память про‐ изводит трансляцию физического адреса как для Функциональный симулятор

Считать широкую команду
Конвейерные события
Системные физические адреса
Производительность потактового и функционального симуляторов
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call