Publications

Detailed Information

Synthesis of Clock Gating Based on Accurate and Learning Driven Power Analyses : 정확하고 학습 기반 전력 분석을 기반으로 하는 클록 게이팅의 합성

Cited 0 time in Web of Science Cited 0 time in Scopus
Authors

박소라

Advisor
김태환
Issue Date
2023
Publisher
서울대학교 대학원
Keywords
clock gatingflip-flop groupinglow-power design
Description
학위논문(석사) -- 서울대학교대학원 : 공과대학 전기·정보공학부, 2023. 2. 김태환.
Abstract
In this paper, we introduce two techniques to efficiently apply clock gating in the
synthesis stage.
First, We propose a new clock gating methodology based on a precise power saving
analysis to overcome the ineffectiveness of the conventional logic structure based clock
gating. Two new features exploited in our proposed clock gating are (i) the multiplexer
selection signal probability that a flip-flop with multiplexer feedback loop receives a
new input and (ii) the joint probability of selection signals that two flip-flops with
different multiplexor selection signals both receive new inputs at the same clock cycle.
In summary, our method reduces the total power consumption by 2.46% on average
(up to 5.00%) over the conventional clock gating method.
In the second work, we address a new problem of transforming the long toggling/untoggling sequences of flip-flops cycle-accurate activities into short embedding vectors, so that the flip-flop grouping for clock gating is practically feasible in
terms of the memory usage and run time for checking activity similarity among flip-flops. To this end, we propose a machine learning based generation of embedding
vectors which are accurate enough to predict the original flip-flop toggling sequences.
Precisely, we develop a neural network model of LSTM (long short-term memory)
based AE(autoencoder) model combined with SDAE (stacked denoising autoencoder)
to take into account the time-series (i.e., clock cycle) similarity feature among the toggling sequences, which is essential to determine which flip-flops should be grouped
together for clock gating. By integrating (1) our LSTM based embedding vector generation model, we propose two additional ML models for clock gating: (2) joint state
probability predictor (JSP) model for generating 0-state probability of two embedding
vectors, and (3) joint feature predictor (JFP) model for generating a new embedding
vector that combines two embedding vectors. Through experiments, it is confirmed
that our proposed LSTM combined with AutoEnc improves the toggling sequence prediction accuracy up to 0.88 while an LSTM (long short-term memory) based AE model
produces accuracy to 0.72, thereby enabling our ML based clock gating framework to
save the dynamic power consumption further over that by the state-of-the-art commercial clock gating tool, which relies on the flip-flops toggling probability for grouping
flip-flops. Through experiments with benchmark circuits in IWLS, it is shown that our
method is able to reduce the dynamic power by 14.0% on average over that by the
conventional toggling-driven clock gating.
본 논문에서는 합성 단계에서 클록 게이팅을 효율적으로 적용하기 위한 두 가지
기법을 소개한다.
첫째로, 클록 게이팅 기반의 기존 로직 구조의 비효율성을 극복하기 위해 정밀
한 절전 분석을 기반으로 한 새로운 클록 게이팅 방법론을 제안한다. 제안된 클록
게이팅 방법에서 활용되는 두 가지 새로운 기능은 (i) 피드백 루프가 있는 플립플롭
의 멀티플렉서 선택 신호 확률 및 (ii) 서로 다른 멀티플렉서 선택 신호를 갖는 두
플립플롭의 멀티플렉서 선택 신호 결합 확률이다. 전력 이득이 있는 경우에만 클록
게이팅을 적용하고 서로 다른 클록 게이팅 그룹을 통합함으로서 전체 동적 전력를
줄이고자 하였다. 실험을 통해 기존의 클록 게이팅 방법에 비해 평균 2.46%(최대
5.00%)의 총 전력 소비를 줄이는 것을 확인하였다.
두 번째로 플립플롭의 클록 주기별 상태를 나타내는 긴 토글링/언토글링 시퀀스
를 짧은 임베딩 벡터로 변환하는 문제를 해결하였다. 이를 토글링 기반 클록 게이
팅을 위한 플립플롭 그룹화에 적용하여 플립플롭 간의 상태 유사성 확인이 메모리
사용량 및 실행 시간 측면에서 실질적으로 실현 가능하게 하였다. 이를 위해 기계
학습 기반으로 원래의 플립플롭 토글 시퀀스를 예측하기에 충분히 정확한 저차원의
임베딩 벡터의 생성을 제안한다. 우리는 토글링 시퀀스 간의 시계열 유사성을 고려
하기 위해 디노이즈 오토인코더를 이용하여 5000 클록 사이클의 토글링 시퀀스를
10차원으로 압축하고 이를 장단기 메모리 오토인코더에 입력하여 전체 시퀀스를
대변하는 저차원 임베딩 벡터를 생성하는 신경망 모델을 개발하였다. 또한 우리는
클록 게이팅을 위한 두 가지 부가적인 신경망 모델인 (1) 2개의 임베딩 벡터의 0-
상태 확률 생성을 위한 결합 확률 예측 모델과 (2) 두 개의 임베딩 벡터를 결합하여
새로운 임베딩 벡터를 예측하는 결합 특징 예측 모델을 제안한다. IWLS 벤치마크
회로를 이용한 실험을 통해, 디노이즈 오토인코더만 사용했을때보다 장단기 메모리
기반의 오토인코더를 결합했을 때 입력 데이터를 복원 정확도가 더 우수한 것을 확
인하였다. 또한 우리의 방법이 기존의 토글링 기반 클록 게이팅에 비해 평균 14.0%
의 동적 전력을 줄일 수 있음을 확인하였다.
Language
eng
URI
https://hdl.handle.net/10371/193288

https://dcollection.snu.ac.kr/common/orgView/000000176331
Files in This Item:
Appears in Collections:

Altmetrics

Item View & Download Count

  • mendeley

Items in S-Space are protected by copyright, with all rights reserved, unless otherwise indicated.

Share