100% found this document useful (1 vote)

391 views20 pages

07 RTL Optimization Techniques

The document discusses techniques for optimizing register transfer level (RTL) designs for timing and area. For timing optimization, it describes how to optimize for high throughput using loop unrolling and pipelining as well as for low latency by removing pipeline registers. It also discusses minimizing logic delay between registers through additional register layers and register balancing. For area optimization, it covers minimizing area through control-based logic reuse, using priority encoders when conditions are mutually exclusive, and considering technology primitives.

Uploaded by

gideontargrave7

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

100% found this document useful (1 vote)

391 views20 pages

07 RTL Optimization Techniques

Uploaded by

gideontargrave7

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Timing optimization

Area optimization

Additional readings

Budapest University of Technology and Economics

RTL Optimization Techniques

Pter Horvth
Department of Electron Devices

August 7, 2014

Pter Horvth

RTL Optimization Techniques

1 / 20

Contents

Timing optimization

Area optimization

Additional readings

Contents

timing optimization concepts and design techniques

throughput, latency, local datapath delay
loop unrolling, removing pipeline registers, register balancing

area optimization concepts and design techniques

resource requirement metrics in standard cell ASIC and FPGA
control-based logic reuse, priority encoders, considering technology
primitives

additional readings

Pter Horvth

RTL Optimization Techniques

2 / 20

Contents

Timing optimization

Area optimization

Additional readings

Timing optimization

Pter Horvth

RTL Optimization Techniques

3 / 20

Contents

Timing optimization

Area optimization

Additional readings

Computation performance concepts

There are three important concepts related to the computation

performance.
throughput: The amount of data processed in a single clock cycle
(bits per second).
latency: The time elapsed between data input and processed data
output (clock cycles).
local datapath delays: Delay of logic between storage elements
(nanoseconds). It determines the maximum clock frequency.

Pter Horvth

RTL Optimization Techniques

4 / 20

Contents

Timing optimization

Area optimization

Additional readings

Timing optimization techniques

High throughput loop unrolling (pipeline)

During the high throughput optimization the time required for
processing of a single data is irrelevant but the time elapsed
between two input reads is minimized.
Data n+1 is read while data n is still under processing.
architecture iterative of pow3 is
begin
process (clk)
begin
if (rising_edge(clk)) then
if (start = '1') then
count <= 2;
pow <= x;
elsif (stop = '0') then
count <= count - 1;
pow <= pow * x;
end if;
end if;
end process;
stop <= '1' when count = 0 else '0';
end architecture;

architecture pipelined of pow3 is

begin
process (clk)
begin
if (rising_edge(clk)) then
-- stage 1
x1 <= x;
-- stage 2
x2 <= x1;
pow1 <= x1 * x1;
-- stage 3
pow <= pow1 * x2;
end if;
end process;
end architecture;
throuhgput: 8/1 = 8 bits/cycle; latency: 3 cycles

throuhgput: 8/3 = 2.7 bits/cycle; latency: 3 cycles

Pter Horvth

RTL Optimization Techniques

5 / 20

Contents

Timing optimization

Area optimization

Additional readings

Timing optimization techniques

High throughput loop unrolling (pipeline)

x[31:0]
32
clk

x[31:0]

clk

start

32
0

clk
32

pow1

32
clk

pow

pow[31:0]
32
clk

pow

throughput: 8/3 = 2.7 bits/cycle;

latency: 3 cycles

pow[31:0]

throughput: 8/1 = 8 bits/cycle;

latency: 3 cycles
Pter Horvth

RTL Optimization Techniques

6 / 20

Contents

Timing optimization

Area optimization

Additional readings

Timing optimization techniques

Low latency removing pipeline registers

The objective of the low-latency optimization is to pass the data
from the input to the output with minimal internal processing
delay.
A low-latency design uses parallelism and removes pipeline registers.
architecture async of pow3 is
begin
process (x)
begin
x1 <= x;

architecture pipelined of pow3 is

begin
process (clk)
begin
if (rising_edge(clk)) then
-- stage 1
x1 <= x;

end process;
process (x1)
begin
x2 <= x1;
pow1 <= x1 * x1;
end process;

-- stage 2
x2 <= x1;
pow1 <= x1 * x1;
-- stage 3
pow <= pow1 * x2;
end if;
end process;
end architecture;

pow <= pow1 * x2;

end architecture;
latency: 1 cycles (with an additional output register)

latency: 3 cycles
Pter Horvth

RTL Optimization Techniques

7 / 20

Contents

Timing optimization

Area optimization

Additional readings

Timing optimization techniques

Low latency removing pipeline registers

x[31:0]
32
clk

x[31:0]
32

32
32

32
clk

clk
32

pow1

32
clk

pow

clk

pow[31:0]

pow
32

latency: 1 cycles

pow[31:0]

latency: 3 cycles
Pter Horvth

RTL Optimization Techniques

8 / 20

Contents

Timing optimization

Area optimization

Additional readings

Timing optimization techniques

Minimizing logic delay register layers

The logic between two sequential elements is called local datapath.
The delay of the slowest local datapath determines the maximum
clock frequency.
The local datapath delay can be reduced by additional register
layers.
architecture single_cycle of fir is
begin
process (clk)
begin
if (rising_edge(clk)) then
if (valid = '1') then
x1 <= x;
x2 <= x1;
y <= A*x + B*x1 + C*x2;
end if;
end if;
end process;
end architecture;
Pter Horvth

architecture multi_cycle of fir is

begin
process (clk)
begin
if (rising_edge(clk)) then
if (valid = '1') then
x1 <= x; x2 <= x1;
prod1 <= A * x;
prod2 <= B * x1;
prod3 <= C * x2;
end if;
end if;
end process;
y <= prod1 + prod2 + prod3;
end architecture;
RTL Optimization Techniques

9 / 20

Contents

Timing optimization

Area optimization

Additional readings

Timing optimization techniques

Minimizing logic delay register layers

x[31:0]

A[31:0]

clk

B[31:0]

32
clk

clk

A[31:0]

clk

x2
C

C[31:0]

32
clk

prod3
32

clk

prod2

prod1
32

32
clk

clk

y
32

y[31:0]
32

y[31:0]

local datapaths: 1 adder and 1

multiplier
Pter Horvth

local datapaths: 1 adder or 1

multiplier
RTL Optimization Techniques

10 / 20

Contents

Timing optimization

Area optimization

Additional readings

Timing optimization techniques

Minimizing logic delay register balancing

During register balancing the logic between registers is redistributed

in order to minimize the worst-case delay between any register pairs.
architecture not_balanced of add3 is
begin
process (clk)
begin
if (rising_edge(clk)) then
reg_a <= in_a;
reg_b <= in_b;
reg_c <= in_c;
sum <= reg_a + reg_b + reg_c;
end if;
end process;
end architecture;

Pter Horvth

architecture balanced of add3 is

begin
process (clk)
begin
if (rising_edge(clk)) then
reg_ab_sum <= in_a + in_b;
reg_c <= in_c;
sum <= reg_ab_sum + reg_c;
end if;
end process;
end architecture;

RTL Optimization Techniques

11 / 20

Contents

Timing optimization

Area optimization

Additional readings

Timing optimization techniques

Minimizing logic delay register balancing

in_a[31:0]

in_b[31:0]

32
clk

reg_b

clk

reg_ab_sum

reg_c
32

in_c[31:0]

reg_b

in_b[31:0]

clk

reg_a

in_a[31:0]

in_b[31:0]
32

clk

+
32

32
clk

clk

sum

sum[31:0]

local datapaths: 2 adders

sum[31:0]

local datapaths: 1 adder

Pter Horvth

RTL Optimization Techniques

12 / 20

Contents

Timing optimization

Area optimization

Additional readings

Area optimization

Pter Horvth

RTL Optimization Techniques

13 / 20

Contents

Timing optimization

Area optimization

Additional readings

Area concepts

The resource requirement means the amount of the basic functional

primitives required for implementing the described functionality.
The basic functional primitives in standard cell ASICs are the
standard cells, which can be simple logic gates, flip-flops but also
more complex arithmetic-logic functions or memories.
The basic logic elements (BLE) of an FPGA consists of a logic
function (the input number is dependent on the vendor and the
device family), a flip-flop and a multiplexer. There are special
purpose resoures as well, such as memory blocks, signal processing
elements (multipliers) etc.

Pter Horvth

RTL Optimization Techniques

14 / 20

Contents

Timing optimization

Area optimization

Additional readings

Area optimization techniques

Minimizing area control-based logic reuse

Control-based logic reuse should be considered the opposite
operation to the loop unrolling. Pipeline requires internal data
storage resources and additional logic to implement parallel
operation. These resources can be reused with the cost of a
reduced throughput.
in1

in2

in3

in4

sel

reset
clk

plr2

zero
clk
reset

in4
32

32
1

FSM

plr1

32
0

in3

in2

+
32

reset
clk

in1

sel_input
zero ce_acc
clk
reset ss_z

32
ce

reset
clk

32
32

32
1
reset
clk

acc

ce
reset
clk

acc

Control-based logic reuse requires an

FSM to generate control signals.

32
zero

acc

acc
Pter Horvth

RTL Optimization Techniques

15 / 20

Contents

Timing optimization

Area optimization

Additional readings

Area optimization techniques

Minimizing area priority encoders

The resource requirement can be improved if the mutual exclusion
is exploited. The elsif statement should be used only if a priority
encoder is required and the conditions are not mutually exclusive.
architecture not_priority of logic is
begin
process (clk)
begin
if (rising_edge(clk)) then
if (ctrl(0) = '1') then
output(0) <= input; end if;
if (ctrl(1) = '1') then
output(1) <= input; end if;
if (ctrl(2) = '1') then
output(2) <= input; end if;
if (ctrl(3) = '1') then
output(3) <= input; end if;
end if;

architecture priority of logic is

begin
process (clk)
begin
if (rising_edge(clk)) then
if (ctrl(0) = '1') then
output(0) <= input;
elsif (ctrl(1) = '1') then
output(1) <= input;
elsif (ctrl(2) = '1') then
output(2) <= input;
elsif (ctrl(3) = '1') then
output(3) <= input;
end if;
end if;
end process;
end architecture;

end process;
end architecture;

Pter Horvth

RTL Optimization Techniques

16 / 20

Contents

Timing optimization

Area optimization

Additional readings

Area optimization techniques

Minimizing area priority encoders

input[31:0]

input
0

output_a
clk

1
sel

ctrl

output_a[31:0]

output_a

clk

1
sel

ctrl

output_a

[0]

32
4

output_b
clk

1
sel

output_b[31:0]

output_b
clk

1
sel

output_b

[0]
[1]

[1]

0
32

output_c
clk

1
sel

0
32

output_c[31:0]

output_c
clk

1
sel

output_c

[0]
[1]
[2]

[2]

4
0
32

output_d
clk

1
sel

0
32

output_d[31:0]

output_d
clk

1
sel

[0]
[1]
[2]
[3]

output_d

[3]

without exploiting mutual exlusion

Pter Horvth

with exploiting mutual exclusion

RTL Optimization Techniques

17 / 20

Contents

Timing optimization

Area optimization

Additional readings

Area optimization techniques

Minimizing area considering technology primitives

With appropriate HDL coding style a more efficient logic

synthesis can be achieved. The synthesis tool vendors usually
provide coding technique proposals to improve the resource
requirement or timing parameters of the design. The proposed
coding style takes the unique characteritics of the technology
primitives into consideration.
utilizing block RAM modules in FPGAs: Block RAM modules do
not have any reset inputs and their outputs are synchronous to a
clock signal. Only HDL models with these parameters can be
implemented in block RAMs.
utilizing high quality DSP units: The DSP slices in the FPGAs have
synchronous outputs. This restriction have to be taken into account
in HDL model generation.

Pter Horvth

RTL Optimization Techniques

18 / 20

Contents

Timing optimization

Area optimization

Additional readings

Area optimization techniques

Minimizing area considering technology primitives

architecture FFS of RAM is
begin
process (clk)
begin
if (reset = '1') then
content <= (others=>(others=>'0'));
elsif (rising_edge(clk)) then
if (write = '1') then
content(address) <= data_in;
end if;
end if;
end process;
data_out <= content(address);
end architecture;

Because of the asynchronous

output this model cannot be
implemented in block RAM.
The reset function hinders the
LUT implementation as well.
Pter Horvth

architecture BRAM of RAM is

begin
process (clk)
begin
if (rising_edge(clk)) then
if (write = '1') then
content(address) <= data_in;
end if;
data_out <= content(address);
end if;
end process;
end architecture;

This model can be implemented

as flip-flops, LUT RAM and
block RAM as well.

RTL Optimization Techniques

19 / 20

Contents

Timing optimization

Area optimization

Additional readings

Steve Kilts Advanced FPGA Design, Architecture, Implementation,

and Optimization
David Money Harris, Sarah L. Harris Digital Design and Computer
Architecture
Peter J. Ashenden Digital Design An Embedded System
Approach Using VHDL
M. Moris Mano, Charles R. Kime Logic and Computer Design
Fundamentals
Pong P. Chu RTL Hardware Design Using VHDL
Peter Wilson Design Recipes for FPGAs

Pter Horvth

RTL Optimization Techniques

20 / 20

New Cortex-R Processors For Lte and 4g Mobile Baseband
No ratings yet
New Cortex-R Processors For Lte and 4g Mobile Baseband
6 pages
PF Smarttime Sta Ug PDF
No ratings yet
PF Smarttime Sta Ug PDF
90 pages
4x4 Vedic Multiplier FPGA Design
No ratings yet
4x4 Vedic Multiplier FPGA Design
7 pages
Blu-Ray Disc Format - File System Specification
No ratings yet
Blu-Ray Disc Format - File System Specification
6 pages
gem5 Simulator: Features & Models
No ratings yet
gem5 Simulator: Features & Models
14 pages
008 Architectural
No ratings yet
008 Architectural
45 pages
White Paper Blu-Ray Disc Rewritable Format: Audio Visual Application Format Specifications For BD-RE Version 2.1
No ratings yet
White Paper Blu-Ray Disc Rewritable Format: Audio Visual Application Format Specifications For BD-RE Version 2.1
27 pages
FPGA Architecture and Tools Guide
No ratings yet
FPGA Architecture and Tools Guide
9 pages
A 3-D CPU-FPGA-DRAM Hybrid Architecture For Low-Power Computation
No ratings yet
A 3-D CPU-FPGA-DRAM Hybrid Architecture For Low-Power Computation
14 pages
VLSI FPGA Design Training
No ratings yet
VLSI FPGA Design Training
7 pages
UMTS Channel PDF
No ratings yet
UMTS Channel PDF
47 pages
Unit-III: Memory: Topics
No ratings yet
Unit-III: Memory: Topics
54 pages
Xilinx Training Courses
No ratings yet
Xilinx Training Courses
16 pages
Logic Synthesis in VLSI Design
No ratings yet
Logic Synthesis in VLSI Design
86 pages
Deploying Lte Wireless Communications On Fpgas: A Complete Matlab and Simulink Workflow
No ratings yet
Deploying Lte Wireless Communications On Fpgas: A Complete Matlab and Simulink Workflow
16 pages
Pulse-Shaping Filters in Communication
No ratings yet
Pulse-Shaping Filters in Communication
11 pages
The Role of Jitter in Timing Signals (White Paper)
No ratings yet
The Role of Jitter in Timing Signals (White Paper)
19 pages
BeMicro MAX 10 Board Features Overview
No ratings yet
BeMicro MAX 10 Board Features Overview
5 pages
CHAPTER 2 Memory Hierarchy Design & APPENDIX B. Review of Memory Heriarchy
No ratings yet
CHAPTER 2 Memory Hierarchy Design & APPENDIX B. Review of Memory Heriarchy
73 pages
Bus
No ratings yet
Bus
45 pages
Microcontrollers and Embedded Systems
100% (1)
Microcontrollers and Embedded Systems
49 pages
Xilinx Tutorial
100% (1)
Xilinx Tutorial
13 pages
Chapter 2 Instructions Language of The Computer
No ratings yet
Chapter 2 Instructions Language of The Computer
95 pages
OpenCL Best Practices Guide
No ratings yet
OpenCL Best Practices Guide
54 pages
Xilinx Training Courses
No ratings yet
Xilinx Training Courses
16 pages
Introduction To FPGA
No ratings yet
Introduction To FPGA
34 pages
System Bus Noc
No ratings yet
System Bus Noc
102 pages
Image Processing Using Fpgas: Imaging
No ratings yet
Image Processing Using Fpgas: Imaging
4 pages
Advanced VLSI Design Overview
No ratings yet
Advanced VLSI Design Overview
339 pages
AVMSVI-04 - Automating Testbench Tasks With TCL
No ratings yet
AVMSVI-04 - Automating Testbench Tasks With TCL
26 pages
DDR3 Write & Read Leveling Guide
No ratings yet
DDR3 Write & Read Leveling Guide
3 pages
W-CDMA Air Interface Overview and Functions
100% (1)
W-CDMA Air Interface Overview and Functions
29 pages
SDRAM Architecture & Efficiency
No ratings yet
SDRAM Architecture & Efficiency
31 pages
Verilog & VHDL for Hardware Designers
No ratings yet
Verilog & VHDL for Hardware Designers
28 pages
UCIe Presentation Slides
No ratings yet
UCIe Presentation Slides
10 pages
Cadence Digital Design Synthesis Flow
No ratings yet
Cadence Digital Design Synthesis Flow
22 pages
Image Processing Using VHDL
No ratings yet
Image Processing Using VHDL
36 pages
RTL Optimization Techniques Overview
No ratings yet
RTL Optimization Techniques Overview
20 pages
RTL Design Approach
No ratings yet
RTL Design Approach
15 pages
ADSD Fall2011 05 Architect Ing Speed 2011nov03
No ratings yet
ADSD Fall2011 05 Architect Ing Speed 2011nov03
96 pages
04 Synthesis
No ratings yet
04 Synthesis
57 pages
W13L18 - Real Time System Design - 1
No ratings yet
W13L18 - Real Time System Design - 1
29 pages
Lecture 6 - RTL Synthesis
100% (2)
Lecture 6 - RTL Synthesis
72 pages
Unit 3 DSD
No ratings yet
Unit 3 DSD
107 pages
Advanced FPGA Design Techniques
No ratings yet
Advanced FPGA Design Techniques
52 pages
Chapter 14
No ratings yet
Chapter 14
23 pages
RTL Debug Tutorial AMD Peter
No ratings yet
RTL Debug Tutorial AMD Peter
15 pages
Introduction To Synthesis
100% (1)
Introduction To Synthesis
39 pages
Optimization Techniques
No ratings yet
Optimization Techniques
16 pages
High Level Synthesis II: ECE 3401 Digital Systems Design
No ratings yet
High Level Synthesis II: ECE 3401 Digital Systems Design
35 pages
RTL Design and Synthesis Guide
No ratings yet
RTL Design and Synthesis Guide
8 pages
LSI Design and Development Process
No ratings yet
LSI Design and Development Process
70 pages
VHDL Synthesis Basics FSM Implementations (PDFDrive)
No ratings yet
VHDL Synthesis Basics FSM Implementations (PDFDrive)
94 pages
HDL Le Unite 4
No ratings yet
HDL Le Unite 4
75 pages
The Ultimate Guide To RTL Design - HardwareBee
No ratings yet
The Ultimate Guide To RTL Design - HardwareBee
6 pages
VLSI Interview Questions
No ratings yet
VLSI Interview Questions
5 pages
3 FPGA Architecture 3
No ratings yet
3 FPGA Architecture 3
52 pages
W1M3 HLS ProblemFormulations
No ratings yet
W1M3 HLS ProblemFormulations
25 pages
Advanced Techniques For RTL
No ratings yet
Advanced Techniques For RTL
4 pages
RTL Design Optimization Techniques
100% (1)
RTL Design Optimization Techniques
40 pages
SVA Encapsulation in UVM: Enabling Phase and Configuration Aware Assertions
No ratings yet
SVA Encapsulation in UVM: Enabling Phase and Configuration Aware Assertions
8 pages
Overview of Embedded Busses
No ratings yet
Overview of Embedded Busses
6 pages
Doxygen
No ratings yet
Doxygen
135 pages
8086 Programming: Compiled By: Chandra Thapa October 23, 2012
No ratings yet
8086 Programming: Compiled By: Chandra Thapa October 23, 2012
76 pages
SystemVerilog Assertions Guide
No ratings yet
SystemVerilog Assertions Guide
39 pages
FSM Design Techniques for Glitch-Free Outputs
100% (1)
FSM Design Techniques for Glitch-Free Outputs
13 pages
Utmost4 Users1
No ratings yet
Utmost4 Users1
271 pages
Doxygen
No ratings yet
Doxygen
135 pages
Section 1 - Introduction To Binary Trees
100% (1)
Section 1 - Introduction To Binary Trees
27 pages
VLIW Architecture for Embedded Systems
No ratings yet
VLIW Architecture for Embedded Systems
47 pages
Utmost TFT Training Part1
No ratings yet
Utmost TFT Training Part1
96 pages
Week 0 W
No ratings yet
Week 0 W
59 pages
Chap 2 Data Types Fall 2014
No ratings yet
Chap 2 Data Types Fall 2014
78 pages
Lab Manual
100% (1)
Lab Manual
15 pages
2-5 ActiveFilters
No ratings yet
2-5 ActiveFilters
12 pages
Class 12 Topics
No ratings yet
Class 12 Topics
43 pages
ReleaseNote PipeWIZARD 4x
No ratings yet
ReleaseNote PipeWIZARD 4x
5 pages
When To Use System Objects Instead of MATLAB Functions: Randi
No ratings yet
When To Use System Objects Instead of MATLAB Functions: Randi
14 pages
Assignment 3 - 304, Dcs
No ratings yet
Assignment 3 - 304, Dcs
9 pages
Using Graphic Network Simulator 3 For Ddos Attacks Simulation
No ratings yet
Using Graphic Network Simulator 3 For Ddos Attacks Simulation
8 pages
Physical Design Automation Question Bank
No ratings yet
Physical Design Automation Question Bank
3 pages
SAS Basics for Beginners
No ratings yet
SAS Basics for Beginners
5 pages
bizhub 226/206 Printer Specs
No ratings yet
bizhub 226/206 Printer Specs
2 pages
UL and DL Power Congestion Analysis
No ratings yet
UL and DL Power Congestion Analysis
13 pages
Bài Giảng IT 4680 - Truyền Thông Đa Phương Tiện Và Ứng Dụng - PGS.ts. Nguyễn Thị Hoàng Lan - 999695
No ratings yet
Bài Giảng IT 4680 - Truyền Thông Đa Phương Tiện Và Ứng Dụng - PGS.ts. Nguyễn Thị Hoàng Lan - 999695
56 pages
User Manual DNC One 2015
100% (1)
User Manual DNC One 2015
30 pages
Lte Handover Call Flow
100% (12)
Lte Handover Call Flow
12 pages
Multithreading Models & Issues
No ratings yet
Multithreading Models & Issues
7 pages
Noise Margins For The CMOS Inverter: - Noise Margin Related To K - When K 1, NM NM 0.93 V (Better Than NMOS)
No ratings yet
Noise Margins For The CMOS Inverter: - Noise Margin Related To K - When K 1, NM NM 0.93 V (Better Than NMOS)
16 pages
OpenScape 4000 V7 - Competitor Information - BC OpenScape 4000 V7 Vs Cisco UCM
No ratings yet
OpenScape 4000 V7 - Competitor Information - BC OpenScape 4000 V7 Vs Cisco UCM
16 pages
RUNNING HEAD: WEEK 6 Case Analysis
No ratings yet
RUNNING HEAD: WEEK 6 Case Analysis
8 pages
Install Garmin Mobile XT on PDA
No ratings yet
Install Garmin Mobile XT on PDA
10 pages
How Cell Phones Work
No ratings yet
How Cell Phones Work
12 pages
Windows Server 2008 R2: Summary of Changes From R1 To R2
No ratings yet
Windows Server 2008 R2: Summary of Changes From R1 To R2
43 pages
Install Ubuntu Touch Developer Preview
0% (1)
Install Ubuntu Touch Developer Preview
57 pages
RFP Response Template
67% (3)
RFP Response Template
31 pages
Oracle DB Shutdown Guide
No ratings yet
Oracle DB Shutdown Guide
2 pages
Overview of the Hadoop Ecosystem
No ratings yet
Overview of the Hadoop Ecosystem
21 pages
LogRhythmRuleBuilding CheatSheet 6.1
0% (1)
LogRhythmRuleBuilding CheatSheet 6.1
11 pages
M.Tech CPLD & FPGA Exam Guide
No ratings yet
M.Tech CPLD & FPGA Exam Guide
2 pages
4MP Wi-Fi Dome Camera Specs
No ratings yet
4MP Wi-Fi Dome Camera Specs
4 pages
Cloud Computing: Benefits and Challenges
No ratings yet
Cloud Computing: Benefits and Challenges
5 pages
Tivoli Operations Planning and Control V2R3 Automates Production Control Across The Enterprise
No ratings yet
Tivoli Operations Planning and Control V2R3 Automates Production Control Across The Enterprise
12 pages
Data Converter Operation Guide
0% (1)
Data Converter Operation Guide
48 pages
A Software Application For Colleges of Education Students Results Processing
No ratings yet
A Software Application For Colleges of Education Students Results Processing
13 pages

07 RTL Optimization Techniques

Uploaded by

07 RTL Optimization Techniques

Uploaded by

Contents

Budapest University of Technology and Economics

RTL Optimization Techniques

RTL Optimization Techniques

timing optimization concepts and design techniques

area optimization concepts and design techniques

RTL Optimization Techniques

RTL Optimization Techniques

Computation performance concepts

Computation performance concepts

There are three important concepts related to the computation

RTL Optimization Techniques

Timing optimization techniques

High throughput loop unrolling (pipeline)

architecture pipelined of pow3 is

throuhgput: 8/3 = 2.7 bits/cycle; latency: 3 cycles

RTL Optimization Techniques

Timing optimization techniques

High throughput loop unrolling (pipeline)

throughput: 8/3 = 2.7 bits/cycle;

throughput: 8/1 = 8 bits/cycle;

RTL Optimization Techniques

Timing optimization techniques

Low latency removing pipeline registers

architecture pipelined of pow3 is

pow <= pow1 * x2;

RTL Optimization Techniques

Timing optimization techniques

Low latency removing pipeline registers

RTL Optimization Techniques

Timing optimization techniques

Minimizing logic delay register layers

architecture multi_cycle of fir is

Timing optimization techniques

Minimizing logic delay register layers

local datapaths: 1 adder and 1

local datapaths: 1 adder or 1

Timing optimization techniques

Minimizing logic delay register balancing

During register balancing the logic between registers is redistributed

architecture balanced of add3 is

RTL Optimization Techniques

Timing optimization techniques

Minimizing logic delay register balancing

local datapaths: 2 adders

local datapaths: 1 adder

RTL Optimization Techniques

RTL Optimization Techniques

The resource requirement means the amount of the basic functional

RTL Optimization Techniques

Area optimization techniques

Minimizing area control-based logic reuse

Control-based logic reuse requires an

RTL Optimization Techniques

Area optimization techniques

Minimizing area priority encoders

architecture priority of logic is

RTL Optimization Techniques

Area optimization techniques

Minimizing area priority encoders

without exploiting mutual exlusion

with exploiting mutual exclusion

Area optimization techniques

Minimizing area considering technology primitives

With appropriate HDL coding style a more efficient logic

RTL Optimization Techniques

Area optimization techniques

Minimizing area considering technology primitives

Because of the asynchronous

architecture BRAM of RAM is

This model can be implemented

RTL Optimization Techniques

Steve Kilts Advanced FPGA Design, Architecture, Implementation,

RTL Optimization Techniques

You might also like