【免费】硬件加速的快速无损压缩基LZ4算法.zip资源-CSDN文库

共1个文件

pdf：1个

需积分: 0 173 浏览量 2024-05-17 10:42:29 上传评论收藏 9.88MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

硬件加速的快速无损压缩基LZ4算法.zip （1个子文件）

硬件加速的快速无损压缩基LZ4算法.pdf 9.9MB

硬件加速的快速无损压缩

基于

算法

Jee

hon

金

长安区西富路

SKKU

2066

电子与计算机工程系

水原，韩国

290

7200

88.

kim

skku

摘要

数据压缩可以有效地利用存储空间。特别是对于移动设备，其

CPU

(

ntr

ssin

g U

nit

)

操作时钟和电源等资源有限，

因此需要设计硬件压缩方法。大多数基于字典的自适应压缩方

法都起源于

算法。

是最快的压缩算法之一。

在本文中，我们提出了一种先进的算法和硬件架构，提高了压

缩比和速度。为了获得更高的压缩比，本文算法采用可变长度

格式，而

采用固定长度格式。实验结果表明，该体系结构

的压缩吞吐量可达

3.84

，压缩比可达

。通过这种方

式，我们基于硬件的架构以低功耗提高了移动设备的内存性能

和电池寿命。

CCS

的概念

•

信息系统➝数据库管理系统➝数据结构➝数据布局➝数据

压缩

•

硬件➝通信硬件、接口和存储➝信号处理系统

关键字

无损压缩

;

硬件架构

;

移动设备。

介绍

随着高质量多媒体服务的增加，数据压缩已成为使用存储的电

子设备的必要条件。多年来，移动通信和视频服务的质量不断

提高，传输和存储数据的需求呈爆炸式增长。对大容量存储和

传输的需求增长速度至少是存储和传输容量增长

[

]

的两倍。

有两种类型的数据压缩

有损和无损数据制作数字许可或拷贝全

部或部分的努力对个人或教室使用授予提供副本不是没有费用

或分配利润或商业优势

承担此通知副本和完整的引文在第一

页。本作品的组成部分版权归

ACM

以外的其他人所有。信用证抽象化

是允许的。以其他方式复制、重新发布、在服务器上发布或重新发布到

列表，需要事先获得特定的许可和

或支付费用。从

rmis

sions

请求权限。

ICDSP

2019, 2019

年

月

日，韩国济州岛。

2019

计算机

械协会。

ACM ISBN

978

4503

6204

7/19/02…15.00

美元

DOI

https

://

/10.1145/3316551.3316564

曹

长安区西富路

SKKU

2066

电子与计算机工程系

水原，韩国

290

7200

skku

压缩

[

]

。有损数据压缩主要用于图像、视频等多媒体数据。与

有损压缩不同，无损压缩在压缩和解压缩后能很好地保存原始

文件中的信息。无损数据压缩分为基于树的编码和基于字典的

编码。代表性的基于树的代码有

代码

[

]

和算术代码

[

]

。基于字典的代码不同于

代码和算术代码，由源数

据生成的符号或符号串由字典索引表示。基于自适应字典的代

码在对源数据进行编码时构建字典。

算法是应用最广泛的自

适应字典编码，它基于

和

的两篇里程碑式论文

[

][

]

。

本文提出了一种基于

的改进算法和一种优化的移动设备

硬件结构。根据

FPGA

实现的

算法

[

][

]

，硬件实现的压

缩算法比软件实现的压缩算法具有更快的压缩性能。智能手

机等移动设备有以下限制

:1)

时钟频率

;2)

功耗

;3)

芯片的大小。

必须考虑在移动设备中实现这些约束。

[

]

是

[

]

的改进形式，是

oll

在

2011

年提

出的一种固定的、面向字节的算法。

类似于

，因为

它有一个由搜索缓冲区和向前查找缓冲区组成的滑动窗口。

搜索之前未压缩的数据流中的重复数据，并用索引替换它。

通过哈希表来匹配数据，从而提高了压缩速度。

的压缩数

据如图

[

]

所示，它由标记、文字长度、偏移量和匹配长度组

成。

序列的数据格式如下。

是每个序列的第一个值。

是一个单字节值，包含

两个

位字段，文字长度和匹配长度。四个最高有效位，

即。，

tok

[

7:4

]

是文字长度，范围从

到

。四个最低有

效位，即。，

tok

[

3:0

]

的匹配长度从

到

。如果

tok

[

7:4

]

为

，则没有文字。如果是

，字面值长度必须

有从

到

255

的额外字节，以表示字面值的完整长度。如果

tok

[

3:0

]

为

，则表示最小匹配长度为

，称为

min

。因此，令牌

[

3:0

]

值从

到

意味着匹配长度值从

到

。如果

tok

[

3:0

]

为

，则匹配长度中有更多字节。

令

牌

文字长度

文

字

抵

消

匹配长度

个

字

节

低氮

字节

升

字节

字

节

低氮

字节

图

所示。

序列的数据格式

当令牌

[

7:4

]

为

时，字面值长度是额外的字节。如果文字长

度为

254

，则没有更多的文字。如果文字长度是

255

，在

下一个文字长度中有更多字节。

偏移量是

字节的值，小端格式。偏移量表示要复制的匹配的

位置。偏移值

表示

“

当前位置

字节

”

。最大偏移量为

65535

。

匹配长度类似于文字长度。当令牌

[

3:0

]

达到可能的最高值

时，额外的字节被添加到匹配长度中，值从

到

255.

总是为偏移值分配

个字节。它对压缩比的性能没有有效

的影响。

算法最初是为一般处理器的软件实现而提出的，

因此在硬件

[

]

上实现

存在一定的约束。

该方法

在本节中，我们提出了一种改进的序列和哈希计算的数据格式。

通过指定压缩单元的大小，可以优化哈希表的大小。压缩单元的

大小设置为

，以便为内存页面进行优化并节省内部内存。

3.1

数据格式

我们的数据格式几乎与

相似，除了头部和偏移量。如图

所

示。报头位于每个压缩单元的开头，包含压缩大小和原始标志。

如果压缩后的大小大于原始大小，

标志被标记为

，原始数

据被添加到

eade

后，而不是压缩符号后，则解压缩器不需要

解压缩该压缩单元。在数据根本没有压缩的最坏情况下，

标

志使解压缩程序更快。在最坏的情况下，压缩单位大小被添加到

原始数据的头部大小。

偏移量由大小标志和偏移量大小组成。

siz

标志为最高位。如果

siz

标志值为

，偏移量大小使用

，即。，

{

[

]

，

[

6:0

]

}

。如果

siz

标志值为

，则偏移量大小使用

，

即。，

{

[

]

，

[

14:0

]

}

。偏移大小表示匹配的位

置，最大偏移大小值为

32768

。可变偏移字节长度使得我们的方

法比

有更好的压缩比。

3.2

哈希计算

哈希函数的目的是将任意大小的数据映射到固定大小的数据。

对于匹配检测，使用哈希表的搜索算法明显比其他算法快。理

想的哈希表的大小是输入数据位乘以压缩单位字节的大小。然

而，由于哈希表的大小是有限的，因此哈希计算计算输入的比

特数比输入的比特数要少。哈希计算的性能取决于不同输入得

到相同结果的频率。

的哈希计算算法基于

acc

哈希原

理

[

]

，由

(1)

计算

( )

(

2654435771) 1

使用说𝐻

𝐿 𝑍

𝐼 𝑁 𝐼 𝑁

明

头

令

牌

文字长度

文

字

抵

消

匹配长度

字

节

个

字

节

低氮

字节

升字

节

个字

节

低氮

字节

图

。建议的每个压缩单元的数据格式，其中

为

位值。

(1)

硬件实现复杂，计算周期长。哈希计算的实验公式表示为

(2)

((

≪

)

≫

20)

0 (2)

压缩单𝐼 𝑁 𝐼 𝑁 𝐼 𝑁 𝐼 𝑁 𝑥 𝐹 𝐹 𝐹

元大小为

。

(2)

被

位屏蔽，仅使用位操作将

位输入映射

到

位。因此，一个很小的硬件资源就足以计算

(2)

，只需要一两

个周期。

硬件体系结构

建议的硬件架构如图

所示。它主要由核心模块

(

压缩机和减

压器

)

和

AMBA

(

ced M

ontroll

hit

tur

)

接口组成，用于应用处理器之间的互连。核心模块通过

APB

(

高级外设总线

)

[

]

与处理器进行控制信号的通信。输入

数据和输出数据通过

AXI

(

高级可扩展总线

)

[

]

处理，它是一

种读

写优化总线。

该设计在

rilo

g HDL

(

e De

ription

age

)

中进

行描述，在

编译器上进行编译，在

UVM

(

niv

tion

tho

olo

)

环境下进行仿真，并在

ynopsys

设计编译器上结合

通用库进行合成。各模块的综合结果

如表

所示。

表

。合成的结果

模块数模块面积总面积

(

）

压缩

1 0.01320 0.01320

解压

1 0.01345 0.01345

哈希表

2 0.00515 0.01029

SRAM

8 0.00652

0.05215

AXI

(

DMA

) 1 0.01187 0.01187

APB

0.00133 0.00133

压缩模块如图

所示。主要包括

SRAM

控制、哈希计算、字节

匹配和流生成。为了避免数据输入的瓶颈，将输入数据写入

个

独立的

中。输入数据存储在

SRAM

中，压缩机从

SRAM

移

位寄存器中读取

128

数据。对于每个

的输入数据，哈

希计算模块计算哈希值，读取哈希表来比较和更新索引。如果在

哈希表中搜索计算出的哈希值，则移动到该位置并开始匹配字

节。当匹配长度大于

时，可以跳过哈希计算，因为哈希值已经

从前面的文字计算出来了。这可以通过流水线增加压缩机的吞吐

量，从而实现并行处理。当压缩单元的最后一个数据处理完毕

后，压缩机检查压缩尺寸是否大于原始尺寸。如果是，压缩器将

标志设置到报头并输出原始数据。当压缩内存数据时，对于

未压缩的页，只有页眉被写入输出。

评论收藏

内容反馈

稀稀落落987

粉丝: 1254
资源: 396

硬件加速的快速无损压缩基LZ4算法.zip

huf.zip_zip_无损压缩_无损压缩算法代码

无损压缩算法Brotli.zip

无损压缩算法源代码包

compc++.zip_lzari_rle8_压缩算法_图像理解_无损压缩

compress/huf/rle等无损压缩算法代码包

JAVA文件压缩与解压缩实践(源代码+文档).zip

JAVA文件压缩与解压缩实践(源代码+lw).zip

JAVA文件压缩与解压缩实践(源代码+论文).zip

zstd for Windows:一种快速无损压缩算法和数据压缩工具-开源

LZ77.zip_LZ77_LZ77编码译码_call6ld_lz77字典编码_lz77编码

基于java的文件压缩与解压缩系统设计与实现毕业设计(源代码+项目报告).zip

[计算机毕设]基于java的文件压缩与解压缩系统设计与实现(源代码+项目报告).zip

Go中的无损数据压缩-Golang开发

7-Zip-zstd:7-Zip，支持Brotli，Fast-LZMA2，蜥蜴，LZ4，LZ5和Zstandard

p7zip:带有其他编解码器和改进功能的新p7zip分支（来自https

emoji-compress：一组使用emoji代替位的压缩和编码算法

Linux gzip 命令的使用

Origin绘制相关性热图插件(Correlation Plot)

（免费）Chrome浏览器插件axure-chrome-extension

vep视频快速加密提取器

最新版YS9082HC主控开卡工具 YS9082HC-MPToolV8.00.00.18.826-HCS1A25E2023062

糖尿病数据集diabetes.csv（免费）

2011-2022年北大数字普惠金融指数数据（包括省市县）.zip

noc指导教师资格认证题库

IEEE 802.11be（WiFi7） 协议原文pdf文档

全国统计用区划代码和城乡划分代码(2023版)

Axhub Charts Pro V2.1.1.rplib

ESRI-Licensing文件夹，安装arcgispro无法破解登录

青霉素发酵过程仿真数据

最新资源

IEEE 802.11be（WiFi7）协议原文pdf文档