关于SSE浮点指令的介绍资源-CSDN文库

5星 · 超过95%的资源需积分: 9 5 浏览量 2011-08-18 19:41:24 上传评论收藏 60KB DOC 举报

SSE（Streaming SIMD Extensions）是Intel公司在Pentium III处理器中引入的一种并行处理技术，旨在加速浮点计算，特别是对于多媒体和科学计算任务。SSE扩展了x86架构，提供了一组新的指令，允许处理器同时处理多个数据元素，如浮点数，从而显著提升了计算性能。 SSE包含了一系列的浮点指令，这些指令主要用于处理单精度（32位）浮点数，同时也支持一些双精度（64位）浮点操作。以下是一些关键的SSE浮点指令的说明： 1. **ADDPS**：这是添加四个单精度浮点数的指令。它将源操作数（xmm2/m128）的每个元素与目标操作数（xmm1）对应元素相加，并将结果存储回目标操作数。例如，如果xmm1的四个元素分别是A、B、C、D，源操作数的四个元素分别是E、F、G、H，则执行ADDPS后，xmm1的新值会是A+E、B+F、C+G、D+H。 2. **ADDSS**：这个指令只处理单精度浮点数的最低有效元素。它将源操作数（xmm2/m32）的最低32位与目标操作数（xmm1）的最低32位相加，其他元素保持不变。例如，如果xmm1的四个元素是A、B、C、D，源操作数是E，则执行ADDSS后，xmm1的新值是A+E、B、C、D。 3. **ANDNPS**：这个指令执行按位逻辑“取反与”操作。它首先对目标操作数（xmm1）的所有元素进行逻辑取反，然后与源操作数（xmm2/m128）进行按位与运算。结果存储回目标操作数。 4. **ANDPS**：这个指令进行按位逻辑“与”操作。目标操作数的每个元素与源操作数的对应元素进行逻辑与运算，结果存储回目标操作数。 5. **CMPPS**：这个指令用于比较两个寄存器中的单精度浮点数。imm8参数是一个8位立即数，决定了比较的方式，包括等于（EQ）、小于（LT）、小于等于（LE）、不有序（UNORD）、不等于（NE）、不小于（NLT）、不小于等于（NLE）和有序（ORD）。比较后的结果会设置相应的标志位，以便后续的条件转移指令使用。 SSE指令集还包括其他如MULPS（乘法）、SUBPS（减法）、DIVPS（除法）、MAXPS（最大值）、MINPS（最小值）等浮点运算指令，以及多种数据转换和移动指令。通过使用这些指令，程序员可以编写出更高效、更快的代码，特别是在需要大量浮点运算的领域，如图形渲染、物理模拟和音频处理等。 SSE是x86架构的重要增强，它为浮点运算提供了并行处理能力，大大提升了计算效率。理解和掌握SSE指令集是优化高性能计算代码的关键。

资源推荐

资源详情

资源评论

．． 的指令说明



说明 

功能两组单精度数相加

算法　　 　 

　　　

　　　

　

　

说明 

功能低位单精度数相加

算法　　 

　　

　　

　

　

说明 

功能  取反”再和 求“与”运算

算法　!"#

　

说明 

功能进行两个寄存器的逻辑“与”操作

算法　

　$

说明 $%

功能比较两个寄存器的数值，根据 % 的不同数值采用不同的比较方法

　　%%&%&%'

　　%(%(&%(&%('

算法　)*"%#

　　　+!,-,

　.)*"%#

　　　+!,.,

　.)*"%#

　　　+!,.,

　.)*"%#

　　　+!,/!,

　.)*"%#

　　　+!,,

　.)*"%#

　　　+!,.,

　.)*"%#

　　　+!,.,

　.)*"%#

　　　+!,!,

　$　 !

　$　!

　$!

　$!

　)*"$/#+

　　　0********

　.

　　　0

　)*"$/#+

　　　0********

　.

　　　0

　)*"$/#+

　　　0********

　.

　　　0

　)*"$/#

　　　+0********

　.

　　　0

　*)

其它你可以使用下面的可读性良好的指令。

　指令　　　　　　　　　　　实现

　$-　　　　　$

　$.　　　　　$

　$.　　　　　$

　$/!　　　$

　$-　 　　　$

　$.　 　　　$

　$.　 　　　$

　$!　 　　　$

　$

剩余12页未读，继续阅读

评论收藏

内容反馈

aaadhduxb

2016-10-25

tinghao de xiexie

力都

粉丝: 1
资源: 5

关于SSE浮点指令的介绍

SSE and MMX 指令的详细介绍及例子

SSE指令集SSE优化手册

SSE技术文档 sse指令用法

SSE4.2命令集的详细说明

sse浮点运算优化实例

FP系列浮点运算指令.rar

SSE指令集加速.docx

intel汇编MMX/SSE指令集（a）

AMD sse5指令集

基于SSE指令集的程序设计简介

SSE.rar_SSE_SSE 图像_SSE指令集_sse 图像处理_sse图像

SSE开发指导文档.doc

MMX_SSE_SSE2学习笔记

体系结构大作业SSE指令电子相册

intel SIMD指令参考手册

基于C++的图像处理算法实现、INTEL上SSE加速、ARM上NEON加速

(6.6)--MMX及SSE指令集1

SSE.rar_SSE

SSE体系结构与编程

SSE指令集学习笔记（个人记录）

Intel SSE4 Programming Reference

32位汇编中定义Unicode字符串、使用SSE4指令、使用COM接口的宏

高斯消去法SSE并行化_sse并行化, 并行程序设计 高斯消去法sse并行化

intel SSE2/3/4，AVX指令集

大块内存拷贝源代码, 各种方法实现，包括mmx和sse指令

最新资源

高斯消去法SSE并行化_sse并行化, 并行程序设计高斯消去法sse并行化