淘宝客 备案 网站名称2022引流人脉推广软件

pingmian/2026/1/24 6:03:12/文章来源:
淘宝客 备案 网站名称,2022引流人脉推广软件,用帝国做网站怎么样,app推广地推接单网1. 引言 以下是《riscv-v-spec-1.0.pdf》文档的关键内容#xff1a; 这是一份关于向量扩展的详细技术文档#xff0c;内容覆盖了向量指令集的多个关键方面#xff0c;如向量寄存器状态映射、向量指令格式、向量加载和存储操作、向量内存对齐约束、向量内存一致性模型、向量…  1. 引言 以下是《riscv-v-spec-1.0.pdf》文档的关键内容 这是一份关于向量扩展的详细技术文档内容覆盖了向量指令集的多个关键方面如向量寄存器状态映射、向量指令格式、向量加载和存储操作、向量内存对齐约束、向量内存一致性模型、向量算术指令格式、向量整数和浮点算术指令、向量归约操作、向量掩码指令、向量置换指令、异常处理以及标准向量扩展等。 首先文档定义了向量元素和向量寄存器状态之间的映射关系并阐述了向量指令的格式。在此基础上提出了配置设置指令如vsetvl、ivsetiv和vlsetvl用于设定向量长度VL和向量对齐长度AVL。 接着文档详细说明了向量加载和存储操作以及向量内存对齐和一致性模型。这些模型确保了向量操作的高效性和准确性。 然后文档介绍了向量算术指令格式包括向量整数、固定点和浮点算术指令。这些指令支持广泛的数学运算为高性能计算提供了强大的支持。 此外文档还涉及向量归约操作、掩码指令和置换指令这些指令增强了向量操作的灵活性和功能性。 最后文档讨论了异常处理机制并列举了标准向量扩展指令列表。这些扩展指令为向量处理器提供了丰富的功能集使其能够适应不同的应用场景和性能需求。 综上所述这份文档为向量指令集的设计和实现提供了全面的指导和参考有助于开发者更好地理解和利用向量处理器的能力。 【RISC-V 指令集】RISC-V 向量V扩展指令集介绍(一)-向量扩展编程模型-CSDN博客 【RISC-V 指令集】RISC-V 向量V扩展指令集介绍(二)-向量元素到向量寄存器状态的映射-CSDN博客【RISC-V 指令集】RISC-V 向量V扩展指令集介绍(三)-向量指令格式-CSDN博客 【RISC-V 指令集】RISC-V 向量V扩展指令集介绍(四)- 配置和设置指令(vsetvli/vsetivli/vsetvl)-CSDN博客 【RISC-V 指令集】RISC-V 向量V扩展指令集介绍(五)- 向量加载和存储-CSDN博客 【RISC-V 指令集】RISC-V 向量V扩展指令集介绍(六)- 向量内存一致性模型-CSDN博客 【RISC-V 指令集】RISC-V 向量V扩展指令集介绍(七)- 向量算术指令格式-CSDN博客 【RISC-V 指令集】RISC-V 向量V扩展指令集介绍(八)- 向量整数算术指令-CSDN博客 【RISC-V 指令集】RISC-V 向量V扩展指令集介绍(九)- 向量整数算术指令-CSDN博客 13. 向量浮点指令 标准向量浮点指令将元素视为符合IEEE-754/2008标准的值。如果向量浮点操作数的元素宽度EEW不对应支持的IEEE浮点类型则指令编码是保留的。 是否支持浮点以及支持哪些元素宽度是由特定的向量扩展决定的。当前的扩展集包括对32位和64位浮点值的支持。当添加16位和128位元素宽度时它们也将被视为符合IEEE-754/2008标准的值。未来的扩展可能会支持其他浮点格式。 向量浮点指令要求存在与支持的向量浮点元素宽度相对应的基本标量浮点扩展。 注意特别是未来支持16位半精度浮点值的向量扩展也将需要一些标量半精度浮点支持。 如果浮点单元状态字段mstatus.FS处于关闭状态则任何尝试执行向量浮点指令的操作都将引发非法指令异常。任何修改任何浮点扩展状态即浮点CSR或f寄存器的向量浮点指令必须将mstatus.FS设置为Dirty。 如果实现了虚拟机管理程序扩展且V1则vsstatus.FS字段对向量浮点指令也有效。如果vsstatus.FS或mstatus.FS处于关闭状态则任何尝试执行向量浮点指令的操作都将引发非法指令异常。任何修改任何浮点扩展状态即浮点CSR或f寄存器的向量浮点指令必须将mstatus.FS和vsstatus.FS都设置为Dirty。 向量浮点指令在处理NaNs时与标量浮点指令具有相同的行为。 浮点向量-标量操作的标量值来源于“向量算术指令编码”部分所述。 13.1 向量浮点异常标志 在任何活动的浮点元素上发生的向量浮点异常都会在fflags寄存器中设置标准的FP异常标志。非活动元素不会设置FP异常标志。 13.2 向量浮点加法/减法指令 # Floating-point add vfadd.vv vd, vs2, vs1, vm # Vector-vector vfadd.vf vd, vs2, rs1, vm # vector-scalar # Floating-point subtract vfsub.vv vd, vs2, vs1, vm # Vector-vector vfsub.vf vd, vs2, rs1, vm # Vector-scala r vd[i] vs2[i] - f[rs1] vfrsub.vf vd, vs2, rs1, vm # Scalar-vector vd[i] f[rs1] - vs2[i]13.3 向量扩展浮点加法/减法指令 # Widening FP add/subtract,2*SEW SEW /- SEW vfwadd.vv vd, vs2, vs1, vm # vector-vector vfwadd.vf vd, vs2, rs1, vm # vector-scalar vfwsub.vv vd, vs2, vs1, vm # vector-vector vfwsub.vf vd, vs2, rs1, vm # vector-scalar # Widening FP add/subtract,2*SEW 2*SEW /- SEW vfwadd.wv vd, vs2, vs1, vm # vector-vector vfwadd.wf vd, vs2, rs1, vm # vector-scalar vfwsub.wv vd, vs2, vs1, vm # vector-vector vfwsub.wf vd, vs2, rs1, vm # vector-scalar 13.4 向量浮点乘法/除法指令 # Floating-point multiply vfmul.vv vd, vs2, vs1, vm # Vector-vector vfmul.vf vd, vs2, rs1, vm # vector-scalar # Floating-point divide vfdiv.vv vd, vs2, vs1, vm # Vector-vector vfdiv.vf vd, vs2, rs1, vm # vector-scalar # Reverse floating-point divide vector scalar / vector vfrdiv.vf vd, vs2, rs1, vm # scalar-vector, vd[i] f[rs1]/vs2[i]13.5 向量浮点扩展乘法指令 # Widening floating-point multiply vfwmul.vv vd, vs2, vs1, vm # vector-vector vfwmul.vf vd, vs2, rs1, vm # vector-scalar 13.6 向量浮点融合乘加指令 提供了所有四种类型的融合乘加并且有两种破坏形式会覆盖其中一个操作数即加数或第一个乘数。 # FP multiply-accumulate, overwrites addend vfmacc.vv vd, vs1, vs2, vm # vd[i] (vs1[i] * vs2[i]) vd[i] vfmacc.vf vd, rs1, vs2, vm # vd[i] (f[rs1] * vs2[i]) vd[i] # FP negate-(multiply-accumulate), overwrites subtrahend vfnmacc.vv vd, vs1, vs2, vm # vd[i] -(vs1[i] * vs2[i]) - vd[i] vfnmacc.vf vd, rs1, vs2, vm # vd[i] -(f[rs1] * vs2[i]) - vd[i] # FP multiply-subtract-accumulator, overwrites subtrahend vfmsac.vv vd, vs1, vs2, vm # vd[i] (vs1[i] * vs2[i]) - vd[i] vfmsac.vf vd, rs1, vs2, vm # vd[i] (f[rs1] * vs2[i]) - vd[i] # FP negate-(multiply-subtract-accumulator), overwrites minuend vfnmsac.vv vd, vs1, vs2, vm # vd[i] -(vs1[i] * vs2[i]) vd[i] vfnmsac.vf vd, rs1, vs2, vm # vd[i] -(f[rs1] * vs2[i]) vd[i] # FP multiply-add, overwrites multiplicand vfmadd.vv vd, vs1, vs2, vm # vd[i] (vs1[i] * vd[i]) vs2[i] vfmadd.vf vd, rs1, vs2, vm # vd[i] (f[rs1] * vd[i]) vs2[i] # FP negate-(multiply-add), overwrites multiplicand vfnmadd.vv vd, vs1, vs2, vm # vd[i] -(vs1[i] * vd[i]) - vs2[i] vfnmadd.vf vd, rs1, vs2, vm # vd[i] -(f[rs1] * vd[i]) - vs2[i] # FP multiply-sub, overwrites multiplicand vfmsub.vv vd, vs1, vs2, vm # vd[i] (vs1[i] * vd[i]) - vs2[i] vfmsub.vf vd, rs1, vs2, vm # vd[i] (f[rs1] * vd[i]) - vs2[i] # FP negate-(multiply-sub), overwrites multiplicand vfnmsub.vv vd, vs1, vs2, vm # vd[i] -(vs1[i] * vd[i]) vs2[i] vfnmsub.vf vd, rs1, vs2, vm # vd[i] -(f[rs1] * vd[i]) vs2[i]注意虽然我们考虑使用标量FP FMA编码中未使用的两种舍入模式来提供一些非破坏性的FMA但这些模式会因为是具有三个输入和单独输出的唯一可屏蔽操作而使微体系结构复杂化。 13.7 向量加宽浮点融合乘加指令 加宽的浮点融合乘加指令都会用结果覆盖宽的加数。乘数输入都是SEW宽而加数和目标是2*SEW位宽。 # FP widening multiply-accumulate, overwrites addend vfwmacc.vv vd, vs1, vs2, vm # vd[i] (vs1[i] * vs2[i]) vd[i] vfwmacc.vf vd, rs1, vs2, vm # vd[i] (f[rs1] * vs2[i]) vd[i] # FP widening negate-(multiply-accumulate), overwrites addend vfwnmacc.vv vd, vs1, vs2, vm # vd[i] -(vs1[i] * vs2[i]) - vd[i] vfwnmacc.vf vd, rs1, vs2, vm # vd[i] -(f[rs1] * vs2[i]) - vd[i] # FP widening multiply-subtract-accumulator, overwrites addend vfwmsac.vv vd, vs1, vs2, vm # vd[i] (vs1[i] * vs2[i]) - vd[i] vfwmsac.vf vd, rs1, vs2, vm # vd[i] (f[rs1] * vs2[i]) - vd[i] # FP widening negate-(multiply-subtract-accumulator), overwrites addend vfwnmsac.vv vd, vs1, vs2, vm # vd[i] -(vs1[i] * vs2[i]) vd[i] vfwnmsac.vf vd, rs1, vs2, vm # vd[i] -(f[rs1] * vs2[i]) vd[i] 13.8 向量浮点平方根指令 这是一条一元向量-向量指令。 # Floating-point square root vfsqrt.v vd, vs2, vm # Vector-vector square root 13.9 向量浮点平方根倒数指令 这是一条返回1/sqrt(x)的7位精确估计值的一元向量-向量指令。 # Floating-point reciprocal square-root estimate to 7 bits. vfrsqrt7.v vd, vs2, vm 注意早期的草案版本使用了汇编器名称vfrsqrte7但这被认为会与元素宽度的ex表示法造成混淆。为了向后兼容早期的名称可以作为工具链中的别名保留。 下表描述了该指令对所有浮点输入类别的行为 Input  Output  Exceptions Raised -∞ x -0.0 canonical NaN NV -0.0 -∞ DZ 0.0 ∞ DZ 0.0 x ∞ estimate of1/sqrt(x) ∞ 0.0 qNaN canonical NaN sNaN canonical NaN NV 所有正常和次正常输入都会产生正常输出。输出值与动态舍入模式无关。 对于非异常情况将指数的低位和尾数最高位之后的高6位进行连接并用于查询以下表格。该表的输出将成为结果尾数在首位之后的高7位结果尾数的其余部分为零。在查找之前会将次正规输入正规化并适当调整指数。选择输出指数以使结果近似于参数的平方根的倒数。 更精确地说结果的计算方法如下。如果输入是正常的那么让正规化输入指数等于输入指数否则等于0减去尾数中的前导零的数量。如果输入是次正规的那么通过将输入尾数向左移动1减去正规化输入指数的位数来获得正规化输入尾数同时丢弃前导的1位。输出指数等于floor((3*B - 1 - 正规化输入指数) / 2)floor表示向下取整。输出符号等于输入符号。 下表给出了输出尾数的7个最高有效位MSBs作为正规化输入指数的最低有效位LSB和正规化输入尾数的6个最高有效位的函数输出尾数的其他位均为零。 Table 16. vfrsqrt7.v common-case lookup table contents exp[0] sig[MSB -: 6] sig__out[MSB -: 7] 0 0 ~ 63 52 ~ 0 1 0 ~ 63 127 ~ 53 注释例如当SEW32时vfrsqrt7(0x00718abc (≈ 1.043e-38)) 0x5f080000 (≈ 9.800e18)而vfrsqrt7(0x7f765432 (≈ 3.274e38)) 0x1f820000 (≈ 5.506e-20)。 选择7位精度是因为它分别需要0、1、2、3次牛顿-拉弗森迭代才能接近bfloat16、FP16、FP32、FP64的精度。未来的指令可以定义更高的估算精度。 13.10 向量浮点倒数指令 # Floating-point reciprocal estimate to 7 bits. vfrec7.v vd, vs2, vm 早期草稿版本使用了汇编程序名vfrece7但这被认为会与元素宽度的ex表示法造成混淆。为了向后兼容早期的名称可以作为工具链中的别名保留。 这是一条向量-向量一元指令它返回一个精确到7位的1 / x的估算值。 下表描述了该指令对于所有浮点输入类别的行为其中B是指数偏差  Input(x) Rounding Mode Ouput(y- 1/x) Exceptions Raised -∞ any -0.0 -2B1  x  -2B (normal) any -2-(B1) ≥ y  -2-B (subnormal, sig01…) -2B x -2B-1 (normal) any -2-B ≥ y -2-B1 (subnormal, sig1…) -2B-1  x  -2-B1 (normal) any -2-B1 ≥ y  -2B-1 (normal) -2-B1  x -2-B (subnormal, sig1…) any -2B-1 ≥ y -2B (normal) -2-B  x  -2-(B1) (subnormal, sig01…) any -2B ≥ y -2B1 (normal) -2-(B1)  x  -0.0 (subnormal, sig00…) RUP, RTZ greatest-mag. negative inite value NX, OF -2-(B1)  x  -0.0 (subnormal, sig00…) RDN, RNE, RMM -∞ NX, OF -0.0 any -∞ DZ 0.0 any ∞ DZ 0.0 x 2-(B1) (subnormal, sig00…) RUP, RNE, RMM ∞ NX, OF 0.0 x 2-(B1) (subnormal, sig00…) RDN, RTZ greatest inite value NX, OF 2-(B1) x  2-B (subnormal, sig01…) any 2B1 y ≥ 2B (normal) 2-B x 2-B1 (subnormal, sig1…) any 2B y ≥ 2B-1 (normal) 2-B1 x 2B-1 (normal) any 2B-1  y ≥ 2-B1 (normal) 2B-1 x 2B (normal) any 2-B1  y ≥ 2-B (subnormal, sig1…) 2B x 2B1 (normal) any 2-B  y ≥ 2-(B1) (subnormal, sig01…) ∞ any 0.0 qNaN any canonical NaN sNaN any canonical NaN NV 注意次正规输入中那些大小至少为2-(B1)的输入会产生正规输出其他次正规输入会产生无穷大的输出。正规输入中那些大小至少为2B-1的输入会产生次正规输出其他正规输入会产生正规输出。 当发生溢出异常时输出值取决于动态舍入模式。 对于非异常情况尾数的高7位在最高位之后用于查询以下表格。该表的输出将成为结果尾数在首位之后的高7位结果尾数的其余部分为零。在查找之前会将次正规输入正规化并适当调整指数。选择输出指数以使结果近似于参数的倒数并相应地使次正规输出反规范化。 更精确地说结果的计算方法如下。如果输入是正常的那么让正规化输入指数等于输入指数否则等于0减去尾数中的前导零的数量。正规化输出指数等于(2B - 1 - 正规化输入指数)。如果正规化输出指数超出范围[-1, 2B]则结果对应于上表中异常情况之一。 如果输入是次正规的那么通过将输入尾数向左移动1减去正规化输入指数的位数来获得正规化输入尾数同时丢弃前导的1位。否则正规化输入尾数等于输入尾数。下表给出了正规化输出尾数的7个最高有效位MSBs作为正规化输入尾数的7个最高有效位的函数正规化输出尾数的其他位均为零。 Table 17. vfrec7.v common-case lookup table contents sig[MSB -: 7] sig__out[MSB -: 7] 0 ~127 127 ~ 0 如果正规化输出指数为0或-1则结果为次正规数输出指数为0并且输出尾数通过将正规化输出尾数的左侧连接一个1位然后将该数量向右移动1减去正规化输出指数的位数来获得。否则输出指数等于正规化输出指数输出尾数等于正规化输出尾数。输出符号等于输入符号。 注意例如当SEW32时vfrec7(0x00718abc (≈ 1.043e-38)) 0x7e900000 (≈ 9.570e37)而vfrec7(0x7f765432 (≈ 3.274e38)) 0x00214000 (≈ 3.053e-39)。 选择7位精度是因为它分别需要0、1、2、3次牛顿-拉弗森迭代才能接近bfloat16、FP16、FP32、FP64的精度。未来的指令可以定义更高的估算精度。 13.11 向量浮点最大/最小值指令 向量浮点vfm in和vfmax指令的行为与RISC-V F/D/Q扩展2.2版中的相应标量浮点指令相同。 # Floating-point minimum vfmin.vv vd, vs2, vs1, vm # Vector-vector vfmin.vf vd, vs2, rs1, vm # vector-scalar # Floating-point maximum vfmax.vv vd, vs2, vs1, vm # Vector-vector vfmax.vf vd, vs2, rs1, vm # vector-scalar 13.12 向量注入指令 标量符号注入指令的向量版本。结果从向量vs2操作数中获取除符号位以外的所有位。 vfsgnj.vv vd, vs2, vs1, vm # Vector-vector vfsgnj.vf vd, vs2, rs1, vm # vector-scalar vfsgnjn.vv vd, vs2, vs1, vm # Vector-vector vfsgnjn.vf vd, vs2, rs1, vm # vector-scalar vfsgnjx.vv vd, vs2, vs1, vm # Vector-vector vfsgnjx.vf vd, vs2, rs1, vm # vector-scalar 注意可以使用符号注入指令将浮点数值向量的符号取反其中两个源操作数都设置为相同的向量操作数。提供了一个汇编伪指令vfneg.v vd,vsvfsgnjn.vv vd,vs,vs。 可以使用符号注入指令和两个源操作数都设置为相同的向量操作数来计算浮点元素向量的绝对值。提供了一个汇编伪指令vfabs.v vd,vsvfsgnjx.vv vd,vs,vs。 13.13 向量比较指令 这些向量FP比较指令将两个源操作数进行比较并将比较结果写入掩码寄存器。目标掩码向量始终保存在单个向量寄存器中元素布局如“掩码寄存器布局”部分所述。目标掩码向量寄存器可能与源向量掩码寄存器v0相同。比较指令写入掩码寄存器因此总是在无尾策略下操作。 比较指令遵循标量浮点比较指令的语义。vmfeq和vmfne仅在发出NaN信号时引发无效操作异常。vmflt、vmfle、vmfgt和vmfge在发出信号和静默NaN输入时都会引发无效操作异常。当任一操作数为NaN时vmfne将1写入目标元素而其他比较在任一操作数为NaN时写入0。 # Compare equal vmfeq.vv vd, vs2, vs1, vm # Vector-vector vmfeq.vf vd, vs2, rs1, vm # vector-scalar # Compare not equal vmfne.vv vd, vs2, vs1, vm # Vector-vector vmfne.vf vd, vs2, rs1, vm # vector-scalar # Compare less than vmflt.vv vd, vs2, vs1, vm # Vector-vector vmflt.vf vd, vs2, rs1, vm # vector-scalar # Compare less than or equal vmfle.vv vd, vs2, vs1, vm # Vector-vector vmfle.vf vd, vs2, rs1, vm # vector-scalar # Compare greater than vmfgt.vf vd, vs2, rs1, vm # vector-scalar # Compare greater than or equal vmfge.vf vd, vs2, rs1, vm # vector-scalarComparison Assembler Mapping Assembler pseudoinstruction va vb vmflt.vv vd, va, vb, vm va vb vmfle.vv vd, va, vb, vm va vb vmflt.vv vd, vb, va, vm vmfgt.vv vd, va, vb, vm va vb vmfle.vv vd, vb, va, vm vmfge.vv vd, va, vb, vm va f vmflt.vf vd, va, f, vm va f vmfle.vf vd, va, f, vm va f vmfgt.vf vd, va, f, vm va f vmfge.vf vd, va, f, vm va, vb vector register groups f scalar floating-point register 注意提供所有形式是必要的以便正确处理NaN的无序比较。 当任一输入为NaN时可以通过屏蔽信号比较来实现C99浮点静默比较如下所示。当被比较数是非NaN常量时可以省略中间的两个指令。 # Example of implementing isgreater() vmfeq.vv v0, va, va # Only set where A is not NaN . vmfeq.vv v1, vb, vb # Only set where B is not NaN . vmand.mm v0, v0, v1 # Only set where A and B are ordered, vmfgt.vv v0, va, vb, v0.t # so only set flags on ordered values.注意在上面的序列中很容易想要屏蔽第二个vmfeq指令并移除vmand指令但这种更高效的序列在va的一个元素包含静默NaN而vb中对应的元素包含发出信号的NaN时无法正确引发无效异常。 13.14 向量浮点分类指令 这是一个向量-向量一元指令其操作方式与标量分类指令相同。 vfclass.v vd, vs2, vm # Vector-vector 此指令生成的10位掩码放置在结果元素的最低位中。结果的高位SEW-10用零填充。该指令仅针对SEW16b及以上定义因此结果将始终位于目标元素中。 13.15 向量-标量浮点合并指令 提供了一个向量-标量浮点合并指令该指令对vstart到vl中当前向量长度的所有主体元素进行操作无论掩码值如何。 vfmerge.vfm指令被编码为屏蔽指令vm0。在掩码值为零的元素处将第一个向量操作数复制到目标元素否则将标量浮点寄存器值复制到目标元素。 vfmerge.vfm vd, vs2, rs1, v0 # vd[i] v0.mask[i] ? f[rs1] : vs2[i] 13.16 向量浮点移位指令 向量浮点移位指令将浮点标量操作数分散到一个向量寄存器组中。该指令将一个标量f寄存器值复制到向量寄存器组的所有活动元素。此指令被编码为屏蔽指令vm1。该指令必须将vs2字段设置为v0vs2的所有其他值均保留。 vfmv.v.f vd, rs1 # vd[i] f[rs1] 注意vfmv.v.f指令与vfmerge.vfm指令共享编码但vm1且vs2v0。 13.17 浮点/整数转换指令 提供转换操作以在浮点值和无符号整数及有符号整数之间进行转换其中源和目标都是SEW宽度。 vfcvt.xu.f.v vd, vs2, vm # Convert float to unsigned integer. vfcvt.x.f.v vd, vs2, vm # Convert float to signed integer. vfcvt.rtz.xu.f.v vd, vs2, vm # Convert float to unsigned integer, truncating. vfcvt.rtz.x.f.v vd, vs2, vm # Convert float to signed integer, truncating. vfcvt.f.xu.v vd, vs2, vm # Convert unsigned integer to float. vfcvt.f.x.v vd, vs2, vm # Convert signed integer to float. 转换在异常情况下遵循与标量转换指令相同的规则。转换使用frm中的动态舍入模式但rtz变体除外它们向零舍入。 提供rtz变体以加速从浮点到整数的截断转换这在C和Java等语言中很常见。 13.18 扩展浮点/整数转换指令 提供了一组转换指令用于在较窄的整数和浮点数据类型与宽度为两倍的类型之间进行转换。 vfwcvt.xu.f.v vd, vs2, vm # Convert float to double-width unsigned integer. vfwcvt.x.f.v vd, vs2, vm # Convert float to double-width signed integer. vfwcvt.rtz.xu.f.v vd, vs2, vm # Convert float to double-width unsigned integer, truncating. vfwcvt.rtz.x.f.v vd, vs2, vm # Convert float to double-width signed integer, truncating. vfwcvt.f.xu.v vd, vs2, vm # Convert unsigned integer to double-width float. vfwcvt.f.x.v vd, vs2, vm # Convert signed integer to double-width float. vfwcvt.f.f.v vd, vs2, vm # Convert single-width float to double-width float.这些指令对向量寄存器重叠的约束与其他加宽指令相同见加宽向量算术指令。 双宽度IEEE浮点值总是可以准确地表示单宽度整数。 双宽度IEEE浮点值总是可以准确地表示单宽度IEEE浮点值。 不支持将浮点加宽转换作为单个指令的完整集合但任何加宽转换都可以通过几个加倍步骤来实现结果等效并且不会引发额外的异常标志。 13.19 压缩浮点/整数类型转换 提供了一组转换指令用于将更宽的整数和浮点数据类型转换为宽度为一半的类型。 vfncvt.xu.f.w vd, vs2, vm # Convert double-width float to unsigned integer. vfncvt.x.f.w vd, vs2, vm # Convert double-width float to signed integer. vfncvt.rtz.xu.f.w vd, vs2, vm # Convert double-width float to unsigned integer, truncating. vfncvt.rtz.x.f.w vd, vs2, vm # Convert double-width float to signed integer, truncating. vfncvt.f.xu.w vd, vs2, vm # Convert double-width unsigned integer to float. vfncvt.f.x.w vd, vs2, vm # Convert double-width signed integer to float. vfncvt.f.f.w vd, vs2, vm # Convert double-width float to single-width float. vfncvt.rod.f.f.w vd, vs2, vm # Convert double-width float to single-width float, #rounding towards odd.这些指令对向量寄存器重叠的约束与其他缩小指令相同见缩小向量算术指令。 不支持将浮点缩小转换作为单个指令的完整集合。转换可以通过一系列减半步骤来实现。如果使用除最后一次减半步骤外的所有步骤都使用向奇数舍入vfncvt.rod.f.f.w则结果将等效舍入并会引发相同的异常标志。只有最后一步应该使用所需的舍入模式。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/86284.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网站开发的费用属于什么科目设计高端网站哪家好

天融信阿尔法实验室 李喆有人说php是世界上最好的语言,这可能是对开发人员来说,确实有这方面的特点,因为它开发起来不像其他语言那样麻烦,就比如:弱类型,它不需要像java等语言那样明确定义数据类型。这给开…

太原市手机微网站建设网站建设课程设计实训心得

(1) Python: 使用Python打开新的终端(terminal)并执行语句 通过Python 打开各系统(MAC, LINUX, WINDOWS)下的终端 (Terminal) python执行shell脚本的几种方法 自己写Linux命令 用Python写个Linux系统命令 Python 使用sftp传输文件…

免费做网站手机软件赣州章贡区邮政编码是多少

在.net中调用时出现“拒绝了对对象 sp_sdidebug(数据库 master,所有者 dbo)的 EXECUTE 权限”的错误的解决办法。该问题是我在用指定的URL启动项目后,再“附加进程”后运行程序时出现的。该问题主要是.net2005的调试机制引起的&am…

一条龙建站多少钱深圳楼市最新消息

柯尼卡美能达作为一个复合机品牌,除了在黑白复合机上有很大的市场,在彩色数码多功能复合机上也有很大的优势。这款柯尼卡美能达 bizhub C226 A3彩色数码多功能复合机可以说是彩色复合机的代表,在性能和打印质量方面都很不错,并且售…

万网域名网站建设代做网页制作网站

文章目录 一、前言二、iCould相关配置三、功能实现3.1 UIDocumentPickerViewController 选取控制器3.2 读取文件3.3 文档预览3.3.1 下载并保存3.3.1 QLPreviewController预览文档四、总结一、前言 最近正在研发的项目有一个需求: 允许用户将iCloud中的文档上传,实现文件的流…

福建宁德建设局网站erp系统排行榜

typora-copy-images-to: imgs theme: cyanosis 敏感词库的设计,要求增删改查敏感词。敏感词文本匹配,敏感词一万个,文本长度在 20 - 1000 答:使用 trie 树来实现敏感词库的设计,可以利用字符串公共前缀来节约存储空间。…

中国建设劳动学会是正规网站吗手机网站开发公司

学单片机有前途吗? 个人认为学习任何一门技术都比不学的强,针对学单片机有前途吗?那么比较对象当然就是在整个IT行业做对比。因此我们可以从职业前景、钱景、这几方面综合考量。 学单片机有前途吗?我觉得重要的一点就是是否适合职业生涯发展,总说程序…

c 如何做公司网站wordpress提交后不见了

文章目录 55. 右旋字符串题目描述暴力优化:不能申请额外空间,只能在本串上操作思路代码 55. 右旋字符串 题目描述 字符串的右旋转操作是把字符串尾部的若干个字符转移到字符串的前面。给定一个字符串 s 和一个正整数 k,请编写一个函数&…

宏大建设集团有限公司网站赣州网上问政

许多应用程序将一系列事件记录到基于文件的存储中,以供以后使用。 从日志记录和审核,直到在事件源设计或其紧密相关的CQRS中保留事务重做日志,这都可以是任何东西。 Java具有多种方法,可以通过这些方法将文件顺序写入或重新读取。…

西安网站制作哪家好外贸 网站推广

大家好,我是Z哥。最近在工作中学习到一个我觉得很有价值的小工具,在这里与大家分享一下。这个小工具需要自己稍作开发,并不存在什么第三方的现成工具供你使用,因为这个工具的核心关键是「数据」,而「数据」这个东西对于…

网站设计与制作一般步骤长白山网站学做管理平台

目录 文章目录 目录本节实战1、安全概述2、证书签发流程1.签发证书2.身份认证 3、认证1.对等认证a.默认的宽容模式b.全局严格 mTLS 模式c.命名空间级别策略d.为每个工作负载启用双向 TLS 2.请求认证a.JWK 与 JWKS 概述b.配置 JWT 终端用户认证c.设置强制认证规则 关于我最后 本…

电商平台网站模板prizm viewer wordpress

Java"对象序列化":是指将实现了Serializable接口的对象转换成一组byte,日后要用这个对象时候,可以根据byte数据恢复出来,并据此重新构建那个对象。 优点: 1、JavaBean类基本都要求实现了Serializable接口&…

大理建设学校官方网站网站中加入地图

--注意:因使用了sys.wait()所有api需要在协程中使用 -- 用法实例 PROJECT "ESP32C3_TM1650" VERSION "1.0.0" _G.sys require("sys") local tm1650 require "tm1650"-- 拆分整数,并把最低位数存放在数组最大索引处 loc…

正规网站建设找哪家做网站刷东西

背景 在flink中对两个流进行connect之后进行出处理的场景很常见,我们本文就以书中的一个例子为例说明下实现一个CoProcessFunction的一些要点 实现CoProcessFunction的一些要点 这个例子举例的是当收到某个传感器放行的控制消息时,从传感器传来的温度…

网站快速排名案例微博评论箱 wordpress

经典网站: Stack Overflow:作为全球最大的程序员问答社区,Stack Overflow 汇聚了大量的编程问题和解答,为程序员提供了极大的帮助。GitHub:全球最大的开源代码托管平台,程序员可以在上面共享自己的项目代码…

天津做网站哪个公司好大连开发区人才网

第一题: 输出月份英文名 设计思路: 1:看题目:主函数与函数声明,知道它要你干什么2:理解与分析:在main中,给你一个月份数字n,要求你通过调用函数char *getmonth,来判断:若…

什么叫网站开发网页视频下载器app免费

简介: 本届大会以“前沿 探索 想象力”为主题,与业界同仁、合作伙伴共同打造一场数字时代的云上相聚。其中,边缘计算技术领域因5G快速发展而备受关注,阿里云边缘云专场吸引了数百位参会嘉宾驻足。 于10月21日上午举办的“边缘云应…

深圳龙华建网站公司wordpress 注册用户列表

有没有一起拼用银行卡的,取钱的时候我用,存钱的时候你用 1、相同的树 难度等级:⭐ 直达链接:相同的树 2、单值二叉树 难度等级:⭐ 直达链接:单值二叉树 3、对称二叉树 难度等级:⭐⭐ 直达…

制作论坛类网站模板洛阳网站优化

1. Spring 是如何解决循环依赖的? Spring 通过一系列复杂的机制来解决循环依赖问题,特别是在单例作用域的 Bean 之间。以下是一些关键点和 Spring 如何处理它们: 构造函数循环依赖: Spring 容器无法解决构造函数注入导致的循环依赖。这是因…

做网站泊头net网站开发是什么

目录 &#x1f4a1;题目描述 &#x1f4a1;双指针解法 &#x1f4a1;单调栈解法 &#x1f4a1;题目描述 给定 n 个非负整数表示每个宽度为 1 的柱子的高度图&#xff0c;计算按此排列的柱子&#xff0c;下雨之后能接多少雨水。 提示&#xff1a; n height.length1 < n…