RV32I指令集及其编码方式解读

文章目录

前言
RISCV指令集的模块化
RV32I
- R型指令
- I型指令
- - load指令 (I型)
- S型指令
- B型指令 (S型指令变体)
- - - PC相对地址
    - B型指令
    - 简单举例
- U型指令
- - LUI指令
  - - li伪指令
  - AUIPC指令
- J型指令(U型指令变体)
- - JAL指令
  - JALR指令(I型指令)
注
参考

前言

$R I SC - V$ 表示精简指令集计算机 $\ Instruction \ Set \ Computer)$ 的第五代指令集。其主要特点在于：指令长度固定，指令数量精简，通常在一个时钟周期内完成，且 $R I SC V$ 完全开源。

而与其相对的 $\ Instruction \ Set \ Computer)$ 相比更加简洁高效。我们熟知的 $x 86$ 其经过多年发展以及向前兼容的要求使得指令集非常繁杂，且授权费用高昂。

面向 $32$ 位的 $R I SC V$ 指令集称为 $R V 32$ ，另外对应有 $64$ 位的 $R V 64$ 和 $128$ 位的 $R V 128$ 。本文将以 $R V 32$ 为主体，向大家详细介绍 $32$ 位基础指令集 $R V 32 I$ 的指令编码及其具体格式以及一些指令编码时立即数位置奇怪的原因。

RISCV指令集的模块化

$R I SC V$ 的指令集按照不同的功能分为不同的子模块，以 $R V 32$ 为例，模块用 $R V 32$ +字母命名，一个 $R I SC V$ 指令集必须包含基础指令集 $R V 32 I$ 以及可选的扩展部分，扩展部分包括标准扩展和用户自定义扩展。基础以及部分标准扩展指令集如下表所示：

RV32模块	全称	用途
RV32I	Base Integer Instruction Set	加减法，访问内存，控制转移分支指令，环境调用断点，内存屏障
RV32M	Integer Multiplication and Division	整数乘法除法
RV32F	Single-Precision Floating Point	单精度浮点数
RV32D	Double-Precision Floating Point	双精度浮点数
RV32Q	Quad-Precision Floating Point	四倍精度浮点数
RV32C	Compressed Instruction	压缩指令，指令字长16bit，用于对指令大小有限制的环境
RV32A	Atomic Instruction	原子指令，用于OS支持
RV32V	Vector Operation	向量运算
RV32E		通用寄存器变为16个，用作简单嵌入式设备，其余和RV32I基本一致

表中并未包含全部标准扩展，仅列出部分作为参考。

RV32I

$R V 32 I$ 中共有指令格式 $6$ 种，核心四种为 $\ I \ S \ U$ 。六种指令格式分别是：
$1$ ： $R$ 型指令，用于寄存器和寄存器之间的算术运算。
$2$ ： $I$ 型指令，用于寄存器和立即数之间的算术运算以及用于从内存中加载数据。
$3$ ： $S$ 型指令，用于向内存存储数据。
$4$ ： $B$ 型指令，用于短距离分支指令。 $S$ 型指令的变体。
$5$ ： $U$ 型指令，用于立即数高 $20 bi t$ 操作指令。
$6$ ： $J$ 型指令，用于长距离跳转。 $U$ 型指令的变体。

其中，通用寄存器 $32$ 个，从 $x 0 - x 31$ ，共需 $5 bi t$ 表示。其中， $x 0$ 被硬连线到 $0$ 。
另有一个寄存器： $p c$ ，用于存储当前正在执行的指令的地址。

四种主要的指令编码方式如下图所示：
在这里插入图片描述
可以看到，为了方便硬件设计，所有指令都保持 $\ rs \ rd \ funct$ 字段在寄存器位置的一致 (有例外，但 $R V 32 I$ 中没有)。 $f u n c t 3$ 字段主要用于区分具体的指令。

$f u n c t 7$ 字段主要用于以后的扩展，指令中只使用很少一部分。例如： $S U B, S U B W, SR A, SR A I, SR A I W$ 指令使用 $f u n c t 7 = 0 b 0100000$ 相对于指令 $A DD, A DD W, SR L, SR L I, SR L I W$ 中 $f u n c t 7 = 0 b 0000000$ 只有很小的改动，该位主要用于对结果进行符号扩展。

其中， $o p co d e$ 长度为 $7$ ，占据指令 $in s t [6 : 0]$ 。一种 $o p co d e$ 代表了一种类别的操作， $o p co d e$ 具体映射如下表所示：

在这里插入图片描述
1： $o p co d e$ 最低两位 $in s t [1 : 0]$ 必须为 $1$ 则指令有效。
2： $o p co d e$ 并不完全由 $R I S U J B$ 这些指令格式决定，同样是 $I$ 型指令， $\ \ addi$ 有着不同的 $o p co d e$ 。

另外，标准原话："There is no dedicated stack pointer or subroutine return address link register in the Base Integer ISA; the instruction encoding allows any x register to be used for these purposes." 标准基础指令集中并未规定某一个特定寄存器用于堆栈指针和函数返回值的存储。但是按照调用约定， $x 1$ 用于存储返回值，而 $x 2$ 用于作为堆栈指针使用。具体如下图所示：

在这里插入图片描述

R型指令

$R$ 型指令主要用于寄存器-寄存器之间的算术运算，不包含立即数。
例如： $\ x18, x19, x10$ ，其中， $x 18$ 为 $\ Register)$ 目的寄存器， $x 19$ 为 $\ register)$ 源寄存器， $x 10$ 为 $\ register)$ 源寄存器。

$R$ 型指令的编码方式如下图所示：
在这里插入图片描述所有 $R$ 型指令的 $o p co d e$ 一样，都为 $in s t [6 : 0] = 0 b 0110011$ ，对应上述 $o p co d e$ 映射表中 $OP$ 表项。
所有 $R$ 型指令的编码方式及其各字段的值如下表所示：

inst[31:25]	inst[24:20]	inst[19:15]	inst[14:12]	inst[11:7]	inst[6:0]	指令助记符
0000000	rs2	rs1	000	rd	0110011	add
0100000	rs2	rs1	000	rd	0110011	sub
0000000	rs2	rs1	001	rd	0110011	sll
0000000	rs2	rs1	010	rd	0110011	slt
0000000	rs2	rs1	011	rd	0110011	sltu
0000000	rs2	rs1	100	rd	0110011	xor
0000000	rs2	rs1	101	rd	0110011	srl
0100000	rs2	rs1	101	rd	0110011	sra
0000000	rs2	rs1	110	rd	0110011	or
0000000	rs2	rs1	111	rd	0110011	and

$\ right \ arithmetic)$ 算术右移指令需要高位补符号位。
位运算中没有逐位取反操作，若要对寄存器 $x 10$ 的内容逐位取反，只需： $\ x10,x10,x0$ 。此时， $rd=10_{10}=0b01010$ ， $rs1=10_{10}=0b01010$ ， $rs2=0_{10}=0b00000$ ，因此指令二进制表示为： $\ 00000 \ 01010 \ 100 \ 01010 \ 0110011$

I型指令

$I$ 型指令主要用于寄存器-立即数之间的算术运算，也用于 $l o a d$ 指令的指令格式。
例如： $\ x18, x19, -50$ ，其中， $x 18$ 为 $\ Register)$ 目的寄存器， $x 19$ 为 $\ register)$ 源寄存器， $- 50$ 为立即数 $(imm e d ia t e)$ 。
$I$ 型指令的编码方式对比 $R$ 型指令如下图所示：
在这里插入图片描述 $I$ 型指令中用于算术运算的指令 $o p co d e$ 一样，都为 $in s t [6 : 0] = 0 b 0010011$ ，对应上述 $o p co d e$ 映射表中 $OP - I MM$ 表项。
其中，立即数用 $12 bi t$ 补码表示，其具体表示范围为： $[- 2048, 2047]$ 。所有立即数通过符号扩展到 $32 bi t$ 之后再进行运算。
所有 $I$ 型指令的编码方式及其各字段的值如下表所示：

inst[31:20]	inst[19:15]	inst[14:12]	inst[11:7]	inst[6:0]	指令助记符
imm[11:0]	rs1	000	rd	0010011	addi
imm[11:0]	rs1	010	rd	0010011	slti
imm[11:0]	rs1	011	rd	0010011	sltiu
imm[11:0]	rs1	100	rd	0010011	xori
imm[11:0]	rs1	110	rd	0010011	ori
imm[11:0]	rs1	111	rd	0010011	andi
0000000+shamt[4:0]	rs1	001	rd	0010011	slli
0000000+shamt[4:0]	rs1	101	rd	0010011	srli
0100000+shamt[4:0]	rs1	101	rd	0010011	srai

1：伪指令 $m v$ 用于寄存器值的拷贝， $\ x10, x19$ 指令具体实现方式为： $\ x10,x19,0$
2：伪指令 $n o p$ 用于 $\ operation$ ， $n o p$ 指令具体实现方式为： $\ x0,x0,0$
3：立即数逻辑运算中，最高有效位保持和 $R$ 型指令 $f u n c t 7$ 字段一致的 $7$ 位宽度，方便硬件设计。
4：同时，由于寄存器字长为 $32$ ，故移位量 $\ amount)$ 只需要考虑在 $[0, 31]$ 即可，只需要 $5 bi t$ 编码。关于在具体设计中移位长度大于 $32$ 则直接结果置 $0$ 还是对移位量按照 $32$ 取余需要根据具体的架构设计。我在这里有过简要分析：移位案例。

load指令 (I型)

$l o a d$ 指令用于从内存中读取数据到寄存器。
$R V 32 I$ 提供了一个 $32 bi t$ 的内存地址空间，其根据字节寻址。一个可能的 $l o a d$ 指令： $\ x10,2(x2)$ ，用于从 $(x 2) + 2$ 所指向的内存地址取一个字。其中， $r d$ 寄存器为 $x 10$ ，数据宽度为字长 $w or d$ ，基地址寄存器 $ba se / rs 1$ 为 $x 2$ ，偏移量 $o ff se t$ 为 $2$ 。
$l o a d$ 指令格式和 $I$ 型指令一致。具体如下图所示：
在这里插入图片描述其中， $l o a d$ 指令的 $o p co d e$ 在 $o p co d e$ 映射表中第一项 $l o a d$ ， $o p co d e = 0 b 0000011$ 。
其中，基址偏移量 $o ff se t$ 用 $12 bi t$ 补码表示，其具体表示范围为： $[- 2048, 2047]$ 。通过符号扩展到 $32 bi t$ 之后和基地址相加。
所有 $l o a d$ 指令编码方式及个字段的值如下表所示：

inst[31:20]	inst[19:15]	inst[14:12]	inst[11:7]	inst[6:0]	指令助记符
imm[11:0]	rs1	000	rd	0000011	lb
imm[11:0]	rs1	001	rd	0000011	lh
imm[11:0]	rs1	010	rd	0000011	lw
imm[11:0]	rs1	100	rd	0000011	lbu
imm[11:0]	rs1	101	rd	0000011	lhu

1： $\ (load \ byte)$ 指令用于从内存中读取一字节内容，将其符号扩展之后放入 $r d$ 寄存器。而与其对应的 $\ (load \ byte \ unsigned)$ 用于从内存读取一字节内容，将其 $0$ 扩展后放入 $r d$ 寄存器。 $\ (load \ half \ word)$ 和 $\ (load \ half \ word \ unsigned)$ 同理。
2： $w i d t h$ 编码中后两位表示宽度，最高位表示 $u n s i g n e d$

S型指令

$s t ore$ 指令用于把寄存器中的数据放入指定内存位置。
$R V 32 I$ 提供了一个 $32 bi t$ 的内存地址空间，其根据字节寻址。一个可能的 $s t ore$ 指令： $\ x10,8(x2)$ ，用于把寄存器 $x 10$ 的内容放入 $(x 2) + 8$ 的内存地址空间。其中，不存在目的寄存器 $r d$ ，源寄存器 $rs 1$ 寄存器为 $x 10$ ，存储数据宽度为字长 $w or d$ ，源寄存器 $rs 2$ 为 $x 2$ ，偏移量 $o ff se t$ 为 $8$ 。
$s t ore$ 指令含 $\ \ rs2 \ \ offset$ 但不含 $r d$ ，因此需要一种单独编码格式。
$S$ 型指令格式如下图所示：
在这里插入图片描述 1：其中， $opcode\ \ funct3 \ \ rs1 \ \ rs2$ 的位置和前面指令保持一致。立即数位置变动。
2：标准原话："the instruction format was chosen to keep all register specifiers at the same position in all formats at the expense of having to move immediate bits across formats "，以立即数的编码移动为代价来使得所有寄存器在统一位置。
3：其中， $s t ore$ 指令的 $o p co d e$ 在 $o p co d e$ 映射表中 $STORE$ ， $o p co d e = 0 b 0100011$ 。
4：其中，基址偏移量 $o ff se t$ 用 $12 bi t$ 补码表示，其具体表示范围为： $[- 2048, 2047]$ 。通过符号扩展到 $32 bi t$ 之后和基地址相加。
所有 $s t ore$ 指令编码方式及个字段的值如下表所示：

inst[31:25]	inst[20:24]	inst[19:15]	inst[14:12]	inst[11:7]	inst[6:0]	指令助记符
imm[11:5]	rs2	rs1	000	imm[4:0]	0100011	sb
imm[11:5]	rs2	rs1	001	imm[4:0]	0100011	sh
imm[11:5]	rs2	rs1	010	imm[4:0]	0100011	sw

以上文例子 $\ x10,8(x2)$ 为例，其 $\ 01000$ ， $rs 2 = 0 b 01010$ ， $rs 1 = 0 b 00010$ ， $f u n c t 3 = 0 b 010$ ，综上，该指令二进制表示为： $\ \ 01010 \ \ 00010 \ \ 010 \ \ 01000 \ \ 0100011$

B型指令 (S型指令变体)

$B$ 型指令为条件分支指令，用于在条件满足时跳转到指定标签位置。
一个可能的 $b r an c h$ 分支指令： $\ x1,x2,label$ ，用于比较寄存器 $x 1$ 和 $x 2$ 的值是否相等，相等程序跳转到 $l ab e l$ 分支位置。其中，不存在目的寄存器 $r d$ ，源寄存器 $rs 1$ 寄存器为 $x 10$ ，源寄存器 $rs 2$ 为 $x 2$ ，条件成立跳转位置为 $l ab e l$ 。

PC相对地址

在当今操作系统中，可执行文件执行时由于映射到内存虚拟地址空间的位置的不确定性所以需要类似 $w in d o w s$ 可执行文件中的重定位表来对一些地址做重定位。因此编译器在编译源代码过程中会尽量使用PC相对地址，介绍 $R V 32 I$ 时有提到除通用寄存器外还有寄存器 $p c$ 用于存储当前执行指令地址。分支指令中待跳转目的地址在指令编码中会记录为相对当前PC的单元偏移量，减少重定位的开销。

简言之，分支指令的跳转不以字节为单位。而在 $R V 32 I$ 中，基本单元为 $2$ 字节。不以 $1$ 字节作为单元的单位的原因在于： $R V 32 I$ 中所有指令的长度都为 $4$ 字节，避免分支跳转到一条指令的中间位置。以 $2$ 字节为基本单元的原因在于： $R I SC V$ 中有 $R V 32 C$ 扩展，该扩展用于把指令长度缩短到 $2$ 字节，用于对机器码长度有限制的场景中。为了使得在该扩展用仍旧适用，取基本单元大小为 $2$ 字节。

B型指令

$B$ 型指令的指令编码与 $S$ 型指令对比如下图所示：
在这里插入图片描述保持和 $S$ 型指令中 $\ \ funct3 \ \ rs1 \ \ rs2$ 位置相同。合理调整立即数各 $bi t$ 的位置。
0：立即数 $imm e d ia t e$ 表示待跳转标签和当前 $PC$ 内存地址的差值。以字节为单位。 $B$ 型指令中跳转基本单元为 $2$ 字节，故最低位不考虑，指令中不记录该位。
1：立即数的最高位永远位于指令中的最高有效位 $MSB$ 。主要原因："In RISC-V the sign bit for all immediates is always held in bit 31 of the instruction to allow sign-extension to proceed in parallel with instruction decoding."，该标准原话告诉我们立即数的最高位永远位于指令的最高有效位方便在指令解码的同时进行符号扩展。
2：立即数编码奇怪的第二原因：" immediates is chosen to maximize overlap with the other formats and with each other."，立即数需要尽量和其余编码格式中立即数位置重合，方便逻辑的复用。
3： $B$ 型指令中首先立即数最高位 $imm [12]$ 位于 $in s t [31]$ ，其次 $imm [10 : 5]$ 位于 $in s t [30 : 25]$ 和 $S$ 型保持一致。其次，立即数 $imm [4 : 1]$ 位于 $in s t [11 : 8]$ 和 $S$ 型保持一致。最后一位填充到 $in s t [7]$ 。
4： $B$ 型指令中记录 $13 bi t$ 立即数的高 $12 bi t$ ，最低位一直为 $0$ ，跳转的地址空间范围： $2*2^{11}),2*(2^{11}-1)]=[-4096,4094]$
5： $B$ 型指令的 $o p co d e$ 为 $0 b 1100011$ 。
所有 $B$ 型指令编码及其字段值如下所示：

inst[31:25]	inst[20:24]	inst[19:15]	inst[14:12]	inst[11:7]	inst[6:0]	指令助记符
imm[12 \|10:5]	rs2	rs1	000	imm[4:1 \| 11]	1100011	beq
imm[12 \|10:5]	rs2	rs1	001	imm[4:1 \| 11]	1100011	bne
imm[12 \|10:5]	rs2	rs1	100	imm[4:1 \| 11]	1100011	blt
imm[12 \|10:5]	rs2	rs1	101	imm[4:1 \| 11]	1100011	bge
imm[12 \|10:5]	rs2	rs1	110	imm[4:1 \| 11]	1100011	bltu
imm[12 \|10:5]	rs2	rs1	111	imm[4:1 \| 11]	1100011	bgeu

简单举例

以下面RISCV代码为例，给出其分支指令的二进制表示：

Loop: beq x19,x10,End
add x18,x18,x10
addi x19,x19,-1
j Loop
End: # target instruction

假设当前 $PC$ 指向分支指令 $\ x19,x10,End$ 的地址， $R V 32 I$ 指令定长 $32 bi t$ ，那么标签 $E n d$ 的地址为 $PC + 16$ 。立即数以 $2$ 字节为单元，所有 $imm = 8$ ， $rs2=0b01010=10_{10}$ ， $rs1=0b10011=19_{10}$ ， $f u n c t 3 = 0 b 000$ ，综上，该指令二进制表示为： $\ \ 01010 \ \ 10011 \ \ 000 \ \ 01000 \ \ 1100011$

U型指令

分支指令的跳转范围有限。考虑标准库 $mma p$ 的地址位置和当前文件距离较大时则需要更大的跳转范围。例如： $\ x10,x0,far$ 而 $f a r$ 距离当前pc距离很大，则考虑以下形式改写指令：

bne x10,x0,next
j far
next:
# next instruction

上述含立即数类型的指令中立即数用 $12 bi t$ 表示，对应的， $U$ 型指令给出了控制立即数高 $20 bi t$ 的指令。
$U$ 型指令编码格式如下图所示，具体仅有指令 $LU I$ 和 $A U I PC$ ：
在这里插入图片描述

LUI指令

$\ (load \ upper \ immediate)$ 用于把立即数的值写入目的寄存器高 $20 bi t$ ，并将目的寄存器低 $12 bi t$ 清零。
$LU I$ 指令的 $o p co d e$ 由映射表可知为 $0 b 0110111$
结合 $a dd i$ 指令写寄存器的低 $12 bi t$ ，可以达到控制寄存器 $32 bi t$ 的目的。例如：

lui x10, 0x87654      # x10 = 0x87654000
addi x10, x10, 0x321  # x10 = 0x87654321

其中， $r d = 0 b 01010$ ， $\ 0111 \ 0110 \ 0101 \ 0100$ ，故指令二进制及十六进制表示为： $\ 01010 \ 0110111=0x87654537$

特殊的点，假如当前需求为设置 $x 10$ 寄存器内容为 $0 x D E A D BEEF$ ：

lui x10, 0xDEADB      # x10 = 0xDEADB000
addi x10, x10, 0xEEF  # x10 = 0xDEADAEEF

由于立即数在加法指令执行前会符号扩展，低 $12 bi t$ 相加时直接相加，结果正确。高 $20 bi t$ 相加时 $0 x D E A D B$ 与符号扩展的全 $1$ 补码表示为 $- 1$ 相加，故而高 $20 bi t$ 比预期少 $1$ 。
所以：在立即数低 $12 bi t$ 的最高有效位为 $1$ 时，设置高 $20 bi t$ 时需要对立即数加 $1$ 处理。如下所示：

lui x10, 0xDEAADC      # x10 = 0xDEADC000
addi x10, x10, 0xEEF  # x10 = 0xDEADBEEF

li伪指令

$\ (load \ immediate)$ 用于加载立即数到目的寄存器。
$\ x10, 0x87654321$ 即把立即数 $0 x 87654321$ 加载到寄存器 $x 10$ 中。该伪指令最终借由指令 $\ x10, 0x87654$ 和 $\ x10, x10, 0x321$ 实现。

AUIPC指令

1： $\ (add \ upper \ immediate \ to \ PC)$ 用于把立即数左移 $12 bi t$ ，低位补 $0$ 形成 $o ff se t$ ，并将 $o ff se t + p c$ 放入目的寄存器， $p c$ 为 $a u i p c$ 指令所在的地址。
2： $A U I PC$ 指令用于辅助 $PC$ 相对寻址。指令可以通过 Label: AUIPC x10, 0 拿到当前 $l ab e l$ 的地址(位于 $x 10$ 寄存器中)。
3： $A U I PC$ 指令的 $o p co d e$ 由映射表可知为 $0 b 0010111$

4：指令 $\ x10, 0$ ， $r d = 0 b 01010$ ， $\ 0000 \ 0000 \ 0000 \ 0000$ ，故指令二进制及十六进制表示为： $\ 01010 \ 0010111=0x00000517$

J型指令(U型指令变体)

远距离跳转指令有： $J A L$ 和 $J A L R$ ，不同于分支指令， $J$ 型 $J A L$ 指令拥有更远的跳转空间，配合 $U$ 型指令可以更加灵活。

JAL指令

$J A L$ 指令通过立即数并以 $2$ 字节为单位形成有符号立即数和当前 $p c$ 相加形成目的地址，用于远距离跳转并将跳转指令的下一条指令的地址放入目的寄存器 $r d$ ，方便函数返回。举例见下文。
$\ (Jump \ and \ link)$ 指令编码对比 $I$ 型和 $U$ 型如下图所示：
在这里插入图片描述
$J A L$ 指令 $o p co d e$ 由映射表可知为： $0 b 1101111$ 。保持最高位位于指令 $in s t [31]$ 位置，立即数部分尽量与已有指令最大重合方便复用。 $J A L$ 指令可用于函数调用，例如：

JAL ra, Func
# next instruction
...
Func:
addi sp, sp, -48 # 一个可能的函数栈帧结构开始位置
...

1： $J A L$ 指令的寻址范围： $20 bi t$ 有符号立即数的 $2$ 字节寻址单元，最低为为 $0$ ，则以字节为单位的寻址范围为： $2*2^{19}),2*(2^{19}-1)]$ ，范围约为 $±1MiB \pm1MiB$ 。
2：伪指令 $\ label$ 用于无条件跳转到 $l ab e l$ 位置，同时不在意返回地址。最终实现方式为： $\ x0, label$ 丢弃返回地址。

JALR指令(I型指令)

$J A L R$ 指令通过立即数给出相对源寄存器rs的偏移量，符号扩展到 $32 bi t$ ，与 $rs$ 的值相加之后作为跳转的目的地址，同时记录跳转指令下一条指令地址到目的寄存器 $r d$ ，方便函数返回。指令格式： $\ rd, \ rs, \ immediate$ ，具体示例见下文。
$\ (Jump \ and \ link \ register)$ 指令编码对比 $I$ 型指令如下图所示：
在这里插入图片描述 $J A L$ 指令 $o p co d e$ 由映射表可知为： $0 b 1100111$ 。保持最高位位于指令 $in s t [31]$ 位置，立即数部分与 $I$ 型指令一样。 $J A L R$ 指令可用于 $32 bi t$ 绝对地址函数调用，或已知的 $\ PC$ 相对地址的值。例如，已知待跳转函数地址为 $0 x 87654321$ ：

lui x5,0x87654    # x5 = 0x87654000
jalr ra,x5,0x321  # ra = address of next instruction, pc = 0x87654321
# next instruction

1：伪指令 $\ (jump \ register)$ 用于无条件跳转到目的寄存器地址。其具体实现方式： $\ x5 = jalr \ x0, x5, 0$
2：伪指令 $\ (return)$ 用于函数返回。其具体实现方式： $\ ra = jalr \ x0, ra, 0$
3：以指令 $\ ra,x5,0x321$ 为例，其偏移量 $o ff se t = 0 x 321 = 0 b 001100100001$ ，基地址寄存器 $ba se (x 5) = 0 x 00101$ ，目的寄存器 $r d (r a / x 1) = 0 b 00001$ ，综上，其二进制表示为： $\ 00101 \ 000 \ 00001 \ 1100111$