计算机系统结构实验-实验一-MIPS指令系统

西瓜呆毛汪

1. 初识MIPS指令系统

第一次接触MIPS指令系统时，我完全被那些看似神秘的汇编指令搞懵了。什么"lw"、"sw"、"add"之类的缩写，就像天书一样。但当我真正开始用MIPSsim模拟器动手操作后，才发现这些指令其实就像乐高积木，是构建计算机程序的最基础模块。

MIPS指令系统最大的特点就是精简规整。所有指令都是32位定长，而且只有三种基本格式：R型、I型和J型。这种设计让指令解码变得特别简单，这也是为什么很多计算机体系结构的课程都选择MIPS作为教学案例。在实际操作中，你会发现每条指令的执行都会精确地改变寄存器或内存的状态，这种确定性对于理解计算机工作原理特别有帮助。

记得我第一次运行MIPSsim时，界面上的寄存器窗口、内存窗口和代码窗口让我有点不知所措。但按照实验手册的指引，加载了样例程序后，通过单步执行，我清楚地看到了PC寄存器如何自动递增，看到了指令如何从内存加载到CPU，看到了运算结果如何写回寄存器。这种直观的观察体验，比单纯看书要深刻得多。

2. MIPSsim模拟器入门指南

2.1 环境配置与基本操作

MIPSsim模拟器的使用其实并不复杂，但有几个关键设置需要注意。首先一定要确保模拟器工作在非流水线模式下，这对初学者理解指令执行流程特别重要。在菜单栏选择"配置"→"流水方式"，取消勾选即可。

加载程序时有个小技巧：样例程序alltest.asm的起始地址是0x00000100，但PC寄存器初始值是0x00000000。这是因为MIPS架构中，0x00000000地址通常保留给异常处理程序使用。我第一次实验时就因为这个细节困惑了好久，后来才发现需要先执行几条初始化指令才会跳到真正的程序入口。

模拟器提供了多种程序执行方式：

单步执行(F7)：最适合观察每条指令的详细效果
连续执行(F5)：快速运行完整程序
设置断点：在关键指令处暂停执行

建议新手先从单步执行开始，配合观察寄存器和内存的变化。比如执行"lw"指令时，可以清楚地看到数据是如何从内存加载到寄存器的。

2.2 寄存器与内存观察技巧

MIPSsim的寄存器窗口显示了所有32个通用寄存器的实时状态。这里有个实用技巧：你可以直接双击寄存器修改其值，这在测试特定指令时特别方便。比如测试算术指令前，可以先把R1设为2，R2设为3，然后执行"add R3,R1,R2"，就能立即看到R3变成了5。

内存窗口则显示了模拟内存的内容。注意MIPS采用的是按字节编址，但字(word)访问必须是4字节对齐的。我第一次尝试用"lw"指令读取非对齐地址时，模拟器直接报错了，这才深刻理解了内存对齐的重要性。

PC寄存器是理解程序执行流程的关键。每次执行一条指令，PC都会自动指向下一条指令的地址。但在遇到跳转指令时，PC会被直接修改，这种改变程序执行流程的能力正是实现条件判断和循环的基础。

3. 数据传送指令实战解析

3.1 加载指令的奥秘

MIPS的加载指令看似简单，实则暗藏玄机。"lw"(load word)指令是最常用的，它从内存读取32位数据到寄存器。但初学者容易忽略的是符号扩展问题。比如"lb"(load byte)指令加载字节时，会根据最高位进行符号扩展，而"lbu"(load byte unsigned)则不会。

在实验中，我特意测试了这两种情况：

加载0xFFFFFF80到R1（使用lb）：R1最终值为0xFFFFFFFFFFFFFF80
同样的数据使用lbu加载：R1值为0x0000000000000080

这个差异在后续的算术运算中会产生完全不同的结果。比如用前者做加法可能会触发溢出，而后者则不会。这种细节在实际编程中非常重要，特别是处理有符号和无符号数据时。

3.2 存储指令的注意事项

与加载指令对应的是存储指令，如"sw"(store word)。这里有个常见陷阱：存储指令不会改变寄存器的值，只会修改内存。我第一次实验时就犯了个错误，以为"sw"之后寄存器的值也会被清零。

另一个要点是存储地址必须对齐。MIPS架构要求字访问必须是4的倍数，半字访问必须是2的倍数。如果尝试用"sw"指令向地址0x00000001存储数据，模拟器会直接报错。这种严格的对齐要求虽然增加了编程的复杂度，但大大提高了内存访问效率。

在实验中，通过单步执行存储指令，可以清晰地看到内存窗口中特定地址的值被更新。比如执行"sw R1, 0(R2)"后，R2寄存器指向的内存地址的内容就变成了R1的值。这种直观的反馈对理解内存操作特别有帮助。

4. 算术运算指令深度探索

4.1 基本算术运算

MIPS的算术指令包括add、sub、addi等，它们的行为与高级语言中的运算符很相似，但有一些特殊规则需要注意。比如add指令会忽略溢出，而add指令则会在溢出时触发异常。这在实验中可以很直观地观察到：当两个很大的正数相加产生负数结果时，使用add指令程序会继续执行，而使用add指令则会中断。

乘法指令比较特殊，结果会存储在专门的LO和HI寄存器中。这是因为乘法结果可能是64位的，需要两个32位寄存器来存储。实验中修改R1=2，R2=3后执行"mult R1,R2"，就能看到LO寄存器变成了6，而HI寄存器保持为0（因为没有高位部分）。

4.2 立即数运算技巧

addi指令允许直接使用立即数进行运算，这在实际编程中非常方便。但要注意立即数是有符号的16位数，范围是-32768到32767。如果需要更大的立即数，就需要先用"lui"(load upper immediate)指令加载高16位，再用"ori"指令设置低16位。

在实验中，我尝试用addi指令给寄存器加一个负数，发现它实际上执行的是减法操作。比如"addi R1,R1,-1"等效于"sub R1,R1,1"。这种设计使得指令集更加紧凑，因为不需要单独的减法立即数指令。

5. 逻辑运算指令详解

5.1 位操作的艺术

MIPS的逻辑指令包括and、or、xor、nor等，它们对寄存器值的每一位进行独立操作。在实验中，设置R1=0xFFFF0000，R2=0xFF00FF00后，执行"and R3,R1,R2"会得到0xFF000000，这个结果清晰地展示了按位与的操作方式。

立即数版本的逻辑指令（如andi、ori）特别有用。它们允许直接使用常数进行位操作，避免了额外的加载指令。比如要设置某个寄存器的特定位为1，可以用"ori"指令；要清除某些位，可以用"andi"指令配合适当的掩码。

5.2 移位指令的妙用

移位指令（sll、srl、sra）在底层编程中非常重要。它们不仅可以用于快速乘除2的幂次方，还能用于位字段的提取和组装。实验中修改R1=0x80000000后，执行"srl R1,R1,1"会得到0x40000000（逻辑右移），而"sra R1,R1,1"会得到0xC0000000（算术右移，保持符号位）。

特别有趣的是移位指令可以用来实现一些巧妙的技巧。比如"sll R1,R1,0"看起来什么都没做，但实际上可以用来消除延迟槽中的气泡。这种优化技巧在编写高性能MIPS代码时经常用到。

6. 控制转移指令全解析

6.1 条件分支实战

控制转移指令是程序实现条件判断和循环的基础。beq（branch if equal）指令是最常用的条件分支之一。在实验中设置R1=R2=2后，执行"beq R1,R2,target"会成功跳转，PC值直接变为目标地址。这种跳转不是简单的赋值，而是相对于当前PC的偏移量计算。

bgez（branch if greater than or equal to zero）指令演示了如何基于单个寄存器的值进行分支。实验中修改R1=2后执行"bgez R1,target"，PC会跳转到目标地址；如果把R1改为-1，则不会跳转。这种条件判断在循环控制中非常有用。

6.2 跳转与链接指令

jal（jump and link）指令用于函数调用，它会将返回地址（PC+4）保存在R31寄存器中，然后跳转到目标地址。实验中执行"jal 0x00000064"后，可以看到R31变成了下一条指令的地址，而PC变成了0x00000064。这种机制使得函数调用和返回变得非常简单。

jalr（jump and link register）是更灵活的版本，它允许通过寄存器指定跳转地址，还可以选择任意的寄存器存储返回地址。实验中执行"jalr R3,R1"时，PC会跳转到R1指定的地址，而R3会保存返回地址。这种设计支持更复杂的调用约定和函数指针实现。

7. 常见问题与调试技巧

在实际操作MIPSsim时，有几个常见错误新手很容易犯。首先是忘记初始化寄存器，导致运算结果不符合预期。建议在执行任何计算前，先明确设置所有参与运算的寄存器值。

其次是混淆有符号和无符号操作。比如用"lb"加载字节后直接进行算术运算，可能会因为符号扩展导致错误结果。这种情况下应该使用"lbu"，或者先用"andi"指令清除不需要的高位。

调试分支指令时，建议先在目标地址设置断点，然后单步执行到分支指令，观察条件是否满足。如果分支行为不符合预期，检查相关寄存器的值和条件判断逻辑是否正确。

最后，记住MIPS的延迟槽特性：分支和跳转指令后面的那条指令总是会被执行。这个特性在初期很容易被忽略，导致程序逻辑错误。在非流水线模式下虽然影响不大，但养成考虑延迟槽的习惯对后续学习很有帮助。

已经到底了哦