汇编语言学习笔记 《汇编语言》--王爽 前言
学习汇编目的:充分获得底层编程体验;深刻理解机器运行程序的机理。 原则:没有通过监测点不要向下学习;没有完成当前实验不要向下学习。 第一章 基础知识
有三类指令组成汇编语言:汇编指令;伪指令;其他符号。8bit = 1byte = 一个存储单元有n根地址线,则可以寻址2的n次方个内存单元。 1.1节 --1.10节 小结
(1)汇编指令是机器指令的助记符,同机器指令一一对应。 (2)每一种cpu都有自己的汇编指令集。 (3)cpu可以直接使用的信息在存储器中存放。
(4)在存储器中指令和数据没有任何区别,都是二进制信息。 (5)存储单元从零开始顺序编号。
(6)一个存储单元可以存储8个bit,即八位二进制数。
(7)每一个cpu芯片都有许多管脚,这些管脚和总线相连。也可以说,这些管脚引出总线。一个cpu可以引出的三种总线的宽度标志了这个cpu不同方面的性能。地址总线的宽度决定了cpu的寻址能力;数据总线的宽度决定了cpu与其他器件进行数据传送时的一次数据传送量;控制总线的宽度决定了cpu对系统中其他器件的控制能力。 监测点:1KB的存储器有1024个存储单元?存储单元的编号从0到1023. 内存地址空间:
最终运行程序的是cpu,我们用汇编编程时,必须要从cpu的角度思考问题。对cpu来讲,系统中的所有存储器中的存储单元都处于一个统一的逻辑存储器中,它的容量受cpu寻址能力的限制。这个逻辑存储器即是我们所说的内存地址空间。 第二章 寄存器(cpu的工作原理) mov ax, 2 add ax, ax add ax, ax add ax, ax
(1)cpu中的相关部件提供两个16位的地址,一个称为段地址,另一个称为偏移地址; (2)段地址和偏移地址通过内部总线送人一个称为地址加法器的部件; (3)地址加法器将两个16位地址合成为一个20位的物理地址; (4)地址加法器通过内部总线将20位物理地址送人输入输出控制电路; (5)输入输出控制电路将20位物理地址送上地址总线; (6)20位物理地址被地址总线传送到存储器;
段地址*16+偏移地址 = 物理地址 的本质含义 内存并没有分段,段的划分来自cpu。
以后编程时可以根据需要,将若干地址连续的内存单元看做一个段,用段地址*16定位段的起始地址,用偏移地址定位段的内存单元。
一个段的起始地址一定是16的倍数,一个段的最大长度为64kB。当然也没有办法定义一个起始地址不是16的倍数的段。
cpu可以用不同的段地址和偏移地址形成同一物理地址。
在8086cpu加电启动或复位后cs和ip被设置为cs = f000h,ip = ffffh,即ffff0h单元中的指令是8086pc机开机后执行的第一条指令。(??应该是fffffh吧??) cpu将cs:ip指向的内存单元看做指令。
在cpu中,程序员能够用指令读写的部件只有寄存器,程序员可以通过改变寄存器中的内容实现对cpu的控制。
mov指令称为传送指令,cpu中大部分寄存器的值都可以通过mov指令改变。 除了cs:ip 8086没给他这样的功能。 cs:ip可以用转移指令来改变。jmp
jmp cs:ip 用指令给出的段地址修改cs,偏移地址修改ip jmp 某一寄存器 的功能为:用寄存器中的值修改ip jmp ax 含义类似于mov ip,ax
段地址在8086pc机的段寄存器存放。当8086cpu要访问内存时,由段寄存器提供内存单元的段地址。8086cpu有四个段寄存器,其中cs用来存放指令的段地址。 cs存放指令的段地址,ip存放指令的偏移地址。
8086机中,任意时刻,cpu将cs:ip指向的内容当作指令执行。 8086cpu的工作过程:
1.从cs:ip指向内存单元读取指令,读取的指令进入指令缓冲器; 2.ip指向下一条指令 3.执行
8086提供转移指令修改cs:ip的内容 debug的使用
查看,修改cpu中寄存器的内容:r命令 查看内存中的命令:d命令
修改内存中的内容:e命令(可以写入数据,指令,在内存中,它们实际上没有区别) 将内存中的命令解释为机器指令和相应的汇编指令:u命令 执行cs:ip指向的内存单元处的命令:t命令 以汇编指令的形式向内存中写入指令:a命令 第三章 寄存器(内存访问)
3.1内存中字的存储
高八位存放在高字节中,低八位存放在低字节中 3.2DS和【address】 3.3字传送 3.4MOV ADD SUB 3.5数据段 3.6栈
栈是一种具有特殊的访问方式的存储空间。它的特殊性就在于,最后进入这个空间的数据,最先出去。
栈有两个基本的操作:入栈和出栈。
栈的这种操作规则被称为:lifo(last in first out,后进先出)。 cpu如何知道10000H--1000fH这段空间被当作栈使用?
push pop指令在执行时必须知道哪个单元是栈顶单元,可是如何知道呢?
栈顶的段地址存放在ss中,偏移地址存放在sp中。任意时刻,ss:sp指向栈顶单元。 push和pop指令执行时,cpu从ss和sp中得到栈顶的地址。 入栈时,栈顶从高地址向低地址方向增长。 如何定义一个栈的大小? mov ax, 1000h mov ss, ax
mov sp, 0010h ;则栈顶为1000f 栈底为 10000 ****************************************** mov ax, 1000h mov ds, ax mov ax, 2266h mov [0], ax
************************ mov ax,1000h mov ss, ax mov sp, 0002h mov ax, 2266h push ax
栈顶的变化范围最大为:0--ffffh 栈的综述
(1)8086cpu提供了栈操作机制,方案如下:
在ss、sp中存放栈顶的段地址和偏移地址;
提供入栈和出栈指令,他们根据ss、sp指示的地址,按照栈的方式访问内存单元。 (2)push指令的执行步骤:1)sp=sp-2;2)向ss:sp指向的字单元送人数据; (3)pop指令的执行步骤:1)从ss:sp指向的字单元中读取数据;2)sp=sp+2 (4)任意时刻,ss:sp指向栈顶元素。
(5)8086cpu只记录栈顶,栈空间的大小我们要自己管理。
(6)用栈来暂存以后需要恢复的寄存器的内容时,寄存器出栈的顺序要和入栈的顺序相反。 (7)push、pop指令实质上是一种内存传送指令,注意他们的灵活运用。 一个栈段最大可以设为64k 段的综述
我们可以将一段内存定义为一个段,用一个段地址指示段,用偏移地址访问段内的单元。这完全是我们的安排。 用一个段存放代码,即代码段 用一个段存放数据,即数据段 用一个段当栈,即栈段
对于数据段,把段地址放在ds中,用mov,add,sub等访问内存单元的指令时,cpu就将我们定义的数据段内容当做数据来访问;
对于代码段,把段地址放在cs:ip中,用mov,add,sub等访问内存单元的指令时,cpu就将执行我们定义的代码段的指令;
对于栈段,把段地址放在ss:sp中,用push pop 等访问内存单元的指令时,cpu就将其当作堆栈来访问;
debug的t命令在执行修改器ss的指令时,下一条指令也紧接着被执行了。 3.7栈超界问题
8086cpu不保证我们对栈的操作不会超界。也就是说,8086cpu只知道栈顶在何处而不知道我们安排的栈空间有多大,这点就好像,cpu只知道当前要执行的指令在何处,而不知道要执行的指令有多少。从这两点我们可以看出cpu的工作机理,它只考虑当前情况:当前的栈在何处,当前要执行的指令是哪一条。 对于超界问题我们可以做到就是小心。 第五章【bx】和loop指令
我们完整的描述一个内存单元,需要两种信息:
(1)内存单元的地址;(2)内存单元存放数据的类型; inc bx的含义是bx中的内容加一
[bx]寄存器bx中所包含的地址中存放的内容 [bx]表示一个内存单元,他的偏移地址在bx中。 loop指令执行的时候,要进行两步操作: