知识点:机器语言、汇编语言的产生、汇编语言的组成、存储器、指令和数据、存储单元、CPU对存储器的读写、地址总线、数据总线、控制总线、内存地址空间(概述)、主板、接口卡、各类存储器芯片、内存地址空间。
汇编语言是直接在硬件之上工作的编程语言,首先要了解硬件系统的结构,才能有效地应用汇编语言对其编程。
机器语言
说到汇编语言的产生,首先要讲一下机器语言。机器语言是机器指令的集合。机器指令展开来讲就是一台机器可以正确执行的命令。
电子计算机的机器指令是一列二进制数字。计算机将之转变为一列高低电平,以使计算机的电子器件受到驱动,进行运算。
上面所说的计算机指的是可以执行机器指令,进行运算的机器。这是早期计算机的概念。现在,在常用的PC机中,有一个芯片来完成上面所说的计算机的功能,这个芯片就是我们常说的CPU(Central Processing Unit,中央处理器单元),CPU是一种微处理器。
以后我们提到的计算机是指由CPU和其他受CPU直接或间接控制的芯片、器件、设备组成的计算机系统,比如我们最常见的PC机。
每一种微处理器,由于硬件设计和内部结构和不同,就需要用不同的电平脉冲来控制,使它工作。所以每一种微处理器都有自己的机器指令集,也就是机器语言。
早期的程序设计均使用机器语言。程序员们将用0、1数字编成的程序代码打在纸带或卡片上,1打孔,0不打孔,再将程序通过纸带机或卡片机输入计算机,进行运算。
应用8086CPU完成计算 s = 768 + 12288 - 1280,机器码如下:
1011000000000000000000000000011
0000010100000000000000000110000
0010110100000000000000000000101
要书写和阅读机器码程序不是一件简单的工作,要记住所有抽象的二进制码。上面只是一个非常简单的小程序,就暴露了机器码的晦涩难懂和不易查错。
汇编语言的产生
早期的程序员很快就发现了使用机器语言带来的麻烦,它是如此难于辨别和记忆,给整个产业的发展带来了障碍。于是汇编语言产生了。
汇编语言的主体是汇编指令。
汇编指令和机器指令的差别在于指令的表示方法上。
汇编指令是机器指令便于记忆的书写格式。
例如:机器指令 1000100111011000表示把寄存器BX的内容送到AX中。汇编指令则写成mov ax, bx,这样的写法与人类语言接近,便于阅读和记忆。
操作:寄存器BX的内容送到AX中
机器指令:1000100111011000
汇编指令:mov ax, bx
(寄存器,简单地讲是CPU中可以存储数据的器件,一个CPU中有多个寄存器。AX是其中一个寄存器的代号,BX是另一个寄存器的代号。)
此后,程序员们就用汇编指令编写源程序。可是,计算机能读懂的只有机器指令,那么如何让计算机执行程序员用汇编指令编写的程序呢?这时,就需要有一个能够将汇编指令转换成机器指令的翻译程序,这样的程序被称为编译器。程序员用汇编语言写出源程序,再用汇编编译器将其编译为机器码。由计算机最终执行。
用汇编语言编写程序的工作过程:
(程序员)汇编指令 --> 编译器 --> 机器码 --> 计算机
汇编语言的组成
汇编语言发展至今,由以下3类指令组成。
汇编指令:机器码的助记符,有对应的机器码。
伪指令:没有对应的机器码,由编译器执行,计算机并不执行。
其他符号:如:+、-、*、/等,由编译器识别,没有对应的机器码。
汇编语言的核心是汇编指令,它决定了汇编语言的特性。
存储器
CPU是计算机的核心部件,它控制整个计算机的运作并进行运算。
要想让一个CPU工作,就必须向它提供指令和数据。
指令和数据在存储器中存放,也就是平时所说的内存。
在一台PC机中内在的作用仅次于CPU。离开了内存,性能再好的CPU也无法工作。
这就像再聪明的大脑,没有了记忆也无法进行思考。
磁盘不同于内存,磁盘上的数据或程序如果不读到内存中,就无法被CPU使用。
要灵活地利用汇编语言编程,首先要了解CPU是如何从内存中读取信息,以及向内存中写入信息的。
指令和数据
指令和数据是应用上的概念。在内存或磁盘上,指令和数据没有任何区别,都是二进制信息。
CPU在工作的时候把有的信息看作指令,有的信息看作数据,为同样的信息赋予了不同的意义。
就像围棋的棋子,在棋盒里的时候没有任何区别,在对弈的时候就有了不同的意义。
例如,内存中的二进制信息 1000100111011000,计算机可以把它看作大小为89D8H的数据来处理,也可以将基看作指令mov ax, bx来执行。
1000100111011000 --> 89D8H(数据)
1000100111011000 --> mov ax, bx(指令)
存储单元
存储器被划分成若干个存储单元,每个存储单元从0开始顺序编号,例如一个存储器有128个存储单元,编号从0~127。
电子计算机的最小信息单位是bit(音译为比特),也就是一个二进制位。
8个bit组成一个Byte,也就是通常讲的一个字节。
微型机存储器的存储单元可以存储一个字节,即8个二进制位。
一个存储器有128个存储单元,它可以存储128个字节。
微机存储器的容量是以字节为最小单位来计算的。
对于拥有128个存储单元的存储器,我们可以说,它的容量是128字节。
对于大容量的存储器一般还用以下单位计量容量(以下B来代表Byte):
1KB = 1024B
1MB = 1024KB
1GB = 1024 MB
1TB = 1024 GB
磁盘的容量单位同内存的一样,以上单位是微机中常用的计量单位。
CPU对存储器的读写
存储器被划分成多个存储单元,存储单元从零开始顺序编号。这些编号可以看作存储单元在存储器中的地址。就像一条街,每个房子都有门牌号码。
CPU要从内在中读数据,首先要指定存储单元的地址。
也就是说它要先确定读取哪一个存储单元的数据。就像在一条街上找人,先要确定他住哪个房子里。
另外,在一台微机中,不只有存储器这一种器件。CPU在读写数据时还要指明,它要对哪一个器件进行操作,进行哪种操作,是从中读出数据,还是向里面写入数据。
可见,CPU要想进行数据的读写,必须和外部器件(标准的说法是芯片)进行3类信息的交互:
*存储单元的地址(地址信息)
*器件的选择,读或写的命令(控制信息)
*读或写的数据(数据信息)
那么CPU是通过什么将地址、数据和控制信息传到存储器芯片中的呢?
电子计算机能处理、传输的信息都是电信号,电信号当然要用导线传送。在计算机中专门有连接CPU和其他芯片的导线,通常称为总线。
总线从物理上来讲,就是一根根导线的集合。
根据传送信息的不同,总线从逻辑上又分为3类,即地址总线、控制总线、和数据总线。
CPU从3号单元中读取数据的过程如下:
CPU
|
|
内存 |
|
地址线
|
12 [0] |
|
3-----> |
3B [1] |
|
|
9C [2] |
|
数据线 |
08 [3] |
|
8<----- |
31 [4] |
|
|
23 [5] |
|
控制线 |
15 [6] |
|
内存读写命令---> |
13 [7] |
|
|
18 [8] |
cpu从内存中读取数据的过程。
(1)CPU通过地址线将地址信息3发出。
(2)CPU通过控制线发出内在读命令,选中存储器芯片,并通知它,将要从中读取数据。
(3)存储器将3号单元中的数据08通过数据线送入CPU。
写操作与读操作的步骤相似。向3号单元写入数据26:
(1)CPU通过地址线将地址信息3发出。
(2)CPU通过控制线发出内存写命令,选中存储器芯片,并通知它,要向其中写入数据。
(3)CPU通过数据线将数据26送入内存的3号单元中。
从上面的我们知道CPU是如何进行数据读写的。可是,我们如何命令计算机进行数据的读写呢?
要让一个计算机或微处理器工作,应向它输入能够驱动它进行工作的电平信息(机器码)。
对于8086CPU,下面的机器码能够完成从3号单元读数据:
机器码:101000000000001100000000
含义:从3号单元读取数据送入寄存器AX
CPU接收这条机器码后将完成上面所述的读写工作。
机器码难于记忆,用汇编指令来表示,情况如下:
机器码:101000000000001100000000
对应的汇编指令:MOV AX, [3]
含义:传送3号单元的内容到AX
地址总线CPU是通过地址总线来指定存储器单元的。
地址总线上能传送多少个不同的信息,CPU就可以对多少个存储单元进行寻址。
现假设,一个CPU有10根地址线,让我们来看一下它的寻址情况。
在电子计算机中,一根导线可以传送的稳定状态只有两种,高电平或低电平。
用二进制表示就是1或0,10根导线可以传送10位二进制数据。
而10位二进制数可以表示多个不同的数据呢?
2的10次方个,最小数为0,最大数为1023。
一个CPU有N根地址线,则可以说这个CPU的地址总线的宽度为N。
这样的CPU最多可以寻找2的N次方个内存单元。
数据总线
CPU与内存或其他器件之间的
数据传送是通过数据总线来进行的。
数据总线的宽度决定了CPU和外界的数据传送速度。
8根数据总线一次可传送一个8位二进制数据(即一个字节)。
16根数据总线一次可传送2个字节。
控制总线CPU对外部器件的控制是通过总线来进行的。在这里控制总线是个总称,控制总线是一些不同控制线的集合。
有多少根控制总线,就意味着这个CPU提供了对外部器件的多少种控制。
所以,控制总线的宽度决定了CPU对外部器件的控制能力。
内存读写命令是由几根控制线综合发出的,其中有一根名为读信号输出控制线负责由CPU向外传送读信号,CPU向该控制线上输出低电平表示将要读取数据;有一根名为写信号输出的控制线则负责传送写信号。
小结
1)汇编指令是机器指令的助记符,同机器指令一一对应。
2)每一种CPU都有自己的汇编指令集。
3)CPU可以直接使用的信息在存储器中存放。
4)在存储器中指令和数据没有任何区别,都是二进制信息。
5)存储单元从零开始顺序编号。
6)一个存储单元可以存储8个bit(用作单位写成"b"),即8位二进制数。
7)1B=8b 1KB=1024B 1MB=1024KB 1GB=1024MB
8)每一个CPU芯片都有许多管脚,这些管脚和总线相连。也可以说,这些管脚引出总线。
一个CPU可以引出三种总线的宽度标志了这个CPU的不同方面的性能:
地址总线的宽度决定了CPU的寻址能力;
数据总线的宽度决定了CPU与其他器件进行数据传送时的一次数据传送数;
控制总线的宽度决定了CPU对系统中其他器件的控制能力。
习题:
(1)1个CPU的寻址能力为8KB,那么它的地址总线的宽度为________。
(2)1KB的存储器有________个存储单元?存储单元的编号从__________到__________。
(3)1KB的存储器可以存储_________个bit,_________个byte。
(4)1GB,1MB,1KB分别是_____________________________byte。
(5)8080、8088、80286、80386的地址总线分别为16根、20根、24根、32根,则它们的寻址能力分别为:__________KB、________MB、__________MB、______________GB。
(6)8080、8088、8086、80286、80386的数据总线宽度分别为8根、8根、16根、16根、32根。则它们一次可以传送的数据为:_______B、________B、________B、__________B、_______B。
(7)从内存中读取1024字节的数据,8086至少要读_______次,80386至少要读__________次。
(8)在存储器中,数据和程序以________形式存放。
答案:
(1)13
解析:微型机的存储单元可以存储一个字节,即8个二进制位。8KB即8K字节,即2的13次方个存储单元。一个CPU有N根地址线,则可以说这个CPU的地址总线的宽度为N,这样的CPU最多可以寻找2的N次方个存储单元。
(2)1024,0,1023
解析:1KB,即1024字节,一个存储单元为一个字节。存储单元从零开始顺序编号。
(3)8192,1024
解析:1B=8b 1KB=1024B
(4)2^30, 2^20, 2^10
(5)64, 1, 16, 4
解析:一个CPU有N根地址线,表示这个CPU地址总线宽度为N,可以寻址2的N次方个存储单元。
(6)1,1,2,2,4
解析:一根数据线,只能传送一位二进制数(0或1,低电平或高电平)
(7)512, 256
解析:8086的数据总线宽度为16,一次可以传送2个字节,80386的数据总线宽度为32,一次可以传送4个字节。
(8)二进制(0或1)
内存地址空间(概述)什么是内存地址空间呢?
举例来讲,一个CPU的地址线宽度为10,那么可以寻址1024个内存单元(存储单元,一个存储单元在微型机中表示一个字节),这1024个可寻到的内存单元就构成了这个CPU的内存地址空间。
主板
在每一台PC机中,都有一个主板,主板上有核心器件和一些主要器件,这些器件通过总线(地址总线、数据总线、控制总线)相连。
这些器件有:CPU、存储器、外围芯片组、扩展插槽等。
扩展插槽上一般插有RAM内存条和各类接口卡。
接口卡
计算机系统中,所有可用程序控制其工作的设备,必须受到CPU的控制。
CPU对外部设备都不能直接控制,如显示器、音箱、打印机等。
直接控制这些设备进行工作的是插在扩展插槽上的接口卡。
扩展插槽通过总线和CPU相连,所以接口卡也通过总线同CPU相连。
CPU可以直接控制这些接口卡,从而实现CPU对外设的间接控制。
简单地讲,就是
CPU通过总线向接口卡发送命令,接口卡根据CPU的命令控制外设进行工作。
各类存储器芯片
一台PC机中,装有多个存储器芯片,这些存储器芯片从物理连接上看是独立的、不同的器件。
从读写属性上看分为两类:随机存储器(RAM)和只读存储器(ROM)。
随机存储器可读可写,但必须带电存储,关机后存储的内容丢失;
只读存储只能读取不能写入,关机后其中的内容不丢失。
这些存储器从功能和连接上又可分为以下几类:
随机存储器
用于存放供CPU使用的绝大部分程序和数据,主随机存储器一般由两个位置上的RAM组成,装在主板上的RAM和插在扩展插槽上的RAM。
装有BIOS(Basic Input/Output System,基本输入输出系统)的ROM
BIOS是由主板和各类接口卡(如:显卡、网卡等)厂商提供的软件系统,可能通过它利用该硬件设备进行最基本的输入输出。
在主板和某些接口卡上插有存储相应BIOS的ROM,例如:主板上的ROM中存储着主板的BIOS(通常称为系统BIOS);显卡上的ROM中存储显卡的BIOS;如果网卡上装有ROM,那其中就可以存储网卡的BIOS。
接口卡上的RAM
某些接口卡需要对大批量输入、输出数据进行暂时存储,在其上装有RAM。最典型的是显示卡上的RAM,一般称为显存。显示卡随时将显存中的数据向显示器上输出。换句话说,我们将需要显示的内容写入显存,就会出现在显示器上。
内存地址空间
上述的各种存储器,它们在物理上是独立的器件,但是它们在以下两点上相同:
1)都和CPU的总线相连;
2)CPU对它们进行读或写的时候都通过控制线发现内在读写命令。
也就是说,CPU在操纵和控制它们的时候,把它们都当作内存来对待,把它们总的看作一个由若干存储单元组成的存储器。
这个逻辑存储器就是我们所说的内在地址空间。所有的物理存储器被看作是一个由若干存储单元组成的逻辑存储器,每个物理存储器在这个逻辑存储器中占有一个地址段,即一段地址空间。
CPU在这段地址空间中读写数据,实际上就是在相对应的物理存储器中读写数据。
内存地址空间的大小受CPU地址总线宽度的限制。
8086CPU的地址总线宽度为20,可以传送2^20个不同的地址信息(大小从0至2^20-1)。即可以定位2^20个内在单元,则8086PC的内在地址空间大小为1MB。
同理,80386CPU的地址总线宽度为32,则内存地址空间最大为4GB。
我们在基于一个计算机硬件系统编程的时候,必须得知道这个系统中的内在地址空间分配情况。
因为当读者想在某类存储器中读写数据的时候,读者必须知道它的第一个单元的地址和最后一个单元的地址,才能保证读写操作是在预期的存储器中进行。
比如,读者希望向显示器输出一段信息,那么读者必须将这段信息写到显存中,显卡才能将它输出到显示器上。要向显存中写入数据,读者必须知道显存在内存地址空间中的地址。
不同的计算机系统的内存地址空间的分配情况是不同的。
内存地址空间
最终运行程序的是CPU,我们用汇编编程的时候,必须要从CPU角度考虑问题。
对CPU来讲,系统中的所有存储器中的存储单元都处于一个统一的逻辑存储器中,它的容量受CPU寻址能力的限制。
这个逻辑存储器即是我们所说的内存地址空间。