硬件工程師對于程序空間的理解
在硬件工程師和普通用戶看來,內(nèi)存就是插在或固化在主板上的內(nèi)存條,它們有一定的容量——比如64 MB。但在應(yīng)用程序員眼中,并不過度關(guān)心插在主板上的內(nèi)存容量,而是他們可以使用的內(nèi)存空間——他們可以開發(fā)一個(gè)需要占用1 GB內(nèi)存的程序,并讓其在OS平臺(tái)上運(yùn)行,哪怕這臺(tái)運(yùn)行主機(jī)上只有128 MB的物理內(nèi)存條。而對于OS開發(fā)者而言,則是介于二者之間,他們既需要知道物理內(nèi)存的細(xì)節(jié),也需要提供一套機(jī)制,為應(yīng)用程序員提供另一個(gè)內(nèi)存空間,這個(gè)內(nèi)存空間的大小可以和實(shí)際的物理內(nèi)存大小之間沒有任何關(guān)系。
我們將主板上的物理內(nèi)存條所提供的內(nèi)存空間定義為物理內(nèi)存空間;將應(yīng)用程序員看到的內(nèi)存空間定義為線性空間。物理內(nèi)存空間大小在不同的主機(jī)上可以是不一樣的,隨著主板上所插的物理內(nèi)存條的容量不同而不同;但為應(yīng)用程序員提供的線性空間卻是固定的,不會(huì)隨物理內(nèi)存的變化而變化,這樣才能保證應(yīng)用程序的可移植性。盡管物理內(nèi)存的大小可以影響應(yīng)用程序運(yùn)行的性能,并且很多情況下對物理內(nèi)存的大小有一個(gè)最低要求,但這些因素只是為了讓一個(gè)OS可以正常的運(yùn)行。
線性空間的大小在32-bit平臺(tái)上為4 GB的固定大小,對于每個(gè)進(jìn)程都是這樣(一個(gè)應(yīng)用可以是多進(jìn)程的,在OS眼中,是以進(jìn)程為單位的)。也就是說線性空間不是進(jìn)程共享的,而是進(jìn)程隔離的,每個(gè)進(jìn)程都有相同大小的4 GB線性空間。一個(gè)進(jìn)程對于某一個(gè)內(nèi)存地址的訪問,與其它進(jìn)程對于同一內(nèi)存地址的訪問絕不沖突。比如,一個(gè)進(jìn)程讀取線性空間地址1234ABCDh可以讀出整數(shù)8,而另外一個(gè)進(jìn)程讀取線性空間地址1234ABCDh可以讀出整數(shù)20,這取決于進(jìn)程自身的邏輯。
在任意一個(gè)時(shí)刻,在一個(gè)CPU上只有一個(gè)進(jìn)程在運(yùn)行。所以對于此CPU來講,在這一時(shí)刻,整個(gè)系統(tǒng)只存在一個(gè)線性空間,這個(gè)線性空間是面向此進(jìn)程的。當(dāng)進(jìn)程發(fā)生切換的時(shí)候,線性空間也隨著切換。所以結(jié)論就是每個(gè)進(jìn)程都有自己的線性空間,只有此進(jìn)程運(yùn)行的時(shí)候,其線性空間才被運(yùn)行它的CPU所知。在其它時(shí)刻,其線性空間對于CPU來說,是不可知的。所以盡管每個(gè)進(jìn)程都可以有4 GB的線性空間,但在CPU眼中,只有一個(gè)線性空間的存在。線性空間的變化,隨著進(jìn)程切換而變化。
盡管線性空間的大小和物理內(nèi)存的大小之間沒有任何關(guān)系,但使用線性空間的應(yīng)用程序最終還是要運(yùn)行在物理內(nèi)存中。應(yīng)用所給出的任何線性地址最終必須被轉(zhuǎn)化為物理地址,才能夠真正的訪問物理內(nèi)存。所以,線性內(nèi)存空間必須被映射到物理內(nèi)存空間中,這個(gè)映射關(guān)系需要通過使用硬件體系結(jié)構(gòu)所規(guī)定的數(shù)據(jù)結(jié)構(gòu)來建立。我們不妨先稱其為映射表。一個(gè)映射表的內(nèi)容就是某個(gè)線性內(nèi)存空間和物理內(nèi)存空間之間的映射關(guān)系。OS Kernel一旦告訴某個(gè)CPU一個(gè)映射表的位置,那么這個(gè)CPU需要去訪問一個(gè)線性空間地址時(shí),就根據(jù)這張映射表的內(nèi)容,將這個(gè)線性空間地址轉(zhuǎn)化為物理空間地址,并將此物理地址送到地址線,畢竟地址線只知道物理地址。
所以,我們很容易得出一個(gè)結(jié)論,如果我們給出不同的映射表,那么CPU將某一線性空間地址轉(zhuǎn)化的物理地址也會(huì)不同。所以我們?yōu)槊恳粋(gè)進(jìn)程都建立一張映射表,將每個(gè)進(jìn)程的線性空間根據(jù)自己的需要映射到物理空間上。既然某一時(shí)刻在某一CPU上只能有一個(gè)應(yīng)用在運(yùn)行,那么當(dāng)任務(wù)發(fā)生切換的時(shí)候,將映射表也更換為響應(yīng)的映射表就可以實(shí)現(xiàn)每個(gè)進(jìn)程都有自己的線性空間而互不影響。所以,在任意時(shí)刻,對于一個(gè)CPU來說,也只需要有一張映射表,以實(shí)現(xiàn)當(dāng)前進(jìn)程的線性空間到物理空間的轉(zhuǎn)化。
--------------------------------------------------------------------------------
2. OS Kernel Space & Process Space
由于OS Kernel在任意時(shí)刻都必須存在于內(nèi)存中,而進(jìn)程卻可以切換,所以在任意時(shí)刻,內(nèi)存中都存在兩部分,OS Kernel和用戶進(jìn)程。而在任意時(shí)刻,對于一個(gè)CPU來說只存在一個(gè)線性空間,所以這個(gè)線性空間必須被分成兩部分,一部分供OS Kernel使用,另一部分供用戶進(jìn)程使用。既然OS Kernel在任何時(shí)候都占用線性空間中的一部分,那么對于所有進(jìn)程的線性空間而言,它們?yōu)镺S Kernel所留出的線性空間可以是完全相同的,也就是說,它們各自的映射表中,也分為兩部分,一部分是進(jìn)程私有映射部分,對于OS Kernel映射部分的內(nèi)容則完全相同。
從這個(gè)意義上來說,我們可以認(rèn)為,對于所有的進(jìn)程而言,它們共享OS Kernel所占用的線性空間部分,而每個(gè)進(jìn)程又各自有自己私有的線性空間部分。假如,我們將任意一個(gè)4 GB線性空間分割為1 GB的OS Kernel空間部分和3 GB的進(jìn)程空間部分,那么所有進(jìn)程的4 GB線性空間中1 GB的OS Kernel空間是共享的,而剩余的3 GB進(jìn)程空間部分則是各個(gè)進(jìn)程私有的。Linux就是這么做的,而Windows NT則是讓OS Kernel和進(jìn)程各使用2 GB線性空間。
--------------------------------------------------------------------------------
3. Segment Mapping & Page Mapping
所有的線性空間的內(nèi)容只有被放置到物理內(nèi)存中才能夠被真正的運(yùn)行和操作。所以,盡管OS Kernel和進(jìn)程都被放在線性空間中,但它們最終必須被放置到物理內(nèi)存中。所以O(shè)S Kernel和所有的進(jìn)程都最終共享物理內(nèi)存。在現(xiàn)階段,物理內(nèi)存遠(yuǎn)沒有線性空間那么大——線性空間是4 GB,而物理內(nèi)存空間往往只有幾百兆,甚至更小。另外即使物理內(nèi)存有4 GB,但由于每個(gè)進(jìn)程都可以有3 GB線性空間(假如進(jìn)程私有線性空間是3 GB的話),如果把所有進(jìn)程的線性空間內(nèi)容都放在物理內(nèi)存中,明顯是不現(xiàn)實(shí)的。所以O(shè)S Kernel必須將某些進(jìn)程暫時(shí)用不到的數(shù)據(jù)或代碼放在物理內(nèi)存之外,將有限的內(nèi)存提供給當(dāng)前最需要的進(jìn)程。另外,由于OS Kernel在任何時(shí)候都有可能運(yùn)行,所以O(shè)S Kernel最好被永遠(yuǎn)放在物理內(nèi)存中。我們僅僅將進(jìn)程數(shù)據(jù)進(jìn)行換入換出。
從線性空間到物理空間的映射需要映射表,映射表的內(nèi)容是將某段線性空間映射到相同大小的物理內(nèi)存空間上。從理論上,我們可以使用兩種映射方法:變長映射,和定長映射。變長映射指的是根據(jù)不同的需要,將一個(gè)一個(gè)變長段映射到物理內(nèi)存上,其格式可以如下(線性空間段起始地址,物理空間段起始地址,段長度)。假如一個(gè)進(jìn)程有3個(gè)段:10M的數(shù)據(jù)段,5M的代碼段,和8K的堆棧段,那么就可以在映射表中建立3項(xiàng)內(nèi)容,每一項(xiàng)針對一個(gè)段。這看起來沒有問題。但假如現(xiàn)在我們的實(shí)際的內(nèi)存只有32M,其中10M被內(nèi)核占用,留給進(jìn)程的物理空間只有22M,那么此進(jìn)程在運(yùn)行時(shí),就占據(jù)了10M+5M+8K的內(nèi)存空間。隨后當(dāng)進(jìn)程發(fā)生切換時(shí),假如另一個(gè)進(jìn)程和其有相同的內(nèi)存要求,那么剩余的22M-(10M+5M+8K)明顯就不夠用了,這時(shí)只能將原進(jìn)程的某些段換出,并且必須是整段的換出。這就意味著我們必須至少換出一個(gè)10M的數(shù)據(jù)段,而換出的成本很高,因?yàn)槲覀儽仨殞⑦@10M的內(nèi)容拷貝到磁盤上,磁盤I/O是很慢的。
所以,使用變長的段映射的結(jié)果就是一個(gè)段要么被全部換入,要么被全部換出。但在現(xiàn)實(shí)中,一個(gè)程序中并非所有的代碼和數(shù)據(jù)都能夠被經(jīng)常訪問,往往被經(jīng)常訪問的只占全部代碼數(shù)據(jù)的一部分,甚至是一小部分。所以更有效的策略是我們最好只換出那些并不經(jīng)常使用的部分,而保留那些經(jīng)常被使用的部分。而不是整個(gè)段的換入換出。這樣可以避免大塊的慢速磁盤操作。
這就是定長映射策略,我們將內(nèi)存空間分割為一個(gè)個(gè)定長塊,每個(gè)定長塊被稱為一個(gè)頁。映射表的基本格式為(物理空間頁起始地址),由于頁是定長的,所以不需要指出它的長度,另外,我們不需要在映射表中指定線性地址,我們可以將線性地址作為索引,到映射表中檢索出相應(yīng)的物理地址。當(dāng)使用頁時(shí),其策略為:當(dāng)換出的時(shí)候,我們只將那些不活躍的,也就是不經(jīng)常使用的頁換出,而保留那些活躍的頁。在換入的時(shí)候,只有被請求訪問的頁才被換入,沒有被請求訪問的頁將永遠(yuǎn)不會(huì)被換入到物理內(nèi)存。這就是請求頁(Demand Page)算法的核心思想。
這就引出一個(gè)頁大小的問題:首先我們不可能以字節(jié)為單位,這樣映射表的大小和線性空間大小相同——假如整個(gè)線性空間都被映射的話——我們不可能將全部線性空間用作存放這個(gè)映射表。由此,我們也可以得知,頁越小,則映射表的容量越大。而我們不能讓映射表占用太多的空間。但如果頁太大,則面臨著和不定長段映射同樣的問題,每次換出一個(gè)頁,都需要大量的磁盤操作。另外,由于為一個(gè)進(jìn)程分配內(nèi)存的最小單位是頁,假如我們的頁大小為4 MB,那么即使一個(gè)進(jìn)程只需要使用4 KB的內(nèi)存,也不得不占用整個(gè)4 MB頁,這明顯是一種很大的浪費(fèi)。所以我們必須在兩者之間進(jìn)行折衷,一般平臺(tái)所規(guī)定的頁大小為1 KB到8 KB,IA-32所規(guī)定的頁大小為4 KB。(IA-32也支持4 MB頁,你可以根據(jù)你的OS的用途進(jìn)行選擇,一般都是使用4 KB頁)。
編輯:admin 最后修改時(shí)間:2019-07-31