我們經(jīng)常可以看到初學(xué)者在單片機論壇中詢問他們是否可以在他們微不足道的小的8位微機中運行Linux。這些問題的結(jié)果通常是帶來笑聲。我們也經(jīng)??吹?,在Linux論壇中,詢問Linux運行的最低要求是什么。常見的答案是Linux需要一個32位架構(gòu)和一個MMU(存儲器管理單元),并至少1MB的RAM來滿足內(nèi)核的需求。
考慮到8位的單個芯片比32位芯片要便宜很多的事實,8位的出貨量其實遠高于32位的。
打個直觀的比方,現(xiàn)在我們有了高鐵,是不是所有傳統(tǒng)的普快、特快火車都要立即淘汰呢?
顯然事實并非如此,至于原因就太多了?,F(xiàn)實情況就是8位MCU曾經(jīng)的應(yīng)用領(lǐng)域并不能立即用32位的MCU直接替代。
本項目旨在(并且成功)粉碎這些概念。下圖中您所看到的開發(fā)板基于ATmega1284P。我(歪果仁)還制作了一塊基于ATmega644a的開發(fā)板,也同樣獲得了成功。該開發(fā)板沒有使用其他處理器,啟動Linux 2.6.34內(nèi)核。事實上,它甚至可以運行一個完整的Ubuntu棧,包括X(如果你有時間等它啟動)和gnome。
RAM(隨即存取存儲器)
是的,沒錯,完整的Linux安裝需要數(shù)兆字節(jié)的RAM和32位帶有MMU的CPU。本項目擁有這一切。首先,讓我們訪問RAM。正如您所看到的,在電路中有一塊古董級的30引腳SIMM內(nèi)存模塊。這些是基于80286的PC曾經(jīng)使用的。它通過接口和ATmega連接,我寫代碼來訪問它并按照規(guī)格刷新它(SDRAM需要恒定速率刷新以避免丟失數(shù)據(jù))。它到底有多快呢?刷新中斷每62ms發(fā)生一次,占用時間1.5ms,因此占用3%以下的CPU。訪問RAM,為了便于編程,一次訪問一個字節(jié)。這樣產(chǎn)生的最大帶寬約為300KBps。
存 儲
對于RAM需要工作在休眠狀態(tài),我們有兩件事要處理。存儲并不是太難解決的問題。使用SPI可以十分容易的與SD卡交互,我的項目中做到了這一點。一個1GB的SD卡可以工作的很好,雖然512MB就已經(jīng)滿足這一特殊的文件系統(tǒng)(Ubuntu Jaunty)。ATmega擁有一個硬件SPI模塊,但無論出于何種原因,它工作的不是十分順暢,因此我將這個接口進行位拆裂。它仍然足夠塊——大約200KBps。這對項目來說還非常有意義——它能夠在有足夠管腳的任何微控制器上實現(xiàn),而不用使用其他硬件模塊。
CPU(中央處理單元)
所有剩下的就是那個32位CPU和MMU需求。不過AVR沒有MMU,并且它是8位的。為了克服這一困難,我編寫了一款A(yù)RM仿真器。ARM是我最熟悉的架構(gòu),并且它足夠簡單,可以讓我很舒服的為它編寫出一個仿真器。為什么要編寫一個,而不是移植一個呢?好吧,移植別人的代碼是沒有樂趣的,再加上我看到?jīng)]有將仿真器輕松移植到8位設(shè)備上的書面資料。原因之一:AVR編譯器堅持16位處理整數(shù)將會給你帶來麻煩,如簡單的“(1<<20)”,產(chǎn)生0。你需要用“1UL<<20”。不必要的說,困擾其他人的未知基本代碼尋遍所有的地方,整數(shù)都被假定并將會失敗,這將是一個災(zāi)難。另外,我想用這個機會編寫一款很好的模塊化ARM仿真器。所以我付諸行動。
其他功能
電路板通過一個串行端口和真實世界進行通信。目前,它通過串行端口連接到我PC運行的minicom上,但是它可測的替代連接是連接到電路上的一個鍵盤和一個字符LCD,可以使其完全獨立。電路板上還有兩個LED。它們指示SD卡的訪問情況。一個代表讀操作,一個代表寫操作。電路板上還有一個按鈕。當(dāng)按下并按住1秒時它將使串行端口脫離仿真的CPU的當(dāng)前有效速度。AVR的主頻是24MHz(超過原有20MHz的輕微超頻)。
它的速度有多快?
uARM肯定沒有速率守護進程。它花了大約2個小時啟動到BASH提示符("init=/bin/bash"內(nèi)核命令行)。然后用4個多小時啟動整個Ubuntu("exec init"然后登陸)。啟動X將消耗更長時間。有效的仿真CPU速度約為6.5KHz,這與你期望的在一個可憐的8位微控制器上仿真一個32位CPU和MMU是同等的水平。奇怪的是,一旦啟動,該系統(tǒng)是有些可用的。您可以輸入一個命令,并在一分鐘之內(nèi)得到答復(fù)。也就是說實際上你是可以使用它的。比如,今天我還用它來格式化我的SD卡。這絕對不是最快的,但我覺得它可能是最便宜、最慢、最簡單的手工組裝、最低的部件數(shù)量以及最低端的Linux PC。電路板是使用導(dǎo)線手工焊接的,甚至沒有使用印刷電路板(PCB)的必要。
仿真器的細節(jié)?
仿真器是相當(dāng)模塊化的,允許它隨意擴展仿真其他SoC(片上系統(tǒng))和硬件配置。仿真的CPU是ARMv5TE。前一段時間,我開始進行支持ARMv6的工作,但是一直沒有完成(從代碼中可以看出來),因為不是很需要。仿真的SoC是PXA255。由于模塊化的設(shè)計,你可以替換SoC.c文件,并使用相同的ARMv5TE核心編譯一個完整的新的SoC,或者替換核心,或者按照意愿替換外設(shè)。這是有目的的,我的意思是這個代碼也是一個關(guān)于ARM SoC如何工作的相當(dāng)整潔的范例。CPU仿真器自身的代碼并不是太整潔,那么,好吧,它是一個CPU模擬器。這是幾年前花了超過6個月的空閑時間寫的,然后就放在一邊了。它最近復(fù)活是專門為了這個項目。仿真器實現(xiàn)了i-cache來提高速度。這給予了AVR很多幫助,使內(nèi)部存儲器能夠以超過每秒5MB的速率訪問,而不像我的外部RAM。我還沒有抽出時間去實現(xiàn)d-cache(數(shù)據(jù)緩存),但是這已經(jīng)在我的待辦事項列表上了。訪問塊設(shè)備沒有被仿真為SD設(shè)備。事實證明這太慢了。取而代之的是一個準虛擬化磁盤設(shè)備(pvdisk,參見pvDisk.tar.bz2,GPL許可證),我編寫的時候使用了一個無效的操作碼來調(diào)入仿真器并訪問磁盤。我的鏡像中的ramdisk(虛擬磁盤)加載這個pvdisk,然后改變根目錄到/dev/pvd1。
ramdisk被包含在了“rd.img”中。我使用的“機器類型”是PalmTE2。為什么?因為我非常熟悉這款硬件,它是我見到的第一款PXA255機器類型。
Hypercall(超級調(diào)用)?
有一些服務(wù)你可以通過使用一個特殊的操作碼向仿真器發(fā)出請求。在ARM中它是0xF7BBBBBB,在Thumb中它是0xBBBB。挑選這些是由于它們所在的范圍ARM保證是未定義的。超級調(diào)用號碼通過寄存器R12被傳遞,參數(shù)通過寄存器R0-R3被傳遞,返回值被放置在R0中。
調(diào)用:
· 0 = 停止仿真
· 1 = 打印十進制數(shù)
· 2 = 打印字符
· 3 = 獲取RAM大小
· 4 = 塊設(shè)備操作(R0 = 操作,R1 = 扇區(qū)(sector)號)。請注意,這些不寫入仿真的RAM,它們使用另一個超級調(diào)用填充了仿真用戶訪問的仿真器內(nèi)部緩沖區(qū),一次一個字。我的意思是實現(xiàn)DMA,但是還沒有抽出時間去做。
操作:
· 0 = 獲取信息(如果扇區(qū)號是0,返回扇區(qū)的數(shù)量;如果扇區(qū)號是1,以字節(jié)位單位返回扇區(qū)大小)
· 1 = 扇區(qū)讀取
· 2 = 扇區(qū)寫入
· 5 = 塊設(shè)備緩沖區(qū)訪問(R0 = 值輸入/值輸出,R1 = 字數(shù),R2 = 如果寫入為1,其他情況為0)
Thumb支持?
完全支持Thumb。我欺騙了一下,解碼每個Thumb指令字符串(instr)為等價的ARM指令字符串并執(zhí)行,以此代替使用ARM仿真器函數(shù)。它不像它原來一樣快,但是它簡單并且代碼小巧??梢允褂?56KB的查找表,但是我感覺256KB對于微控制器的閃存來說太大了。一些Thumb指令不能被轉(zhuǎn)換為ARM指令,它們被正確處理代替。
我想要建立一個!
用于非商業(yè)目的,你肯定可以做到這一點。接線方式如下:
· RAM的DQ0-DQ7連接AVR的C0-C7;
· RAM的A0-A7連接AVR的A0-A7;
· RAM的A8-A11連接AVR的B0-B3;
· RAM的nRAM nRAS nCAS nWE連接AVR的D7 B4 B5;
· SD的DI SCK DO連接AVR的B6 B7 D6;
· LED的read write連接AVR的D2 D3(LED的其他管腳接地);
· 按鈕連接AVR的D4(其他管腳接地)。
RAM可以是任何30引腳的16MB的SIMM,可以運行在每64毫秒4000個周期的CAS-before-RAS刷新頻率下。我使用的(OWC)可以花幾塊錢在網(wǎng)上買到。原理圖顯示在這里,點擊可以放大。
源代碼?
這個代碼有點兒亂,但是它可以工作(代碼國內(nèi)無法下載)。要在PC上建立仿真器并進行嘗試輸入“make”。要運行使用“./uARM DISK_IMAGE”。要建立優(yōu)化的PC版本使用“make BUILD=opt”。要建立AVR運行的版本使用“make BUILD=avr”。現(xiàn)在,它的編譯目標是ATmega1284P。要以ATmega644為編譯目標,除了要修改makefile,減少icache.h中的數(shù)字以便于i-cache足夠小來配合644內(nèi)部的RAM。在歸檔文件中還包括用于1284p最終的hex文件。
啟動過程
要在AVR中保留代碼空間,幾乎沒有啟動代碼存在于仿真器中。事實上,“ROM”總共50字節(jié):8字節(jié)用來選擇Thumb模式,一些Thumb代碼要讀取SD卡的第一個扇區(qū)并跳到Thumb模式(參看embeddedBoot.c)。SD卡的MBR有另一個bootloader(在Thumb模式下寫入)。這個bootloader看著MBR,找到活動分區(qū)并加載它的內(nèi)容到RAM的末尾。然后,它跳到目的RAM地址+512(參看mbrBoot.c)。這里運行著第三個,也是最大的bootloader,ELLE(參看ELLE.c)。這個bootloader重新定位了ramdisk,建立ATAGS,并調(diào)用內(nèi)核。我提供了所有的二進制文件和源代碼以便于大家能夠按照意愿制作您自己鏡像。啟動過程會讓人回憶起PC開機。:)包含的mkbooting.sh工具可以用來制作用于啟動分區(qū)的工作鏡像。