LINUX設備驅動程序如何與硬件通信
LINUX設備驅動程序是怎么樣和硬件通信的?下面將由學習啦小編帶大家來解答這個疑問吧,希望對大家有所收獲!
LINUX設備驅動程序與硬件設備之間的通信
設備驅動程序是軟件概念和硬件電路之間的一個抽象層,因此兩方面都要討論。到目前為止,我們已經討論詳細討論了軟件概念上的一些細節,現在討論另一方面,介紹驅動程序在Linux上如何在保持可移植性的前提下訪問I/O端口和I/O內存。
我們在需要示例的場合會使用簡單的數字I/O端口來講解I/O指令,并使用普通的幀緩沖區顯存來講解內存映射I/O。
I/O端口和I/O內存
計算機對每種外設都是通過讀寫它的寄存器進行控制的。大部分外設都有幾個寄存器,不管是在內存地址空間還是在I/O地址空間,這些寄存器的訪問地址都是連續的。
I/O端口就是I/O端口,設備會把寄存器映射到I/O端口,不管處理器是否具有獨立的I/O端口地址空間。即使沒有在訪問外設時也要模擬成讀寫I/O端口。
I/O內存是設備把寄存器映射到某個內存地址區段(如PCI設備)。這種I/O內存通常是首先方案,它不需要特殊的處理器指令,而且CPU核心訪問內存更有效率。
I/O寄存器和常規內存
盡管硬件寄存器和內存非常相似,但程序員在訪問I/O寄存器的時候必須注意避免由于CPU或編譯器不恰當的優化而改變預期的I/O動作。
I/O寄存器和RAM最主要的區別就是I/O操作具有邊際效應,而內存操作則沒有:由于內存沒有邊際效應,所以可以用多種方法進行優化,如使用高速緩存保存數值、重新排序讀/寫指令等。
編譯器能夠將數值緩存在CPU寄存器中而不寫入內存,即使儲存數據,讀寫操作也都能在高速緩存中進行而不用訪問物理RAM。無論是在編譯器一級或是硬件一級,指令的重新排序都有可能發生:一個指令序列如果以不同于程序文本中的次序運行常常能執行得更快。
在對常規內存進行這些優化的時候,優化過程是透明的,而且效果良好,但是對I/O操作來說這些優化很可能造成致命的錯誤,這是因為受到邊際效應的干擾,而這卻是驅動程序訪問I/O寄存器的主要目的。處理器無法預料某些其它進程(在另一個處理器上運行,或在在某個I/O控制器中發生的操作)是否會依賴于內存訪問的順序。編譯器或CPU可能會自作聰明地重新排序所要求的操作,結果會發生奇怪的錯誤,并且很難調度。因此,驅動程序必須確保不使用高速緩沖,并且在訪問寄存器時不發生讀或寫指令的重新排序。
由硬件自身引起的問題很解決:只要把底層硬件配置成(可以是自動的或是由Linux初始化代碼完成)在訪問I/O區域(不管是內存還是端口)時禁止硬件緩存即可。
由編譯器優化和硬件重新排序引起的問題的解決辦法是:對硬件(或其他處理器)必須以特定順序的操作之間設置內存屏障(memory barrier)。Linux提供了4個宏來解決所有可能的排序問題:
#include <linux/kernel.h>
void barrier(void)
這個函數通知編譯器插入一個內存屏障,但對硬件沒有影響。編譯后的代碼會把當前CPU寄存器中的所有修改過的數值保存到內存中,需要這些數據的時候再重新讀出來。對barrier的調用可避免在屏障前后的編譯器優化,但硬件完成自己的重新排序。
#include <asm/system.h>
void rmb(void);
void read_barrier_depends(void);
void wmb(void);
void mb(void);
這些函數在已編譯的指令流中插入硬件內存屏障;具體實現方法是平臺相關的。rmb(讀內存屏障)保證了屏障之前的讀操作一定會在后來的讀操作之前完成。wmb保證寫操作不會亂序,mb指令保證了兩者都不會。這些函數都是barrier的超集。
void smp_rmb(void);
void smp_read_barrier_depends(void);
void smp_wmb(void);
void smp_mb(void);
上述屏障宏版本也插入硬件屏障,但僅僅在內核針對SMP系統編譯時有效;在單處理器系統上,它們均會被擴展為上面那些簡單的屏障調用。
設備驅動程序中使用內存屏障的典型形式如下:
writel(dev->registers.addr, io_destination_address);
writel(dev->registers.size, io_size);
writel(dev->registers.operation, DEV_READ);
wmb();
writel(dev->registers.control, DEV_GO);
在這個例子中,最重要的是要確保控制某種特定操作的所有設備寄存器一定要在操作開始之前已被正確設置。其中的內存屏障會強制寫操作以要求的順序完成。
因為內存屏障會影響系統性能,所以應該只用于真正需要的地方。不同類型的內存屏障對性能的影響也不盡相同,所以最好盡可能使用最符合需要的特定類型。
值得注意的是,大多數處理同步的內核原語,如自旋鎖和atomic_t操作,也能作為內存屏障使用。同時還需要注意,某些外設總線(比如PCI總線)存在自身的高速緩存問題,我們將在后面的章節中討論相關問題。
在某些體系架構上,允許把賦值語句和內存屏障進行合并以提高效率。內核提供了幾個執行這種合并的宏,在默認情況下,這些宏的定義如下:
#define set_mb(var, value) do {var = value; mb();} while 0
#define set_wmb(var, value) do {var = value; wmb();} while 0
#define set_rmb(var, value) do {var = value; rmb();} while 0
在適當的地方,<asm/system.h>中定義的這些宏可以利用體系架構特有的指令更快的完成任務。注意只有小部分體系架構定義了set_rmb宏。
使用I/O端口
I/O端口是驅動程序與許多設備之間的通信方式——至少在部分時間是這樣。本節講解了使用I/O端口的不同函數,另外也涉及到一些可移植性問題。
I/O端口分配
下面我們提供了一個注冊的接口,它允允許驅動程序聲明自己需要操作的端口:
#include <linux/ioport.h>
struct resource *request_region(unsigned long first, unsigned long n, const char *name);
它告訴內核,我們要使用起始于first的n個端口。name是設備的名稱。如果分配成功返回非NULL,如果失敗返回NULL。
所有分配的端口可從/proc/ioports中找到。如果我們無法分配到我們要的端口集合,則可以查看這個文件哪個驅動程序已經分配了這些端口。
如果不再使用這些端口,則用下面函數返回這些端口給系統:
void release_region(unsigned long start, unsigned long n);
下面函數允許驅動程序檢查給定的I/O端口是否可用:
int check_region(unsigned long first, unsigned long n);//不可用返回負的錯誤代碼
我們不贊成用這個函數,因為它返回成功并不能確保分配能夠成功,因為檢查和其后的分配并不是原子操作。我們應該始終使用request_region,因為這個函數執行了必要的鎖定,以確保分配過程以安全原子的方式完成。
操作I/O端口
當驅動程序請求了需要使用的I/O端口范圍后,必須讀取和/或寫入這些端口。為此,大多數硬件都會把8位、16位、32位區分開來。它們不能像訪問系統內存那樣混淆使用。
因此,C語言程序必須調用不同的函數訪問大小不同的端口。那些只支持映射的I/O寄存器的計算機體系架構通過把I/O端口地址重新映射到內存地址來偽裝端口I/O,并且為了易于移植,內核對驅動程序隱藏了這些細節。Linux內核頭文件中(在與體系架構相關的頭文件<asm/io.h>中)定義了如下一些訪問I/O端口的內聯函數:
unsigned inb(unsigned port);
void outb(unsigned char byte, unsigned port);
字節讀寫端口。
unsigned inw(unsigned port);
void outw(unsigned short word, unsigned port);
訪問16位端口
unsigned inl(unsigned port);
void outl(unsigned longword, unsigned port);
訪問32位端口
在用戶空間訪問I/O端口
上面這些函數主要是提供給設備驅動程序使用的,但它們也可以用戶空間使用,至少在PC類計算機上可以使用。GNU的C庫在<sys/io.h>中定義了這些函數。如果要要用戶空間使用inb及相關函數,則必須滿足正下面這些條件:
編譯程序時必須帶有-O選項來強制內聯函數的展開。
必須用ioperm(獲取單個端口的權限)或iopl(獲取整個I/O空間)系統調用來獲取對端口進行I/O操作的權限。這兩個函數都是x86平臺特有的。
必須以root身份運行該程序才能調用ioperm或iopl。或者進程的祖先進程之一已經以root身份獲取對端口的訪問。
如果宿主平臺沒有以上兩個系統調用,則用戶空間程序仍然可以使用/dev/port設備文件訪問I/O端口。不過要注意,該設備文件的含義與平臺密切相關,并且除PC平臺以處,它幾乎沒有什么用處。
串操作
以上的I/O操作都是一次傳輸一個數據,作為補充,有些處理器實現了一次傳輸一個數據序列的特殊指令,序列中的數據單位可以是字節、字、雙字。這些指令稱為串操作指令,它們執行這些任務時比一個C語言編寫的循環語句快得多。下面列出的宏實現了串I/O:
void insb(unsigned port, void *addr, unsigned long count);
void outsb(unsigned port, void *addr, unsigned long count);從內存addr開始連續讀/寫count數目的字節。只對單一端口port讀取或寫入數據
void insw(unsigned port, void *addr, unsigned long count);
void outsw(unsigned port, void *addr, unsigned long count);對一個16位端口讀寫16位數據
void insl(unsigned port, void *addr, unsigned long count);
void outsl(unsigned port, void *addr, unsigned long count);對一個32位端口讀寫32位數據
在使用串I/O操作函數時,需要銘記的是:它們直接將字節流從端口中讀取或寫入。因此,當端口和主機系統具有不同的字節序時,將導致不可預期的結果。使用inw讀取端口將在必要時交換字節,以便確保讀入的值匹配于主機的字節序。然而,串函數不會完成這種交換。
暫停式I/O
在處理器試圖從總線上快速傳輸數據時,某些平臺(特別是i386)就會出現問題。當處理器時鐘比外設時鐘(如ISA)快時就會出現問題,并且在設備板上特別慢時表現出來。為了防止出現丟失數據的情況,可以使用暫停式的I/O函數來取代通常的I/O函數,這些暫停式的I/O函數很像前面介紹的那些I/O函數,不同之處是它們的名字用_p結尾,如inb_p、outb_p等等。在linux支持的大多數平臺上都定義了這些函數,不過它們常常擴展為非暫停式I/O同樣的代碼,因為如果不使用過時的外設總線就不需要額外的暫停。
平臺相關性
I/O指令是與處理器密切相關的。因為它們的工作涉及到處理器移入移出數據的細節,所以隱藏平臺間的差異非常困難。因此,大部分與I/O端口相關的源代碼都與平臺相關。
回顧前面函數列表可以看到有一處不兼容的地方,即數據類型。函數的參數根據各平臺體系架構上的不同要相應地使用不同的數據類型。例如,port參數在x86平臺上(處理器只支持64KB的I/O空間)上定義為unsigned short,但在其他平臺上定義為unsigned long,在這些平臺上,端口是與內存在同一地址空間內的一些特定區域。
感興趣的讀者可以從io.h文件獲得更多信息,除了本章介紹的函數,一些與體系架構相關的函數有時也由該文件定義。
值得注意的是,x86家族之外的處理器都不為端口提供獨立的地址空間。
I/O操作在各個平臺上執行的細節在對應平臺的編程手冊中有詳細的敘述;也可以從web上下載這些手冊的PDF文件。
I/O端口示例
演示設備驅動程序的端口I/O的示例代碼運行于通用的數字I/O端口上,這種端口在大多數計算機平臺上都能找到。
數字I/O端口最常見的一種形式是一個字節寬度的I/O區域,它或者映射到內存,或者映射到端口。當把數字寫入到輸出區域時,輸出引腳上的電平信號隨著寫入的各位而發生相應變化。從輸入區域讀取到的數據則是輸入引腳各位當前的邏輯電平值。
這類I/O端口的具體實現和軟件接口是因系統而異的。大多數情況下,I/O引腳由兩個I/O區域控制的:一個區域中可以選擇用于輸入和輸出的引腳,另一個區域中可以讀寫實際的邏輯電平。不過有時情況簡單些,每個位不是輸入就是輸出(不過這種情況下就不能稱為“通用I/O"了);在所有個人計算機上都能找到的并口就是這樣的非通用的I/O端口。
并口簡介
并口的最小配置由3個8位端口組成。第一個端口是一個雙向的數據寄存器,它直接連接到物理連接器的2~9號引腳上。第二個端口是一個只讀的狀態寄存器;當并口連接打印機時,該寄存器報告打印機狀態,如是否是線、缺紙、正忙等等。第三個端口是一個只用于輸出的控制寄存器,它的作用之一是控制是否啟用中斷。
如下所示:并口的引腳
示例驅動程序
while(count--) {
outb(*(ptr++), port);
wmb();
}
使用I/O內存
除了x86上普遍使的I/O端口之外,和設備通信的另一種主要機制是通過使用映射到內存的寄存器或設備內存,這兩種都稱為I/O內存,因為寄存器和內存的差別對軟件是透明的。
I/O內存僅僅是類似RAM的一個區域,在那里處理器可以通過總線訪問設備。這種內存有很多用途,比如存放視頻數據或以太網數據包,也可以用來實現類似I/O端口的設備寄存器(也就是說,對它們的讀寫也存在邊際效應)。
根據計算機平臺和所使用總線的不同,i/o內存可能是,也可能不是通過頁表訪問的。如果訪問是經由頁表進行的,內核必須首先安排物理地址使其對設備驅動程序可見(這通常意味著在進行任何I/O之前必須先調用ioremap)。如果訪問無需頁表,那么I/O內存區域就非常類似于I/O端口,可以使用適當形式的函數讀取它們。
不管訪問I/O內存是否需要調用ioremap,都不鼓勵直接使用指向I/O內存的指針。相反使用包裝函數訪問I/O內存,這一方面在所有平臺上都是安全的,另一方面,在可以直接對指針指向的內存區域執行操作的時候,這些函數是經過優化的。并且直接使用指針會影響程序的可移植性。
I/O內存分配和映射
在使用之前,必須首先分配I/O區域。分配內存區域的接口如下(在<linux/ioport.h>中定義):
struct resource *request_mem_region(unsigned long start, unsigned long len, char *name);
該函數從start開始分配len字節長的內存區域。如果成功返回非NULL,否則返回NULL值。所有的I/O內存分配情況可從/proc/iomem得到。
不再使用已分配的內存區域時,使用如下接口釋放:
void release_mem_region(unsigned long start, unsigned long len);
下面函數用來檢查給定的I/O內存區域是否可用的老函數:
int check_mem_region(unsigned long start, unsigned long len);//這個函數和check_region一樣不安全,應避免使用
分配內存之后我們還必須確保該I/O內存對內存而言是可訪問的。獲取I/O內存并不意味著可引用對應的指針;在許多系統上,I/O內存根本不能通過這種方式直接訪問。因此,我們必須由ioremap函數建立映射,ioremap專用于為I/O內存區域分配虛擬地址。
我們根據以下定義來調用ioremap函數:
#include <asm/io.h>
void *ioremap(unsigned long phys_addr, unsigned long size);
void *ioremap_nocache(unsigned long phys_addr, unsigned long size);在大多數計算機平臺上,該函數和ioremap相同:當所有I/O內存已屬于非緩存地址時,就沒有必要實現ioremap的獨立的,非緩沖版本。
void iounmap(void *addr);
記住,由ioremap返回的地址不應該直接引用,而應該使用內核提供的accessor函數。
訪問I/O內存
在某些平臺上我們可以將ioremap的返回值直接當作指針使用。但是,這種使用不具有可移植性,訪問I/O內存的正確方法是通過一組專用于些目的的函數(在<asm/io.h>中定義)。
從I/O內存中讀取,可使用以下函數之一:
unsigned int ioread8(void *addr);
unsigned int ioread16(void *addr);
unsigned int ioread32(void *addr);
其中,addr是從ioremap獲得的地址(可能包含一個整數偏移量);返回值是從給定I/O內存讀取到的值。
寫入I/O內存的函數如下:
void iowrite8(u8 value, void *addr);
void iowrite16(u16 value, void *addr);
void iowrite32(u32 value, void *addr);
如果必須在給定的I/O內存地址處讀/寫一系列值,則可使用上述函數的重復版本:
void ioread8_rep(void *addr, void *buf, unsigned long count);
void ioread16_rep(void *addr, void *buf, unsigned long count);
void ioread32_rep(void *addr, void *buf, unsigned long count);
void iowrite8_rep(void *addr, const void *buf, unsigned long count);
void iowrite16_rep(void *addr, const void *buf, unsigned long count);
void iowrite32_rep(void *addr, const void *buf, unsigned long count);
上述函數從給定的buf向給定的addr讀取或寫入count個值。count以被寫入數據的大小為單位。
上面函數均在給定的addr處執行所有的I/O操作,如果我們要在一塊I/O內存上執行操作,則可以使用下面的函數:
void memset_io(void *addr, u8 value, unsigned int count);
void memcpy_fromio(void *dest, void *source, unsigned int count);
void memcpy_toio(void *dest, void *source, unsigned int count);
上述函數和C函數庫的對應函數功能一致。
像I/O內存一樣使用I/O端口
某些硬件具有一種有趣的特性:某些版本使用I/O端口,而其他版本則使用I/O內存。導出給處理器的寄存器在兩種情況下都是一樣的,但訪問方法卻不同。為了讓處理這類硬件的驅動程序更加易于編寫,也為了最小化I/O端口和I/O內存訪問這間的表面區別,2.6內核引入了ioport_map函數:
void *ioport_map(unsigned long port, unsigned int count);
該函數重新映射count個I/O端口,使其看起來像I/O內存。此后,驅動程序可在該函數返回的地址上使用ioread8及其相關函數,這樣就不必理會I/O端口和I/O內存之間的區別了。
當不需要這種映射時使用下面函數一撤消:
void ioport_unmap(void *addr);
這些函數使得I/O端口看起來像內存。但需要注意的是,在重新映射之前,我們必須通過request_region來分配這些I/O端口。
為I/O內存重用short
前面介紹的short示例模塊訪問的是I/O端口,它也可以訪問I/O內存。為此必須在加載時通知它使用I/O內存,另外還要修改base地址以使其指向I/O區域。
下例是在MIPS開發板上點亮調試用的LED:
mips.root# ./short_load use_mem=1 base = 0xb7ffffc0
mips.root# echo -n 7 > /dev/short0
下面代碼是short寫入內存區域時使用的循環:
while(count--) {
iowrite8(*ptr++, address);
wmb();
}
1MB地址空間之下的ISA內存
最廣為人知的I/O內存區之一就是個人計算機上的ISA內存段。它的內存范圍在64KB(0xA0000)到1MB(0x100000)之間,因此它正好出現在常規系統RAM的中間。這種地址看上去有點奇怪,因為這個設計決策是20世紀80年代早期作出的,在當時看來沒有人會用到640KB以上的內存。
LINUX設備驅動程序如何與硬件通信





上一篇:java語言怎么寫硬件接口編程
下一篇:智能硬件如何選擇無線通信協議