您好,登錄后才能下訂單哦!
小編給大家分享一下Linux內核輸出中文字符的案例,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
你在Windows/MacOS的登錄Linux的SSH終端上很容易輸入中文并且獲得中文輸出,比如下面這樣:
但是卻幾乎不可能將中文顯示在Linux自身的 虛擬終端 上:
[root@localhost font]# echo 皮鞋 >/dev/tty2
顯示了兩個問號,顯然Linux內核并不能識別中文。
為什么說是Linux內核不能識別中文呢?這里需要理清一個關系:
你在遠程SSH終端上的輸入和顯示輸出的行為,都是SSH終端的宿主機完成的,比如Windows,MacOS,和Linux無關。
你在Linux本地虛擬終端,比如/dev/tty1上的輸入和顯示輸出行為,則是由Linux內核自己處理的。
比如,我在MacOS用iTerm SSH連接到了一個遠程CentOS Linux,iTerm上的所有的鍵盤輸入,顯示器輸出行為都是iTerm的這臺MacOS宿主機完成的。
相反,如果你直接在這臺CentOS Linux的虛擬終端上輸入并且企圖獲得輸出,那么這個輸入輸出則必須由Linux內核自身來處理。
基本上就這些。至于說為什么Linux內核不支持中文,那要了解Linux內核處理虛擬終端輸入輸出時是如何對待unicode的邏輯,這要涉及一大堆的理論知識,非常煩人。
反正我這里就是無法輸出中文,我也不是做這個的,顯然這不是一個必然要完成的工作任務,所以,我只是玩玩。
本文的目標就是要讓Linux的虛擬終端可以輸出中文。
僅僅是輸出中文,哪怕是一個中文漢字也好。具體來講,就是 當我在鍵盤敲入'A'字符時,顯示器回顯出來的是一個漢字。
所以說,本文并不打算 讓Linux內核大規模完備地支持中文 ,這種事已經有很多人和社區做了,但是可玩性并不高,畢竟這種事是可以當私活兒賺錢的,只要是賺錢的活兒,可玩性就不高,因為要快嘛。
不需要懂冗長枯燥的unicode編碼,不需要懂枯燥的font字體格式,看看怎么玩。
先展示效果吧,下面是一個
不是很好看,于是就做了下面一個
下面說一下這是如何實現的。
從你敲鍵盤的某個按鍵開始,到某個字符最終顯示在虛擬終端的顯示器上,這期間其實有兩個映射:
鍵盤和字符集的映射
將某個按鍵事件轉換為某個字符集里的某個碼,比如當按下'A'鍵時,將其映射到0x41。
字符集和字體的映射
將某個字符集的碼字映射到某個點陣用來顯示。比如將0x41映射到能讓人看出來是一個字符'A'的樣子的
Linux的console并不能識別超過0x00ff的字符集碼字,因此就不能處理碼字超過0x00ff的unicode,如果希望它能做到,這就要改內核代碼了。
剛才說了,修改內核代碼大規模全面支持中文,這是可以賺錢的事,不但沒意思,也沒人會分享。
所以我嘗試去修改上面的兩個映射來解決問題。由于只是顯示,所以我不會去修改 鍵盤和字符集的映射 ,因為那樣仍然會碰到字符集碼字超過0x00ff的處理問題。
這意味著要想顯示中文,只剩下一條路,那就是修改 字符集和字體的映射 !
這個映射肯定是保存在內核內存或者文件系統的某個地方。我可以在當前內核的config文件里找到如下的信息:
[root@localhost font]# cat /boot/config-3.10.0-862.11.6.el7.x86_64 |grep FONT # CONFIG_FONTS is not set CONFIG_FONT_8x8=y CONFIG_FONT_8x16=y
再去看/proc/kallsyms里有什么:
[root@localhost font]# cat /proc/kallsyms |grep font.*8x ffffffffb006a3e0 R font_vga_8x8 ffffffffb006a420 r fontdata_8x8 ffffffffb006ac20 R font_vga_8x16 ffffffffb006ac60 r fontdata_8x16 ffffffffb0307a10 r __ksymtab_font_vga_8x16 ffffffffb03234b8 r __kcrctab_font_vga_8x16 ffffffffb034246e r __kstrtab_font_vga_8x16
嗯,這就是內核里保存的字體:
[root@localhost rh]# ll ./drivers/video/console/font_8x* -rw-r--r--. 1 root root 95976 Sep 17 2018 ./drivers/video/console/font_8x16.c -rw-r--r--. 1 root root 50858 Sep 17 2018 ./drivers/video/console/font_8x8.c
這里不再分析這兩個文件。這里僅僅是確認了一個事實, 內核在初始化的時候會使用自己的字體 ,這個時候畢竟除了內核本身,什么都沒有。
問題是到了用戶態,這個字體是可以被改變的,可以被改的花里胡哨的,這些個字體可不是僅僅兩個8x8和8x16就能hold住的…
這個時候就需要找我們安裝在發行版里面的字體文件了。我們要找到它,然后改掉里面的某個字體的形狀,將其變成中文!就這么簡單。
不必去搜這個字體文件安裝保存在什么地方,通過執行strace setfont命令就能找到它。
[root@localhost ~]# strace -F -e trace=open setfont ... strace: Process 6276 attached [pid 6276] open("/etc/ld.so.cache", O_RDONLY|O_CLOEXEC) = 4 ... [pid 6276] open("/lib/kbd/consolefonts/default8x16.psfu.gz", O_RDONLY|O_NOCTTY|O_NONBLOCK) = 4 [pid 6276] +++ exited with 0 +++ --- SIGCHLD {si_signo=SIGCHLD, si_code=CLD_EXITED, si_pid=6276, si_uid=0, si_status=0, si_utime=0, si_stime=0} --- +++ exited with 0 +++
就是它了, /lib/kbd/consolefonts/default8x16.psfu.gz
也不必去搜psfu格式的字體的format,通過模式識別就能找到特定的字符。
我準備先找到 ‘A',然后把它后面的'B'和'C'改成我的名字“趙”和“亞”。
首先我要把“趙”和“亞”字做出來,形成一個點陣。以下是我的作品“趙”:
00000000 00000000 00100000 11111000 00100101 00100101 11111010 00100011 00111010 01100101 01100000 10011000 10000111 00000000 00000000 00000000
下面就要用這個點陣替換'B'的點陣,同時制作一個“亞”字,替換'C'的點陣,
在下面的站點可以找到該default font的對應點陣圖解:
https://www.zap.org.au/software/fonts/console-fonts-distributed/psftx-centos-7.5/default8x16.psfu.large.pdf
我們就可以得到該'A'字符的點陣數組,然后在default8x16.psfu文件里匹配這個數組就可以了。代碼如下:
#include <stdio.h> #include <stdlib.h> #include <fcntl.h> #include <linux/fb.h> #include <string.h> unsigned char zhaoya[32] = { // 第一行為“趙” 0x00, 0x00, 0x20, 0xf8, 0x25, 0x25, 0xfa, 0x23, 0x3a, 0x65, 0x60, 0x98, 0x87, 0x00, 0x00, 0x00, // 第二行為亞 0x00, 0x00, 0x00, 0x7e, 0x24, 0x24, 0x24, 0xa5, 0xa5, 0x66, 0x24, 0x24, 0x7e, 0x00, 0x00, 0x00 }; int main(int argc, char **argv) { int i = 0; unsigned char buf[16]; off_t offset = 0; int s = 0; int fd = open("default8x16.psfu", O_RDWR); i = pread(fd, buf, 8, offset); while (1) { i = pread(fd, buf, 16, offset); if (s == 2) { // 替換'C' memcpy (buf, &zhaoya[16], 16); i = pwrite(fd, buf, 16, offset); break; } if (s == 1) { // 替換'B' memcpy (buf, &zhaoya[0], 16); pwrite(fd, buf, 16, offset); s = 2; } // 簡易的方法識別到'A' if (buf[0] == 0x00 && buf[1] == 0x00 && buf[2] == 0x10 && buf[3] == 0x38) { printf("A found at %d !\n", offset); s = 1; } offset += 16; } }
直接編譯執行,然后將這個default8x16.psfu作為參數set到內核即可:
[root@localhost font]# setfont ./default8x16.psfu
此時進入Linux的虛擬終端tty2,當敲鍵盤的大寫'B'時,就會出現一個“趙”字。
雖然
于是我要找一個更高分辨率的font。我在Ubuntu上找到了一個高分辨率的
https://www.zap.org.au/software/fonts/console-fonts-distributed/psftx-debian-9.4/Lat7-VGA28x16.psf.pdf
我不需要自己做
https://graphemica.com/
替換font的代碼如下:
#include <stdio.h> #include <stdlib.h> #include <fcntl.h> #include <string.h> #include "zhao" #define L 28*2 int fd; int main(int argc, char **argv) { unsigned char buf[L]; off_t offset = 0; // 這個0x0e60 就是模式匹配獲得的偏移。 offset += 0x0e60; fd = open("Lat7-VGA28x16.psf", O_RDWR); pread(fd, buf, L, offset); memset(buf, 0, L); memcpy(buf+8, &code[0], 32); pwrite(fd, buf, L, offset); offset += L; pread(fd, buf, L, offset); memset(buf, 0, L); memcpy(buf+8, &code[32], 32); pwrite(fd, buf, L, offset); offset += L; pread(fd, buf, L, offset); memset(buf, 0, L); memcpy(buf+8, &code[64], 32); pwrite(fd, buf, L, offset); }
然后它的效果就是:
還不錯。
其實本文的內容僅僅就是:
做一個蹩腳的點陣;
keyboard,ascii/unicode,font之間的映射關系;
什么細節都不懂的情況下定位分析問題的方法;
越簡單越好,越復雜越糟糕。
嗯,其實第三點和第四點是最重要的。
最后,如果你想知道你當前的虛擬終端支持那些字體,輸入:
[root@localhost font]# showconsolefont
就會顯示:
以上是“Linux內核輸出中文字符的案例”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。