91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python中字符串指的是什么

發布時間:2021-05-24 09:31:07 來源:億速云 閱讀:228 作者:小新 欄目:開發技術

小編給大家分享一下Python中字符串指的是什么,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!

1 Python字符串是什么?

根據維基百科定義:字符串是由零個或多個字符組成的有限序列。而在Python 3中,它有著更明確的意思: 字符串是由Unicode碼點組成的不可變序列 (Strings are immutable sequences of Unicode code points.)

字符串是一種序列,這意味著它具備序列類型都支持的操作:

# 以下的s、t皆表示序列,x表示元素
x in s # 若s包含x,返回True,否則返回False
x not in s # 若s包含x,返回False,否則返回True
s + t # 連接兩個序列
s * n # s復制n次
s[i] # s的索引第i項
s[i:j] # s切片從第i項到第j-1項
s[i:j:k] # s切片從第i項到第j-1項,間隔為k
len(s) # s的長度
min(s) # s的最小元素
max(s) # s的最大元素
s.index(x) # x的索引位置
s.count(x) # s中出現x的總次數

字符串序列還具備一些特有的操作,限于篇幅,按下不表。預告一下,下一篇《 你真的知道Python的字符串怎么用嗎? 》將會展開介紹,敬請期待……

字符串序列是一種不可變序列,這意味著它不能像可變序列一樣,進行就地修改。例如,在字符串“Python”的基礎上拼接“Cat”,得到字符串“PythonCat”,新的字符串是一個獨立的存在,它與基礎字符串“Python”并沒有關聯關系。

basename = "Python"
myname = basename + "Cat"
id(basename) == id(myname) >>> False
# 作為對比,列表能就地修改
baselist = ["Python"]
baselist.append("Cat")
print(baselist) >>> ['Python', 'Cat']

字符串這種序列與其它序列(如列表、元組)的不同之處在于,它的“元素”限定了只能是Unicode碼點。Unicode碼點是什么呢?簡單理解,就是用Unicode編碼的字符。那字符是什么呢? 字符 是人類書寫系統的各類符號,例如阿拉伯數字、拉丁字母、中文、日文、藏文、標點符號、控制符號(換行符、制表符等)、其它特殊符號(@#¥%$*等等)。那Unicode編碼又是什么呢?Unicode別名是萬國碼、國際碼,它是一種適用性最廣的、將書寫字符編碼為計算機數字的標準。

總所周知,在最底層的計算機硬件世界里,只有0和1。那么,怎么用這個二進制數字,來表示人類的文化性的字符呢?這些字符數量龐大,而且還在日益增長與變化,什么樣的編碼方案才是最靠譜的呢?

歷史上,人類創造了多種多樣的字符編碼標準,例如ASCII(1963年)編碼,以西歐語言的字符為主,它的缺點是只能編碼128個字符;例如GB2312(1981年),這是中國推出的編碼標準,在兼容ASCII標準的基礎上,還加入了對日文、俄文等字符的編碼,但缺點仍是編碼范圍有限,無法表示古漢語、繁體字及更多書寫系統的字符。

Unicode編碼標準于1991年推出,至今迭代到了第11版,已經能夠編碼146個書寫系統的130000個字符,可謂是無所不包,真不愧是“國際碼”。Unicode編碼其實是一個二進制字符集,它建立了從書寫字符映射成唯一的數字字符的關系,但是,由于各系統平臺對字符的理解差異,以及出于節省空間的考慮,Unicode編碼還需要再做一次轉換,轉換后的新的二進制數字才能作為 實際存儲及網絡傳輸時的編碼 。

這種轉換方式被稱為 Unicode轉換格式 (Unicode Transformation Format,簡稱為UTF),它又細分為UTF-8、UTF-16、UTF-32等等方式。我們最常用的是UTF-8。為什么UTF-8最常用呢?因為它是可變長度的編碼方案,針對不同的字符使用不同的字節數來編碼,例如編碼英文字母時,只需要一個字節(8個比特),而編碼較復雜的漢字時,就會用到三個字節(24個比特)。

Python中字符串指的是什么

二進制的編碼串可以說是給機器閱讀的,為了方便,我們通常會將其轉化為十六進制,例如“中”字的Unicode編碼可以表示成 0x4e2d ,其UTF-8編碼可以表示為 0xe4b8ad ,'0x'用于開頭表示十六進制,這樣就簡潔多了。不過,UTF-8編碼的結果會被表示成以字節為單位的形式,例如“中”字用UTF-8編碼后的字節形式是 \xe4\xb8\xad 。

Python中為了區分Unicode編碼與字節碼,分別在開頭加“u”和“b”以示區分。在Python 3中,因為Unicode成了默認編碼格式,所以“u”被省略掉了。

# 字符轉Unicode編碼
# Python3中,開頭的u被省略,b不可省略
hex(ord('中')) >>> '0x4e2d'
hex(ord('A')) >>> '0x41'
# 字符轉UTF-8編碼(encode)
'中'.encode('utf-8') >>> b'\xe4\xb8\xad'
'A'.encode('utf-8') >>> b'A'
# Unicode編碼還原成字符
chr(0x4e2d) >>> '中'
chr(0x41) >>> 'A'
# UTF-8編碼還原成字符(decode)
b'\xe4\xb8\xad'.decode('utf-8') >>> '中'
b'A'.decode('utf-8') >>> 'A'

總結一下,Python 3 中的字符串是由Unicode碼點組成的不可變序列,也即是,由采用Unicode標準編碼的字符組成的不可變序列。Unicode編碼將書寫系統的字符映射成了計算機二進制數字,為了方便,通常顯示為十六進制;在運算內存中,字符以Unicode編碼呈現,當寫入磁盤或用于網絡傳輸時,一般采用UTF-8方式編碼。

在Python 2中,因為歷史包袱,即Python先于Unicode編碼而誕生,所以其編碼問題是個大難題。幸好拋棄Python 2已成大勢所趨,所以我就不再對此做介紹或比對了。

2 Python字符串 VS Java字符串

雖然不提縱向版本間的差異,但是,我想將Python字符串與其它編程語言做一個橫向對比。我覺得這會是挺好玩的事。通過跨語言的比較,也許我們能加深對一個事物(字符串)的理解,還可能受到啟發,得到對“編程語言”及“編程哲學”的領悟。

由于本人才疏學淺,本文就只對兩點皮毛特性作說明,歡迎讀者斧正和補充。

(1)字符串的定義方式

Python的字符串是內置類型,所以使用起來很方便,有如下三種定義方式:

str_0 = '''Python字符串可以寫在用三引號對內,表示多行字符串。
還可以寫在單引號對內,
當然還可以寫在雙引號對內。
'''
str_1 = 'Python貓是一只貓'
str_2 = "Python貓是一個微信公眾號"

Java的字符串不是內置類型,它屬于對象,需要通過String類來創建。不過,正因為字符串太常用,所以Java特意預定義了一個字符串類String,使得程序員也可以像這樣來定義: String name = "Python貓"; ,而不必這樣寫: String name = new String("Python貓"); 。

Java的字符串只能寫在雙引號內,不具備Python中單雙引號混用的靈活。至于三引號的多行字符串表示法,Java程序員表示羨慕得要死,那種痛苦,受過折磨的人最懂。寫出來讓Python程序員開心一下:

String s = "Java 的多行字符串很麻煩,\n"
  + "既要使用換行符,\n"
  + "還需要使用加號拼接";

為什么Java不支持多行字符串、什么時候支持多行字符串?此類問題在Python程序員眼里,可能很費解,但它絕對能排進“Java程序員最希望能實現的特性”的前列。好不容易,官方有計劃在Java 11 實現,但今年9月發布的Java 11 仍是沒有,現在改計劃到Java 12 了。

(2)單個字符與字符序列

Java中其實也有單引號的使用,用在char類型上,例如 char c = 'A'; 。char是一種內置類型,表示單個用Unicode編碼的字符。Python中沒有char類型,字符串類型通吃一切。

前面說到,Python的字符串是一種字符序列,而Java的字符串并不是一種序列,要表示相近的概念的話,就得用到 字符數組 或者 字符串數組 ,例如:

char[] a = { 'a', 'b', 'c'}; 
String[] str = new String[]{"1","2","3"};

字符數組和字符串數組是一種序列,但并不是字符串,它們之間如果要相互轉換,還是挺麻煩的。另外,說是序列,但Java的序列操作絕對無法跟Python相比,別的不說,就上面提及的幾個基礎操作,試問Java能否實現、實現起來要花費多大力氣?

Python的優點有哪些

1、簡單易用,與C/C++、Java、C# 等傳統語言相比,Python對代碼格式的要求沒有那么嚴格;2、Python屬于開源的,所有人都可以看到源代碼,并且可以被移植在許多平臺上使用;3、Python面向對象,能夠支持面向過程編程,也支持面向對象編程;4、Python是一種解釋性語言,Python寫的程序不需要編譯成二進制代碼,可以直接從源代碼運行程序;5、Python功能強大,擁有的模塊眾多,基本能夠實現所有的常見功能。

看完了這篇文章,相信你對“Python中字符串指的是什么”有了一定的了解,如果想了解更多相關知識,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

湖口县| 赤水市| 玛曲县| 临邑县| 广河县| 白水县| 新营市| 教育| 榕江县| 象州县| 来安县| 汉沽区| 呈贡县| 平泉县| 江川县| 滦南县| 德庆县| 鄂托克前旗| 临夏市| 桐梓县| 策勒县| 古交市| 乌审旗| 泌阳县| 文昌市| 普安县| 丹寨县| 隆安县| 湛江市| 高唐县| 潞城市| 双柏县| 青州市| 姜堰市| 军事| 大方县| 修武县| 长治市| 海口市| 大安市| 南开区|