您好,登錄后才能下訂單哦!
這篇文章主要為大家展示了“怎么高效地拼接字符串”,內容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領大家一起研究并學習一下“怎么高效地拼接字符串”這篇文章吧。
不久前,因為一些原因,我們決定用 Go 語言對一個 Java 項目進行重構。這個項目的業務非常簡單,在實現簡單業務的簡單功能時,需要將幾組短字符串按順序拼接成一個長字符串。毋庸置疑,使用 + 操作符,是常用的字符串拼接方法,這在很多編程語言中都適用,Go 也不例外。
功能重構很快完成了,但在代碼 review 環節時,對新語言的好奇心頻頻冒出,Go 語言中是否有其他更為高級或者靈活的方法呢?經過一番調研嘗試,初步得出使用 strings.Builder 是性能最優的結論,于是,決定用它替換 + 操作符,并部署到線上。
幾個月后,該項目在原基礎上需求有所增加。再次面對該代碼,心情也發生了變化,使用 strings.Builder 固然可行,但它需要三行代碼,相比之下,用 + 操作符一行代碼便能實現。在簡潔性和高效性之間,該如何抉擇呢?Go 語言中,是否有魚和熊掌兼得的方法?
抱著這樣的心思,我總結出 Go 語言中至少有 6 種關于字符串的拼接方式。但新問題也隨之產生了,為何 Go 語言支持如此多種拼接方式?每種方式的存在,其背后的原因和邏輯又是什么呢?
讓我們先分兩種常用場景、兩種字符串長度進行對比看看。
待拼接字符串長度、次數已知,可一次完成字符串拼接,測試結果如下:
32 字節以下。
超過 32 字節,未超過 64 字節。+ 操作符發生了一次內存分配,但效率依然很高。bytes.Buffer 高于 strings.Builder。
64 字節以上。+ 操作符優勢依然明顯,strings.Join() 也不甘示弱。
待拼接字符串長度、次數未知,需要循環追加完成拼接操作,測試結果如下:
32 字節以下。+ 每次拼接都會生成新字符串,導致大量的字符串創建、替代。
超過 32 字節,未超過 64 字節。bytes.Buffer 發生 2 次內存分配。
64 字節以上。bytes.Buffer 優勢已然不再, strings.Builder 一騎絕塵。不過,這似乎還不是最終的結果。
大量字符串拼接,終于要使出 strings.Builder 的必殺器 Grow() 了,bytes.Buffer 也有 Grow() 方法,但似乎作用不大。
從上面的測試結果可以看出,在不同情況下,每種拼接方式的效率都不同,為什么會這樣呢?那就得從它們的拼接原理說起。
+ 操作符,也叫級聯符。它使用簡單、應用廣泛。
res := "發" + "發"
拼接過程:
1.編譯器將字符串轉換成字符數組后調用 runtime/string.go 的 concatstrings() 函數
2.在函數內遍歷字符數組,得到總長度
3.如果字符數組總長度未超過預留 buf(32字節),使用預留,反之,生成新的字符數組,根據總長度一次性分配內存空間
4.將字符串逐個拷貝到新數組,并銷毀舊數組
+= 追加操作符,與 + 操作符相同,也是通過 runtime/string.go的concatstrings() 函數實現拼接,區別是它通常用于循環中往字符串末尾追加,每追加一次,生成一個新的字符串替代舊的,效率極低。
res := "發" res += "發"
拼接過程:
1.同上
bytes.Buffer ,在 Golang 1.10 之前,它是循環中往末尾追加效率最高的方法,尤其是當拼接的字符串數量較大時。
var b bytes.Buffer // 創建一個 buffer b.WriteString("發") // 將字符串追加到buffer上 b.WriteString("發") b.String() // 取出字符串并返回
拼接過程:
1.創建 []byte ,用于緩存需要拼接的字符串
2.首次使用 WriteString() 填充字符串時,由于字節數組容量為 0 ,最少會發生 1 次內存分配
3.待拼接字符串長度小于 64 字節,make 一個長度為字符串總長度,容量為 64 字節的新數組
4.待拼接字符串超過 64 字節時動態擴容,按 2* 當前容量 + 待拼接字符長度 make 新字節數組
5.將字節數組轉換成 string 類型返回
strings.Builder 在 Golang 1.10 更新后,替代了byte.Buffer,成為號稱效率最高的拼接方法。
var b strings.Builder b.WriteString("發") b.WriteString("發") b.String()
拼接過程:
1.創建 []byte,用于緩存需要拼接的字符串
2.通過 append 將數據填充到前面創建的 []byte 中
3.append 時,如果字符串超過初始容量 8 且小于 1024 字節時,按乘以 2 的容量創建新的字節數組,超過 1024 字節時,按 1/4 增加
4.將老數據復制到新創建的字節數組中 5.追加新數據并返回
strings.Join() 主要適用于以指定分隔符方式連接成一個新字符串,分隔符可以為空,在字符串一次拼接操作中,性能僅次于 + 操作符。
strings.Join([]string{"發", "發"}, "")
拼接過程:
1.接收的是一個字符切片
2.遍歷字符切片得到總長度,據此通過 builder.Grow 分配內存
3.底層使用了 strings.Builder,每使用一次 strings.Join() ,都會創建新的 builder 對象
fmt.Sprintf(),返回使用 format 格式化的參數。除了字符串拼接,函數內還有很多格式方面的判斷,性能不高,但它可以拼接多種類型,字符串或數字等。
fmt.Sprintf("str1 = %v,str2 = %v", "發", "發")
拼接過程:
1.創建對象
2.字符串格式化操作
3.將格式化后的字符串通過 append 方式放到[] byte 中
4.最后將字節數組轉換成 string 返回
在待拼接字符串確定,可一次完成字符串拼接的情況下,推薦使用 + 操作符,即便 strings.Builder 用 Grow() 方法預先擴容,其性能也是不如 + 操作符的,另外,Grow()也不可設置過大。
在拼接字符串不確定、需要循環追加字符串時,推薦使用 strings.Builder。但在使用時,必須使用 Grow() 預先擴容,否則性能不如 strings.Join()。
以上是“怎么高效地拼接字符串”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。