您好,登錄后才能下訂單哦!
序列化是一種對象持久化的手段。普遍應用在網絡傳輸、RMI等場景中。類通過實現java.io.Serializable 接口以啟用其序列化功能。
在我的博客中,其實已經有多篇文章介紹過序列化了,對序列化的基礎知識不夠了解的朋友可以參考以下幾篇文章:
Java對象的序列化與反序列化
深入分析Java的序列化與反序列化
單例與序列化的那些事兒
在這幾篇文章中,我分別介紹過了序列化涉及到的類和接口、如何自定義序列化策略、transient關鍵字和序列化的關系等,還通過學習ArrayList對序列化的實現源碼深入學習了序列化。并且還拓展分析了一下序列化對單例的影響等。
但是,還有一個知識點并未展開介紹,那就是關于serialVersionUID 。這個字段到底有什么用?如果不設置會怎么樣?為什么《阿里巴巴Java開發手冊》中有以下規定:
背景知識
在展開本文的介紹之前,先來簡單介紹一些和序列化有關的知識,內容均來自文章開頭的三個文章鏈接中。
Serializable 和 Externalizable
Java類通過實現 java.io.Serializable 接口以啟用其序列化功能。未實現此接口的類將無法進行序列化或反序列化。可序列化類的所有子類型本身都是可序列化的。
如果讀者看過Serializable的源碼,就會發現,他只是一個空的接口,里面什么東西都沒有。Serializable接口沒有方法或字段,僅用于標識可序列化的語義。但是,如果一個類沒有實現這個接口,想要被序列化的話,就會拋出java.io.NotSerializableException異常。
它是怎么保證只有實現了該接口的方法才能進行序列化與反序列化的呢?
原因是在執行序列化的過程中,會執行到以下代碼:
if?(obj?instanceof?String)?{ ?writeString((String)?obj,?unshared); }?else?if?(cl.isArray())?{ ?writeArray(obj,?desc,?unshared); }?else?if?(obj?instanceof?Enum)?{ ?writeEnum((Enum<?>)?obj,?desc,?unshared); }?else?if?(obj?instanceof?Serializable)?{ ?writeOrdinaryObject(obj,?desc,?unshared); }?else?{ ?if?(extendedDebugInfo)?{ ?throw?new?NotSerializableException( ?cl.getName()?+?"\n"?+?debugInfoStack.toString()); ?}?else?{ ?throw?new?NotSerializableException(cl.getName()); ?} }
在進行序列化操作時,會判斷要被序列化的類是否是Enum、Array和Serializable類型,如果都不是則直接拋出NotSerializableException。
Java中還提供了Externalizable接口,也可以實現它來提供序列化能力。
Externalizable繼承自Serializable,該接口中定義了兩個抽象方法:writeExternal()與readExternal()。
當使用Externalizable接口來進行序列化與反序列化的時候需要開發人員重寫writeExternal()與readExternal()方法。否則所有變量的值都會變成默認值。
transient
transient 關鍵字的作用是控制變量的序列化,在變量聲明前加上該關鍵字,可以阻止該變量被序列化到文件中,在被反序列化后,transient 變量的值被設為初始值,如 int 型的是 0,對象型的是 null。
自定義序列化策略
在序列化過程中,如果被序列化的類中定義了writeObject 和 readObject 方法,虛擬機會試圖調用對象類里的 writeObject 和 readObject 方法,進行用戶自定義的序列化和反序列化。
如果沒有這樣的方法,則默認調用是 ObjectOutputStream 的defaultWriteObject 方法以及 ObjectInputStream 的defaultReadObject 方法。
用戶自定義的 writeObject 和 readObject 方法可以允許用戶控制序列化的過程,比如可以在序列化的過程中動態改變序列化的數值。
所以,對于一些特殊字段需要定義序列化的策略的時候,可以考慮使用transient修飾,并自己重寫writeObject 和 readObject 方法,如java.util.ArrayList中就有這樣的實現。
以上,就是一些讀者需要掌握和和序列化有關的知識。
我們隨便找幾個Java中實現了序列化接口的類,如String、Integer等,我們可以發現一個細節,那就是這些類除了實現了Serializable外,還定義了一個serialVersionUID
那么,到底什么是serialVersionUID呢?為什么要設置這樣一個字段呢?
什么是serialVersionUID
序列化是將對象的狀態信息轉換為可存儲或傳輸的形式的過程。我們都知道,Java對象是保存在JVM的堆內存中的,也就是說,如果JVM堆不存在了,那么對象也就跟著消失了。
而序列化提供了一種方案,可以讓你在即使JVM停機的情況下也能把對象保存下來的方案。就像我們平時用的U盤一樣。把Java對象序列化成可存儲或傳輸的形式(如二進制流),比如保存在文件中。這樣,當再次需要這個對象的時候,從文件中讀取出二進制流,再從二進制流中反序列化出對象。
虛擬機是否允許反序列化,不僅取決于類路徑和功能代碼是否一致,一個非常重要的一點是兩個類的序列化 ID 是否一致,這個所謂的序列化ID,就是我們在代碼中定義的serialVersionUID。
如果serialVersionUID變了會怎樣
我們舉個例子吧,看看如果serialVersionUID被修改了會發生什么?
public?class?SerializableDemo1?{ ?public?static?void?main(String[]?args)?{ ?//Initializes?The?Object ?User1?user?=?new?User1(); ?user.setName("hollis"); ?//Write?Obj?to?File ?ObjectOutputStream?oos?=?null; ?try?{ ?oos?=?new?ObjectOutputStream(new?FileOutputStream("tempFile")); ?oos.writeObject(user); ?}?catch?(IOException?e)?{ ?e.printStackTrace(); ?}?finally?{ ?IOUtils.closeQuietly(oos); ?} ?} } class?User1?implements?Serializable?{ ?private?static?final?long?serialVersionUID?=?1L; ?private?String?name; ?public?String?getName()?{ ?return?name; ?} ?public?void?setName(String?name)?{ ?this.name?=?name; ?} }
我們先執行以上代碼,把一個User1對象寫入到文件中。然后我們修改一下User1類,把serialVersionUID的值改為2L。
class?User1?implements?Serializable?{ ?private?static?final?long?serialVersionUID?=?2L; ?private?String?name; ?public?String?getName()?{ ?return?name; ?} ?public?void?setName(String?name)?{ ?this.name?=?name; ?} }
然后執行以下代碼,把文件中的對象反序列化出來:
public?class?SerializableDemo2?{ ?public?static?void?main(String[]?args)?{ ?//Read?Obj?from?File ?File?file?=?new?File("tempFile"); ?ObjectInputStream?ois?=?null; ?try?{ ?ois?=?new?ObjectInputStream(new?FileInputStream(file)); ?User1?newUser?=?(User1)?ois.readObject(); ?System.out.println(newUser); ?}?catch?(IOException?e)?{ ?e.printStackTrace(); ?}?catch?(ClassNotFoundException?e)?{ ?e.printStackTrace(); ?}?finally?{ ?IOUtils.closeQuietly(ois); ?try?{ ?FileUtils.forceDelete(file); ?}?catch?(IOException?e)?{ ?e.printStackTrace(); ?} ?} ?} }
執行結果如下:
java.io.InvalidClassException:?com.hollis.User1;?local?class?incompatible:?stream?classdesc?serialVersionUID?=?1,?local?class?serialVersionUID?=?2
可以發現,以上代碼拋出了一個java.io.InvalidClassException,并且指出serialVersionUID不一致。
這是因為,在進行反序列化時,JVM會把傳來的字節流中的serialVersionUID與本地相應實體類的serialVersionUID進行比較,如果相同就認為是一致的,可以進行反序列化,否則就會出現序列化版本不一致的異常,即是InvalidCastException。
這也是《阿里巴巴Java開發手冊》中規定,在兼容性升級中,在修改類的時候,不要修改serialVersionUID的原因。除非是完全不兼容的兩個版本。所以,serialVersionUID其實是驗證版本一致性的。
如果讀者感興趣,可以把各個版本的JDK代碼都拿出來看一下,那些向下兼容的類的serialVersionUID是沒有變化過的。比如String類的serialVersionUID一直都是-6849794470754667710L。
但是,作者認為,這個規范其實還可以再嚴格一些,那就是規定:
如果一個類實現了Serializable接口,就必須手動添加一個private static final long serialVersionUID變量,并且設置初始值。
為什么要明確定一個serialVersionUID
如果我們沒有在類中明確的定義一個serialVersionUID的話,看看會發生什么。
嘗試修改上面的demo代碼,先使用以下類定義一個對象,該類中不定義serialVersionUID,將其寫入文件。
class?User1?implements?Serializable?{ ?private?String?name; ?public?String?getName()?{ ?return?name; ?} ?public?void?setName(String?name)?{ ?this.name?=?name; ?} ?}
然后我們修改User1類,向其中增加一個屬性。在嘗試將其從文件中讀取出來,并進行反序列化。
class?User1?implements?Serializable?{ ?private?String?name; ?private?int?age; ?public?String?getName()?{ ?return?name; ?} ?public?void?setName(String?name)?{ ?this.name?=?name; ?} ?public?int?getAge()?{ ?return?age; ?} ?public?void?setAge(int?age)?{ ?this.age?=?age; ?} ?}
執行結果:
java.io.InvalidClassException:?com.hollis.User1;?local?class?incompatible:?stream?classdesc?serialVersionUID?=?-2986778152837257883,?local?class?serialVersionUID?=?7961728318907695402
同樣,拋出了InvalidClassException,并且指出兩個serialVersionUID不同,分別是-2986778152837257883和7961728318907695402。
從這里可以看出,系統自己添加了一個serialVersionUID。
所以,一旦類實現了Serializable,就建議明確的定義一個serialVersionUID。不然在修改類的時候,就會發生異常。
serialVersionUID有兩種顯示的生成方式:
一種是默認的1L,比如:
private?static?final?long?serialVersionUID?=?1L;
另外一種是根據類名、接口名、成員方法及屬性等來生成一個64位的哈希字段,比如:
private?static?final?long?serialVersionUID?=?xxxxL;
后面這種方式,可以借助IDE生成,后面會介紹。
背后原理
知其然,要知其所以然,我們再來看看源碼,分析一下為什么serialVersionUID改變的時候會拋異常?在沒有明確定義的情況下,默認的serialVersionUID是怎么來的?
為了簡化代碼量,反序列化的調用鏈如下:
ObjectInputStream.readObject?->? readObject0?->? readOrdinaryObject?->? readClassDesc?->? readNonProxyDesc?->? ObjectStreamClass.initNonProxy
在initNonProxy中 ,關鍵代碼如下:
在反序列化過程中,對serialVersionUID做了比較,如果發現不相等,則直接拋出異常。
深入看一下getSerialVersionUID方法:
public?long?getSerialVersionUID()?{ ?//?REMIND:?synchronize?instead?of?relying?on?volatile? ?if?(suid?==?null)?{ ?suid?=?AccessController.doPrivileged( ?new?PrivilegedAction<Long>()?{ ?public?Long?run()?{ ?return?computeDefaultSUID(cl); ?} ?} ?); ?} ?return?suid.longValue(); }
在沒有定義serialVersionUID的時候,會調用computeDefaultSUID 方法,生成一個默認的serialVersionUID。
這也就找到了以上兩個問題的根源,其實是代碼中做了嚴格的校驗,并且在未定義的時候自動生成了一個serialVersionUID。
IDEA提示
為了確保我們不會忘記定義serialVersionUID,可以調節一下Intellij IDEA的配置,在實現Serializable接口后,如果沒定義serialVersionUID的話,IDEA(eclipse一樣)會進行提示:
并且可以一鍵生成一個:
當然,這個配置并不是默認生效的,需要手動到IDEA中設置一下:
在圖中標號3的地方(Serializable class without serialVersionUID的配置),打上勾,保存即可。
總結
serialVersionUID是用來驗證版本一致性的。所以在做兼容性升級的時候,不要改變類中serialVersionUID的值。
特別說明一下,由于本文標題并不完全能表達本文的全部內容,這里再強調一下:serialVersionUID 既然是驗證版本一致性的,在做版本升級的時候(非兼容性升級),記得要修改這個字段的值哦,這樣可以避免序列化混亂。
如果一個類實現了Serializable接口,一定要記得定義serialVersionUID,否則會發生異常。可以在IDE中通過設置,讓他幫忙提示,并且可以一鍵快速生成一個serialVersionUID。
之所以會發生異常,是因為反序列化過程中做了校驗,并且如果沒有明確定義的話,會根據類名及屬性等自動生成一個。
點擊獲取?附送學習進階架構資料、PDF書籍文檔、面試資料
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。