Java基礎之對象序列化
1. 什麽是Java對象序列化
Java平臺允許我們在內存中創建可復用的Java對象,但一般情況下,只有當JVM處於運行時,這些對象才可能存在,即,這些對象的生命周期不會比JVM的生命周期更長。但在現實應用中,就可能要求在JVM停止運行之後能夠保存(持久化)指定的對象,並在將來重新讀取被保存的對象。Java對象序列化就能夠幫助我們實現該功能。
使用Java對象序列化,在保存對象時,會把其狀態保存為一組字節,在未來,再將這些字節組裝成對象。必須註意地是,對象序列化保存的是對象的"狀態",即它的成員變量。由此可知,對象序列化不會關註類中的靜態變量。
除了在持久化對象時會用到對象序列化之外,當使用RMI(遠程方法調用),或在網絡中傳遞對象時,都會用到對象序列化。Java序列化API為處理對象序列化提供了一個標準機制。在Java中,只要一個類實現了java.io.Serializable接口,那麽它就可以被序列化。
2.JDK中序列化的方法
2.1序列化例子
實現java.io.Serializable或Externalizable接口,後者繼承前者,聲明不用系統默認的序列化方法, 程序員自己編寫序列化寫讀方法。
public class SimpleSerial { public static void main(String[] args) throws Exception { File file = new File("person.out"); ObjectOutputStream oout = new ObjectOutputStream(newFileOutputStream(file)); Person person = new Person("John", 101, Gender.MALE); oout.writeObject(person); oout.close(); ObjectInputStream oin = new ObjectInputStream(new FileInputStream(file)); Object newPerson = oin.readObject(); // 沒有強制轉換到Person類型 oin.close(); System.out.println(newPerson); } }
當重新讀取被保存的Person對象時,並沒有調用Person的任何構造器,看起來就像是直接使用字節將Person對象還原出來的。
當Person對象被保存到person.out文件中之後,我們可以在其它地方去讀取該文件以還原對象,但必須確保該讀取程序的CLASSPATH中包含有Person.class(哪怕在讀取Person對象時並沒有顯示地使用Person類,如上例所示),否則會拋出ClassNotFoundException。
2.2序列化ID問題
虛擬機是否允許反序列化,不僅取決於類路徑和功能代碼是否一致,一個非常重要的一點是兩個類的序列化 ID 是否一致(就是 private static final long serialVersionUID = 1L)。如果不指定序列化ID,JAVA會用指紋摘要算法自動為該class生成一個默認ID,在類添加修改字段時,序列化ID自動改變,再反序列化之前的類就會失敗,包序列化ID不同的錯誤,因此必須根據需要指定序列化ID,如果ID不變,則類字段有添加改動等時依然兼容反序列化之前的文件,反之不想兼容之前的,將ID設為不同即可。
2.3Serializable的作用
為什麽一個類實現了Serializable接口,它就可以被序列化呢?一般類繼承該接口後,才可使用ObjectOutputStream來持久化對象,否則調會報不能序列writeObject0時會化異常,
private void writeObject0(Object obj, boolean unshared) throws IOException { if (obj instanceof String) { writeString((String) obj, unshared); } else if (cl.isArray()) { writeArray(obj, desc, unshared); } else if (obj instanceof Enum) { writeEnum((Enum) obj, desc, unshared); } else if (obj instanceof Serializable) { writeOrdinaryObject(obj, desc, unshared); } else { if (extendedDebugInfo) { throw new NotSerializableException(cl.getName() + "\n" + debugInfoStack.toString()); } else { throw new NotSerializableException(cl.getName()); } } }
從上述代碼可知,如果被寫對象的類型是String,或數組,或Enum,或Serializable,那麽就可以對該對象進行序列化,否則將拋出NotSerializableException。
如果僅僅只是讓某個類實現Serializable接口,而沒有其它任何處理的話,則就是使用默認序列化機制。使用默認機制,在序列化對象時,不僅會序列化當前對象本身,還會對該對象引用的其它對象也進行序列化,同樣地,這些其它對象引用的另外對象也將被序列化,以此類推。所以,如果一個對象包含的成員變量是容器類對象,而這些容器所含有的元素也是容器類對象,那麽這個序列化的過程就會較復雜,開銷也較大。
2.4影響序列化的方法
在現實應用中,有些時候不能使用默認序列化機制。比如,希望在序列化過程中忽略掉敏感數據,或者簡化序列化過程。
(1)transient關鍵字
當某個字段被聲明為transient後,默認序列化機制就會忽略該字段。此處將Person類中的age字段聲明為transient
(2)writeObject()方法與readObject()方法
對於上述已被聲明為transitive的字段age,除了將transitive關鍵字去掉之外,是否還有其它方法能使它再次可被序列化?方法之一就是在Person類中添加兩個方法:writeObject()與readObject(),如下所示:
public class Person implements Serializable { transient private Integer age = null; private void writeObject(ObjectOutputStream out) throws IOException { out.defaultWriteObject(); out.writeInt(age); } private void readObject(ObjectInputStream in) throws IOException, ClassNotFoundException { in.defaultReadObject(); age = in.readInt(); } }
在writeObject()方法中會先調用ObjectOutputStream中的defaultWriteObject()方法,該方法會執行默認的序列化機制,此時會忽略掉age字段。然後再調用writeInt()方法顯示地將age字段寫入到ObjectOutputStream中。readObject()的作用則是針對對象的讀取,其原理與writeObject()方法相同。必須註意地是,writeObject()與readObject()都是private方法,被ObjectOutputStream中的writeSerialData方法,以及ObjectInputStream中的readSerialData用反射調用。
(3)Externalizable接口
無論是使用transient關鍵字,還是使用writeObject()和readObject()方法,其實都是基於Serializable接口的序列化。JDK中提供了另一個序列化接口--Externalizable,使用該接口之後,之前基於Serializable接口的序列化機制就將失效。使用Externalizable進行序列化,當讀取對象時,會調用被序列化類的無參構造器去創建一個新的對象,然後再將被保存對象的字段的值分別填充到新對象中。因此實現Externalizable接口的類必須要提供一個無參的構造器,且它的訪問權限為public。然後被序列化對象重載writeExternal()與readExternal()方法實現序列化反序列化操作。
public class Person implements Externalizable { private String name = null; transient private Integer age = null; …… @Override public void writeExternal(ObjectOutput out) throws IOException { out.writeObject(name); out.writeInt(age); } @Override public void readExternal(ObjectInput in) throws IOException, ClassNotFoundException { name = (String) in.readObject(); age = in.readInt(); } }
(4)readResolve()方法
當我們使用Singleton模式時,應該是期望某個類的實例應該是唯一的,但如果該類是可序列化的,為了能在序列化過程仍能保持單例的特性,可以在Person類中添加一個readResolve()方法,在該方法中直接返回單例對象。無論是實現Serializable接口,或是Externalizable接口,當從I/O流中讀取對象時,readResolve()方法都會被調用到。實際上就是用readResolve()中返回的對象直接替換在反序列化過程中創建的對象,而被創建的對象則會被垃圾回收掉。
public class Person implements Serializable { private static class InstanceHolder { private static final Person instatnce = new Person("John", 31, Gender.MALE); } public static Person getInstance() { return InstanceHolder.instatnce; } …… private Object readResolve() throws ObjectStreamException { return InstanceHolder.instatnce; } }
3、註意事項
a)當一個父類實現序列化,子類自動實現序列化,不需要顯式實現Serializable接口;
b)當一個對象的實例變量引用其他對象,序列化該對象時也把引用對象進行序列化;
c)並非所有的對象都可以序列化,,至於為什麽不可以,有很多原因了,比如:
1.安全方面的原因,比如一個對象擁有private,public等field,對於一個要傳輸的對象,比如寫到文件,或者進行rmi傳輸 等等,在序列化進行傳輸的過程中,這個對象的private等域是不受保護的。
2. 資源分配方面的原因,比如socket,thread類,如果可以序列化,進行傳輸或者保存,也無法對他們進行重新的資源分 配,而且,也是沒有必要這樣實現
把一個對象完全轉成字節序列,方便傳輸。
理解Java對象序列化
Java基礎之對象序列化