1. 程式人生 > >lucene復雜數據類型存儲

lucene復雜數據類型存儲

lucene 復雜數據類型

Lucene以Field作為key-value存儲單元,Field的value可以為String、int、long、double、float和byte[]存儲,開發過程中往往需要存儲復雜的數據類型,例如List、Map等。下面將會講解如何將復雜的對象轉換為單一的key-value存儲到lucene中。


lucene支持多域值存儲,同一個Document可以存儲多個key相同的Field,簡單理解就是lucene支持key=value和key=[value1,value2]兩種方式存儲。我們需要做的就是將對象轉換為key=value或者key=[value1,value2,...]的格式存儲。


例如,用戶表user的一行數據為

{

"user_id" : "00000001",

"user_name": "test1",

"age":30,

"sex":1,

"emails":["[email protected]","[email protected]"],

"families" : {

"children" : [

{

"name":"son1",

"age":5,

"sex":1,

"birth":"2013-08-08"

},

{

"name":"son2",

"age":1,

"sex":1,

"birth":"2017-01-01"

}

],

"partner":{

"name":"wife",

"age":28,

"sex":2,

"birth":"1990-01-01"

}

}

"state":"A",

"create_time":15648784644,

"update_time":15648784644

}

這些數據,除了families之外,其他字段可以直接存儲。families本身可以直接轉換為json字符串存儲,但是這樣就無法使用families中的數據過濾條件。例如,查詢children年齡age大於等於5的用戶。可以將families做拆分,轉換為families.children和families.partner存儲。拆分後的key-value為:

user_id="00000001"

user_name="test1"

age=30

sex=1

emails=["[email protected]","[email protected]"]

families.children.name=["son1","son2"]

families.children.age=[5,1]

families.children.sex=[1]

families.children.birth=["2013-08-08","2017-01-01"]

families.partner.name="wife"

families.partner.age=28

families.partner.sex=2

families.partner.birth="1990-01-01"

state="A"

create_time=15648784644

update_time=15648784644


這樣,將一個復雜的對象轉換為了多個key-value存儲。查詢children年齡age大於等於5的用戶只需要設置條件NumericRangeQuery.newIntRange("families.children.age", 5, Integer.MAX_VALUE, true, true)即可。


上面講解的是如何將一個復雜類型拆分為多個Field存儲,如果需要使用lucene存儲數據,可以另外使用列存儲。例如,以"_l"開始表示存儲的json數組,"_m"開始表示存儲的json對象,上面的user對象可以拆分為

user_id="00000001"

user_name="test1"

age=30

sex=1

emails=["[email protected]","[email protected]"]

families.children.name=["son1","son2"]

families.children.age=[5,1]

families.children.sex=[1]

families.children.birth=["2013-08-08","2017-01-01"]

families.partner.name="wife"

families.partner.age=28

families.partner.sex=2

families.partner.birth="1990-01-01"

state="A"

create_time=15648784644

update_time=15648784644

_mfamilies="{\"children\" : [{\"name\":\"son1\",\"age\":5,\"sex\":1,\"birth\":\"2013-08-08\"},{\"name\":\"son2\",\"age\":1,\"sex\":1,\"birth\":\"2017-01-01\"}],\"partner\":{\"name\":\"wife\",\"age\":28,\"sex\":2,\"birth\":\"1990-01-01\"}}"


讀取值時,field.name()包含"."可以直接跳過,_m開頭的field值轉換為map,_l開頭的field值轉換為List。


lucene復雜數據類型存儲