1. 程式人生 > >DataStage中merge、lookup、join的區別與聯系

DataStage中merge、lookup、join的區別與聯系

處理過程 key 占用內存 效率 功能 要求 過程 事實表 lookup

三者功能類似,都可以將表連接起來進行輸出。

區別主要體現在性能上。

lookup就是一個表在另一個表中找,處理過程都在內存進行,因此占用內存較多,一般大事實表和小緯表用這種方式關聯效率高。

merge和join的處理過程不需用占大量內存。不同在於merge要先把key值排序在做join,因此要求key不能重復,Merge的輸出集可以設為多個。

DataStage中merge、lookup、join的區別與聯系