1. 程式人生 > >結構化、半結構化和非結構化數據

結構化、半結構化和非結構化數據

tracking 數據庫 能夠 二維 表示 結構化數據 媒體 acl 面向

在實際應用中,我們會遇到各式各樣的數據庫如nosql非關系數據庫(memcached,redis。mangodb)。RDBMS關系數據庫(oracle,mysql等),另一些其他的數據庫如hbase,在這些數據庫中。又會出現結構化數據。非結構化數據。半結構化數據,以下列出各種數據類型:
結構化數據: 可以用數據或統一的結構加以表示,我們稱之為結構化數據,如數字、符號。傳統的關系數據模型、行數據,存儲於數據庫,可用二維表結構表示。
半結構化數據: 所謂半結構化數據。就是介於全然結構化數據(如關系型數據庫、面向對象數據庫中的數據)和全然無結構的數據(如聲音、圖像文件等)之間的數據,XML、HTML文檔就屬於半結構化數據。它通常是自描寫敘述的,數據的結構和內容混在一起,沒有明顯的區分。


非結構化數據: 非結構化數據庫是指其字段長度可變,並且每一個字段的記錄又能夠由可反復或不可反復的子字段構成的數據庫,用它不僅能夠處理結構化數據(如數字、符號等信息)並且更適合處理非結構化數據(全文文本、圖象、聲音、影視、超媒體等信息)。 非結構化數據,包含全部格式的辦公文檔、文本、圖片、XML、HTML、各類報表、圖像和音頻/視頻信息等等

結構化、半結構化和非結構化數據