1. 程式人生 > >半結構化、結構化以及非結構化資料

半結構化、結構化以及非結構化資料

結構化資料:即行資料,儲存在資料庫裡,可以用二維表結構來邏輯表達實現的資料。

非結構化資料:包括所有格式的辦公文件、文字、圖片、XML、HTML、各類報表、影象和音訊/視訊資訊等等。

半結構化資料:就是介於完全結構化資料(如關係型資料庫、面向物件資料庫中的資料)和完全無結構的資料(如聲音、影象檔案等)之間的資料,HTML文件就屬於半結構化資料。它一般是自描述的,資料的結構和內容混在一起,沒有明顯的區分。

示例:

 資料模型:
  結構化資料:二維表(關係型)
  半結構化資料:樹、圖
  非結構化資料:無
  RMDBS的資料模型有:如網狀資料模型、層次資料模型、關係型
  其他:
  結構化資料:先有結構、再有資料
  半結構化資料:先有資料,再有結構