1. 程式人生 > >1、【華為HCIE-Storage】--基礎知識

1、【華為HCIE-Storage】--基礎知識

HCIE storage hostman

------------------------------------重要說明------------------------------------

以下內容有來自華為存儲官方教材

具體教材內容請移步華為存儲官網進行教材下載

------------------------------------重要說明------------------------------------

① 數據定義

數據數據是對所有事物的數字表示。

SNIA( Storage Networking Industrial Association)關於數據的定義是:“數據是對所有事物的數字表示”。

這個定義看起來比較抽象,但是當你觀察當今企業的運營,你會發現一個企業每天都會產生大量的數據。所有的這些數據用以維持業務的運營和盈利。

假設一個企業不使用任何的電子信息系統,比如email系統,比如用於推廣其產品的網站,或者用於給客戶下單的網店,這將是怎樣的場景。再假設一個企業還是使用手寫的文檔來對部件或原材料來下訂單,或者所有的員工都使用傳統的手寫文檔來購買產品,將是怎樣的情形。

我們不再使用傳統的方法和工具來運營企業,是因為使用數字格式的信息具有非常明顯的優勢:數字信息更容易保存、修改以及復制。並且,也更容易讓更多的人在工作中共享相同的信息。

結構化數據:是存儲在數據庫裏,可以用二維表結構來邏輯表達實現的數據。

結構化數據是直接可用的,對於特定的員工提供了非常有效的信息。

結構化數據的典型例子是數據庫以及電子表格中存儲的數據。

非結構化數據

不方便用數據庫二維邏輯表來表現的數據

非結構化數據通常比較雜亂,因為從非結構化數據上通常無法看到數據本身代表的含義,無法直接獲取數據中的信息。

典型的非結構化數據如文檔、圖片、網頁、視頻等。

比如,文檔的內容與企業的關系並不能一眼就看出來,因為需要有人閱讀文檔的內容,並確定這些內容對企業是否有用。

② 信息定義

信息:是為了滿足用戶決策的需要而經過加工處理的數據。信息是從已收集到的數據中提取出來的。

當今企業面臨的最大的挑戰是如何解釋每天、每年收集到的海量數據中包含的意義。對於企業是否盈利更重要的不是數據而是從所有數據中提取出來的信息。如果我們只看數據的話,它不會告訴我們是否盈利,而只有當我們將數據進行對比(比如對比本周和上一周的數據),我們才能知道銷售是上升還是下降了。從兩周的銷售數據的對比中,獲取到的信息能告訴我們是否盈利。

基於提取到的信息,我們可以分析得到企業收集數據方式,甚至企業內部的組織方式。因此只看數據,我們可能會得出結論:數據越多越好。

關於企業銷售情況的信息可能會導致企業的一系列改變,比如運營方式的改變、產品的改變、目標客戶的改變以及價格的改變。

因此在大多數的場景下,數據越多越容易找到有用的信息。但是,問題出現了:我們生產的數據太多了,數據的處理產生了新的問題。

③ 信息生命周期管理

每個員工需要什麽數據來完成她的工作由這個員工的工作上的角色來決定。因此信息的分類有很多種:市場數據、銷售信息、產品成本、人力資源成本、後勤成本和研發成本。企業必須要保證其員工在正確的時間獲得正確的信息。

信息/數據保存格式甚至跟擁有信息一樣重要。比如,一個員工給其他人發送了一封包含重要信息的郵件,則接收者需要有一臺終端、一個郵件程序以及有相應的郵件賬號來接收這封郵件。如果我接收了一個文件,但是我的應用軟件無法打開這個文件,那麽我也無法獲得裏面的信息。

下一個問題是,數據應該保存多長時間?這個與具體的業務和數據有關,但是通常政府法規規定了企業應該將信息保存多長時間,有些信息甚至需要保存幾十年。比如一個橋梁建築公司,只要修建的橋梁還存在,則該建築公司需要將該橋梁的圖紙或者架構設計文檔數據一直保存著。

a. 信息生命周期管理-硬拷貝

這裏格式應該被考慮成一個廣義的格式含義。盡管當今很多數據都是以數字形式保存的,但仍然還有很多模擬形式的數據,比如照片、有法律效力的紙質文件、傳真或者那些從未數字化的歸檔數據。

所有的文檔有其相關性,需要知道要保持多久。有些文檔非常敏感而且需要被妥善保存;有些文檔只能查看一下,不能被復制。在這些情況下,需要采用特別紙張來防止這些文檔被復制,比如可以使復制的信息不可讀。同時,對於紙質文件還有版本控制的問題。版本控制,同時也意味著,如果原始的版本被修改,你需要保留不同的版本。

對於紙質文件,如果要做版本控制,那就意味著需要歸檔保存多個版本的文件。現在的紙張質量比較好,但是以前的紙張質量比較脆弱,容易損壞。同時,紙張上的墨水也會化掉,甚至可能把整個張紙都破壞了。要保留這些舊的文件是一個非常巨大的工作,且花費不小。如今,我們將這些大多數的紙質文檔數字化,並且將原件保存在條件非常適合保存的地方。我們現在可以查看掃描件,可以將掃描件放大來查看文件的細節,我們還可以修改圖片文件並且方便地將這些掃描件或圖片文件共享給其他的用戶。

如果信息需要被控制,則需要有一些辦法來控制。比如將文檔保存在保險箱裏,有的歸檔的文件甚至要保存在保存條件良好的封閉房間中,且需要安全保衛。

a. 信息生命周期管理-數字信息

數字文件通常有它們的限制,我們需要使用相應的軟件來打開,讀取,或者修改文件。因此在創建時,需要選擇一個允許所有相關的使用者都可以訪問的文件格式來記錄數據。

有三種典型的文件類型:

文本文件:這類文件主要包含了字符(字母或者/和數字)和少量的圖片。 Word文檔、電子表格、數據庫文件是典型的例子。

位圖文件:在位圖中,所有相關的圖元(或像素)都被單獨保存。典型的例子是照片和掃描件,因為位圖文件需要保存位圖的每一位像素,因此需要大量的存儲空間。

矢量圖文件:矢量圖是以數學對象和公式來保存的。典型的例子是AutoCAD等畫圖軟件產生的文檔。

當選擇文件保存格式時,最好是普遍都可以打開的,而不是只是某一個公司的軟件可以打開。這些文件的格式可以存在和支持很多年。比如TIFF格式的位圖、 IGES的矢量圖或者SGML格式的文件。對於文本格式的文件, ODF(Open Document Format)的文件使用得越來越多了。

當保存位圖信息時,常常進行壓縮。盡管壓縮可以用來減小文件的存儲空間, 但是壓縮也意味著信息的丟失。有時,將文件以無損模式保存防止了信息的丟失。 TIFF格式就是一種無損格式,而JPG和PNG格式因為內在的壓縮技術,就不是無損的。

附: CALS( Computer Aided Logisitcs Support)是美國軍方使用的一種文件格式。BASEL是歐洲企業財務部門信息標準。

a. 信息生命周期管理-硬件

對於數字信息,我們就可以使用物理隔離或者軟件隔離的方式。物理隔離的方式,比如我們把數據存在與外部網絡隔離的環境中,在這樣的環境中,只有內部網絡可以訪問數據,從而隔離外部的非法訪問。

類似的隔離也可以用軟件來實現,我們可以用ICT基礎設施中的技術來防止非法的訪問。比如我們可以用防火墻、安全網關、訪問控制列表以及交換機中VLAN的劃分來進行軟件隔離。

在什麽情況下,我們需要保證數據的完整性呢?也就是說,保存的數據不允許後面再被修改。比如法律相關的文檔,醫療機構的醫療報告,通常就被要求防止非法的修改。對於紙質文檔,可以將這些文件存放在特殊的地方以防止篡改。對於數字文檔,需要將這些文檔存放在WORM( Write Once Read Many)介質中。 WORM技術允許數據寫

一次,但是不允許修改,而讀數據則不受限制。

如果某些信息需要多個人都訪問,一種辦法是做多個副本,供多人訪問。如果某些文檔需要多人修改,則需要他們依次訪問依次修改,而不能同時修改。

如果需要多個應用打開和修改相同的文件則需要集群技術。在集群技術中,多個主機和應用可以同時訪問同一個文件。集群中的每一個成員都可以修改文件內容,並且修

改的內容在修改後能被正確保存。

a. 信息生命周期管理-保留周期

獲取信息重要,但是長時間保存這些信息也非常重要。很多企業將訂單、發票、付款信息和票據等保存很多年,以備在後期業務中再次需要用到這些文件的信息。一些生產工具的保修信息和服務協議也需要保存與工具的使用壽命相同的時間。

有時,不同的行業有一些額外的規定。比如,在許多西歐國家,發票、員工合同相關的信息通常要求要保存7年或更長時間。病人的醫療文檔要求至少要保存15年,這樣醫生可以方便查看病人的病史,而且可以幫助他制定更好的醫療計劃。基於此,政府可能要求企業長時間保存這些文檔,雖然這些文檔對企業本身可能沒有什麽用了。

在數字信息被保留下來後,接下來的問題是:這些以數字形式保存的信息要保存多久?

如果數據存儲在磁性介質上(也許還有人記得錄像機或者錄音機),磁帶可能過幾年就消磁了。存儲在CD或者DVD上的數據也不能無限期的保存下來。比如CD保存了一段時間後,也有可能出現無法讀取的情況。我們必須將數據保存在更可靠的介質上,而且要定期維護更新這些介質(比如每隔兩年重新生成副本)。

a. 信息生命周期管理-如何銷毀廢棄數據

在數據超過了保存期限後,就不再有用了,而且企業也不再需要保存這些數據了。問

題是如何銷毀這些我們不再需要的數據呢?

首先,有些法規也規定了防止了數據的濫用。比如美國的索克思法案 (SOX:全稱為Sarbanes-Oxley Act)就規定了公司有責任保存或者銷毀其產生或使用的數據,而且也有責任保證沒有人可以復制或者將數據帶出企業。

如果信息是以紙件方式歸檔存放的,則必須要對紙件進行粉粹銷毀,或者進行焚燒銷

毀。

數字信息不是那麽容易銷毀。磁盤格式化之類的傳統方式並不是非常安全,因為可能還是有技術方法能夠恢復希望銷毀的數據。基於這種情況,有些專業的軟件可以擦除介質上的數據,並向寫過舊數據的地方寫入隨機數據(可能需要寫入多次)的方式來保證銷毀。對於一些政府機構來說,需從磁盤上擦除數據甚至物理粉粹磁盤,以保證任何人都無法重復使用這些介質。

1、【華為HCIE-Storage】--基礎知識