1. 程式人生 > >【shell】數據文件分割

【shell】數據文件分割

shell 前綴 ace com 存儲 display 使用 數字 整數

有時候我們必須把數據文件分割為更小的文件,這樣方便我們郵件發送或者查看文件內容。split命令則可以用來分割文件。

一、根據大小來分割文件


1.一般分割

例如:現在有文件tmp.log,大小為:3680k,我們以1000k為單位分割該文件,在split命令中,除了k(KB),我們還可以使用M(MB)、G(GB)、c(byte)、w(word)

Linux:/qinys/data # split -b 1000k tmp.log

技術分享圖片


2.分割時指定後綴

在分割時,默認使用字母後綴,我們可以給文件名指定數字後綴,使用-d選項,此外,-a length可以指定後綴長度:

Linux:/qinys/data # split -b 1000k tmp.log -d -a 2

技術分享圖片

3.分割時候指定前綴

我們分割文件的時候為了區分那些是原始文件,哪些是分割後的文件,我們使用前綴來區分,以下在分割後的文件名之前添加fg_

Linux:/qinys/data # split -b 1000k tmp.log -d -a 2 fg_

技術分享圖片

二、根據行數來分割


現在存在數據文件tmp.log,數據總記錄數為:31346

以下是根據文件記錄數來拆分文件,以10000條記錄為單位進行拆分

Linux:/qinys/data # split -l 10000 tmp.log -d -a 2 row_

技術分享圖片


三、根據內容拆分


現在存在文件tmp1.log,文件內容如下所示:

技術分享圖片

我們現在想把每個ping的結果分別存儲到各個文件,以便查看;

命令如下:

Linux:/qinys/data #

csplit tmp1.log /ping/ -n 2 -s {*} -f ping -b "%02d.log"

執行結果如下:

技術分享圖片

命令解釋:

  • /ping/ 用來匹配特定的行,分割從此處開始;它從當前行(第一行)一直復制到(但不包括)包含ping的行
  • {*} 表示匹配重復執行分割操作,直到文件末尾為止。可以使用{整數}的形式來指定分割的次數
  • -s 是命令進入靜默模式,不打印其他信息
  • -n 指定分割後的文件名的數字個數,例如:01,02,03等
  • -f 指定分割後的文件名前綴
  • -b 指定後綴格式,%02d.log表示長度為2位,不足的使用0代替。例如:01,02,03等;可以參照c語言printf參數格式

【shell】數據文件分割