1. 程式人生 > >awk 內建函式詳解

awk 內建函式詳解

本文承接上篇 linux awk 內建變數,本篇總結下awk內建函式。awk內建函式主機分為如下幾種:數學函式、字串函式、時間函式、其它函式。

一、數學函式

以下算術函式執行與 C 語言中名稱相同的子例程相同的操作:

函式名 說明
atan2( y, x ) 返回 y/x 的反正切。
cos( x ) 返回 x 的餘弦;x 是弧度。
sin( x ) 返回 x 的正弦;x 是弧度。
exp( x ) 返回 x 冪函式。
log( x ) 返回 x 的自然對數。
sqrt( x ) 返回 x 平方根。
int( x ) 返回 x 的截斷至整數的值。
rand( ) 返回任意數字 n,其中 0 <= n < 1。
srand( [Expr] ) 將 rand 函式的種子值設定為 Expr 引數的值,或如果省略 Expr 引數則使用某天的時間。返回先前的種子值。

例1:

  1. [[email protected] ~]# awk 'BEGIN{OFMT="%.3f";fs=sin(1);fe=exp(10);fl=log(10);fi=int(3.1415);print fs,fe,fl,fi;}'
  2. 0.84122026.4662.3033

在上一篇內建函式中已經總結過 OFMT 設定輸出資料格式是保留3位小數。

例2:獲得隨機數

  1. [[email protected]
    ~]# awk 'BEGIN{srand();fr=int(100*rand());print fr;}'
  2. 4
  3. [[email protected] ~]# awk 'BEGIN{srand();fr=int(100*rand());print fr;}'
  4. 45

上面的數學函式在常運維中使用的比較少,隨機數相對會多一些。不過awk產生隨機數的方法太過複雜,個人還是比較使用shell 變數通過echo $RANDOM產生,具體可以參看我的另一篇博文---shell 生成隨機數與隨機字串 。

二、字串函式

函式 說明
gsub( Ere, Repl, [ In ] ) 除了正則表示式所有具體值被替代這點,它和 sub 函式完全一樣地執行,。
sub( Ere, Repl, [ In ] ) 用 Repl 引數指定的字串替換 In 引數指定的字串中的由 Ere
引數指定的擴充套件正則表示式的第一個具體值。sub 函式返回替換的數量。出現在 Repl 引數指定的字串中的 &(和符號)由 In
引數指定的與 Ere 引數的指定的擴充套件正則表示式匹配的字串替換。如果未指定 In 引數,預設值是整個記錄($0 記錄變數)。
index( String1, String2 ) 在由 String1 引數指定的字串(其中有出現 String2 指定的引數)中,返回位置,從 1 開始編號。如果 String2 引數不在 String1 引數中出現,則返回 0(零)。
length [(String)] 返回 String 引數指定的字串的長度(字元形式)。如果未給出 String 引數,則返回整個記錄的長度($0 記錄變數)。
blength [(String)] 返回 String 引數指定的字串的長度(以位元組為單位)。如果未給出 String 引數,則返回整個記錄的長度($0 記錄變數)。
substr( String, M, [ N ] ) 返回具有 N 引數指定的字元數量子串。子串從 String
引數指定的字串取得,其字元以 M 引數指定的位置開始。M 引數指定為將 String 引數中的第一個字元作為編號 1。如果未指定 N
引數,則子串的長度將是 M 引數指定的位置到 String 引數的末尾 的長度。
match( String, Ere ) 在 String 引數指定的字串(Ere
引數指定的擴充套件正則表示式出現在其中)中返回位置(字元形式),從 1 開始編號,或如果 Ere 引數不出現,則返回 0(零)。RSTART
特殊變數設定為返回值。RLENGTH 特殊變數設定為匹配的字串的長度,或如果未找到任何匹配,則設定為 -1(負一)。
split( String, A, [Ere] ) 將 String 引數指定的引數分割為陣列元素 A[1], A[2], . .
., A[n],並返回 n 變數的值。此分隔可以通過 Ere 引數指定的擴充套件正則表示式進行,或用當前欄位分隔符(FS
特殊變數)來進行(如果沒有給出 Ere 引數)。除非上下文指明特定的元素還應具有一個數字值,否則 A 陣列中的元素用字串值來建立。
tolower( String ) 返回 String 引數指定的字串,字串中每個大寫字元將更改為小寫。大寫和小寫的對映由當前語言環境的 LC_CTYPE 範疇定義。
toupper( String ) 返回 String 引數指定的字串,字串中每個小寫字元將更改為大寫。大寫和小寫的對映由當前語言環境的 LC_CTYPE 範疇定義。
sprintf(Format, Expr, Expr, . . . ) 根據 Format 引數指定的 printf 子例程格式字串來格式化 Expr 引數指定的表示式並返回最後生成的字串。

注:Ere部分可以是正則表示式 。

1、gsub,sub使用

  1. [[email protected] ~]# awk 'BEGIN{info="this is a test2012test!";gsub(/[0-9]+/,"||",info);print info}'
  2. this is a test||test!

在 info中查詢滿足正則表示式,/[0-9]+/ 用"||"替換,並且替換後的值,賦值給info並列印輸出。

2、查詢字串(index使用)

  1. [[email protected] ~]# awk 'BEGIN{info="this is a test2012test!";print index(info,"11111")?"ok":"no found";}'
  2. no found
  3. [[email protected] ~]# awk 'BEGIN{info="this is a test2012test!";print index(info,"is")?"ok":"no found";}'
  4. ok
  5. [[email protected] ~]# awk 'BEGIN{info="this is a test2012test!";print index(info,"test")?"ok":"no found";}'
  6. ok

這個比較牛X,使用了三元運算子 “ 表示式 ? 動作1:動作2” 。

3、正則表示式匹配查詢(match使用)

  1. [[email protected] ~]# awk 'BEGIN{info="this is a test2012test!";print match(info,/[0-9]+/)?"ok":"no found";}'
  2. ok

4、擷取字串(substr使用)

  1. [[email protected] ~]# awk 'BEGIN{info="this is a test2012test!";print substr(info,4,10);}'
  2. s is a tes

從第 4個 字元開始,擷取10個長度字串。

5、字串分割(split使用)

  1. [[email protected] ~]# awk 'BEGIN{info="this is a test";split(info,tA," ");print length(tA);for(k in tA){print k,tA[k];}}'
  2. 4
  3. 4 test
  4. 1 this
  5. 2 is
  6. 3 a

分割info,將info字串使用空格切分為動態陣列tA 。注意awk for …in 迴圈,是一個無序的迴圈。 並不是從陣列下標1…n ,因此使用時候需要特別注意。

6、格式化字串輸出(sprintf使用)

其中格式化字串包括兩部分內容: 一部分是正常字元, 這些字元將按原樣輸出; 另一部分是格式化規定字元, 以"%"開始, 後跟一個或幾個規定字元,用來確定輸出內容格式。 需要特別注意的是使用printf時預設是不會換行的,而print函式預設會在每行後面加上"\n"換行符。

格式符 說明
%d 十進位制有符號整數
%u 十進位制無符號整數
%f 浮點數
%s 字串
%c 單個字元
%p 指標的值
%e 指數形式的浮點數
%x %X 無符號以十六進位制表示的整數
%o 無符號以八進位制表示的整數
%g 自動選擇合適的表示法 
  1. [[email protected] ~]# awk 'BEGIN{n1=124.113;n2=-1.224;n3=1.2345; printf("%.2f,%.2u,%.2g,%X,%o\n",n1,n2,n3,n1,n1);}'
  2. 124.11,18446744073709551615,1.2,7C,174
  3. [[email protected] ~]# awk 'BEGIN{n1=124.113;n2=-1.224;n3=1.2645; printf("%.2f,%.2u,%.2g,%X,%o\n",n1,n2,n3,n1,n1);}'
  4. 124.11,18446744073709551615,1.3,7C,174

注:看上面的n3輸出值會發現,在使用printf處理時一個比較智慧的功能是可以進行四捨五入保留小數點位的。

三、時間函式

函式名 說明
mktime( YYYY MM DD HH MM SS[ DST]) 生成時間格式
strftime([format [, timestamp]]) 格式化時間輸出,將時間戳轉為時間字串 
具體格式,見下表.
systime() 得到時間戳,返回從1970年1月1日開始到當前時間(不計閏年)的整秒數

1、systime獲取系統當前時間

這裡返回的是時間戳,是將當前時間減去1970-1-1時間,所得到的秒數。

  1. [[email protected] ~]# awk 'BEGIN{now=systime();print now}'
  2. 1343210982

2、strftime返回系統時間

  1. [[email protected] ~]# awk 'BEGIN{tstamp=1343210982;print strftime("%c",tstamp);}'
  2. Wed25Jul201206:09:42 PM CST
  3. [[email protected] ~]# awk 'BEGIN{tstamp=mktime("2001 01 18 12 15 40");print strftime("%c",tstamp);}'
  4. Thu18Jan200112:15:40 PM CST

3、mktime獲取時間差

  1. [[email protected] ~]# awk 'BEGIN{tstamp1=mktime("2001 01 01 12 12 12");tstamp2=mktime("2001 02 01 0 0 0");print tstamp2-tstamp1;}'
  2. 2634468
  3. [[email protected] ~]# awk 'BEGIN{tstamp1=mktime("2001 01 01 12 12 12");tstamp2=systime();print tstamp2-tstamp1;}'
  4. 308201392

先將時間通過mktime轉化為時間戳,再通過求兩個時間戳之間的差,獲取兩個時間之間具體差了多少秒。

strftime日期和時間格式說明符

格式 描述
%a 星期幾的縮寫(Sun)
%A 星期幾的完整寫法(Sunday)
%b 月名的縮寫(Oct)
%B 月名的完整寫法(October)
%c 本地日期和時間
%d 十進位制日期
%D 日期 08/20/99
%e 日期,如果只有一位會補上一個空格
%H 用十進位制表示24小時格式的小時
%I 用十進位制表示12小時格式的小時
%j 從1月1日起一年中的第幾天
%m 十進位制表示的月份
%M 十進位制表示的分鐘
%p 12小時表示法(AM/PM)
%S 十進位制表示的秒
%U 十進位制表示的一年中的第幾個星期(星期天作為一個星期的開始)
%w 十進位制表示的星期幾(星期天是0)
%W 十進位制表示的一年中的第幾個星期(星期一作為一個星期的開始)
%x 重新設定本地日期(08/20/99)
%X 重新設定本地時間(12:00:00)
%y 兩位數字表示的年(99)
%Y 當前月份
%Z 時區(PDT)
%% 百分號(%)

四、其他函式

函式 說明
close( Expression ) 用同一個帶字串值的 Expression 引數來關閉由 print 或
printf 語句開啟的或呼叫 getline 函式開啟的檔案或管道。如果檔案或管道成功關閉,則返回
0;其它情況下返回非零值。如果打算寫一個檔案,並稍後在同一個程式中讀取檔案,則 close 語句是必需的。
system(Command ) 執行 Command 引數指定的命令,並返回退出狀態。等同於 system 子例程。
Expression | getline [ Variable ] 從來自 Expression 引數指定的命令的輸出中通過管道傳送的流中讀取一個輸入記錄,並將該記錄的值指定給 Variable 引數指定的變數。如果當前未開啟將 Expression 引數的值作為其命令名稱的流,則建立流。建立的流等同於呼叫 popen 子例程,此時 Command 引數取 Expression 引數的值且 Mode 引數設定為一個是 r 的值。只要流保留開啟且
Expression 引數求得同一個字串,則對 getline 函式的每次後續呼叫讀取另一個記錄。如果未指定 Variable 引數,則 $0
記錄變數和 NF 特殊變數設定為從流讀取的記錄。
getline [ Variable ] < Expression 從 Expression 引數指定的檔案讀取輸入的下一個記錄,並將
Variable 引數指定的變數設定為該記錄的值。只要流保留開啟且 Expression 引數對同一個字串求值,則對 getline
函式的每次後續呼叫讀取另一個記錄。如果未指定 Variable 引數,則 $0 記錄變數和 NF 特殊變數設定為從流讀取的記錄。
getline [ Variable ] 將 Variable 引數指定的變數設定為從當前輸入檔案讀取的下一個輸入記錄。如果未指定 Variable 引數,則 $0 記錄變數設定為該記錄的值,還將設定 NF、NR 和 FNR 特殊變數。

1、開啟關閉外部檔案(close相關)

  1. [[email protected] ~]# awk 'BEGIN{while("cat /etc/passwd"|getline){print $0;};close("/etc/passwd");}'
  2. root:x:0:0:root:/root:/bin/bash
  3. bin:x:1:1:bin:/bin:/sbin/nologin
  4. daemon:x:2:2:daemon:/sbin:/sbin/nologin
  5. adm:x:3:4:adm:/var/adm:/sbin/nologin
  6. lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
  7. sync:x:5:0:sync:/sbin:/bin/sync
  8. …………省略

2、逐行讀取外部檔案(getline使用方法)

  1. [[email protected] ~]# awk 'BEGIN{while(getline < "/etc/passwd"){print $0;};close("/etc/passwd");}'
  2. root:x:0:0:root:/root:/bin/bash
  3. bin:x:1:1:bin:/bin:/sbin/nologin
  4. daemon:x:2:2:daemon:/sbin:/sbin/nologin
  5. adm:x:3:4:adm:/var/adm:/sbin/nologin
  6. lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
  7. …………省略

下面是一個互動式getline的示例:

  1. [[email protected] ~]# awk 'BEGIN{print "Enter your name:";getline name;print name;}'
  2. Enter your name:
  3. 361way.com
  4. 361way.com

3、呼叫外部應用程式(system使用方法)

  1. [[email protected] ~]# awk 'BEGIN{b=system("ls -l");print b;}'
  2. total 4952
  3. -rw-r--r--1 root root 23276Dec12012 a.py
  4. -rw-r--r--1 root root 4954897Jan192012 cms.tar.gz
  5. -rw-r--r--1 root root 73May262012 git.readme
  6. -rw-r--r--1 root root 401Mar252012 git_up

內建函式部分就行到這裡。

相關推薦

awk 函式

本文承接上篇 linux awk 內建變數,本篇總結下awk內建函式。awk內建函式主機分為如下幾種:數學函式、字串函式、時間函式、其它函式。 一、數學函式 以下算術函式執行與 C 語言中名稱相同的子例程相同的操作: 函式名 說明 atan2( y, x )

第11天函式

參考部落格地址:https://www.cnblogs.com/sesshoumaru/p/6140987.html#p2 人生三問 什麼是內建函式  內建函式就是python直譯器給我們已經定義好的一系列函式,我們可以直接進行呼叫,而不必進行定義的。 為什麼要用內建函式  對於一些常用的功能,我們沒有必要

C++函式呼叫過程和函式

       上圖表示 函式呼叫過程:①程式先執行函式呼叫之前的語句;②流程的控制轉移到被呼叫函式入口處,同時進行引數傳遞;③執行被呼叫函式中函式體的語句;④流程返回呼叫函式的下一條指令處,將函式返回值帶回;⑤接著執行主調函式未執

Python函式【翻譯自python3.6官方文件共68個】

翻譯源 來自:https://docs.python.org/3/library/functions.html  abs(x) 返回一個數的絕對值。引數可以是一個整數或一個浮點數。若引數是複數,返回複數的模 all(iterable) 若 可迭代物件中所有元素為真

python字串函式

概述 字串方法是從python1.6到2.0慢慢加進來的——它們也被加到了Jython中。 這些方法實現了string模組的大部分方法,如下表所示列出了目前字串內建支援的方法,所有的方法都包含了對Unicode的支援,有一些甚至是專門用於Unicode的。

Python3字串各種函式

● Python3訪問字串     Python不支援單字元型別,單字元在Python中也是作為一個字串來使用;     字串切片擷取; 空值 空值是Python裡一個特殊的值,用None表示。None不能理解為0,因為0是有

Python函式——總結篇

#字串可以提供的引數 's' None >>> format('some string','s') 'some string' >>> format('some string') 'some string' #整形數值可以提供的引數有 'b' 'c' 'd' 'o'

Python函式

         置頂   內建函式詳解 https://docs.python.org/3/library/functions.html?highlight=built#ascii        此文參考了別人整理好的東西(地址:http://www.cnblogs.co

JS:部分函式

1,parseInt(String str) 主要將首位為數字的字串轉換成數字,如果不是以數字開頭,將返回NaN <!DOCTYPE html> <html> <head> <meta charset="UTF-8">

python3函式

python內建了一系列的常用函式,以便於我們使用,python英文官方文件詳細說明:點選檢視, 為了方便檢視,將內建函式的總結記錄下來。 二. 使用說明    以下是Python3版本所有的內建函式: 1. abs()  獲取絕對值 1 >&g

Hive 運算子 & 函式 -- 適合關鍵詞查詢

1.內建運算子 1.1關係運算符 運算子 型別 說明 A = B 所有原始型別 如果A與B相等,返回TRUE,否則返回FALSE A == B 無 失敗,因為無效的語法。 SQL使用”=”,不使用”==”。 A <> B 所有原始型別

Python的模組

一、什麼是模組   模組就是封裝了一些列功能的py檔案,我們使用的時候直接匯入這個檔案,通過傳入引數的方式使用其他檔案的功能函式 二、模組有哪些 內建模組 自定義模組 第三方模組 三、如何匯入模組   匯入模組分為4種: 1 #匯入模組 2 import mode_tes

Python方法

  1. 簡介   本指南主題是 魔法方法 。   所以,為了修復我感知的Python文件的缺陷,我開始提供更為通俗的,有示例支援的Python魔法方法指南。我一開始 寫了一些博文,現在我把這些博文總起來成為一篇指南。   希望你喜歡這篇指南,一篇友好,通俗易懂的Python魔法方法指南!   2.

vue指令

指令是Vue模板中最常用的一項功能,它帶有字首v-,主要職責是當其表示式的值改變時,相應的將某些行為應用在 DOM 上。這篇文章主要介紹了vue內建指令詳解,需要的朋友可以參考下 指令 (Directives) 是帶有 v- 字首的特殊屬性, 職責是,當表示式的值改變時,將其產生的連帶影響,響應式地作用於

JavaWeb學習----JSP物件---九大內物件沒cook JavaWeb學習----JSP物件

JavaWeb學習----JSP內建物件詳解 JSP共有以下9大內建物件: out request response session pageContext application config page exception 文章連結 -

大資料系列之hive(八、hive函式

1.內建運算子1.1關係運算符 運算子 型別 說明 A = B 所有原始型別 如果A

ASP物件之Request物件

來源:網頁教學網 Request物件用於接受所有從瀏覽器發往你的伺服器的請求內的所有資訊。   所有客戶證書的資訊的集合。對於Key,該集合具有如下的關鍵字: Subject 證書的主題。包含所有關

MongoDB角色(翻譯自官方文件)

1 資料庫使用者角色 每個資料庫都包含下列的角色: read : 提供讀取所有的非系統集合的能力,也能讀取以下系統集合:system.indexes,system.js,system.namespacesreadWrite:提供所有讀許可權另外還能修改非系統集合和system.js集合

Python3.5——模組之os模組、sys模組、shutil模組

1、os模組:提供對作業系統進行呼叫的介面 #!/usr/bin/env python # -*- coding:utf-8 -*- # Author:ZhengzhengLiu import os print(os.getcwd()) #獲取當前的操作目錄,即當前

Hbase中Filter

一、建表 1、表名:“ORDER_TABLE” 2、列簇:“user”,“order”,“item” 3、表結構如下:   二、封裝服務 服務程式碼如下: @Override public String get(String tableName, Filter filte