Linux C函式strtok解析

阿新 • • 發佈：2019-01-27

1. 今天看了看strtok函式，特意找了下Linux核心2.0.1版本的程式碼，因為在更高版本（至少2.6）已經使用strsep替換了該函式.

函式原型：

char * strtok(char * s,const char * ct)

使用第二個引數ct中的分隔符字串，分割第一個引數s，ct引數的分隔符可以是任意字元，可以是單個字元的分隔符，也可以是字串形式的分隔符如:"!,;'/"等，都可以作為分隔符。例如：

s="abc,def,123;456!/aaa"

ct=",;!/"

s將被分割為為：abc def 123 456 aaa

測試程式碼：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

int main()
{
  char s[] = "abc,def,123;456!/aaa";
  char delim[] = " ,;!/";

  char *p = NULL;
  for(p = strtok(s, delim); p != NULL; p = strtok(NULL, delim))
  {
    printf("%s ", p);
  }
  printf("\n");

  return 0;
}

[[email protected] algorithm]$ gcc strtok.c -o strtok
[[email protected] algorithm]$ ./strtok
abc def 123 456 aaa

2. strtok程式碼分析，以下程式碼摘自Linux2.01.版本：

char * strtok(char * s,const char * ct)
{
	char *sbegin, *send;

	sbegin  = s ? s : ___strtok;
	if (!sbegin) {
		return NULL;
	}
	sbegin += strspn(sbegin,ct);
	if (*sbegin == '\0') {
		___strtok = NULL;
		return( NULL );
	}
	send = strpbrk( sbegin, ct);
	if (send && *send != '\0')
		*send++ = '\0';
	___strtok = send;
	return (sbegin);
}

先說下strtok的整體思想也就是關鍵的幾個步驟：

a。首先strtok將資料儲存在全域性變數__strtok中，因此不是執行緒安全的也即不可重入。

b。strtok查詢分隔符字串時，跳過連續的分隔符，這樣可以忽略連續分隔符之間的空串，連續分隔符是從源字串開始位置計算，個數通過函式strspn計算得出。

size_t strspn(const char *s, const char *accept)，計算字串 str 中連續有幾個字元都屬於字串 accept。

例如：";,/!ABC!/DEF"，前四個字元都是分隔符且是連續的，那麼strspn函式返回4，有效資料跳過前4個分隔符就從字元A開始，直到下一分隔符。

c。呼叫函式strpbrk，即源字串中的字元如果與分隔符字串中任意字元相同，就返回指向源字串中該字元的指標，即找到了分隔符，返回該資料的指標。

char * strpbrk(const char * cs,const char * ct)，比較字串str1和str2中是否有相同的字元，如果有，則返回該字元在str1中的位置的指標。

例如：";,/!ABC!/DEF"，跳過4個分隔符後，從A開始直到遇到分隔符感嘆號（!）那麼，就返回指向資料起始位置的指標，該指標指向字元A。

細節分析：

a。變數__strtok是全域性變數，定義在string.c檔案中：char * ___strtok = NULL; 在標頭檔案linux/string.h中進行外部宣告，只要使用該變數的c檔案包含該標頭檔案即可；

b。全域性變數__strtok儲存了剩餘未做分隔的字串的起始地址，每次呼叫strtok函式，都從全域性變數__strtok指向的地址開始查詢引數中的分隔符字串，找到之後__strtok指向本次分隔符的下一位置（有效資料或者結尾符\0，又或者是分隔符如果有連續分隔符的話）。

c。對於字串 "abc,def,123;456!/aaa"; 第一次呼叫strtok之後，分隔符逗號（,）被設定為\0，__strtok設定為指向第一個分隔符逗號之後的資料即__strtok指向字元d，返回指向字元a的指標；第二次呼叫strtok時，從__strtok指向的字元d開始查詢delim中的分隔符，找到第二個逗號時，與第一次操作一樣，分隔符逗號被設定為\0，並從新設定__strtok指向字元1，返回指向字元d的指標，後續一直如此迴圈。

d。如果源字串包含連續分隔符，則呼叫函式strspn計算出連續相同的分隔符字元後會跳過這些分隔符。

附上函式strspn的測試示例：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

int main()
{
  int ret = 0;
  char s1[] = "abc,;!/}defgh,,,**#123,456";
  char s2[] = ";,/#}*abc,;!/}defgh,,,**#123,456";
  char delim[] = ",;!/}#*";

  ret = strspn(s1, delim);
  printf("ret1:%d\n", ret);

  ret = strspn(s2, delim);
  printf("ret2:%d\n", ret);

  return 0;
}

結果如下：

[[email protected] algorithm]$ gcc strspn.c -o strspn
[[email protected] algorithm]$ ./strspn
ret1:0
ret2:6

函式是從源字串開始位置匹配分隔符，只有開始的連續才起作用，開始有1個或者多個則返回匹配到的分隔符個數，如果開始位置一個分隔符都沒有，則返回0，如果有1個則返回1個，上例中返回6個。

Linux C函式strtok解析

Linux C函式strtok解析

linux C函式之stat函式

Linux C 函式速查

【轉】Linux C函式庫參考

linux C函式之access函式的用法【轉】

linux c 命令列解析

Linux--C函式

Linux C]利用libxml2解析xml檔案

Linux C 函式指標應用---回撥函式

Linux C中main函式中的引數argc和argv

Linux C獲取時間函式例項

【C語言】字串函式strtok 按照指定字串分割

Linux C 中獲取local日期和時間 time()&localtime()函式

軟體素材---linux C語言：linux下獲取可執行檔案的絕對路徑--getcwd函式

軟體素材---linux C語言：拼接字串函式 strcat的用例(與char陣列聯合使用挺好)

C++ 函式呼叫過程中棧的變化解析

C++ 虛擬函式表解析

Linux常用C函式

Linux C高階程式設計——網路程式設計之包裹函式

Linux C高階程式設計——檔案操作之庫函式

Linux C函式strtok解析

相關推薦