1. 程式人生 > >jQuery選擇器程式碼詳解(三)——tokenize方法

jQuery選擇器程式碼詳解(三)——tokenize方法

原創文章,轉載請註明出處,多謝!

/*
 * tokenize方法是選擇器解析的核心函式,它將選擇器轉換成兩級陣列groups
 * 舉例:
 *     若選擇器為“div.class,span”,則解析後的結果為:
 *     group[0][0] = {type:'TAG',value:'div',matches:match}
 *     group[0][1] = {type:'CLASS',value:'.class',matches:match}
 *     group[1][0] = {type:'TAG',value:'span',matches:match}
 * 由上述結果可以看出,groups的每一個元素以逗號分隔的選擇器塊的解析結果,
 * 另外,上述結果中的matches等於模式匹配的結果,由於在此不方便寫清楚,
 * 故只把程式碼matches:match寫在這裡。
 * 
 * tokenize方法完成如下兩個主要任務:
 * 1、解析選擇器
 * 2、將解析結果存入快取中,以備後用
 * 
 * 
 * @param selector 待解析的選擇器字串
 * @param parseOnly 為true時,說明本次呼叫是匹配子選擇器
 *     舉個例子:若初始選擇器為"div:not(.class:not(:eq(4))):eq(3)"
 *     程式碼首先匹配出TAG選擇器div,
 *     之後匹配出的pseudo選擇器字串是:not(.class:not(:eq(4))):eq(3),
 *     程式碼會把“.class:not(:eq(4))):eq(3”作為not的括號內的值進一步進行解析,
 *     此時程式碼在呼叫tokenize解析時,parseOnly引數會傳入true.
 */
function tokenize(selector, parseOnly) {
	var matched, match, tokens, type, soFar, groups, preFilters, 
	// 獲取快取中的結果
	cached = tokenCache[selector + " "];

	/*
	 * 若快取中有selector對應的解析結果
	 * 則執行if中語句體
	 */
	if (cached) {
		// 若是對初始選擇器解析(parseOnly!=true),則返回快取結果,
		// 若不是,則返回0
		return parseOnly ? 0 : cached.slice(0);
	}

	/*
	 * 由於字串在javascript中不是作為物件來處理的,
	 * 所以通過賦值,程式碼就自動複製了一個新字串給了soFar,
	 * 這樣,對soFar的任何處理都不會影響selector的原有資料
	 */
	soFar = selector;
	groups = [];
	// 此處賦值,僅僅用於減少後續程式碼字數,縮短執行路徑
	preFilters = Expr.preFilter;

	while (soFar) {

		// Comma and first run
		/*
		 * rcomma = new RegExp("^" + whitespace + "*," + whitespace + "*")
		 * rcomma用來判定是否存在多個選擇器塊,即用逗號隔開的多個並列的選擇器
		 * 
		 * 下面條件判定依次為:
		 * !matched:若是第一次執行迴圈體,則為true;否則為false。
		 *           這裡matched即作為是否第一次執行迴圈體的標識,
		 *           也作為本次迴圈中soFar是否以非法字串(即非合法單一選擇器)開頭的標誌。
		 * (match = rcomma.exec(soFar):獲取符合rcomma的匹配項
		 */
		if (!matched || (match = rcomma.exec(soFar))) {
			if (match) {
				// Don't consume trailing commas as valid
				/*
				 * 剔除掉第一個逗號及之前的所有字元
				 * 舉個例子:
				 * 若初始選擇器為:"div.news,span.closed",
				 * 在解析過程中,首先由後續程式碼解析完畢div.news,剩下",span.closed"
				 * 在迴圈體內執行到這裡時,將逗號及之前之後連續的空白(match[0])刪除掉,
				 * 使soFar變成"span.closed",繼續執行解析過程
				 * 
				 * 在這裡,若初始選擇器的最後一個非空白字元是逗號,
				 * 那麼執行下面程式碼時soFar不變,即soFar.slice(match[0].length)返回空字串,
				 * 故最終返回的是||後面的soFar
				 */
				soFar = soFar.slice(match[0].length) || soFar;
			}
			
			/*
			 * 在第一次執行迴圈體或者遇到逗號分割符時,將tokens賦值為一個空陣列,
			 * 同時壓入groups陣列
			 */
			groups.push(tokens = []);
		}

		matched = false;

		// Combinators
		/*
		 * rcombinators = new RegExp(
		 *		"^" + whitespace + "*([>+~]|" + whitespace + ")" + whitespace + "*"),
		 * rcombinators用來匹配四種關係符,即>+~和空白
		 * 
		 * 若soFar中是以關係符開始的,則執行if內的語句體
		 */
		if ((match = rcombinators.exec(soFar))) {
			/*
			 * 將match[0]移除match陣列,同時將它賦予matched
			 * 若原本關係符兩邊帶有空格,則此時match[0]與matched是不相等的
			 * 舉個例子:
			 * 若soFar = " + .div";
			 * 執行match = rcombinators.exec(soFar)後,
			 * match[0] = " + ",而match[1]="+";
			 * 執行完matched = match.shift()後,
			 * matched=" + ",而match[0]="+";
			 */
			matched = match.shift();
			// 將匹配結果壓入tokens陣列中
			tokens.push({
				value : matched,
				// Cast descendant combinators to space
				/*
				 * rtrim = new RegExp("^" + whitespace + "+|((?:^|[^\\\\])(?:\\\\.)*)"
				 *			+ whitespace + "+$", "g"),
				 * whitespace = "[\\x20\\t\\r\\n\\f]";
				 * 
				 * 下面match[0].replace(rtrim, " ")的作用是將match[0]左右兩邊的空白替換為空格
				 * 但是由於其上的match.shift的作用,match[0]已經是兩邊不帶空白的字串了,
				 * 故此出的替換是沒有用途的程式碼
				 */
				type : match[0].replace(rtrim, " ")
			});
			
			// 將關係符之後的字串賦予soFar,繼續解析
			soFar = soFar.slice(matched.length);
		}

		// Filters
		/*
		 * 下面通過for語句對soFar逐一匹配ID、TAG、CLASS、CHILD、ATTR、PSEUDO型別的選擇器
		 * 若匹配到了,則先呼叫該型別選擇器對應的預過濾函式,
		 * 然後,將結果壓入tokens陣列,繼續本次迴圈。
		 */
		for (type in Expr.filter) {
			/*
			 * match = matchExpr[type].exec(soFar):對soFar呼叫type型別的正則表示式對soFar進行匹配,
			 *     並將匹配結果賦予match。若未匹配到資料,則match為undefined。
			 * !preFilters[type]:若不存在type型別的預過濾函式,則為true
			 * match = preFilters[type](match):執行預過濾,並將結果返回給match
			 * 
			 */
			if ((match = matchExpr[type].exec(soFar))
					&& (!preFilters[type] || (match = preFilters[type]
							(match)))) {
				// 將match[0]移除match陣列,同時將它賦予matched
				matched = match.shift();
				// 將匹配結果壓入tokens陣列中
				tokens.push({
					value : matched,
					type : type,
					matches : match
				});
				// 將匹配結果之後的字串賦予soFar,繼續解析
				soFar = soFar.slice(matched.length);
			}
		}

		/*
		 * 若matched==false,
		 * 則說明本次迴圈沒有有效的選擇器(包括關係符和id、class等型別選擇器)
		 * 因此,解析到當前位置遺留下來的soFar是非法的選擇器字串
		 * 跳出while迴圈體
		 */
		if (!matched) {
			break;
		}
	}

	// Return the length of the invalid excess
	// if we're just parsing
	// Otherwise, throw an error or return tokens
	/*
	 * 若不是對初始選擇器字串進行解析(!parseOnly==true),
	 *     則返回soFar.length,此時的soFar.length代表連續有效的選擇器最終位置,
	 *     後續文章將以例項進行說明
	 * 若是對初始選擇器字串進行解析,則看soFar是否還有字元,
	 *     若是,則執行Sizzle.error(selector)丟擲異常;
	 *     若不是,則執行tokenCache(selector, groups).slice(0)將結果壓入快取,並返回結果的副本。
	 */
	return parseOnly ? soFar.length : soFar ? Sizzle.error(selector) :
	// Cache the tokens
	tokenCache(selector, groups).slice(0);
}

各位朋友,若覺得寫得不錯,幫我頂一下,給點動力,多謝!