vue?parseHTML函數解析器遇到結束標簽會怎么樣

發布時間：2022-07-14 09:26:29 來源：億速云閱讀：117 作者：iii 欄目：開發技術

今天小編給大家分享一下vue parseHTML函數解析器遇到結束標簽會怎么樣的相關知識點，內容詳細，邏輯清晰，相信大部分人都還太了解這方面的知識，所以分享這篇文章給大家參考一下，希望大家閱讀完這篇文章后有所收獲，下面我們一起來了解一下吧。

引言

接下來我們將會講解當 textEnd === 0 解析器遇到結束標簽，parse 結束標簽的代碼如下：

// End tag:
var endTagMatch = html.match(endTag);
if (endTagMatch) {
	var curIndex = index;
	advance(endTagMatch[0].length);
	parseEndTag(endTagMatch[1], curIndex, index);
	continue
}

match函數匹配正則endTag

首先調用 html 字符串的 match 函數匹配正則 endTag ，將結果保存在常量endTagMatch中。正則 endTag 用來匹配結束標簽，并且擁有一個捕獲組用來捕獲標簽名字，比如有如下html 字符串：

<div></div>

endTagMatch 輸出如下：

endTagMatch = [
'</div>',
'div'
]

第一個元素是整個匹配到的結束標簽字符串

第二個元素是對應的標簽名字。

如果匹配成功 if 語句塊的代碼將被執行，首先使用 curIndex 常量存儲當前 index 的值，然后調用 advance 函數，并以 endTagMatch[0].length 作為參數，接著調用了 parseEndTag 函數對結束標簽進行解析，傳遞給 parseEndTag 函數的三個參數分別是：標簽名以及結束標簽在 html 字符串中起始和結束的位置，最后調用 continue 語句結束此次循環。

關鍵 parseEndTag 函數代碼

現在我們來講解下關鍵 parseEndTag 函數代碼如下：

function parseEndTag(tagName, start, end) {
	var pos, lowerCasedTagName;
	if (start == null) {
		start = index;
	}
	if (end == null) {
		end = index;
	}
	// Find the closest opened tag of the same type
	if (tagName) {
		lowerCasedTagName = tagName.toLowerCase();
		for (pos = stack.length - 1; pos >= 0; pos--) {
			if (stack[pos].lowerCasedTag === lowerCasedTagName) {
				break
			}
		}
	} else {
		// If no tag name is provided, clean shop
		pos = 0;
	}
	if (pos >= 0) {
		// Close all the open elements, up the stack
		for (var i = stack.length - 1; i >= pos; i--) {
			if (i > pos || !tagName &&
				options.warn
			) {
				options.warn(
					("tag <" + (stack[i].tag) + "> has no matching end tag.")
				);
			}
			if (options.end) {
				options.end(stack[i].tag, start, end);
			}
		}
		// Remove the open elements from the stack
		stack.length = pos;
		lastTag = pos && stack[pos - 1].tag;
	} else if (lowerCasedTagName === 'br') {
		if (options.start) {
			options.start(tagName, [], true, start, end);
		}
	} else if (lowerCasedTagName === 'p') {
		if (options.start) {
			options.start(tagName, [], false, start, end);
		}
		if (options.end) {
			options.end(tagName, start, end);
		}
	}
}

你需要知道 parseEndTag 函數調用之前已經獲得到了結束標簽的名字以及結束標簽在html（template）字符串中的起始和結束位置。但是這并不代表著 html parser 結束了。

為什么？

還記得我們之前講的 stack 棧嗎？之前我們講到通過stack可以檢測是否有非一元標簽是否微寫閉合標簽，接下來還會處理 stack 棧中剩余的標簽。

除了這些功能之外，parseEndTag函數還會做一件事兒，如果你感興趣你可以在任何html文件中寫下如下內容：

<body>
</br>
</p>
</body>

上面的html片段中，我們分別寫了</br>、</p>的結束標簽，但注意我們并沒有寫起始標簽，然后瀏覽器是能夠正常解析他們的，其中 </br> 標簽被正常解析為 <br> 標簽，而</p>標簽被正常解析為 <p></p> 。除了 br 與 p 其他任何標簽如果你只寫了結束標簽那么瀏覽器都將會忽略。所以為了與瀏覽器的行為相同，parseEndTag 函數也需要專門處理br與p的結束標簽，即：</br> 和</p>。

總結parseEndTag 函數作用

檢測是否缺少閉合標簽
處理 stack 棧中剩余的標簽
解析</br> 與標簽，與瀏覽器的行為相同

當一個函數擁有兩個及以上功能的時候，最常用的技巧就是通過參數進行控制，還記得jQuery中的Access 嗎？parseEndTag 函數接收三個參數，這三個參數其實都是可選的，根據傳參的不同其功能也不同。

第一種是處理普通的結束標簽，此時三個參數都傳遞
第二種是只傳遞第一個參數
第三種是不傳遞參數，處理 stack 棧剩余未處理的標簽。

代碼并不復雜我們一起來看下吧！

var pos, lowerCasedTagName;
if (start == null) {
	start = index;
}
if (end == null) {
	end = index;
}

定了兩個變量：pos和 lowerCasedTagName，其中變量 pos 會在后面用于判斷 html 字符串是否缺少結束標簽，lowerCasedTagName 變量用來存儲 tagName 的小寫版。

接著是兩句if 語句，當 start 和 end 不存在時，將這兩個變量的值設置為當前字符流的讀入位置，即index。

所以當我們看到這兩個 if 語句時，我們就應該能夠想到：parseEndTag 函數的第二個參數和第三個參數都是可選的。

其實這種使用 parseEndTag 函數的方式我們在handleStartTag 函數中見過，當時我們沒有對其進行講解一起來回顧下。

if (expectHTML) {
  if (lastTag === 'p' && isNonPhrasingTag(tagName)) {
    parseEndTag(lastTag)
  }
  if (canBeLeftOpenTag(tagName) && lastTag === tagName) {
    parseEndTag(tagName)
  }
}

我們知道 lastTag 引用的是stack棧頂的元素，也就是最近(或者說上一次)遇到的開始標簽，所以如下判斷條件：

lastTag === 'p' && isNonPhrasingTag(tagName)

這里想表達的意思是：最近一次遇到的開始標簽是 p 標簽，并且當前正在解析的開始標簽必須不能是段落式內容(Phrasing content)模型，這時候 if 語句塊的代碼才會執行，即調用parseEndTag(lastTag)。

首先大家要知道每一個 html 元素都擁有一個或多個內容模型(content model)，其中p 標簽本身的內容模型是流式內容(Flow content)，并且 p 標簽的特性是只允許包含段落式內容(Phrasing content)。

所以條件成立的情況如下：

<p><h2></h2></p>

在解析上面這段 html 字符串的時候，首先遇到p標簽的開始標簽，此時lastTag被設置為 p ，緊接著會遇到 h2 標簽的開始標簽，由于 h3 標簽的內容模型屬于非段落式內容(Phrasing content)模型，所以會立即調用 parseEndTag(lastTag) 函數閉合 p 標簽，此時由于強行插入了</p> 標簽，所以解析后的字符串將變為如下內容：

<p></p><h3></h3></p>

接著，繼續解析該字符串，會遇到 <h3></h3> 標簽并正常解析之，最后解析器會遇到一個單獨的p 標簽的結束標簽，即：</p>。

這個時候就回到了我們前面講過的，當解析器遇到 p 標簽或者 br 標簽的結束標簽時會補全他們，最終<p><h3></h3></p> 這段 html 字符串將被解析為：

<p></p><h3></h3><p></p>

而這也就是瀏覽器的行為，以上是第一個if 分支的意義。還有第二個if分支，它的條件如下：

canBeLeftOpenTag(tagName) && lastTag === tagName

以上條件成立的意思是：當前正在解析的標簽是一個可以省略結束標簽的標簽，并且與上一次解析到的開始標簽相同，如下：

<p>max
<p>kaixin

p 標簽是可以省略結束標簽的標簽，所以當解析到一個p標簽的開始標簽并且下一次遇到的標簽也是p標簽的開始標簽時，會立即關閉第二個p標簽。即調用：parseEndTag(tagName) 函數，然后由于第一個p標簽缺少閉合標簽所以會Vue會給你一個警告。

handleStartTag函數后續

接下來我們繼續講解handleStartTag函數后續的內容。

if (tagName) {
	lowerCasedTagName = tagName.toLowerCase();
	for (pos = stack.length - 1; pos &gt;= 0; pos--) {
		if (stack[pos].lowerCasedTag === lowerCasedTagName) {
			break
		}
	}
} else {
	// If no tag name is provided, clean shop
	pos = 0;
}

如果tagName存在，lowerCasedTagName 獲取的是 tagName 小寫之后的值，接下來開啟一個 for 循環從后向前遍歷 stack 棧，直到找到相應的位置，并且該位置索引會保存到 pos 變量中，如果 tagName 不存在，則直接將 pos 設置為 0 。

開頭我們講到 pos 變量會被用來判斷是否有元素缺少閉合標簽。怎么做到的呢？看完下面的代碼你就明白了。

if (pos >= 0) {
	// Close all the open elements, up the stack
	for (var i = stack.length - 1; i >= pos; i--) {
		if (i > pos || !tagName &&
			options.warn
		) {
			options.warn(
				("tag <" + (stack[i].tag) + "> has no matching end tag.")
			);
		}
		if (options.end) {
			options.end(stack[i].tag, start, end);
		}
	}
	// Remove the open elements from the stack
	stack.length = pos;
	lastTag = pos && stack[pos - 1].tag;
} else if (lowerCasedTagName === 'br') {
	if (options.start) {
		options.start(tagName, [], true, start, end);
	}
} else if (lowerCasedTagName === 'p') {
	if (options.start) {
		options.start(tagName, [], false, start, end);
	}
	if (options.end) {
		options.end(tagName, start, end);
	}
}

上面代碼由三部分組成，即if...else if...else if。首先我們查看 if 語句塊，當 pos >= 0 的時候就會走 if 語句塊。在 if 語句塊內開啟一個 for 循環，同樣是從后向前遍歷 stack 數組，如果發現 stack 數組中存在索引大于 pos 的元素，那么該元素一定是缺少閉合標簽的，這個時候如果是在非生產環境那么 Vue 便會打印一句警告，告訴你缺少閉合標簽。除了打印一句警告之外，隨后會調用 options.end(stack[i].tag, start, end) 立即將其閉合，這是為了保證解析結果的正確性。

最后更新 stack 棧以及 lastTag

stack.length = pos;
lastTag = pos && stack[pos - 1].tag;

了解下剩下的兩個else if：

if (pos >= 0) {
  // ... 省略
} else if (lowerCasedTagName === 'br') {
  if (options.start) {
    options.start(tagName, [], true, start, end)
  }
} else if (lowerCasedTagName === 'p') {
  if (options.start) {
    options.start(tagName, [], false, start, end)
  }
  if (options.end) {
    options.end(tagName, start, end)
  }
}

這兩個else if 什么情況下成立呢?

當 tagName 沒有在 stack 棧中找到對應的開始標簽時，pos 為 -1 。
tagName為br 、p標簽。

當你寫了 br 標簽的結束標簽：</br> 或 p 標簽的結束標簽 </p> 時，解析器能夠正常解析他們，其中對于 </br> 會將其解析為正常的 <br> 標簽，而 </p> 標簽也會正常解析為<p></p>。

可以發現對于 </br> 和 </p> 標簽瀏覽器可以將其正常解析為 <br> 以及<p></p>，Vue 的 parser 與瀏覽器的行為是一致的。

現在我們還剩一個問題沒有講解，即parseEndTag是如何處理stack棧中剩余未處理的標簽的。其實就是調用 parseEndTag() 函數時不傳遞任何參數，也就是說此時 tagName 參數也不存在。這個時候我們再次查看下面的代碼：

由于 pos 為 0 ，所以 i >= pos 始終成立，這個時候 stack 棧中如果有剩余未處理的標簽，則會逐個警告缺少閉合標簽，并調用 options.end 將其閉合。

以上對于整個詞法分析的過程重點部分就已經講解完畢了，其實現方式就是通過讀取字符流配合正則一點一點的解析字符串，直到整個字符串都被解析完畢為止。并且每當遇到一個特定的token 時都會調用相應的鉤子函數，同時將有用的參數傳遞過去。比如每當遇到一個開始標簽都會調用 options.start 鉤子函數，遇到閉合標簽調用 options.end 鉤子函數。

以上就是“vue parseHTML函數解析器遇到結束標簽會怎么樣”這篇文章的所有內容，感謝各位的閱讀！相信大家閱讀完這篇文章都有很大的收獲，小編每天都會為大家更新不同的知識，如果還想學習更多的知識，請關注億速云行業資訊頻道。

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

vue?parseHTML函數解析器遇到結束標簽會怎么樣

引言

match函數匹配正則endTag

關鍵 parseEndTag 函數代碼

總結parseEndTag 函數作用

handleStartTag函數后續

最后更新 stack 棧以及 lastTag

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

vue?parseHTML函數解析器遇到結束標簽會怎么樣

引言

match函數匹配正則endTag

關鍵 parseEndTag 函數代碼

總結parseEndTag 函數作用

handleStartTag函數后續

最后更新 stack 棧以及 lastTag

猜你喜歡

最新資訊

相關推薦

相關標簽