Java StringTokenizer 類本身并不能直接處理 HTML 標簽,但你可以通過編寫一個簡單的函數來解析 HTML 標簽并提取所需的內容。以下是一個示例函數,用于解析 HTML 標簽并返回標簽名稱和內容:
import java.util.StringTokenizer;
public class HtmlParser {
public static void main(String[] args) {
String html = "<div><p>這是一個 <b>示例</b> HTML 文本。</p></div>";
StringTokenizer tokenizer = new StringTokenizer(html);
while (tokenizer.hasMoreTokens()) {
String token = tokenizer.nextToken();
if (isHtmlTag(token)) {
System.out.println("Tag: " + token);
} else {
System.out.println("Content: " + token);
}
}
}
public static boolean isHtmlTag(String token) {
return token.startsWith("<") && token.endsWith(">");
}
}
這個示例中的 isHtmlTag
函數用于檢查給定的字符串是否是一個 HTML 標簽。如果是,它將返回 true,否則返回 false。在 main
函數中,我們使用 StringTokenizer 類遍歷 HTML 字符串,并使用 isHtmlTag
函數判斷每個令牌是否是 HTML 標簽。如果是標簽,我們打印標簽名稱;否則,我們打印內容。
請注意,這個示例僅用于演示目的,實際應用中可能需要更復雜的解析器來處理嵌套標簽和屬性。在這種情況下,可以考慮使用 Java 的 Jsoup 庫,它是一個功能強大的 HTML 解析庫。