您好,登錄后才能下訂單哦!
Aho-Corasick算法是一種多模式字符串匹配算法,用于在文本中查找多個子字符串
import java.util.*;
public class AhoCorasick {
private TrieNode root;
private List<TrieNode> nodes;
private Map<String, List<Integer>> patternPositions;
public AhoCorasick() {
root = new TrieNode();
nodes = new ArrayList<>();
patternPositions = new HashMap<>();
}
public void addPattern(String pattern) {
TrieNode node = root;
for (char c : pattern.toCharArray()) {
if (!node.children.containsKey(c)) {
node.children.put(c, new TrieNode());
}
node = node.children.get(c);
}
int index = nodes.size();
node.isEndOfWord = true;
nodes.add(node);
patternPositions.computeIfAbsent(pattern, k -> new ArrayList<>()).add(index);
}
public List<Integer> searchPatterns(String text) {
List<Integer> result = new ArrayList<>();
TrieNode node = root;
for (int i = 0; i < text.length(); i++) {
char c = text.charAt(i);
if (!node.children.containsKey(c)) {
node = root;
} else {
node = node.children.get(c);
}
if (node.isEndOfWord) {
for (int patternIndex : patternPositions.getOrDefault(text.substring(i - node.length() + 1), Collections.emptyList())) {
result.add(patternIndex);
}
}
}
return result;
}
private static class TrieNode {
Map<Character, TrieNode> children;
boolean isEndOfWord;
public TrieNode() {
children = new HashMap<>();
isEndOfWord = false;
}
}
public static void main(String[] args) {
AhoCorasick ac = new AhoCorasick();
ac.addPattern("abc");
ac.addPattern("def");
ac.addPattern("ghi");
System.out.println(ac.searchPatterns("abcdefghi")); // Output: [0, 3]
}
}
這個實現中,我們首先創建了一個AhoCorasick
類,其中包含一個TrieNode
類來表示Aho-Corasick算法中的字典樹節點。addPattern
方法用于向字典樹中添加模式字符串,searchPatterns
方法用于在文本中查找所有匹配的模式字符串的位置。
在main
方法中,我們創建了一個AhoCorasick
實例,并添加了三個模式字符串。然后,我們在文本"abcdefghi"
中查找這些模式字符串,并將結果輸出到控制臺。在這個例子中,輸出結果為[0, 3]
,表示模式字符串"abc"
和"def"
分別在文本中的位置0和3。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。