数据结构之Trie——Java实现

Trie

◼ Trie 也叫做字典树、前缀树(Prefix Tree)、单词查找树 ◼ Trie 搜索字符串的效率主要跟字符串的长度有关 ◼ 假设使用 Trie 存储 cat、dog、doggy、does、cast、add 六个单词

实现代码

package trie;

import java.util.HashMap;

public class Trie<V> {
          
   
	private int size;
	private Node<V> root;
	
	public int size() {
          
   
		return size;
	}

	public boolean isEmpty() {
          
   
		return size == 0;
	}

	public void clear() {
          
   
		size = 0;
		root = null;
	}

	public V get(String key) {
          
   
		Node<V> node = node(key);
		return node != null && node.word ? node.value : null;
	}

	public boolean contains(String key) {
          
   
		Node<V> node = node(key);
		return node != null && node.word;
	}

	public V add(String key, V value) {
          
   
		keyCheck(key);
		
		// 创建根节点
		if (root == null) {
          
   
			root = new Node<>(null);
		}

		Node<V> node = root;
		int len = key.length();
		for (int i = 0; i < len; i++) {
          
   
			char c = key.charAt(i); 
			boolean emptyChildren = node.children == null;
			Node<V> childNode = emptyChildren ? null : node.children.get(c);
			if (childNode == null) {
          
   		//如果为空,就需要添加新节点
				childNode = new Node<>(node);
				childNode.character = c;
				node.children = emptyChildren ? new HashMap<>() : node.children;
				node.children.put(c, childNode);
			}
			node = childNode;	//此时走到这里childNode必定不为空,更新node指向
		}
		
		if (node.word) {
          
    // 已经存在这个单词  则需要重置这个节点的value
			V oldValue = node.value;
			node.value = value;
			return oldValue;
		}
		
		// 新增一个单词
		node.word = true;
		node.value = value;
		size++;
		return null;
	}

	public V remove(String key) {
          
   
		// 找到最后一个节点
		Node<V> node = node(key);
		// 如果不是单词结尾,不用作任何处理
		if (node == null || !node.word) return null;
		size--;
		V oldValue = node.value;
		
		// 如果还有子节点 就只需要修改这个节点的word属性为false,将value赋值为null,即为删除该节点
		if (node.children != null && !node.children.isEmpty()) {
          
   
			node.word = false;
			node.value = null;
			return oldValue;
		}
		
		// 如果没有子节点
		Node<V> parent = null;
		while ((parent = node.parent) != null) {
          
   
			parent.children.remove(node.character);
			if (parent.word || !parent.children.isEmpty()) break;
			node = parent;
		}
		
		return oldValue;
	}

	public boolean startsWith(String prefix) {
          
   
		return node(prefix) != null;
	}
	
	private Node<V> node(String key) {
          
   
		keyCheck(key);
		
		Node<V> node = root;
		int len = key.length();
		for (int i = 0; i < len; i++) {
          
   
			if (node == null || node.children == null || node.children.isEmpty()) return null;
			char c = key.charAt(i); 
			node = node.children.get(c);
		}
		
		return node;
	}
	
	private void keyCheck(String key) {
          
   
		if (key == null || key.length() == 0) {
          
   
			throw new IllegalArgumentException("key must not be empty");
		}
	}
	
	private static class Node<V> {
          
   
		Node<V> parent;
		HashMap<Character, Node<V>> children;
		Character character;
		V value;
		boolean word; // 是否为单词的结尾(是否为一个完整的单词)
		public Node(Node<V> parent) {
          
   
			this.parent = parent;
		}
	}
}

总结 ◼ Trie 的优点:搜索前缀的效率主要跟前缀的长度有关 ◼ Trie 的缺点:需要耗费大量的内存,因此还有待改进 ◼ 更多Trie 相关的数据结构和算法 Double-array Trie、Suffix Tree、Patricia Tree、Crit-bit Tree、AC自动机

经验分享 程序员 微信小程序 职场和发展