集合初始化时, 指定集合初始值大小
集合初始化时, 指定集合初始值大小
【阿里巴巴手册推荐】 集合初始化时, 指定集合初始值大小。 说明: HashMap 使用 HashMap(int initialCapacity) 初始化,
正例:initialCapacity = (需要存储的元素个数 / 负载因子) + 1。注意负载因子 ( 即 loader factor) 默认为 0.75, 如果暂时无法确定初始值大小, 请设置为 16。
反例: HashMap 需要放置 1024 个元素, 由于没有设置容量初始大小,随着元素不断增加,容量 7 次被迫扩大, resize 需要重建 hash 表,严重影响性能。
先举个例子来看看:
package com.song.list; import java.util.HashMap; import java.util.Map; public class HashMapDemo { public static void main(String[] args) { //循环 1亿次 for (int num = 1; num <= 1000000000; num = num * 10) { int capacity = (int) (num / 0.75 + 1); String test = "test"; System.out.println("num is " + num); Map<Integer, String> map = new HashMap<>(); Map<Integer, String> mapCapacity = new HashMap<>(capacity); long strat1 = System.nanoTime(); for (int i = 0; i < num; i++) { map.put(i, test); } long end1 = System.nanoTime(); System.out.println("没设置初始值的map: " + (end1 - strat1) + " capacity: " + "null"); long strat2 = System.nanoTime(); for (int i = 0; i < num; i++) { mapCapacity.put(i, test); } long end2 = System.nanoTime(); System.out.println("设置了初始值的map: " + (end2 - strat2) + " capacity: " + capacity); System.out.println("*****************************************************************"); } } }
日志输出: 从结果上可以看出,绝大多数数据还时有比较明显的性能上的提升,但是个别数据,如图中红色框标记的数据,单从耗时上来说甚至比没有设置的初始值还多,这是什么原因呢?
这是因为HashMap有扩容机制,当达到扩容条件时会进行扩容。HashMap的扩容条件就是当HashMap中的元素个数(size)超过临界值(threshold)时就会自动扩容。在HashMap中threshold=loadFactory * capacity。 所以,如果我们没有设置初始容量的大小,随着元素的不断增加,HashMap会发生多次扩容,而HashMap中的扩容机制决定了每次扩容都需要重建hash表,这是非常影响性能的。