集合初始化时, 指定集合初始值大小

集合初始化时, 指定集合初始值大小

【阿里巴巴手册推荐】 集合初始化时, 指定集合初始值大小。 说明: HashMap 使用 HashMap(int initialCapacity) 初始化,

正例:initialCapacity = (需要存储的元素个数 / 负载因子) + 1。注意负载因子 ( 即 loader factor) 默认为 0.75, 如果暂时无法确定初始值大小, 请设置为 16。

反例: HashMap 需要放置 1024 个元素, 由于没有设置容量初始大小,随着元素不断增加,容量 7 次被迫扩大, resize 需要重建 hash 表,严重影响性能。

先举个例子来看看:

package com.song.list;

import java.util.HashMap;
import java.util.Map;

public class HashMapDemo {
          
   
    public static void main(String[] args) {
          
   
        //循环 1亿次
        for (int num = 1; num <= 1000000000; num = num * 10) {
          
   
            int capacity = (int) (num / 0.75 + 1);
            String test = "test";
            System.out.println("num is " + num);
            Map<Integer, String> map = new HashMap<>();
            Map<Integer, String> mapCapacity = new HashMap<>(capacity);
            long strat1 = System.nanoTime();
            for (int i = 0; i < num; i++) {
          
   
                map.put(i, test);
            }
            long end1 = System.nanoTime();
            System.out.println("没设置初始值的map: " + (end1 - strat1) + "  capacity: " + "null");

            long strat2 = System.nanoTime();
            for (int i = 0; i < num; i++) {
          
   
                mapCapacity.put(i, test);
            }
            long end2 = System.nanoTime();
            System.out.println("设置了初始值的map: " + (end2 - strat2) + "  capacity: " + capacity);
            System.out.println("*****************************************************************");

        }
    }
}

日志输出: 从结果上可以看出,绝大多数数据还时有比较明显的性能上的提升,但是个别数据,如图中红色框标记的数据,单从耗时上来说甚至比没有设置的初始值还多,这是什么原因呢?

这是因为HashMap有扩容机制,当达到扩容条件时会进行扩容。HashMap的扩容条件就是当HashMap中的元素个数(size)超过临界值(threshold)时就会自动扩容。在HashMap中threshold=loadFactory * capacity。 所以,如果我们没有设置初始容量的大小,随着元素的不断增加,HashMap会发生多次扩容,而HashMap中的扩容机制决定了每次扩容都需要重建hash表,这是非常影响性能的。

经验分享 程序员 微信小程序 职场和发展