百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

java 集合框架

ccwgpt 2025-05-25 11:16 3 浏览 0 评论

ArrayList 深度解析

1.1 底层数据结构

// JDK1.8源码关键定义
transient Object[] elementData; // 实际存储数据的数组
private int size; // 当前元素数量

1.2 核心机制

① 扩容机制

// 添加元素核心逻辑(JDK1.8)
public boolean add(E e) {
    ensureCapacityInternal(size + 1); // 容量检查
    elementData[size++] = e;
    return true;
}

private void ensureCapacityInternal(int minCapacity) {
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        minCapacity = Math.max(DEFAULT_CAPACITY(10), minCapacity);
    }
    ensureExplicitCapacity(minCapacity);
}

private void ensureExplicitCapacity(int minCapacity) {
    modCount++;
    if (minCapacity - elementData.length > 0)
        grow(minCapacity); // 触发扩容
}

private void grow(int minCapacity) {
    int oldCapacity = elementData.length;
    int newCapacity = oldCapacity + (oldCapacity >> 1); // 1.5倍扩容
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    elementData = Arrays.copyOf(elementData, newCapacity);
}

扩容流程图解

添加元素 → 检查容量不足 → 计算新容量(原1.5倍)
       ↓               ↑
   数组拷贝(System.arraycopy)

② 随机访问性能

// 时间复杂度O(1)
public E get(int index) {
    rangeCheck(index);
    return elementData(index); // 直接数组下标访问
}

③ 插入删除性能瓶颈

// 中间插入示例(需移动元素)
public void add(int index, E element) {
    rangeCheckForAdd(index);
    ensureCapacityInternal(size + 1);
    System.arraycopy(elementData, index, elementData, index + 1, size - index);
    elementData[index] = element;
    size++;
}

元素移动示意图

原数组: [A][B][C][D][ ][ ]
插入X到位置1:
1. 将B,C,D后移 → [A][ ][B][C][D][ ]
2. 放入X → [A][X][B][C][D][ ]

二、LinkedList 深度解析

2.1 底层数据结构

// JDK1.8双向链表节点定义
private static class Node<E> {
    E item;
    Node<E> next;
    Node<E> prev;
    Node(Node<E> prev, E element, Node<E> next) {
        this.item = element;
        this.next = next;
        this.prev = prev;
    }
}

2.2 核心操作原理

① 插入元素

// 头部插入(O(1)时间复杂度)
private void linkFirst(E e) {
    final Node<E> f = first;
    final Node<E> newNode = new Node<>(null, e, f);
    first = newNode;
    if (f == null)
        last = newNode;
    else
        f.prev = newNode;
    size++;
    modCount++;
}

② 随机访问性能

// get方法通过折半查找优化(仍为O(n))
public E get(int index) {
    checkElementIndex(index);
    return node(index).item;
}

Node<E> node(int index) {
    if (index < (size >> 1)) { // 前一半从头遍历
        Node<E> x = first;
        for (int i = 0; i < index; i++)
            x = x.next;
        return x;
    } else { // 后一半从尾遍历
        Node<E> x = last;
        for (int i = size - 1; i > index; i--)
            x = x.prev;
        return x;
    }
}

③ 内存占用分析

每个元素需要额外存储:

  • 前驱节点引用(4/8字节)
  • 后继节点引用(4/8字节)
  • 对象头(12字节)
    总内存开销约为:
    (对象头) + 元素数据 + 2*指针

三、HashMap 深度解析

3.1 数据结构演进

JDK1.7 vs JDK1.8

版本

数据结构

冲突处理

线程安全性问题

JDK1.7

数组+单向链表

头插法

多线程扩容可能导致死循环

JDK1.8+

数组+链表/红黑树

尾插法

数据丢失问题仍存在

3.2 核心实现原理

① 哈希函数优化

// JDK1.8的hash()方法
static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

设计目的:将高16位与低16位异或,减少哈希碰撞概率

② 链表树化条件

static final int TREEIFY_THRESHOLD = 8; // 链表转树阈值
static final int MIN_TREEIFY_CAPACITY = 64; // 最小树化容量

// 树化逻辑(部分代码)
final void treeifyBin(Node<K,V>[] tab, int hash) {
    int n, index; Node<K,V> e;
    if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
        resize(); // 优先扩容
    else if ((e = tab[index = (n - 1) & hash]) != null) {
        // 执行树化操作...
    }
}

③ 扩容机制(resize)

// 扩容核心逻辑(部分)
final Node<K,V>[] resize() {
    Node<K,V>[] oldTab = table;
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    int oldThr = threshold;
    int newCap, newThr = 0;
    
    if (oldCap > 0) {
        if (oldCap >= MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY)
            newThr = oldThr << 1; // 双倍扩容
    }
    // ...其他情况处理
    
    @SuppressWarnings({"rawtypes","unchecked"})
    Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    table = newTab;
    
    // 数据迁移逻辑(高低位拆分)...
    return newTab;
}

④ 红黑树退化为链表

static final int UNTREEIFY_THRESHOLD = 6; // 树转链表阈值

3.3 put操作全流程

graph TD
    A[计算key的hash值] --> B{桶位置是否为空?}
    B -- 是 --> C[直接创建新节点插入]
    B -- 否 --> D{是否是树节点?}
    D -- 是 --> E[红黑树插入]
    D -- 否 --> F[遍历链表]
    F --> G{存在相同key?}
    G -- 是 --> H[覆盖value]
    G -- 否 --> I[尾部插入新节点]
    I --> J{链表长度≥8?}
    J -- 是 --> K{数组长度≥64?}
    K -- 是 --> L[转换为红黑树]
    K -- 否 --> M[扩容]

四、三大集合对比总结

特性

ArrayList

LinkedList

HashMap

底层结构

动态数组

双向链表

数组+链表/红黑树

随机访问

O(1)

O(n)

key哈希计算O(1)

插入删除

尾部O(1),中间O(n)

头尾O(1),中间O(n)

哈希冲突时O(1)~O(log n)

内存占用

较小(仅数组开销)

较大(节点对象)

较大(数组+节点)

线程安全

不安全

不安全

不安全

适用场景

查询多、增删少

频繁头尾操作

键值对快速存取

扩容机制

1.5倍

无固定扩容

2倍,负载因子0.75


五、高频面试问题

Q1:HashMap为什么用红黑树不用AVL树?

  • 红黑树优势:插入删除操作旋转次数更少(最多3次)树高约束较宽松(黑高度平衡)适合读多写少场景

Q2:HashMap如何解决哈希冲突?

  • 链地址法:相同桶位置形成链表/树
  • 再哈希法:通过扰动函数优化哈希值分布
  • 扩容机制:减少单个桶的冲突概率

Q3:ArrayList与LinkedList性能对比误区

  • 实际测试结果(百万次操作):

操作

  • ArrayList时间
  • LinkedList时间
  • 头部插入
  • 500ms
  • 120ms
  • 中间插入
  • 350ms
  • 250000ms
  • 随机访问
  • 1ms
  • 50000ms
  • 结论:大部分场景优先使用ArrayList

  • 六、最佳实践建议

    1. ArrayList初始化:预估数据量设置初始容量
    2. HashMap优化
    // 避免频繁扩容 
    Map<String, Object> map = new HashMap<>(expectedSize); 
    // 或使用Guava工具 
    Maps.newHashMapWithExpectedSize(100);

    遍历选择:ArrayList优先用for循环,LinkedList必须用Iterator,HashMap遍历entrySet效率最高

    通过深入理解这些集合的底层实现,可以更高效地进行Java程序开发与性能优化。

    相关推荐

    Dubbo最全详解(万字图文总结)

    大家好,我是mikechen。Dubbo是非常重要的分布式中间件,也是微服务的核心框架,而且大厂也特别喜欢考察Dubbo,下面我就全面来详解Dubbo@mikechen本篇已收于mikechen原创超...

    探秘Dubbo:RPC框架的奇妙世界

    探秘Dubbo:RPC框架的奇妙世界大家好啊!今天我要带大家走进一个神奇的编程领域——分布式服务调用。说起分布式系统,很多程序员都头疼不已。但今天咱们不谈那些让人抓狂的网络延迟、负载均衡等问题,而是聚...

    Dubbo分布式服务框架:像调教宠物一样驾驭它

    Dubbo分布式服务框架:像调教宠物一样驾驭它大家好呀,今天我们来聊聊Dubbo这个分布式服务框架,它就像一只温顺的小猫咪,但有时候也会调皮捣蛋,所以得好好调教一番。别担心,我会用最轻松的方式来帮你搞...

    深入浅出:Dubbo框架源码分析

    深入浅出:Dubbo框架源码分析Dubbo是一款由阿里巴巴开源的高性能分布式服务框架,广泛应用于微服务架构中。它为开发者提供了强大的RPC调用能力,使得分布式系统中的服务间通信变得简单高效。本文...

    Dubbo分布式服务框架:从零开始的实战之旅

    Dubbo分布式服务框架:从零开始的实战之旅Dubbo作为一个高性能的JavaRPC框架,在微服务架构中扮演着重要角色。它能帮助开发者轻松构建分布式系统,实现服务间的高效通信。今天,我们就来一起探索...

    Dubbo分布式服务框架的工作原理:从入门到精通

    Dubbo分布式服务框架的工作原理:从入门到精通Dubbo是一个高性能的Java分布式服务框架,由阿里巴巴开源。它致力于提供透明化的远程方法调用(RPC),使得开发者能够像调用本地服务一样调用远程服务...

    框架的本质分析——Dubbo

    诞生的背景什么背景下诞生了该技术?不论是哪个框架,不会平白无故诞生,不会平白无故的被人所追捧,了解其背景,追根溯源。随着互联网的发展,网站应用的规模不断扩大,常规的垂直应用架构已无法应对,分布式服务架...

    2023编导艺考「热点话题」评述框架示例(七个2022热点)

    2022冬奥会开幕式(1)“旧”文化符号的“新”应用(2)“全媒体”时代的“小人物”(3)“简约”的形式表达“丰富”的内核(4)“新”叙事结构打破“旧”国家形象(5)数字媒介增强受众“在场感”短视频“...

    84页思考的框架,思维模型的全明星集合,9种经典思维模型

    分享职场干货,提升能力!为职场精英打造个人知识体系,升职加薪!84页思考的框架如何拿到分享的源文件:请您关注、转发,然后私信本头条号“文米”2个字,按照操作流程,专人负责发送源文件给您。...

    DUSt3R-从任意图像集合中重建3D场景的框架

    DUSt3R是什么DUSt3R(DenseandUnconstrainedStereo3DReconstruction,密集无约束立体三维重建)是由来自芬兰阿尔托大学和Naver欧洲实验室的...

    高考数学:一张思维导图掌握集合知识点,真题解析巩固知识

    一、思维导图二、疑难透析三、题型示例1、已知集合A={1,3},B={x丨mx-3=0},且A∪B=A,则m的取值是()。【解析】分类讨论思想∵AUB=A∴BA(1)当m=0时,B=,符合条件;...

    java集合框架03——ArrayList和源码分析

    上一章学习了Collection的架构,并阅读了部分源码,这一章开始,我们将对Collection的具体实现进行详细学习。首先学习List。而ArrayList又是List中最为常用的,因此本章先学习...

    Java Collections 工具类集合框架中常用算法解析

    在软件开发中,算法是非常重要的一部分,它们可以提供高效的数据处理和操作。在Java集合框架中,有几个常用的算法,包括排序算法、二分查找算法、洗牌算法和旋转算法。本文将对这些算法进行详细解析,并写了一些...

    1.6、Java 异常处理机制与集合框架(List、Set、Map等)

    在Java编程中,异常处理机制和集合框架是两个非常重要的概念。前者帮助开发者处理程序运行时可能遇到的错误,确保程序能够稳定运行;后者则提供了一种有效的方式来管理和操作数据集合。本文将分别介绍Java中...

    Java集合框架性能优化秘籍

    Java集合框架性能优化秘籍在Java的世界里,集合框架就像一座巨大的宝库,存储着我们程序的各种数据。然而,随着数据量的增大,如何让这座宝库更高效地运作,就成了我们必须掌握的艺术。今天,我们就来聊聊J...

    取消回复欢迎 发表评论: