Collection.sort实现 | 小胖的博客

todoList java相关工具 jekyll插件 jekyll的配置 jekyll安装 github的个人博客搭建

JVM NMT 工具 k8s学习 docker学习 AQS详解 Raft协议 Ribbon重试问题排查深入理解ClassLoader redis学习 elastic-search学习 reactor学习 eureka学习 tidb文章学习 apache-flink使用 spring-cloud-stream使用 jdk8的ConcurrentHashMap疑惑总结 jstat 监控工具使用说明 effective java 读书笔记 python jupyter 数据分析使用 spring-cloud-sleuth使用 spring-cloud-netflix使用 spring-cloud-confg使用 jupyther notebook 进行数据分析 spring-test使用使用h2在本地跑db单测 spark简介 spring framword 数据访问 YAML简介 YAML简介理解G1垃圾收集器的GC日志 spring boot 使用简介 JDK ThreadGroup简述 JVM 性能监控与故障处理工具 JVM 性能监控与故障处理工具 JVM 垃圾收集器和内存分配策略 JVM内存划分 Spring MessageSource 使用 Spring resources 使用 Spring MessageSource 使用 Spring IoC Container启动过程 Mysql事务隔离级别 Spring Framework各模块简介 Spring IoC Container使用 mysql InnoDB lock 类型使用Jhat分析OOM web安全 SpringMVC文档的疑问 SpringMVC学习 Mysql列转行展示 RMI与RPC JDK版本导致Mybatis在使用时编译不通过 http请求解决跨域问题 Netty权威指南阅读 SqlSessionFactoryBean阅读 top命令 spring中@Cacheable注解使用 SpingMvc的@Responsebody返回值中文乱码问题 SpringIoc学习 guavaCache学习

句子随笔 spring随笔 maven随笔日常开发随笔 Python随笔 Spark随笔 Hive随记常见简称随记面试随笔常见算法 Mac随笔 mysql随笔 linux命令随笔 JVM随笔 git随笔

Collection.sort实现 CPU使用100%问题排查 Java HashMap死循环 Guava Lists.transform()趟坑之旅十万个为什么 Java ThreadLocal类 Java LockSupport类 Java System类 Java Executors类 Executor执行器 Java Map体系学习计划 java集合

策略模式桥接模式适配器模式原型模式建造者模式单例模式 UML图中各种关系的连线设计模式开端简单工厂模式工厂方法模式

jcmd工具使用

数学之美 Java8实战心理学导论-视频笔记大型网站技术架构-读书笔记

模型驱动编程

基础乐理知识

github 2

java相关工具 github的个人博客搭建

jekyll 3

jekyll插件 jekyll的配置 jekyll安装

guava 2

使用Jhat分析OOM guavaCache学习

Spring 5

SpringMVC文档的疑问 SpringMVC学习 spring中@Cacheable注解使用 SpingMvc的@Responsebody返回值中文乱码问题 SpringIoc学习

git 4

面试随笔常见算法 mysql随笔 git随笔

linux 2

linux命令随笔 top命令

mybatis 2

JDK版本导致Mybatis在使用时编译不通过 SqlSessionFactoryBean阅读

netty 1

Netty权威指南阅读

JVM 3

JVM NMT 工具理解G1垃圾收集器的GC日志 JVM随笔

http 1

http请求解决跨域问题

JAVA 1

RMI与RPC

Mysql 2

Mysql事务隔离级别 Mysql列转行展示

web 1

web安全

study 11

CPU使用100%问题排查 Java HashMap死循环 Guava Lists.transform()趟坑之旅十万个为什么 Java ThreadLocal类 Java LockSupport类 Java System类 Java Executors类 Java Map体系学习计划 java集合

javaConcurrent 1

Executor执行器

JDK 1

Collection.sort实现

设计模式 10

策略模式桥接模式适配器模式原型模式建造者模式单例模式 UML图中各种关系的连线设计模式开端简单工厂模式工厂方法模式

java 4

jdk8的ConcurrentHashMap疑惑总结 jstat 监控工具使用说明 effective java 读书笔记 jcmd工具使用

tool 1

jcmd工具使用

mysql 1

mysql InnoDB lock 类型

spring 12

Ribbon重试问题排查 spring随笔 spring-test使用 spark简介 spring framword 数据访问 spring boot 使用简介 Spring MessageSource 使用 Spring resources 使用 Spring MessageSource 使用 Spring IoC Container启动过程 Spring Framework各模块简介 Spring IoC Container使用

mac 1

Mac随笔

jvm 4

JVM 性能监控与故障处理工具 JVM 性能监控与故障处理工具 JVM 垃圾收集器和内存分配策略 JVM内存划分

jdk 1

JDK ThreadGroup简述

yaml 2

YAML简介 YAML简介

unit 1

使用h2在本地跑db单测

test 1

使用h2在本地跑db单测

python 2

python jupyter 数据分析使用 jupyther notebook 进行数据分析

arch 1

大型网站技术架构-读书笔记

spring-cloud 4

spring-cloud-stream使用 spring-cloud-sleuth使用 spring-cloud-netflix使用 spring-cloud-confg使用

maven 1

maven随笔

apache-flink 1

apache-flink使用

tidb 1

tidb文章学习

eureka 1

eureka学习

reactor 1

reactor学习

es 1

elastic-search学习

redis 1

redis学习

stuff 1

心理学导论-视频笔记

Java 2

深入理解ClassLoader Java8实战

音乐 1

基础乐理知识

文字 1

句子随笔

读书 1

数学之美

cloud 1

Ribbon重试问题排查

一致性 1

Raft协议

JDK,并发 1

AQS详解

docker 1

docker学习

k8s 1

k8s学习

Collection.sort实现

2016年09月05日

首先说下,我看的是版本是JDK 1.7.0_71的实现,因为各个版本的实现可能会不一样,所以先声明下版本.

Collection.sort()的代码如下:

    public static <T extends Comparable<? super T>> void sort(List<T> list) {
            Object[] a = list.toArray();
            Arrays.sort(a);
            ListIterator<T> i = list.listIterator();
            for (int j=0; j<a.length; j++) {
                i.next();
                i.set((T)a[j]);
            }
        }

底层实际的排序是交由Array.sort()来做的.

    public static void sort(Object[] a) {
            if (LegacyMergeSort.userRequested)
                legacyMergeSort(a);
            else
                ComparableTimSort.sort(a);
        }

LegacyMergeSort.userRequested这个的意义是说,是否使用之前版本所使用简单归并排序对数组进行排序,可通过在启动参数中使用java.util.Arrays.useLegacyMergeSort来指定.默认是使用新的ComparableTimSort.sort()来进行排序的.

接下来就来看下 ComparableTimSort.sort() 的实现

看了代码后发现, ComparableTimSort.sort() 的实现后,发现它不是简单的只使用了某一种排序算法,而是混合使用了.

在数组元素个数不超过 32 个的时候,是使用折半插入排序的.

超过32个元素后,则使用 TimSort排序算法,进行排序, TimSort是一个对归并排序做了大量优化的版本. TimSort是为了减少对升序部分的回溯和对降序部分的性能倒退, 按照降序或者升序对待排序数组做了分区, 将输入当中已经有序的段,作为一个分区.那么就节省了在这个分区进行回溯的时间了.比如[1,2,3,0]分区后就变成了[[1,2,3],[0]]两个分区了.而对于降序部分,则将其直接反转作为一个分区,例如[2,1,0,1],分区后变为[[0,1,2],[1]]两个分区.最后只需对所有的分区进行归并排序,则可得到最终排序完成的序列.

两个疑问:

TimSort排序分区的minRunLength,最小分区单元的大小为什么要那样设置? 分区的长度保证,下一个分区是上一个分区的2倍,不然就merge两个分区.