文章目录
- 垃圾回收 GC
- 一、哪些对象应该被回收❓❓❓
- ① 引用计数算法(已被淘汰)
- ② 可达性分析法(Reachability Analysis)⭐⭐⭐
- 二、垃圾回收算法
- ① 标记-清除算法
- ② 复制算法
- ③ 标记-整理算法
- ④ 分代算法
- 三、垃圾回收器
- ① Serial(新生代收集器,串行GC)
- ② ParNew(新生代收集器,并行GC)
- ③ Parallel Scavenge(新生代收集器,并行GC)
- ④ Serial Old(老年代收集器,串行GC)
- ⑤ Parallel Old(老年代收集器,并行GC)
- ⑥ CMS(老年代收集器,并发GC)⭐⭐⭐
- ⑦ G1(唯一的全区域垃圾收集器)⭐⭐⭐
- 年轻代垃圾收集
- 老年代垃圾收集
- 四、一个对象的一生⭐⭐⭐
垃圾回收 GC
垃圾回收机制是JVM自动管理内存的一种能力,主要负责清除不再使用的对象,从而避免内存泄漏或溢出。其目标就是:
- 回收不再被引用的对象(以对象为单位进行回收)
- 清理内存空间
- 保证程序长期运行的稳定性
垃圾回收主要是在堆、方法区中执行,其它的内存区域不需要回收,如下表所示:
| 内存区域 | 是否 GC 管理 | 是否参与回收 |
|---|---|---|
| 堆 | ✅ 是 | ✅ 主要回收对象分配区域 |
| 方法区(元空间) | ✅ 是 | ✅ 常量池、类型信息、静态变量 |
| 虚拟机栈/本地方法栈/程序计数器 | ❌ 否 | ❌ 线程执行过程中自动回收 |
一、哪些对象应该被回收❓❓❓
① 引用计数算法(已被淘汰)
每个对象都有一个引用计数器,每当有一个地方引用它,计数器就加一;每当引用失效时,则计数器就减一;只要计数器为0,则说明该对象不再被使用,此时就回收该对象!
引用计数法实现简单,判定效率也比较高,在大部分情况下都是一个不错的算法。比如Swift就采用该算法进行内存管理。
缺点如下所示:
- 需要额外的内存存储引用计数
- 存在循环引用的问题
class Test{Test t;}Test a=newTest();Test b=newTest();a.t=b;b.t=a;// 下面将a、b变成null之后,由于内部的t还存在各自的引用,等待对方释放,但是又不释放自己的引用// 就造成了循环引用问题,导致内存泄漏a=null;b=null;② 可达性分析法(Reachability Analysis)⭐⭐⭐
可达性分析法是Java采用的判断对象是否需要回收的算法!
原理:从一组叫作GC Roots的节点出发,向下搜索对象引用链。如果对象不能通过任何路径被GC Roots到达,就认为它 “不可达”,则可被回收。
这种方法不会出现循环引用的问题,但相比引用计数算法来说,时间开销会大一些,因为需要遍历这颗树来判断可达性!
GC Roots包括:
- 虚拟机栈(栈帧中的本地变量表)中引用的对象
- 方法区中类的静态属性引用的对象
- 方法区中常量引用的对象
- 本地方法栈中引用的对象
二、垃圾回收算法
通过上面确认了哪些对象应该被回收之后,就要进行垃圾对象的回收了!
下面是常见的垃圾回收算法:
| 算法 | 简介 | 适用场景 |
|---|---|---|
| 复制算法 | 把活的对象从一块复制到另一块 | 新生代,效率高 |
| 标记-清除 | 标记存活对象,清除未标记对象 | 老年代 |
| 标记-整理 | 清除后移动存活对象,解决碎片 | 老年代 |
| 分代收集 | 结合上面其它算法,按对象生命周期长短分类处理 | JVM默认策略 |
① 标记-清除算法
标记-清除算法是最基础的回收算法,后续回收算法都是基于该算法进行改进的。
原理:首先标记所有需要回收的对象,然后在统一标记完成后回收所有被标记的对象。
缺点:①会造成大量内存碎片,降低内存利用率。
② 标记和清除的过程效率不高。
② 复制算法
“复制算法” 的出现是为了解决 “标记-清除算法” 的内存碎片问题。
原理:将内存空间分为大小相等的两块,每次只使用其中的一块。当这块内存需要进行垃圾回收时,会将此区域中还存活的对象复制到另一块内存中,然后再把当前内存块进行清除。
优点:避免了内存碎片问题。
缺点:①浪费了大量内存空间。
② 如果存活对象非常多的话,复制开销会很大。
现在的商用虚拟机(包括
HotSpot)都是采用复制算法来回收新生代!新生代中
98%的对象都是 “朝生夕死” 的,所以并不需要按照1:1的比例来划分内存空间,而是将新生代内存分为一块较大的Eden空间(伊甸园)和两块较小的Survivor空间(幸存者),每次使用Eden和其中一块Survivor(两个Survivor区域一个称为From区,另一个称为To区域)。当回收时,将
Eden和Survivor中还存活的对象一次性复制到另一块Survivor空间上,最后清理掉Eden和刚才用过的Survivor空间。当
Survivor空间不够用时,需要依赖老年代内存进行分配担保。
HotSpot默认Eden与Survivor的大小比例是8:1,也就是说Eden:From:To = 8:1:1。所以每次新生代可用内存空间为整个新生代容量的90%,而剩下的10%用来存放回收后存活的对象。
HotSpot实现的复制算法流程如下:
- 当
Eden区满的时候,会触发第一次MinorGC,把还活着的对象拷贝到SurvivorFrom区;当Eden区再次触发MinorGC的时候,会扫描Eden区和From区域,对两个区域进行垃圾回收,经过这次回收后还存活的对象,则直接复制到To区域,并将Eden和From区域清空。- 当后续
Eden又发生MinorGC时,会对Eden和To区域进行垃圾回收,存活的对象复制到From区域,并将Eden和To区域清空。- 部分对象会在
From和To区域中复制来复制去,如此交换15次(由JVM参数MaxTenuringThreshold决定,这个参数默认是15),最终如果还是存活,就存入到老年代。
③ 标记-整理算法
由于 “复制算法” 的拷贝操作在对象存活率比较高的时候开销很大,效率会很低,所以老年代不能采用 “复制算法”,而是针对老年代的特点,采用 “标记-整理算法”。
原理:标记过程和 “标记-清除算法” 是一样的,不同在于 “标记-整理算法” 不是直接对可回收对象进行清除,而是采用类似压缩数组元素的方式,把所有存活对象都往一侧移动,然后直接清除掉端边界以外的内存。
优点:①避免了内存碎片问题
②避免了 “复制算法” 中了内存浪费问题
缺点:搬运对象的开销大
④ 分代算法
分代算法实际上只是做了一个分区,把内存空间划分为新生代、老年代,然后针对两者采用不同的回收算法处理,目前大部分的JVM垃圾回收都采用了这种思想!
在新生代中每次垃圾回收都有大批对象死去,只有少量存活,因此我们采用 “复制算法”。
而老年代中对象存活率高、没有额外空间对它进行分配担保,就必须采用 “标记-清理” 或者 “标记-整理” 算法。
Minor GC又称为新生代GC:指的是发生在新生代的垃圾收集。因为Java对象大多都具备朝生夕灭的特性,因此Minor GC非常频繁,故采用复制算法,一般回收速度也比较快。Full GC又称为老年代GC或者Major GC:指发生在老年代的垃圾收集。出现了Major GC,经常会伴随至少一次的Minor GC,且Major GC的速度一般会比Minor GC慢十倍以上。
原理大概如下所示:
- 堆内存为两个区:新生代、老年代
- 新生代默认占堆内存的
1/3,老年代默认占堆内存的2/3 - 新生代又分为
Eden区、Survivor From区、Survivor To区默认比例是8:1:1 - 工作过程:
- 所有新创建的对象都在
Eden区,当Eden区内存满后将Eden区和Survivor From区存活的对象复制到Survivor To区; - 清空
Eden区与Survivor From区; - 同时
Survivor From与Survivor To分区进行交换; - 每次
Minor GC存活对象年龄加1,当年龄达到15(默认值)岁时,被移到老年代; - 当
Eden的空间无法容纳新创建的对象时,这些对象直接被移至老年代; - 当老年代空间占用达到阈值时,触发
Major GC; - 以上流程循环执行。
- 所有新创建的对象都在
三、垃圾回收器
如果说上面我们讲的收集算法是内存回收的方法论,那么垃圾收集器就是内存回收的具体实现。
垃圾收集器的作用:垃圾收集器是为了保证程序能够正常、持久运行的一种技术,它是将程序中不用的死亡对象也就是垃圾对象进行清除,从而保证了新对象能够正常申请到内存空间。
以下这些收集器是HotSpot虚拟机随着不同版本推出的重要的垃圾收集器:
上图展示了七种作用于不同分代的收集器,如果两个收集器之间存在连线,就说明他们之间可以搭配使用。所处的区域,表示它是属于新生代收集器还是老年代收集器。
自从有了Java,就有了垃圾收集器,这么多垃圾收集器其实是历史发展的产物。最早的垃圾收集器为Serial,也就是串行执行的垃圾收集器,SerialOld为串行的老年代收集器,而随着时间的发展,为了提升更高的性能,于是有了Serial多线程版的垃圾收集器ParNew。后来人们想要更高吞吐量的垃圾收集器,吞吐量是指单位时间内成功回收垃圾的数量,于是就有了吞吐量优先的垃圾收集器ParallelScavenge(吞吐量优先的新生代垃圾收集器)和ParallelOld(吞吐量优先的老年代垃圾收集器)。随着技术的发展后来又有了CMS(ConcurrentMarkSweep)垃圾收集器,CMS可以兼顾吞吐量和以获取最短回收停顿时间为目标的收集器,在JDK1.8之前BS系统的主流垃圾收集器,而在JDK1.8之后,出现了第一个既不完全属于新生代也不完全属于老年代的垃圾收集器G1(GarbageFirst),G1提供了基本不需要停止程序就可以收集垃圾的技术。
① Serial(新生代收集器,串行GC)
Serial收集器是最基本、发展历史最悠久的收集器,在JDK1.3.1之前是虚拟机新生代收集的唯一选择。
这个收集器是一个单线程的收集器,但它的 “单线程” 的意义并不仅仅说明它只会使用一个CPU或一条收集线程去完成垃圾收集工作,更重要的是在它进行垃圾收集时,必须暂停其他所有的工作线程,直到它收集结束(Stop The World,译为停止整个程序,简称STW)。
优势:简单而高效(与其他收集器的单线程比),对于限定单个CPU的环境来说,Serial收集器由于没有线程交互的开销,专心做垃圾收集自然可以获得最高的单线程收集效率。实际上到现在为止:它依然是虚拟机运行在Client模式下的默认新生代收集器。
② ParNew(新生代收集器,并行GC)
ParNew收集器是Serial收集器的多线程版本,除了使用多条线程进行垃圾收集之外,其余行为包括Serial收集器可用的所有控制参数、收集算法、STW、对象分配规则、回收策略等都与Serial收集器完全一样,在实现上,这两种收集器也共用了相当多的代码。
ParNew收集器是许多运行在Server模式下的虚拟机中首选的新生代收集器。作为Server的首选收集器之中有一个与性能无关的很重要的原因是:除了Serial收集器外,目前只有它能与CMS收集器配合工作。
在
JDK1.5时期,HotSpot推出了一款在强交互应用中几乎可认为有划时代意义的垃圾收集器:CMS收集器,这款收集器是HotSpot虚拟机中第一款真正意义上的并发收集器,它第一次实现了让垃圾收集线程与用户线程同时工作。不幸的是,
CMS作为老年代的收集器,却无法与JDK1.4.0中已经存在的新生代收集器Parallel Scavenge配合工作,所以在JDK1.5中使用CMS来收集老年代的时候,新生代只能选择ParNew或者Serial收集器中的一个。
与Serial收集器对比,ParNew收集器在单CPU的环境中绝对不会有比Serial收集器更好的效果,甚至由于存在线程交互的开销,该收集器在通过超线程技术实现的两个CPU的环境中都不能百分之百地保证可以超越Serial收集器。然而,随着可以使用的CPU的数量的增加,它对于GC时系统资源的有效利用还是很有好处的。
③ Parallel Scavenge(新生代收集器,并行GC)
ParallelScavenge收集器是一个新生代收集器,它也是使用复制算法的收集器,也是并行的多线程收集器。它使用两个参数来控制吞吐量:
XX:MaxGCPauseMillis 控制最大的垃圾收集停顿时间 XX:GCRatio 直接设置吞吐量的大小直观上,只要最大的垃圾收集停顿时间越小,吞吐量就越高,但是GC停顿时间的缩短是以牺牲吞吐量和新生代空间作为代价的。比如原来10s收集一次,每次停顿100ms,现在变成5s收集一次,每次停顿70ms。停顿时间下降的同时,吞吐量也下降了。
应用场景:停顿时间越短就越适合需要与用户交互的程序,良好的响应速度能提升用户体验;而高吞吐量则可以高效率地利用CPU时间,尽快完成程序的运算任务,主要适合在后台运算而不需要太多交互的任务。
它和其它收集器的对比如下所示:
Parallel Scavenge与CMS等收集器:ParallelScavenge收集器的特点是它的关注点与其他收集器不同,CMS等收集器的关注点是尽可能地缩短垃圾收集时用户线程的停顿时间,而ParallelScavenge收集器的目标则是达到一个可控制的吞吐量。由于与吞吐量关系密切,ParallelScavenge收集器也经常称为 “吞吐量优先” 收集器。
Parallel Scavenge与ParNew收集器:ParallelScavenge收集器与ParNew收集器的一个重要区别是它具有自适应调节策略。GC自适应的调节策略:Parallel Scavenge收集器有一个参数-XX:+UseAdaptiveSizePolicy。当这个参数打开之后,就不需要手工指定新生代的大小、Eden与Survivor区的比例、晋升老年代对象年龄等细节参数了,JVM会根据当前系统的运行情况收集性能监控信息,动态调整这些参数以提供最合适的停顿时间或者最大的吞吐量,这种调节方式称为GC自适应的调节策略。
④ Serial Old(老年代收集器,串行GC)
Serial Old是Serial收集器的老年代版本,它同样是一个单线程收集器,使用 “标记-整理算法”。应用场景如下所示:
Client模式:Serial Old收集器的主要意义也是在于给Client模式下的虚拟机使用。Server模式:如果是Server模式,那么它主要还有两大用途:一种用途是在JDK1.5以及之前的版本中与ParallelScavenge收集器搭配使用,另一种用途就是作为CMS收集器的后备预案,在并发收集发生Concurrent Mode Failure时使用。
⑤ Parallel Old(老年代收集器,并行GC)
Parallel Old是Parallel Scavenge收集器的老年代版本,使用多线程、“标记-整理算法”。
应用场景:在注重吞吐量以及CPU资源敏感的场合,都可以优先考虑Parallel Scavenge配合Parallel Old收集器。
这个收集器是在JDK1.6中才开始提供的,在此之前,新生代的Parallel Scavenge收集器一直处于比较尴尬的状态。原因是,如果新生代选择了Parallel Scavenge收集器,老年代除了Serial Old收集器外别无选择(Parallel Scavenge收集器无法与CMS收集器配合工作)。由于老年代SerialOld收集器在服务端应用性能上表现不佳,使用了Parallel Scavenge收集器也未必能在整体应用上获得吞吐量最大化的效果,由于单线程的老年代收集中无法充分利用服务器多CPU的处理能力,在老年代很大而且硬件比较高级的环境中,这种组合的吞吐量甚至还不一定有ParNew加CMS的组合给力。直到Parallel Old收集器出现后,“吞吐量优先” 收集器终于有了比较名副其实的应用组合。
⑥ CMS(老年代收集器,并发GC)⭐⭐⭐
CMS(Concurrent Mark Sweep)收集器是一种以获取最短回收停顿时间为目标的收集器。目前很大一部分的Java应用集中在互联网站或者B/S系统的服务端上,这类应用尤其重视服务的响应速度,希望系统停顿时间最短,以给用户带来较好的体验,而CMS收集器就非常符合这类应用的需求!
CMS收集器是基于 “标记-清除算法” 实现的,它的运作过程相对于前面几种收集器来说更复杂一些,整个过程分为四个步骤:
- 初始标记:仅仅只是标记一下
GCRoots能直接关联到的对象,速度很快,需要Stop The World。 - 并发标记:进行
GCRoots Tracing的过程。 - 重新标记
- 为了修正并发标记期间因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间一般会比 初始标记 阶段稍长一些,但远比 并发标记 的时间短。仍然需要
Stop The World。
- 为了修正并发标记期间因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间一般会比 初始标记 阶段稍长一些,但远比 并发标记 的时间短。仍然需要
- 并发清除:清除对象。
由于整个过程中耗时最长的 并发标记 和 并发清除 过程收集器线程都可以与用户线程一起工作,所以从总体上来说,CMS收集器的内存回收过程是与用户线程一起并发执行的。
优点:并发回收、低停顿
缺点:
CMS收集器对CPU资源非常敏感- 其实面向并发设计的程序都对
CPU资源比较敏感。在并发阶段,它虽然不会导致用户线程停顿,但是会因为占用了一部分线程(或者说CPU资源)而导致应用程序变慢,总吞吐量会降低。 CMS默认启动的回收线程数是(CPU数量+3)/4,也就是当CPU在四个以上时,并发回收时垃圾收集线程不少于25%的CPU资源,并且随着CPU数量的增加而下降。但是当CPU不足四个时,CMS对用户程序的影响就可能变得很大。
- 其实面向并发设计的程序都对
CMS收集器无法处理浮动垃圾CMS收集器无法处理浮动垃圾,可能出现ConcurrentModeFailure失败而导致另一次FullGC的产生。- 由于
CMS并发清理阶段用户线程还在运行着,伴随程序运行自然就还会有新的垃圾不断产生,这一部分垃圾出现在标记过程之后,CMS无法在当次收集中处理掉它们,只好留待下一次GC时再清理掉。这一部分垃圾就称为 “浮动垃圾”。 - 也是由于在垃圾收集阶段用户线程还需要运行,那也就还需要预留有足够的内存空间给用户线程使用,因此
CMS收集器不能像其他收集器那样等到老年代几乎完全被填满了再进行收集,需要预留一部分空间提供并发收集时的程序运作使用。 - 要是
CMS运行期间预留的内存无法满足程序需要,就会出现一次ConcurrentModeFailure失败,这时虚拟机将启动后备预案:临时启用SerialOld收集器来重新进行老年代的垃圾收集,这样停顿时间就很长了。
CMS收集器会产生大量空间碎片CMS是一款基于 “标记-清除算法” 实现的收集器,这意味着收集结束时会有大量空间碎片产生。空间碎片过多时,将会给大对象分配带来很大麻烦,往往会出现老年代还有很大空间剩余,但是无法找到足够大的连续空间来分配当前对象,不得不提前触发一次FullGC。
⑦ G1(唯一的全区域垃圾收集器)⭐⭐⭐
G1(Garbage First)垃圾回收器是用在堆内存很大的情况下,把堆空间划分为很多很多的region块,然后并行的对其进行垃圾回收。在清除实例所占用的内存空间后,还会做内存压缩。
G1垃圾回收器回收region的时候基本不会Stop The World,而是基于most garbage优先回收的策略来对region进行垃圾回收的。(整体来看是基于 “标记-整理算法”,从局部也就是两个region之间则是基于 “复制算法”)
无论如何,G1收集器采用的算法都意味着一个region有可能属于Eden,Survivor或者Tenured内存区域。图中的E表示该region属于Eden内存区域,S表示属于Survivor内存区域,T表示属于Tenured内存区域。图中空白的表示未使用的内存空间。G1垃圾收集器还增加了一种新的内存区域,叫做Humongous内存区域,如图中的H块,这种内存区域主要用于存储大对象,即大小超过一个region大小的50%的对象。
年轻代垃圾收集
在G1垃圾收集器中,年轻代的垃圾回收过程使用 “复制算法”。把Eden区和Survivor区的对象复制到新的Survivor区域。
老年代垃圾收集
对于老年代上的垃圾收集,G1垃圾收集器也分为四个阶段,基本跟CMS垃圾收集器一样,但略有不同:
- 初始标记
- 跟
CMS垃圾收集器的 初始标记 阶段一样,G1也需要暂停应用程序的执行,它会标记从根对象出发,在根对象的第一层孩子节点中标记所有可达的对象。但是G1的垃圾收集器的 初始标记 阶段是跟MinorGC一起发生的。也就是说在G1中,不用像在CMS那样,单独暂停应用程序的执行来运行 初始标记 阶段,而是在G1触发MinorGC的时候一并将老年代上的 初始标记 给做了。
- 跟
- 并发标记
- 在这个阶段
G1做的事情跟CMS一样。但G1同时还多做了一件事情,就是如果在 并发阶段 中,发现哪些Tenured region中对象的存活率很小或者基本没有对象存活,那么G1就会在这个阶段将其回收掉,而不用等到后面的 筛选回收 阶段。这也是Garbage First名字的由来。同时在该阶段,G1会计算每个region的对象存活率,方便后面的 筛选回收 阶段使用。
- 在这个阶段
- 最终标记(
CMS中的重新标记阶段)- 在这个阶段
G1做的事情跟CMS一样,但是采用的算法不同,G1采用一种叫做SATB(snapshot-at-the-begining)的算法能够在 重新标记 阶段更快的标记可达对象。
- 在这个阶段
- 筛选回收
- 在
G1中,没有CMS中对应的 并发清除 阶段。相反它有一个 筛选回收 阶段,在这个阶段中,G1会挑选出那些对象存活率低的region进行回收,这个阶段也是和MinorGC一同发生的,如下图所示:
- 在
G1是一款面向服务端应用的垃圾收集器。HotSpot开发团队赋予它的使命是未来可以替换掉JDK1.5中发布的CMS收集器。如果你的应用追求低停顿,G1可以作为选择;如果你的应用追求吞吐量,G1并不带来特别明显的好处。
四、一个对象的一生⭐⭐⭐
我是一个普通的Java对象,我出生在Eden区,在Eden区我还看到和我长的很像的小兄弟,我们在Eden区中玩了挺长时间。有一天Eden区中的人实在是太多了,我就被迫去了Survivor区的From区(S0区),自从去了Survivor区,我就开始漂了,有时候在Survivor的From区,有时候在Survivor的To区(S1区),居无定所。
直到我18岁的时候,爸爸说我成人了,该去社会上闯闯了。于是我就去了年老代那边,年老代里,人很多,并且年龄都挺大的,我在这里也认识了很多人。在老年代里,我生活了很多年(每次GC加一岁)然后被回收了。