一個 Java 對象到底有多大?

2019-10-23     程式設計師聖經
作者:李小武
來源:http://blog.lichengwu.cn/java/2014/01/05/building-memory-efficient-javabean/
  • 一個Java對象到底有多大?
  • Java對象結構
  • 節約內存原則
  • (1)儘量使用基本類型,而不是包裝類型。
  • (2)斟酌欄位類型,在滿足容量前提下,儘量用小欄位。
  • (3)如果可能,儘量用數組,少用集合。
  • (4)小技巧。
  • 總結

編寫Java代碼的時候,大多數情況下,我們很少關注一個Java對象究竟有多大(占據多少內存),更多的是關注業務與邏輯。但是殊不知,在我們不經意間,大量的內存被無形地浪費了。

一個Java對象到底有多大?

想要精確計算一個Java對象占用的內存,首先要了解Java對象的結構表示。

Java對象結構

一個Java對象在Heap的表示,可以分為三部分:

  • Object Header
  • Class Pointer
  • Fields

每個普通Java對象在堆(heap)中都有一個頭信息(object header),頭信息是必不可少的,記錄著對象的狀態。

32位與64位占用空間不同,在32位中:

hash(25)+age(4)+lock(3)=32bit

64位中:

unused(25+1)+hash(31)+age(4)+lock(3)=64bit

我們知道,在Java中,一切皆對象;每個類都有一個父類,Class Pointer就是當前對象父類的一個指針,在32位系統中,這個指針為4byte;在64位系統中,如果開啟指針壓縮(-XX:+UseCompressedOops)或者JVM堆的最大值小於32G,這個指針也是4byte,否則是8byte。

關於欄位(Fields),這裡指的是類的實例欄位;也就是說不包括靜態欄位,因為這個欄位是共享內存的,只會存在一份。

下面以32位系統為例子,計算一下java.lang.Integer到底占用多大內存:

Object Header 和 Pointer 都是固定的,4+4=8byte;再看看欄位,只有這一個,表示數值:

/**
* The value of the Integer.
*
* @serial
*/
private final int value;

一個int在java中占據4byte,所以Integer的大小為4+4+4=12byte。

這個結果對嗎?不對!還有一點沒有說:在java,對象占用的heap大小是8位對齊的,上面的12byte沒有對齊,所以需要補位4byte。結果是16byte!

另外,在Java中還有一種特殊的對象,數組!沒錯,這個對象有點特殊,它比其他對象多了一個屬性:長度(length)。所以我們計算數組長度的時候,需要額外加上一個長度的欄位,即一個int的大小。

例如:int[] arr = new int[10];

arr的占用heap大小為:

4(object header)+4(pointer)+4(length)+4*10(10個int大小)=52byte 由於需要8位對齊,所以最終大小為`56byte`。

節約內存原則

在了解了對象的內存使用情況後,我們可以簡單算一筆帳。一個java.lang.Integer占用16byte,而一個int占用4byte,4:1的比例!也就是說整數的類類型是基本類型內存的4倍!由此我們得出第一個節約內存的原則:

(1)儘量使用基本類型,而不是包裝類型。

資料庫建表的時候欄位類型需要仔細推敲,同樣JavaBean中的屬性欄位類型也需要仔細斟酌。不要吝嗇使用short,byte,boolean,如果短類型能放下數據,儘量不要使用更長的類型。一個long比一個int才多4byte,但是你要想,如果內存中有100W個long,那就白白浪費了約4MB空間,不要小看這一點點的空間浪費,因為隨便一個跑著在線應用的JVM中,對象都能達到上千萬!內存是節省出來的。所以:

(2)斟酌欄位類型,在滿足容量前提下,儘量用小欄位。

你知道一個ArrayList集合,如果裡面放了10個數字,占用多少內存嗎?讓我們算算:

ArrayList中有兩個欄位:

Object Header占4byte,Pointer占4byte,一個int欄位(size)占4byte,elementData數組本身占12(4+4+4),數組中10個Integer對象占10×16。所以整個集合空間大小為4+4+4+12+160=184byte。

如果我們用int[]代替集合呢,12+4×10=52byte,對其後56byte。

集合跟數組的比例是184:56,超過3:1了!

所以我們的第三個建議是:

(3)如果可能,儘量用數組,少用集合。

數組中是可以使用基本類型的,但是集合中只能放包裝類型!

如果實在需要使用集合,推薦一個比較節約內存的集合工具,fastutil。這裡面包含了JKD集合中絕大部分的實現,而且比較省內存。

(4)小技巧。

在上面的三個原則基礎上,提供兩個小技巧。

  • 時間用long/int表示,不用Date或者String。
  • 短字符串如果能窮舉或者轉換成ascii表示,可以用long或者int表示。

小技巧跟具體的場景是數據有關係,可以根據實際情況進行激進優化節省內存。

總結

性能和可讀性向來就有些矛盾,在這裡也是,為了節約內存,不得不進行取捨,代碼醜陋了一些,可讀性差了一些,還好能省下一些內存。上面的原則在確實需要節約內存的時候,不妨可以試試!

文章來源: https://twgreatdaily.com/zh/SuLr-W0BMH2_cNUgidw3.html