JVM内部细节之三:字符串及字符串常量池

本人最近正在面试,然后注意到总是有公司喜欢考String的问题,如字符串连接有几种方式,它们之间有什么不同等问题;要不就是给一段代码问创建了几个对象。那么该不该问呢?我认为当面试有一定工作经验的求职者时还是应该问问这个问题的,应届生就不要为难他们了还是多考考底层基础比较好。下面我结合JVisualVM和javap这两个工具来详细解析下JVM内部是怎么处理String对象的。

字符串常量池(String Constant Pool)

字符串在java程序中被大量使用,为了避免每次都创建相同的字符串对象及内存分配,JVM内部对字符串对象的创建做了一定的优化,在Permanent Generation中专门有一块区域用来存储字符串常量池(一组指针指向Heap中的String对象的内存地址)。

创建字符串对象的几种形式:

(1)通过new方式如String s = new String(“iByteCode”)及string.intern()方法

(2)通过字面量的形式如String s = “aaaaa”

(3)字面量+字面量如String s = “bbbb” + “ccccc”

(4)字面量+变量如String s1 = “dddd”;String s = “eeeee”+s1

假设刚开始字符串常量池为空,那么对于第一种创建方式,JVM内部是怎么处理的,这里也有一个面试题就是一共创建了几个对象,在这里答案是两个,为什么说是两个呢?一个是字符串字面量本身(可以通过string.intern()方法来取得,下图中常量池所指向的字符串对象),一个是单独的字符串对象,Heap视图如下所示:

看下面的代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
 
public class StringConstantPoolTester {
     //private String s1 = new String("iByteCode");
 
    public static void main(String[] args) throws Exception {
        String s1 = new String("iByteCode");
        System.out.println(s1);
        CyclicBarrier barrier = new CyclicBarrier(2);
        barrier.await();
    }
 
}

那么怎么来验证上面的结论的正确性呢?我们可以通过JVisualVM来Heap dump功能来实现,通过OQL语言来查询Heap内值为iByteCode的字符串对象的个数就可以确定上面的代码到底创建了几个对象。执行结果如下图所示:

这里有一点要注意,对于通过new方式创建的String对象,每次都会在Heap上创建一个新的实例,但是对于字符串字面量的形式,只有当字符串常量池中不存在相同对象时才会创建。

第二种方式不用说,相当于第一种方式中的字面量部分。

第三种和第四种方式会怎样创建字符串对象,可以通过javap和JVisualVM来验证,下面通过一段代码来验证:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
 
public class StringConstantPoolTester {
     //private String s1 = new String("iByteCode");
 
    public static void main(String[] args) throws Exception {
        String s1 = new String("iByteCode");
        String s2 = "bbbb" + "ccccc";
        String s3 = "dddd" + s2;
        System.out.println(s3);
        CyclicBarrier barrier = new CyclicBarrier(2);
        barrier.await();
    }
 
}

这段代码的bytecode输出如下:

对于第三种形式String s2 = “bbbb” + “ccccc”,在main方法字节码的第10-12可以看到在JVM里直接通过ldc指令将指向bbbbccccc字符串字面量的引用的值放入到Operand Stack顶,然后存入到Local variable Array的第二个slot位。同时可以通过JVisualVM验证结论的正确性,由于篇幅问题这里省略。

对于第四种形式String s3 = “dddd” + s2,在main方法字节码的13-32可以看到在JVM里面创建了两个字符串字面量dddd和ddddbbbbccccc,并且调用StringBuilder对字符串进行连接。

参考资料:

http://theopentutorials.com/tutorials/java/strings/string-literal-pool/

发表评论

电子邮件地址不会被公开。 必填项已用*标注