StringTable 笔记记录
- 1. 常量池、运行时常量池与字符串常量池(StringTable)的关系
- 2. String str="a"放入字符串常量池的过程
- 3. 常见面试题
- 4. StringTable特性
- 5.StringTable的位置变更
- 5.1 为什么位置变换?
- 5.2 位置变更演示
- 6. StringTable垃圾回收
- 7. StringTable性能调优
- 7.1 考虑字符串是否入池(字符串常量池)
1. 常量池、运行时常量池与字符串常量池(StringTable)的关系
/*** StringTable[] 当变为字符串对象时,还会将符号当作key在StringTable中去找,看有没有取值相同的key,* 如果没有就放入,如果有就直接使用。* 也就是StringTable结构其实是一个哈希表。哈希表是长度固定的,不能进行扩容。如果没有“a”字符串对象,则* 会放入串池。StringTable ["a"],执行完String s1="a"时就会放入串池中。下一行代码类似的。**/
public class Demo {//常量池中的信息,都会被加载到运行时常量池中,这时a,b,ab,都是常量池中的符号,还没有变为java字符串对象//当执行到该行代码时://ldc #2 会把a符号变为 “a” 字符串对象//ldc #3 会把b符号变为 “b” 字符串对象//ldc #4 会把ab符号变为“ab” 字符串对象public static void main(String[] args) {//将“a”放入字符串池中是一个惰性的过程,当执行到该行代码时,才会去检查是否有。String s1="a";String s2="b";String s3="ab";}
}
使用javap -v class文件看具体细节。
这里能看到Constant poool;
常量池:.class 文件中的静态数据,存储字面量和符号引用。
运行时常量池:类加载后解析的常量池,支持动态修改。
字符串常量池:运行时常量池的子集,专门存储字符串字面量。
2. String str="a"放入字符串常量池的过程
3. 常见面试题
String s1 = "a";String s2 = "b";String s3 = "ab";//new StringBuilder().append("a").append("b").toString;//StringBuilder的toString方法最终是new String("ab");String s4 = s1+s2; String s5="a"+"b";System.out.println(s3==s4);//false s3在字符串常量池中,s4在堆中,地址不一样。System.out.println(s3==s5);//true 编译器优化 实际上是"ab" 这里都可以利用javap -v *.class 查看字节码
String s1 = “a”;
String s2 = “b”;
String s4 = s1+s2;的底层如下
4. StringTable特性
- 常量池中的字符串仅是符号,第一次用到时才变为对象。
- 利用串池的机制,避免重复创建字符串对象。
- 字符串变量拼接的原理是StrngBuilder(1.8)
- 字符串常量拼接的原理是编译器优化 String s5=“a”+“b”;
- 可以使用intern方法,主动将串池中还没有的字符串对象放入串池
//串池中StringTable [ "a","b"]//堆中 [ "a", "b","ab" ] 这里注意串池中没有ab,因为这里是动态拼接的变量而不是常量。如果是String str="ab",则串池中存在。String s=new String("a")+new String("b");//想要把s的ab放入串池中调用 s.intern();即可。s.intern();String s2="ab";System.out.println(s==s2);
String x="ab";String s1=new String("a")+new String("b");String s2 = s1.intern();System.out.println(s2==x);//trueSystem.out.println(s1==x);//false x的ab已经放进去了,实际上s1.intern()放不进去了,所以s1和x不相等
这里注意JDK及7以后:
String s1=new String("a")+new String("b");String s2 = s1.intern();String x="ab";System.out.println(s2==x);//trueSystem.out.println(s1==x);//true
String s1="a";String s2="b";String s3="a"+"b";String s4=s1+s2;String s5="ab";String s6=s4.intern();System.out.println(s3==s4);//false s3在常量池s4由StringBuilder拼接然后new String对象 在堆中System.out.println(s3==s5);//true s3编译器优化 实际还是"ab"System.out.println(s3==s6);//trueString x2=new String("c")+new String("d");String x1="cd";x2.intern();System.out.println(x1==x2);//false x2放不进去常量池因为已经存在了,所以x2.intern()返回的是常量池中的对象
5.StringTable的位置变更
5.1 为什么位置变换?
5.2 位置变更演示
import java.util.ArrayList;
import java.util.List;/*** 演示StringTable位置* -Xmx10m* -XX:-UseGCOverheadLimit [写+就是打开开关,-就是关闭。]** -XX:-UseGCOverheadLimit 详解* 1. 作用* -XX:-UseGCOverheadLimit 是 JVM 的一个 故障保护机制开关,默认启用(-XX:+UseGCOverheadLimit)。* 它的核心作用是:* 当 JVM 检测到 GC 占用过多时间(超过 98%)但回收效果极差(释放内存 < 2%)时,抛出 OutOfMemoryError: GC Overhead Limit Exceeded 错误,防止应用陷入无限 GC。* 2. 触发条件* JVM 会在以下情况触发该错误:* GC 时间占比 > 98%(如 100ms 里 98ms 在 GC)。* GC 后内存释放 < 2%(几乎没回收空间)。* 持续超过 5 次 Full GC(不同 JVM 实现可能略有差异)。* 3. 关闭方式* 通过 -XX:-UseGCOverheadLimit 可禁用此机制,让 JVM 继续尝试 GC,而非直接报错。* 但需谨慎使用,可能让应用卡死在 GC 中!*/
public class Demo {public static void main(String[] args) {List<String> list = new ArrayList<>();int i = 0;try {for (int j = 0; j < 260000; j++) {list.add(String.valueOf(j).intern());i++;}} catch (Throwable e) {e.printStackTrace();} finally {System.out.println(i);}}
}
看报错也就知道了串池在堆空间。
6. StringTable垃圾回收
执行代码前的字符串常量池统计
往池子里加了100个对象后
/*** 演示StringTable垃圾回收* -Xmx10m 堆空间设置10m* -XX:+PrintStringTableStatistics 打印字符串常量池的统计信息* -XX:+PrintGCDetails -verbose:gc 打印GC信息*/
public class Demo {public static void main(String[] args) {int i=0;try {for (int j=0;j<100;j++){String.valueOf(j).intern();i++;}} catch (Exception e) {e.printStackTrace();}finally {System.out.println( i);}}
}
后面改成10000个对象
public static void main(String[] args) {int i=0;try {for (int j=0;j<10000;j++){String.valueOf(j).intern();i++;}} catch (Exception e) {e.printStackTrace();}finally {System.out.println( i);}}
发生了GC
这里就证明了确实StringTable是会发生垃圾回收的。
7. StringTable性能调优
StringTable底层是哈希表。
这里是读48w个单词,-XX:StringTableSize=200000 【调整字符串常量池StringTable的大小】
这里就是动态的调整jvm参数发现执行的时间变化是很大的。
7.1 考虑字符串是否入池(字符串常量池)
for循环10次,将480w都存入list中。
没有入池之前> 没有入池占用到80%左右。
入池之后
占用30%多左右。
如果引用出现大量的重复字符串,可以让字符串入池,来减少字符串对象个数,节约堆内存的使用。