首页 > 代码库 > 四:Java之字符串操作String、StringBuffer和StringBuilder
四:Java之字符串操作String、StringBuffer和StringBuilder
string是我们经常用到的一个类型,其实有时候觉得写程序就是在反复的操作字符串,这是C的特点,在java中,jdk很好的封装了关于字符串的操作。三个类String 、StringBuffer 、 StringBuilder .这三个类基本上满足了我们在不同情景下使用字符串的需求。
一、String
JDK的解释是 “Strings are constant; their valuescannot be changed after they are created”也就是说String对象一旦被创建就是固定不变的了,这样的一点好处就是可以多线程之间访问,因为只读不写。
一般情况下我们以下面两种方式创建一个String对象
Stringstr1 = “Liangcs”;
Stringstr2 = new String(“Laingcs”);
两种方式是有区别的,这和java的内存管理有关,前面已经说过,string创建之后是不可变的,所以按照第一种方式创建的字符串会放在栈里,更确切的是常量池中,常量池就是用来保存在编译阶段确定好了大小的数据,一般我们定义的int等基本数据类型就保存在这里。
其具体的一个流程就是,编译器首先检查常量池,看看有没有一个“string”,如果没有则创建。如果有的话,则则直接把str1指向那个位置。
第二种创建字符串的方法是通过new关键字,还是java的内存分配,java会将new的对象放在堆中,这一部分对象是在运行时创建的对象。所以我们每一次new的时候,都会创建不同的对象,即便是堆中已经有了一个一模一样的。
写一个小例子
<span style="font-size:18px;">String str1 = "string"; String str4 = "string"; String str2 = newString("string"); String str3 = newString("string"); /*用于测试两种创建字符串方式的区别*/ System.out.println(str1 == str4); System.out.println(str2 == str3); System.out.println(str3 == str1); str3 =str3.intern(); //一个不常见的方法 System.out.println(str3 == str1); 这个的运行结果是 true //解释:两个字符串的内容完全相同,因而指向常量池中的同一个区域 false //解释:每一次new都会创建一个新的对象 false // 解释: 注意==比较的是地址,不仅仅是内容 true //介绍一下intern方法,这个方法会返回一个字符串在常量池中的一个地址,如果常量池中有与str3内容相同的string则返回那个地址,如果没有,则在常量池中 创建一个string后再返回。实际上,str3现在指向了str1的地址。</span>
很多人有这样的疑问就是既然string是不变的,那么为什么str1 + "some"是合法的,其实,每次对string进行修改,都会创建一个新的对象。
所以如果需要对一个字符串不断的修改的话,效率是非常的低的,因为堆的好处是可以动态的增加空间,劣势就是分配新的空间消耗是很大的,比如我们看下面的测试。
<span style="font-size:18px;"> long start =System.currentTimeMillis(); for(int i = 0; i < 50000; i++) { str1+= " "; } long end = System.currentTimeMillis(); System.out.println("the run timeis "+(end -start)+" ms");</span>
上运行结果是the run time is 3538 ms 如果你把循环的次数后面再增加几个0就会更慢。因为每一次循环都在创建心的对象,那么JDK如何解决这个问题?
下面就要说
二、StringBuffer。
StringBuffer是一个线程安全的,就是多线程访问的可靠保证,最重要的是他是可变的,也就是说我们要操作一个经常变化的字符串,可以使用这个类,基本的方法就是append(与string的concat方法对应)和insert方法,至于怎么使用,就不多讲了,大家可以自己查看API。
<span style="font-size:18px;"> StringBuilder sb = new StringBuilder("string builder"); StringBuffer sf = newStringBuffer("string buffer"); long start =System.currentTimeMillis(); for(int i = 0; i < 50000; i++) { //str1+= " "; sb.append(" "); } long end = System.currentTimeMillis(); System.out.println("the run timeis "+(end -start)+" ms");</span>
测试一下,这次只需要8ms,这就是效率。
三、StringBuilder
那么接下来,就要问StringBuilder是干什么的,其实这个才是我们尝使用的,这个就是在jdk 1.5版本后面添加的新的类,前面说StringBuffer是线程同步的,那么很多情况下,我们只是使用一个线程,那个同步势必带来一个效率的问题,StringBuilder就是StringBuffer的非线程同步的版本,二者的方法差不多,只是一个线程安全(适用于多线程)一个没有线程安全(适用于单线程)。
其实看了一下jdk源代码就会发现,StringBuffer就是在各个方法上加上了关键字syncronized
StringBuilder也是一个可变的字符串对象,他与StringBuffer不同之处就在于它是线程不安全的,基于这点,它的速度一般都比StringBuffer快。与StringBuffer一样,StringBuider的主要操作也是append与insert方法。这两个方法都能有效地将给定的数据转换成字符串,然后将该字符串的字符添加或插入到字符串生成器中。
三者比较
简要的说, String 类型和 StringBuffer 类型的主要性能区别其实在于 String 是不可变的对象(为什么?问问 Java 的设计者吧,为什么 String 不是原生类型呢?)因此在每次对 String 类型进行改变的时候其实都等同于生成了一个新的 String 对象,然后将指针指向新的 String 对象,所以经常改变内容的字符串最好不要用 String ,因为每次生成对象都会对系统性能产生影响,特别当内存中无引用对象多了以后, JVM 的 GC 就会开始工作,那速度是一定会相当慢的。这里尝试举个不是很恰当的例子:
<span style="font-size:18px;"> String S1 = “abc”; For(int I = 0 ; I < 10000 ; I++) // For 模拟程序的多次调用 { S1+ = “def”; S1= “abc”; }</span>
如果是这样的话,到这个 for 循环完毕后,如果内存中的对象没有被 GC 清理掉的话,内存中一共有 上 万个了,惊人的数目,而如果这是一个很多人使用的系统,这样的数目就不算很多了,所以大家使用的时候一定要小心。
而如果是使用 StringBuffer 类则结果就不一样了,每次结果都会对 StringBuffer 对象本身进行操作,而不是生成新的对象,再改变对象引用。所以在一般情况下我们推荐使用StringBuffer ,特别是字符串对象经常改变的情况下。而在某些特别情况下, String 对象的字符串拼接其实是被 JVM 解释成了 StringBuffer 对象的拼接,所以这些时候 String 对象的速度并不会比 StringBuffer 对象慢,而特别是以下的字符串对象生成中, String 效率是远要比 StringBuffer 快的:
String S1 = “This is only a” + “simple” + “ test”;
StringBuffer Sb = newStringBuilder(“This is only a”).append(“ simple”).append(“ test”);
你会很惊讶的发现,生成 String S1 对象的速度简直太快了,而这个时候 StringBuffer 居然速度上根本一点都不占优势。其实这是 JVM 的一个把戏,在 JVM 眼里,这个
String S1 = “This is only a” + “simple” + “test”; 其实就是:
String S1 = “This is only asimple test”; 所以当然不需要太多的时间了。但大家这里要注意的是,如果你的字符串是来自另外的 String 对象的话,速度就没那么快了,譬如:
String S2 = “This is only a”;
String S3 = “ simple”;
String S4 = “ test”;
String S1 = S2 +S3 + S4;
这时候 JVM 会规规矩矩的按照原来的方式去做, S1 对象的生成速度就不像刚才那么快了,一会儿我们可以来个测试作个验证。
由此我们得到第一步结论:
在大部分情况下 StringBuffer >String
而 StringBuilder 跟他们比又怎么样呢?先简单介绍一下, StringBuilder 是 JDK5.0 中新增加的一个类,它跟 StringBuffer 的区别看下面的介绍(来源 JavaWorld ):
Java.lang.StringBuffer 线程安全的可变字符序列。类似于 String 的字符串缓冲区,但不能修改。可将字符串缓冲区安全地用于多个线程。可以在必要时对这些方法进行同步,因此任意特定实例上的所有操作就好像是以串行顺序发生的,该顺序与所涉及的每个线程进行的方法调用顺序一致。
每个字符串缓冲区都有一定的容量。只要字符串缓冲区所包含的字符序列的长度没有超出此容量,就无需分配新的内部缓冲区数组。如果内部缓冲区溢出,则此容量自动增大。从 JDK 5.0 开始,为该类增添了一个单个线程使用的等价类,即 StringBuilder 。与该类相比,通常应该优先使用 StringBuilder 类,因为它支持所有相同的操作,但由于它不执行同步,所以速度更快。
但是如果将 StringBuilder 的实例用于多个线程是不安全的。需要这样的同步,则建议使用 StringBuffer 。
这样说估计大家都能明白他们之间的区别了,那么下面我们再做一个一般性推导:
在大部分情况下 StringBuilder >StringBuffer
因此,根据这个不等式的传递定理: 在大部分情况下
StringBuilder > StringBuffer> String
对于三者使用的总结:
1.如果要操作少量的数据用 String
2.单线程操作字符串缓冲区 下操作大量数据 StringBuilder
3.多线程操作字符串缓冲区 下操作大量数据 StringBuffer
四、常用串操作
1、字符串比较
equals() ------判断内容是否相同。
compareTo() ------判断字符串的大小关系。
compareToIgnoreCase(String int) ------在比较时忽略字母大小写。
== ------判断内容与地址是否相同。
equalsIgnoreCase() ------忽略大小写的情况下判断内容是否相同。
reagionMatches() ------对字符串中的部分内容是否相同进行比较(详情请参考API)。
2、字符串查找
charAt(int index) ------返回指定索引index位置上的字符,索引范围从0开始。
indexOf(String str)------从字符串开始检索str,并返回第一次出现的位置,未出现返回-1。
indexOf(String str,intfromIndex);------从字符串的第fromIndex个字符开始检索str。
lastIndexOf(String str)------查找最后一次出现的位置。
lastIndexOf(String str,intfromIndex)----从字符串的第fromIndex个字符查找最后一次出现的位置。
starWith(String prefix,inttoffset)-----测试此字符串从指定索引开始的子字符串是否以指定前缀开始。
starWith(String prefix)------测试此字符串是否以指定的前缀开始。
endsWith(String suffix)------测试此字符串是否以指定的后缀结束。
3、字符串截取
public String subString(int beginIndex)------返回一个新的字符串,它是此字符串的一个子字符串。
public String subString(int beginIndex,int endIndex)------返回的字符串是从beginIndex开始到endIndex-1的串。
4、字符串替换
public String replace(char oldChar,char newChar)。
public String replace(CharSequence target,CharSequence replacement)------把原来的etarget子序列替换为replacement序列,返回新串。
public String replaceAll(String regex,String replacement)------用正则表达式实现对字符串的匹配。注意replaceAll第一个参数为正则表达式,鄙人曾经深受其害。
通过我自己的学习,我感觉其实最好的资料就是JDK的API,可以好好利用。