首页 > 代码库 > 四:Java之字符串操作String、StringBuffer和StringBuilder

四:Java之字符串操作String、StringBuffer和StringBuilder

 

      string是我们经常用到的一个类型,其实有时候觉得写程序就是在反复的操作字符串,这是C的特点,在java中,jdk很好的封装了关于字符串的操作。三个类String 、StringBuffer 、 StringBuilder .这三个类基本上满足了我们在不同情景下使用字符串的需求。

一、String

    JDK的解释是 “Strings are constant; their valuescannot be changed after they are created”也就是说String对象一旦被创建就是固定不变的了,这样的一点好处就是可以多线程之间访问,因为只读不写。

   一般情况下我们以下面两种方式创建一个String对象

Stringstr1 = “Liangcs”;

Stringstr2 = new String(“Laingcs”);

  两种方式是有区别的,这和java的内存管理有关,前面已经说过,string创建之后是不可变的,所以按照第一种方式创建的字符串会放在栈里,更确切的是常量池中,常量池就是用来保存在编译阶段确定好了大小的数据,一般我们定义的int等基本数据类型就保存在这里。

  其具体的一个流程就是,编译器首先检查常量池,看看有没有一个“string”,如果没有则创建。如果有的话,则则直接把str1指向那个位置。

  第二种创建字符串的方法是通过new关键字,还是java的内存分配,java会将new的对象放在堆中,这一部分对象是在运行时创建的对象。所以我们每一次new的时候,都会创建不同的对象,即便是堆中已经有了一个一模一样的。

   写一个小例子

<span style="font-size:18px;">String str1 = "string";
String str4 = "string";
String str2 = newString("string");
String str3 = newString("string");
       
/*用于测试两种创建字符串方式的区别*/
System.out.println(str1 == str4);
System.out.println(str2 == str3);
System.out.println(str3 == str1);
       
str3 =str3.intern(); //一个不常见的方法
System.out.println(str3 == str1);
这个的运行结果是
true    //解释:两个字符串的内容完全相同,因而指向常量池中的同一个区域
false   //解释:每一次new都会创建一个新的对象
false  // 解释: 注意==比较的是地址,不仅仅是内容 
true //介绍一下intern方法,这个方法会返回一个字符串在常量池中的一个地址,如果常量池中有与str3内容相同的string则返回那个地址,如果没有,则在常量池中       创建一个string后再返回。实际上,str3现在指向了str1的地址。</span>

  很多人有这样的疑问就是既然string是不变的,那么为什么str1 + "some"是合法的,其实,每次对string进行修改,都会创建一个新的对象。

  所以如果需要对一个字符串不断的修改的话,效率是非常的低的,因为堆的好处是可以动态的增加空间,劣势就是分配新的空间消耗是很大的,比如我们看下面的测试。

<span style="font-size:18px;">        long start =System.currentTimeMillis();
       
        for(int i = 0; i < 50000; i++)
        {
            str1+= " ";
        }    
        long end = System.currentTimeMillis();
        System.out.println("the run timeis "+(end -start)+" ms");</span>

上运行结果是the run time is 3538 ms   如果你把循环的次数后面再增加几个0就会更慢。因为每一次循环都在创建心的对象,那么JDK如何解决这个问题?

   下面就要说

二、StringBuffer。

StringBuffer是一个线程安全的,就是多线程访问的可靠保证,最重要的是他是可变的,也就是说我们要操作一个经常变化的字符串,可以使用这个类,基本的方法就是append(与string的concat方法对应)和insert方法,至于怎么使用,就不多讲了,大家可以自己查看API。

<span style="font-size:18px;">       StringBuilder sb = new StringBuilder("string builder");
        StringBuffer sf = newStringBuffer("string buffer");
        long start =System.currentTimeMillis();
        for(int i = 0; i < 50000; i++)
        {
            //str1+= " ";
            sb.append(" ");
        }
        long end = System.currentTimeMillis();
        System.out.println("the run timeis "+(end -start)+" ms");</span>

  测试一下,这次只需要8ms,这就是效率。

三、StringBuilder

  那么接下来,就要问StringBuilder是干什么的,其实这个才是我们尝使用的,这个就是在jdk 1.5版本后面添加的新的类,前面说StringBuffer是线程同步的,那么很多情况下,我们只是使用一个线程,那个同步势必带来一个效率的问题,StringBuilder就是StringBuffer的非线程同步的版本,二者的方法差不多,只是一个线程安全(适用于多线程)一个没有线程安全(适用于单线程)。

  其实看了一下jdk源代码就会发现,StringBuffer就是在各个方法上加上了关键字syncronized

  StringBuilder也是一个可变的字符串对象,他与StringBuffer不同之处就在于它是线程不安全的,基于这点,它的速度一般都比StringBuffer快。与StringBuffer一样,StringBuider的主要操作也是append与insert方法。这两个方法都能有效地将给定的数据转换成字符串,然后将该字符串的字符添加或插入到字符串生成器中。

三者比较

 简要的说, String 类型和 StringBuffer 类型的主要性能区别其实在于 String 是不可变的对象(为什么?问问 Java 的设计者吧,为什么 String 不是原生类型呢?)因此在每次对 String 类型进行改变的时候其实都等同于生成了一个新的 String 对象,然后将指针指向新的 String 对象,所以经常改变内容的字符串最好不要用 String ,因为每次生成对象都会对系统性能产生影响,特别当内存中无引用对象多了以后, JVM 的 GC 就会开始工作,那速度是一定会相当慢的。这里尝试举个不是很恰当的例子:

<span style="font-size:18px;">       String S1 = “abc”;
       For(int I = 0 ; I < 10000 ; I++)  // For 模拟程序的多次调用
       {
              S1+ = “def”;
              S1= “abc”;
       }</span>

如果是这样的话,到这个 for 循环完毕后,如果内存中的对象没有被 GC 清理掉的话,内存中一共有 上 万个了,惊人的数目,而如果这是一个很多人使用的系统,这样的数目就不算很多了,所以大家使用的时候一定要小心。

而如果是使用 StringBuffer 类则结果就不一样了,每次结果都会对 StringBuffer 对象本身进行操作,而不是生成新的对象,再改变对象引用。所以在一般情况下我们推荐使用StringBuffer ,特别是字符串对象经常改变的情况下。而在某些特别情况下, String 对象的字符串拼接其实是被 JVM 解释成了 StringBuffer 对象的拼接,所以这些时候 String 对象的速度并不会比 StringBuffer 对象慢,而特别是以下的字符串对象生成中, String 效率是远要比 StringBuffer 快的:

       String S1 = “This is only a” + “simple” + “ test”;

       StringBuffer Sb = newStringBuilder(“This is only a”).append(“ simple”).append(“ test”);

       你会很惊讶的发现,生成 String S1 对象的速度简直太快了,而这个时候 StringBuffer 居然速度上根本一点都不占优势。其实这是 JVM 的一个把戏,在 JVM 眼里,这个

       String S1 = “This is only a” + “simple” + “test”; 其实就是:

       String S1 = “This is only asimple test”; 所以当然不需要太多的时间了。但大家这里要注意的是,如果你的字符串是来自另外的 String 对象的话,速度就没那么快了,譬如:

String S2 = “This is only a”;

String S3 = “ simple”;

String S4 = “ test”;

String S1 = S2 +S3 + S4;

这时候 JVM 会规规矩矩的按照原来的方式去做, S1 对象的生成速度就不像刚才那么快了,一会儿我们可以来个测试作个验证。

由此我们得到第一步结论:

在大部分情况下 StringBuffer >String

       而 StringBuilder 跟他们比又怎么样呢?先简单介绍一下, StringBuilder 是 JDK5.0 中新增加的一个类,它跟 StringBuffer 的区别看下面的介绍(来源 JavaWorld ):

       Java.lang.StringBuffer 线程安全的可变字符序列。类似于 String 的字符串缓冲区,但不能修改。可将字符串缓冲区安全地用于多个线程。可以在必要时对这些方法进行同步,因此任意特定实例上的所有操作就好像是以串行顺序发生的,该顺序与所涉及的每个线程进行的方法调用顺序一致。

       每个字符串缓冲区都有一定的容量。只要字符串缓冲区所包含的字符序列的长度没有超出此容量,就无需分配新的内部缓冲区数组。如果内部缓冲区溢出,则此容量自动增大。从 JDK 5.0 开始,为该类增添了一个单个线程使用的等价类,即 StringBuilder 。与该类相比,通常应该优先使用 StringBuilder 类,因为它支持所有相同的操作,但由于它不执行同步,所以速度更快。

但是如果将 StringBuilder 的实例用于多个线程是不安全的。需要这样的同步,则建议使用 StringBuffer 。

这样说估计大家都能明白他们之间的区别了,那么下面我们再做一个一般性推导:

在大部分情况下 StringBuilder >StringBuffer

因此,根据这个不等式的传递定理: 在大部分情况下

StringBuilder > StringBuffer> String

对于三者使用的总结:
1.如果要操作少量的数据用 String
2.单线程操作字符串缓冲区 下操作大量数据  StringBuilder
3.多线程操作字符串缓冲区 下操作大量数据  StringBuffer

四、常用串操作

1、字符串比较

        equals()   ------判断内容是否相同。

        compareTo() ------判断字符串的大小关系。

        compareToIgnoreCase(String int)    ------在比较时忽略字母大小写。

        == ------判断内容与地址是否相同。

        equalsIgnoreCase() ------忽略大小写的情况下判断内容是否相同。

        reagionMatches() ------对字符串中的部分内容是否相同进行比较(详情请参考API)。

      2、字符串查找

         charAt(int index) ------返回指定索引index位置上的字符,索引范围从0开始。

         indexOf(String str)------从字符串开始检索str,并返回第一次出现的位置,未出现返回-1。

         indexOf(String str,intfromIndex);------从字符串的第fromIndex个字符开始检索str。

         lastIndexOf(String str)------查找最后一次出现的位置。

         lastIndexOf(String str,intfromIndex)----从字符串的第fromIndex个字符查找最后一次出现的位置。

         starWith(String prefix,inttoffset)-----测试此字符串从指定索引开始的子字符串是否以指定前缀开始。

         starWith(String prefix)------测试此字符串是否以指定的前缀开始。

         endsWith(String suffix)------测试此字符串是否以指定的后缀结束。

      3、字符串截取

          public String subString(int beginIndex)------返回一个新的字符串,它是此字符串的一个子字符串。

         public String subString(int beginIndex,int endIndex)------返回的字符串是从beginIndex开始到endIndex-1的串。

     4、字符串替换

          public String replace(char oldChar,char newChar)。

          public String replace(CharSequence target,CharSequence replacement)------把原来的etarget子序列替换为replacement序列,返回新串。

          public String replaceAll(String regex,String replacement)------用正则表达式实现对字符串的匹配。注意replaceAll第一个参数为正则表达式,鄙人曾经深受其害。

通过我自己的学习,我感觉其实最好的资料就是JDK的API,可以好好利用。