首页 > 代码库 > 四:Java之字符串操作String、StringBuffer和StringBuilder

四:Java之字符串操作String、StringBuffer和StringBuilder

 

      string是我们经经常使用到的一个类型,事实上有时候认为敲代码就是在重复的操作字符串,这是C的特点,在java中。jdk非常好的封装了关于字符串的操作。三个类String 、StringBuffer 、 StringBuilder .这三个类基本上满足了我们在不同情景下使用字符串的需求。

一、String

    JDK的解释是 “Strings are constant; their valuescannot be changed after they are created”也就是说String对象一旦被创建就是固定不变的了,这种一点优点就是能够多线程之间訪问,由于仅仅读不写。

   普通情况下我们以以下两种方式创建一个String对象

Stringstr1 = “Liangcs”;

Stringstr2 = new String(“Laingcs”);

  两种方式是有差别的,这和java的内存管理有关,前面已经说过,string创建之后是不可变的。所以依照第一种方式创建的字符串会放在栈里。更确切的是常量池中,常量池就是用来保存在编译阶段确定好了大小的数据,一般我们定义的int等基本数据类型就保存在这里。

  其详细的一个流程就是,编译器首先检查常量池,看看有没有一个“string”,假设没有则创建。

假设有的话,则则直接把str1指向那个位置。

  另外一种创建字符串的方法是通过newkeyword,还是java的内存分配,java会将new的对象放在堆中,这一部分对象是在执行时创建的对象。所以我们每一次new的时候,都会创建不同的对象,即便是堆中已经有了一个一模一样的。

   写一个小样例

<span style="font-size:18px;">String str1 = "string";
String str4 = "string";
String str2 = newString("string");
String str3 = newString("string");
       
/*用于測试两种创建字符串方式的差别*/
System.out.println(str1 == str4);
System.out.println(str2 == str3);
System.out.println(str3 == str1);
       
str3 =str3.intern(); //一个不常见的方法
System.out.println(str3 == str1);
这个的执行结果是
true    //解释:两个字符串的内容全然同样,因而指向常量池中的同一个区域
false   //解释:每一次new都会创建一个新的对象
false  // 解释: 注意==比較的是地址,不不过内容 
true //介绍一下intern方法,这种方法会返回一个字符串在常量池中的一个地址,假设常量池中有与str3内容同样的string则返回那个地址。假设没有,则在常量池中       创建一个string后再返回。实际上,str3如今指向了str1的地址。</span>

  非常多人有这种疑问就是既然string是不变的,那么为什么str1 + "some"是合法的,事实上。每次对string进行改动,都会创建一个新的对象。

  所以假设须要对一个字符串不断的改动的话,效率是非常的低的,由于堆的优点是能够动态的添加空间,劣势就是分配新的空间消耗是非常大的。比方我们看以下的測试。

<span style="font-size:18px;">        long start =System.currentTimeMillis();
       
        for(int i = 0; i < 50000; i++)
        {
            str1+= " ";
        }    
        long end = System.currentTimeMillis();
        System.out.println("the run timeis "+(end -start)+" ms");</span>

上执行结果是the run time is 3538 ms   假设你把循环的次数后面再添加几个0就会更慢。

由于每一次循环都在创建心的对象。那么JDK怎样解决问题?

   以下就要说

二、StringBuffer。

StringBuffer是一个线程安全的,就是多线程訪问的可靠保证。最重要的是他是可变的,也就是说我们要操作一个常常变化的字符串,能够使用这个类,主要的方法就是append(与string的concat方法相应)和insert方法,至于怎么使用,就不多讲了。大家能够自己查看API。

<span style="font-size:18px;">       StringBuilder sb = new StringBuilder("string builder");
        StringBuffer sf = newStringBuffer("string buffer");
        long start =System.currentTimeMillis();
        for(int i = 0; i < 50000; i++)
        {
            //str1+= " ";
            sb.append(" ");
        }
        long end = System.currentTimeMillis();
        System.out.println("the run timeis "+(end -start)+" ms");</span>

  測试一下,这次仅仅须要8ms。这就是效率。

三、StringBuilder

  那么接下来,就要问StringBuilder是干什么的。事实上这个才是我们尝使用的。这个就是在jdk 1.5版本号后面加入的新的类。前面说StringBuffer是线程同步的。那么非常多情况下。我们仅仅是使用一个线程,那个同步势必带来一个效率的问题,StringBuilder就是StringBuffer的非线程同步的版本号,二者的方法几乎相同。仅仅是一个线程安全(适用于多线程)一个没有线程安全(适用于单线程)。

  事实上看了一下jdk源码就会发现,StringBuffer就是在各个方法上加上了keywordsyncronized

  StringBuilder也是一个可变的字符串对象。他与StringBuffer不同之处就在于它是线程不安全的,基于这点,它的速度一般都比StringBuffer快。与StringBuffer一样,StringBuider的主要操作也是append与insert方法。

这两个方法都能有效地将给定的数据转换成字符串。然后将该字符串的字符加入或插入到字符串生成器中。

三者比較

 简要的说。 String 类型和 StringBuffer 类型的主要性能差别事实上在于 String 是不可变的对象(为什么?问问 Java 的设计者吧,为什么 String 不是原生类型呢?)因此在每次对 String 类型进行改变的时候事实上都等同于生成了一个新的 String 对象,然后将指针指向新的 String 对象,所以常常改变内容的字符串最好不要用 String ,由于每次生成对象都会对系统性能产生影响,特别当内存中无引用对象多了以后, JVM 的 GC 就会開始工作。那速度是一定会相当慢的。这里尝试举个不是非常恰当的样例:

<span style="font-size:18px;">       String S1 = “abc”;
       For(int I = 0 ; I < 10000 ; I++)  // For 模拟程序的多次调用
       {
              S1+ = “def”;
              S1= “abc”;
       }</span>

假设是这种话,到这个 for 循环完成后,假设内存中的对象没有被 GC 清理掉的话。内存中一共同拥有 上 万个了。惊人的数目,而假设这是一个非常多人使用的系统,这种数目就不算非常多了。所以大家使用的时候一定要小心。

而假设是使用 StringBuffer 类则结果就不一样了。每次结果都会对 StringBuffer 对象本身进行操作,而不是生成新的对象。再改变对象引用。

所以在普通情况下我们推荐使用StringBuffer ,特别是字符串对象常常改变的情况下。而在某些特别情况下, String 对象的字符串拼接事实上是被 JVM 解释成了 StringBuffer 对象的拼接,所以这些时候 String 对象的速度并不会比 StringBuffer 对象慢,而特别是下面的字符串对象生成中。 String 效率是远要比 StringBuffer 快的:

       String S1 = “This is only a” + “simple” + “ test”;

       StringBuffer Sb = newStringBuilder(“This is only a”).append(“ simple”).append(“ test”);

       你会非常吃惊的发现,生成 String S1 对象的速度简直太快了,而这个时候 StringBuffer 竟然速度上根本一点都不占优势。事实上这是 JVM 的一个把戏,在 JVM 眼里。这个

       String S1 = “This is only a” + “simple” + “test”; 事实上就是:

       String S1 = “This is only asimple test”; 所以当然不须要太多的时间了。但大家这里要注意的是,假设你的字符串是来自另外的 String 对象的话,速度就没那么快了。譬如:

String S2 = “This is only a”;

String S3 = “ simple”;

String S4 = “ test”;

String S1 = S2 +S3 + S4;

这时候 JVM 会规规矩矩的依照原来的方式去做。 S1 对象的生成速度就不像刚才那么快了,一会儿我们能够来个測试作个验证。

由此我们得到第一步结论:

在大部分情况下 StringBuffer >String

       而 StringBuilder 跟他们比又怎么样呢?先简介一下, StringBuilder 是 JDK5.0 中新添加的一个类。它跟 StringBuffer 的差别看以下的介绍(来源 JavaWorld ):

       Java.lang.StringBuffer 线程安全的可变字符序列。类似于 String 的字符串缓冲区。但不能改动。可将字符串缓冲区安全地用于多个线程。

能够在必要时对这些方法进行同步。因此随意特定实例上的全部操作就好像是以串行顺序发生的,该顺序与所涉及的每一个线程进行的方法调用顺序一致。

       每一个字符串缓冲区都有一定的容量。

仅仅要字符串缓冲区所包括的字符序列的长度没有超出此容量,就无需分配新的内部缓冲区数组。

假设内部缓冲区溢出。则此容量自己主动增大。从 JDK 5.0 開始,为该类增添了一个单个线程使用的等价类。即 StringBuilder 。

与该类相比,通常应该优先使用 StringBuilder 类,由于它支持全部同样的操作,但由于它不运行同步。所以速度更快。

可是假设将 StringBuilder 的实例用于多个线程是不安全的。须要这种同步,则建议使用 StringBuffer 。

这样说预计大家都能明确他们之间的差别了。那么以下我们再做一个一般性推导:

在大部分情况下 StringBuilder >StringBuffer

因此,依据这个不等式的传递定理: 在大部分情况下

StringBuilder > StringBuffer> String

对于三者使用的总结:
1.假设要操作少量的数据用 String
2.单线程操作字符串缓冲区 下操作大量数据  StringBuilder
3.多线程操作字符串缓冲区 下操作大量数据  StringBuffer

四、经常使用串操作

1、字符串比較

        equals()   ------推断内容是否同样。

        compareTo() ------推断字符串的大小关系。

        compareToIgnoreCase(String int)    ------在比較时忽略字母大写和小写。

        == ------推断内容与地址是否同样。

        equalsIgnoreCase() ------忽略大写和小写的情况下推断内容是否同样。

        reagionMatches() ------对字符串中的部分内容是否同样进行比較(详情请參考API)。

      2、字符串查找

         charAt(int index) ------返回指定索引index位置上的字符,索引范围从0開始。

         indexOf(String str)------从字符串開始检索str,并返回第一次出现的位置,未出现返回-1。

         indexOf(String str,intfromIndex);------从字符串的第fromIndex个字符開始检索str。

         lastIndexOf(String str)------查找最后一次出现的位置。

         lastIndexOf(String str,intfromIndex)----从字符串的第fromIndex个字符查找最后一次出现的位置。

         starWith(String prefix,inttoffset)-----測试此字符串从指定索引開始的子字符串是否以指定前缀開始。

         starWith(String prefix)------測试此字符串是否以指定的前缀開始。

         endsWith(String suffix)------測试此字符串是否以指定的后缀结束。

      3、字符串截取

          public String subString(int beginIndex)------返回一个新的字符串,它是此字符串的一个子字符串。

         public String subString(int beginIndex,int endIndex)------返回的字符串是从beginIndex開始到endIndex-1的串。

     4、字符串替换

          public String replace(char oldChar。char newChar)。

          public String replace(CharSequence target,CharSequence replacement)------把原来的etarget子序列替换为replacement序列。返回新串。

          public String replaceAll(String regex。String replacement)------用正則表達式实现对字符串的匹配。注意replaceAll第一个參数为正則表達式,鄙人以前深受其害。

通过我自己的学习,我感觉事实上最好的资料就是JDK的API,能够好好利用。

四:Java之字符串操作String、StringBuffer和StringBuilder