首页 > 代码库 > javascript字符串

javascript字符串

多行

字符串默认仅仅能写在一行内。分成多行将会报错。

能够使用连接运算符(+)连接多个单行字符串,用来模拟多行字符串。

var str= ‘Hello‘ +
    ‘world‘ +
    ‘I\‘m‘ +
    ‘coming‘; // "Hello world I‘m coming"

也能够在每一行的尾部使用反斜杠

var str= "Hello world I‘m coming"; // "Hello world I‘m coming"

只是这样的方式有两点须要注意
(1) 它是ECMAScript 5新加入的。老式浏览器(如IE 8)不支持
(2) 反斜杠的后面必须是换行符,而不能有其它字符(比方空格),否则会报错。


转义

假设非特殊字符前面使用反斜杠,则反斜杠会被省略。

‘\a‘; // "a"

字符串与数组

字符串能够被视为字符数组。能够使用数组的方括号运算符,用来返回某个位置的字符,但无法改变字符串之中的单个字符。

length属性返回字符串的长度。该属性也是无法改变的。

字符串与数组的关系仅此而已。


字符集

JavaScript使用Unicode字符集。使用16位(即2个字节)的UTF-16格式储存。也就是说,JavaScript的单位字符长度固定为2个字节。

对于U+0000到U+FFFF之间的字符。一个16位就够了(即2个字节)。对于U+10000到U+10FFFF之间的字符,就须要2个16位(即4个字节),并且前两个字节在0xD800到0xDBFF之间,后两个字节在0xDC00到0xDFFF之间。浏览器会正确将这四个字节识别为一个字符,可是JavaScript内部的字符长度总是固定为16位,会把这四个字节视为两个字符。

var s1 = ‘?‘;
var s2 = ‘??‘;
console.log(s1.length); // 1
console.log(s2.length); // 2
console.log(s2.charAt(0) + s2.charAt(1)); // ??

处理字符串时要考虑字符编码的问题

// 把字符串变成数组
function getSymbols(string) {
    var length = string.length;
    var index = -1;
    var output = [];
    var character;
    var charCode;
    while (++index < length) {
        character = string.charAt(index);
        charCode = character.charCodeAt(0);
        if (charCode >= 0xD800 && charCode <= 0xDBFF) {
            output.push(character + string.charAt(++index));
        } else {
            output.push(character);
        }
    }
    return output;
}

方法

String

用来生成字符串的包装对象

假设不用new,还能够当作工具方法使用。将随意类型的值转为字符串

String(true) // "true"
String(5) // "5"

fromCharCode

String对象直接提供的方法,依据Unicode编码,生成一个字符串。

String.fromCharCode(104, 101, 108, 108, 111); // "hello"
String.fromCharCode(0x20BB7); // "?"
String.fromCharCode(0xD842, 0xDFB7); // "??"

charAt

返回一个字符串的给定位置的字符。位置从0開始编号。

charCodeAt

返回给定位置字符的Unicode编码(十进制表示)。

concat

用于连接两个字符串。原字符串不受影响。返回一个新字符串。

能够接受多个字符串。

"a".concat("b","c"); // "abc"

substring、substr、slice

这三个方法都用来返回一个字符串的子串,而不会改变原字符串。

它们都能够接受一个或两个參数
第一个參数都是子字符串的開始位置

假设省略第二个參数,则表示子字符串一直持续到原字符串结束

第二个參数对于slice和substring方法,表示子字符串的结束位置。对于substr,表示子字符串的长度。


假设第一个參数大于第二个參数。slice方法并不会自己主动调换參数位置,而是返回一个空字符串。

假设參数为负。对于slice方法,表示字符位置从尾部開始计算。对于substring方法,会自己主动将负数转为0。对于substr方法,负数出如今第一个參数。表示从尾部開始计算的字符位置;负数出如今第二个參数,将被转为0。

indexOf、lastIndexOf

一个字符串在还有一个字符串中的位置,假设返回-1。就表示不匹配。

还能够接受第二个參数,对于indexOf。表示从该位置開始向后匹配。对于lastIndexOf,表示从该位置起向前匹配。


不可为负数。

trim

去除字符串两端的空格

"  hello world  ".trim(); // "hello world"

toLowerCase、toUpperCase

localeCompare

比較两个字符串。它返回一个数字,假设小于0,表示第一个字符串小于第二个字符串。假设等于0,表示两者相等。假设大于0,表示第一个字符串大于第二个字符串。

‘apple‘.localeCompare(‘banana‘); // -1
‘apple‘.localeCompare(‘apple‘); // 0

以下是与搜索和替换相关的有4个方法,它们都同意使用正則表達式

match

match方法返回一个数组,成员为匹配的第一个字符串。假设没有找到匹配。则返回null。返回数组还有index属性和input属性。分别表示匹配字符串開始的位置(从0開始)和原始字符串。

var matches = "cat, bat, sat, fat".match("at");
console.log(matches) // ["at"]
matches.index // 1
matches.input // "cat, bat, sat, fat"

search方法的使用方法等同于match。可是返回值为匹配的第一个位置。假设没有找到匹配,则返回-1。

"cat, bat, sat, fat".search("at"); // 1

replace

用于替换匹配的子字符串。普通情况下仅仅替换第一个匹配(除非使用带有g修饰符的正則表達式)。

"aaa".replace("a", "b"); // "baa"

split

依照给定规则切割字符串。返回一个由切割出来的各部分组成的新数组。

"a|b|c".split("|"); // ["a", "b", "c"]

假设切割规则为空字符串,则返回数组的成员是原字符串的每个字符。

"a|b|c".split(""); // ["a", "|", "b", "|", "c"]

假设省略切割规则。则返回数组的唯一成员就是原字符串。

"a|b|c".split(); // ["a|b|c"]

假设满足切割规则的两个部分紧邻着(即中间没有其它字符)。则返回数组之中会有一个空字符串。

"a||c".split("|"); // ["a", "", "c"]

假设满足切割规则的部分处于字符串的开头或结尾(即它的前面或后面没有其它字符),则返回数组的第一个或最后一个成员是一个空字符串。

"|b|c".split("|"); // ["", "b", "c"]
"a|b|".split("|"); // ["a", "b", ""]

split方法还能够接受第二个參数,限定返回数组的最大成员数。

"a|b|c".split("|", 0) // []
"a|b|c".split("|", 1) // ["a"]
"a|b|c".split("|", 2) // ["a", "b"]
"a|b|c".split("|", 3) // ["a", "b", "c"]
"a|b|c".split("|", 4) // ["a", "b", "c"]

<script type="text/javascript"> $(function () { $(‘pre.prettyprint code‘).each(function () { var lines = $(this).text().split(‘\n‘).length; var $numbering = $(‘
    ‘).addClass(‘pre-numbering‘).hide(); $(this).addClass(‘has-numbering‘).parent().append($numbering); for (i = 1; i <= lines; i++) { $numbering.append($(‘
  • ‘).text(i)); }; $numbering.fadeIn(1700); }); }); </script>

javascript字符串