首页 > 代码库 > javascript字符串
javascript字符串
多行
字符串默认仅仅能写在一行内。分成多行将会报错。
能够使用连接运算符(+)连接多个单行字符串,用来模拟多行字符串。
var str= ‘Hello‘ +
‘world‘ +
‘I\‘m‘ +
‘coming‘; // "Hello world I‘m coming"
也能够在每一行的尾部使用反斜杠
var str= "Hello world I‘m coming"; // "Hello world I‘m coming"
只是这样的方式有两点须要注意
(1) 它是ECMAScript 5新加入的。老式浏览器(如IE 8)不支持
(2) 反斜杠的后面必须是换行符,而不能有其它字符(比方空格),否则会报错。
转义
假设非特殊字符前面使用反斜杠,则反斜杠会被省略。
‘\a‘; // "a"
字符串与数组
字符串能够被视为字符数组。能够使用数组的方括号运算符,用来返回某个位置的字符,但无法改变字符串之中的单个字符。
length属性返回字符串的长度。该属性也是无法改变的。
字符串与数组的关系仅此而已。
字符集
JavaScript使用Unicode字符集。使用16位(即2个字节)的UTF-16格式储存。也就是说,JavaScript的单位字符长度固定为2个字节。
对于U+0000到U+FFFF之间的字符。一个16位就够了(即2个字节)。对于U+10000到U+10FFFF之间的字符,就须要2个16位(即4个字节),并且前两个字节在0xD800到0xDBFF之间,后两个字节在0xDC00到0xDFFF之间。浏览器会正确将这四个字节识别为一个字符,可是JavaScript内部的字符长度总是固定为16位,会把这四个字节视为两个字符。
var s1 = ‘?‘;
var s2 = ‘??‘;
console.log(s1.length); // 1
console.log(s2.length); // 2
console.log(s2.charAt(0) + s2.charAt(1)); // ??
处理字符串时要考虑字符编码的问题
// 把字符串变成数组
function getSymbols(string) {
var length = string.length;
var index = -1;
var output = [];
var character;
var charCode;
while (++index < length) {
character = string.charAt(index);
charCode = character.charCodeAt(0);
if (charCode >= 0xD800 && charCode <= 0xDBFF) {
output.push(character + string.charAt(++index));
} else {
output.push(character);
}
}
return output;
}
方法
String
用来生成字符串的包装对象
假设不用new,还能够当作工具方法使用。将随意类型的值转为字符串
String(true) // "true"
String(5) // "5"
fromCharCode
String对象直接提供的方法,依据Unicode编码,生成一个字符串。
String.fromCharCode(104, 101, 108, 108, 111); // "hello"
String.fromCharCode(0x20BB7); // "?"
String.fromCharCode(0xD842, 0xDFB7); // "??"
charAt
返回一个字符串的给定位置的字符。位置从0開始编号。
charCodeAt
返回给定位置字符的Unicode编码(十进制表示)。
concat
用于连接两个字符串。原字符串不受影响。返回一个新字符串。
能够接受多个字符串。
"a".concat("b","c"); // "abc"
substring、substr、slice
这三个方法都用来返回一个字符串的子串,而不会改变原字符串。
它们都能够接受一个或两个參数
第一个參数都是子字符串的開始位置
假设省略第二个參数,则表示子字符串一直持续到原字符串结束
第二个參数对于slice和substring方法,表示子字符串的结束位置。对于substr,表示子字符串的长度。
假设第一个參数大于第二个參数。slice方法并不会自己主动调换參数位置,而是返回一个空字符串。
假设參数为负。对于slice方法,表示字符位置从尾部開始计算。对于substring方法,会自己主动将负数转为0。对于substr方法,负数出如今第一个參数。表示从尾部開始计算的字符位置;负数出如今第二个參数,将被转为0。
indexOf、lastIndexOf
一个字符串在还有一个字符串中的位置,假设返回-1。就表示不匹配。
还能够接受第二个參数,对于indexOf。表示从该位置開始向后匹配。对于lastIndexOf,表示从该位置起向前匹配。
不可为负数。
trim
去除字符串两端的空格
" hello world ".trim(); // "hello world"
toLowerCase、toUpperCase
localeCompare
比較两个字符串。它返回一个数字,假设小于0,表示第一个字符串小于第二个字符串。假设等于0,表示两者相等。假设大于0,表示第一个字符串大于第二个字符串。
‘apple‘.localeCompare(‘banana‘); // -1
‘apple‘.localeCompare(‘apple‘); // 0
以下是与搜索和替换相关的有4个方法,它们都同意使用正則表達式
match
match方法返回一个数组,成员为匹配的第一个字符串。假设没有找到匹配。则返回null。返回数组还有index属性和input属性。分别表示匹配字符串開始的位置(从0開始)和原始字符串。
var matches = "cat, bat, sat, fat".match("at");
console.log(matches) // ["at"]
matches.index // 1
matches.input // "cat, bat, sat, fat"
search
search方法的使用方法等同于match。可是返回值为匹配的第一个位置。假设没有找到匹配,则返回-1。
"cat, bat, sat, fat".search("at"); // 1
replace
用于替换匹配的子字符串。普通情况下仅仅替换第一个匹配(除非使用带有g修饰符的正則表達式)。
"aaa".replace("a", "b"); // "baa"
split
依照给定规则切割字符串。返回一个由切割出来的各部分组成的新数组。
"a|b|c".split("|"); // ["a", "b", "c"]
假设切割规则为空字符串,则返回数组的成员是原字符串的每个字符。
"a|b|c".split(""); // ["a", "|", "b", "|", "c"]
假设省略切割规则。则返回数组的唯一成员就是原字符串。
"a|b|c".split(); // ["a|b|c"]
假设满足切割规则的两个部分紧邻着(即中间没有其它字符)。则返回数组之中会有一个空字符串。
"a||c".split("|"); // ["a", "", "c"]
假设满足切割规则的部分处于字符串的开头或结尾(即它的前面或后面没有其它字符),则返回数组的第一个或最后一个成员是一个空字符串。
"|b|c".split("|"); // ["", "b", "c"]
"a|b|".split("|"); // ["a", "b", ""]
split方法还能够接受第二个參数,限定返回数组的最大成员数。
"a|b|c".split("|", 0) // []
"a|b|c".split("|", 1) // ["a"]
"a|b|c".split("|", 2) // ["a", "b"]
"a|b|c".split("|", 3) // ["a", "b", "c"]
"a|b|c".split("|", 4) // ["a", "b", "c"]
javascript字符串