首页 > 代码库 > PHP截取中文字符串无乱码的方法

PHP截取中文字符串无乱码的方法

首先是支持gb2312,gbk,big三种编码。 以下是代码:

$len = 19;

$text = "怎么将新闻的很长的标题只显示前面一些字,后面用…..来代替?";

echo strlen($text)<=$len ? $text : (substr($text,0,$len).chr(0)."….");

chr(0)不是null null是什么都没有,而chr(0)的值是0。 表示成16进制是0×00,表示成二进制是00000000 虽然chr(0)不会显示出什么,但是他是一个字符。 当汉字被截断时,根据编码规则他总是要把后边的其他字符拉过来一起作为汉字解释,这就是出现乱码的原因。 而值为0×81到0xff与0×00组合始终都显示为“空” 根据这一特点,在substr的结果后面补上一个chr(0),就可以防止出现乱码了 注: 编码 第一字节 第二字节 gb2312 0xa1-0xf7 0xa1-0xfe gbk 0×81-0xfe 0×81-0xfe 0×40-0x7e big5 0xa1-0xf7 0×81-0xfe 0×40-0x7e 其次这个是网上搜索的,支持utf-8编码,原作者不详:

 

?Download download.txt

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
 function subString_UTF8($str, $start, $lenth)
    {
        $len = strlen($str);
        $r = array();
        $n = 0;
        $m = 0;
        for($i = 0; $i &lt; $len; $i++) {
            $x = substr($str, $i, 1);
            $a  = base_convert(ord($x), 10, 2);
            $a = substr(&#39;00000000&#39;.$a, -8);            if ($n &lt; $start){
                if (substr($a, 0, 1) == 0) {
                }elseif (substr($a, 0, 3) == 110) {
                    $i += 1;
                }elseif (substr($a, 0, 4) == 1110) {
                    $i += 2;
                }
                $n++;
            }else{
                if (substr($a, 0, 1) == 0) {
                    $r[ ] = substr($str, $i, 1);
                }elseif (substr($a, 0, 3) == 110) {
                    $r[ ] = substr($str, $i, 2);
                    $i += 1;
                }elseif (substr($a, 0, 4) == 1110) {
                    $r[ ] = substr($str, $i, 3);
                    $i += 2;
                }else{
                    $r[ ] = &#39;&#39;;                }
                if (++$m &gt;= $lenth){
                    break;
                }
            }
        }
        return $r;
    } // End subString_UTF8;}// End String

 

#由于此函数返回的是一个数组,因此要配合join函数来显示字符串:

#join(‘‘,subString_UTF8($str, $start, $lenth));

#在页面显示的时候还可以在此语句后面连一个"…"