UTF-8编码的空格（194 160）问题

首页 > 代码库 > UTF-8编码的空格（194 160）问题

UTF-8编码的空格（194 160）问题

2024-08-17 00:24:39 223人阅读

前台的字符串传递到后台进行处理，发现了一个较诡异的问题：字符串中的一个空格(ASCII：32)被UTF-8编码之后变成了一个诡异的字符(ASCII：194 和 160的组合)！但在后台其表象还是空格。

　　在UTF-8编码里面存在一个特殊的字符，其编码是“0xC2 0xA0”，转换成字符的时候表现为一个半角空格，跟一般的半角空格（ASCII 0x20）不同的是它的宽度不会被压缩，所以排版中常能用到它。但是GB2312、Unicode之类并没有这样的字符，所以转换后前台会显示为“?”号，只是显示为问号而不是真正的问号，所以无法被替换！

　　对这两个看似相同的字符串进行一下转换可以确认：原始的字符串为：”#‘ %$ ()_ -{}.b“ 被转义后的字符串为：”#‘ %$ ()_ -{}.b“ 【注：双引号不算，转换为byte数组之后可以看到，原来的是16个字节，后来的那个是17个字节：这就是 32 --> 194 160 的结果】

            string tmp1 = "#‘  %$ ()_ -{}.b";
            string tmp2 = "#‘  %$ ()_ -{}.b";
            byte[] o1 = Encoding.UTF8.GetBytes(tmp1);
            byte[] o2 = Encoding.UTF8.GetBytes(tmp2);

　　知道了这个原因之后，就好办了，写代码可以把194 和 160 的组合转换回去。程序（C#）如下所示：

        private string ChangeUTF8Space(string targetStr)
        {
            try
            {
                string currentStr = string.Empty;
                byte[] utf8Space = new byte[] { 0xc2, 0xa0 };
                string tempSpace = Encoding.GetEncoding("UTF-8").GetString(utf8Space);
                currentStr = targetStr.Replace(tempSpace, " ");
                return currentStr;
            }
            catch (Exception ex)
            {
                return targetStr;
            }
        }

更多的编码格式对照表可以看这篇文章：http://www.utf8-chartable.de/unicode-utf8-table.pl?utf8=dec

原主：http://www.cnblogs.com/mingmingruyuedlut/archive/2012/07/04/2575180.html

UTF-8编码的空格（194 160）问题

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > UTF-8编码的空格（194 160）问题

UTF-8编码的空格（194 160）问题

看完仍有疑问？有类似问题直接问程序猿