首页 > 代码库 > python中文和unicode字符串之间的互相转换
python中文和unicode字符串之间的互相转换
首先:中文->unicode字符串
import chardet
import codecs
>>> a = "我是一个中国人"
>>> a
‘\xce\xd2\xca\xc7\xd2\xbb\xb8\xf6\xd6\xd0\xb9\xfa\xc8\xcb‘
>>> chardet.detect(a)
{‘confidence‘: 0.99, ‘encoding‘: ‘GB2312‘}
>>> b = a.decode(‘GB2312‘)
>>> b
u‘\u6211\u662f\u4e00\u4e2a\u4e2d\u56fd\u4eba‘ -->但是我们往往不想要外面的u
>>> c =repr(b)
>>> c
"u‘\\u6211\\u662f\\u4e00\\u4e2a\\u4e2d\\u56fd\\u4eba‘"
>>> d = c[2:-1]
>>> d
‘\\u6211\\u662f\\u4e00\\u4e2a\\u4e2d\\u56fd\\u4eba‘
>>> print d
\u6211\u662f\u4e00\u4e2a\u4e2d\u56fd\u4eba
然后是 unicode ->中文:
>>> a = ‘\u9a8c‘
>>> a
‘\\u9a8c‘
>>> b = ‘u‘+‘\‘‘+a+‘\‘‘
>>> b
"u‘\\u9a8c‘"
>>> c = eval(b)
>>> c
u‘\u9a8c‘
>>> print c
验
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。