首页 > 代码库 > python基础篇----字符串unicode
python基础篇----字符串unicode
python中处理中文常要用到unicode,因为较容易遇到字符串编码的问题,我一般都是将字符串统一转成unicode去处理
python中定义一个unicode字符串,可以在字符串前面加u:
str=u"hello world"
python中定义不转义的字符串,可以在字符串前面加r:
path=r"c:\programfile\test"
解码将其他字符串格式转为unicode:
ret=str.decode("gb2312")ret=str.decode("ascii")ret=str.decode("utf-8")
编码将unicode字符转为其他字符串格式:
ret=str.encode(“gb2312”)ret=str.encode("ascii")ret=str.encode("utf-8")
chardef判断字符串为何种编码格式:
encode = chardef.detect(str)print encode[‘encoding‘]
字符串格式化%s
print "test for %s, value is %d"%("format", 123)
一般在py文件开始的时候都加上#encoding=utf-8,避免文件中有中文乱码
处理字符串问题最主要是知道字符串输入的时候是什么格式,在输入的时候处理好字符串,处理过程就好办了
python基础篇----字符串unicode
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。