首页 > 代码库 > perl输出中文有乱码
perl输出中文有乱码
测试文件的时候发现输出中文有乱码,所以学习了一下perl的Encode原理。现做一下总结:
perl的基础知识:在Perl看来, 字符串只有两种形式。一种是octets, 即8位序列, 也就是我们通常说的字节数组。另一种utf8编码的字符串, perl管它叫string。 也就是说: Perl只认识两种编码: Ascii(octets)和utf8(string)。
所以输出时候出现乱码,应该把utf8编码转为用户能够接受的形式。例如中文用gb2312.
my $s=":<中文关键词>=英国皇家学会;;《哲学汇刊》;;物理科学;;科学传播.";
$a=$s=~/>=(.+)$/;
print encode(‘gb2312‘,$1)."\n"; #输出英国皇家学会;;《哲学汇刊》;;物理科学;;科学传播.
perl输出中文有乱码
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。