首页 > 代码库 > 采集之字符串转码问题
采集之字符串转码问题
今天遇到一个问题,经过几个小时的找错,最终确定为编码错误,原来编码错误也不可以插入数据库。原因是我采集拿到的数据是gb2312 ,而数据库是utf8的,所以一直纳闷为什么打印出来的sql没有问题,但是就是不能插入数据库,如果把sql拿出来直接运行的话,是可以成功的。最后,还是在一个哥的提醒下,让我意识到的,因为在我看来,如果编码错误,执行sql应该是错误的,但是却没有想到,凡是汉字的字段全部取消,这也许是经验问题,我想下次肯定就碰不到了。
通过gb2312 采集的页面,插入utf8的数据,string mb_convert_encoding ( string $str
, string $to_encoding
[,mixed $from_encoding
] ) ,官方解释:转换字符编码。第一个参数:你要转换的字符串,第二个参数:转换为什么编码(我这里是utf8),第三个参数:原来编码(我这里指采集的原页面 gb2312)。
今天只用到了这个函数,听说还有别的字符串转码函数,待续。。。。
采集之字符串转码问题
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。