首页 > 代码库 > 去除字符串中的emoji字符
去除字符串中的emoji字符
对于使用utf8编码的mysql数据库来说,如果字符串中存在emoji小图像,是不能存进数据库中的,查了一下,原因大概是因为utf8编码可以存1-3个字节的字符,但是emoji是4个字节;解决方法可以把mysql的编码换成utf8mb4,需要相应版本的mysql;另外一种方法是把字符串中所有的emoji给去除掉,然后在存进数据库,具体的方法是:
public static String filterEmoji(String source,String slipStr) { if(isNotBlank(source)){ return source.replaceAll("[\\ud800\\udc00-\\udbff\\udfff\\ud800-\\udfff]", slipStr); }else{ return source; } }
参考链接:http://www.cnblogs.com/jeyson/p/5639791.html
各种emoji编码
去除字符串中的emoji字符
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。