首页 > 代码库 > php emoji utf8转unicode
php emoji utf8转unicode
/** * Translates a sequence of UTF-8 bytes to their equivalent unicode code points. * Each code point is prefixed with "\u". * * @param string $utf8 * * @return string */function utf8_to_unicode($utf8) { $i = 0; $l = strlen($utf8); $out = ‘‘; while ($i < $l) { if ((ord($utf8[$i]) & 0x80) === 0x00) { // 0xxxxxxx $n = ord($utf8[$i++]); } elseif ((ord($utf8[$i]) & 0xE0) === 0xC0) { // 110xxxxx 10xxxxxx $n = ((ord($utf8[$i++]) & 0x1F) << 6) | ((ord($utf8[$i++]) & 0x3F) << 0) ; } elseif ((ord($utf8[$i]) & 0xF0) === 0xE0) { // 1110xxxx 10xxxxxx 10xxxxxx $n = ((ord($utf8[$i++]) & 0x0F) << 12) | ((ord($utf8[$i++]) & 0x3F) << 6) | ((ord($utf8[$i++]) & 0x3F) << 0) ; } elseif ((ord($utf8[$i]) & 0xF8) === 0xF0) { // 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx $n = ((ord($utf8[$i++]) & 0x07) << 18) | ((ord($utf8[$i++]) & 0x3F) << 12) | ((ord($utf8[$i++]) & 0x3F) << 6) | ((ord($utf8[$i++]) & 0x3F) << 0) ; } elseif ((ord($utf8[$i]) & 0xFC) === 0xF8) { // 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx $n = ((ord($utf8[$i++]) & 0x03) << 24) | ((ord($utf8[$i++]) & 0x3F) << 18) | ((ord($utf8[$i++]) & 0x3F) << 12) | ((ord($utf8[$i++]) & 0x3F) << 6) | ((ord($utf8[$i++]) & 0x3F) << 0) ; } elseif ((ord($utf8[$i]) & 0xFE) === 0xFC) { // 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx $n = ((ord($utf8[$i++]) & 0x01) << 30) | ((ord($utf8[$i++]) & 0x3F) << 24) | ((ord($utf8[$i++]) & 0x3F) << 18) | ((ord($utf8[$i++]) & 0x3F) << 12) | ((ord($utf8[$i++]) & 0x3F) << 6) | ((ord($utf8[$i++]) & 0x3F) << 0) ; } else { throw new \Exception(‘Invalid utf-8 code point‘); } $n = strtoupper(dechex($n)); $pad = strlen($n) <= 4 ? strlen($n) + strlen($n) %2 : 0; $n = str_pad($n, $pad, "0", STR_PAD_LEFT); $out .= sprintf("\u%s", $n); } return $out;}
本文出自 “7804265” 博客,请务必保留此出处http://7814265.blog.51cto.com/7804265/1862517
php emoji utf8转unicode
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。