国产欧美日韩第一页|日本一二三不卡视频|在线精品小视频,亚洲第一免费播放区,metcn人体亚洲一区,亚洲精品午夜视频

如何在 MySQL 中存儲(chǔ) emoji ?

2016-11-06 08:55:43 23927

問題還原

使用 erlang 存儲(chǔ)一些特殊字符串到 MySQL 的時(shí)候,卻沒法讀出來。經(jīng)檢查,這些字符串的二進(jìn)制格式如下:

<<240,159,152,134,240,159,152,144>>

查看二進(jìn)制的 unicode 是什么?

14> unicode:characters_to_list(<<240,159,152,134,240,159,152,144>>).[128518,128528]15> erlang:integer_to_list(128518,16).%%查看十六進(jìn)制"1F606"16> erlang:integer_to_list(128528,16)."1F610"

明顯,1F606 和 1F610 超過了常見 unicode 字符串 0000-FFFF 的表達(dá)范圍。

1F606 和 1F610 代表什么?

根據(jù) unicode 官網(wǎng)上的說明,這是一種 emoji(表情符號(hào)),具體的展示形式與廠商有關(guān)。


MySQL 上存儲(chǔ)失敗的原因

目前來說,多數(shù) MySQL 都?以 utf8 存儲(chǔ),注意 MySQL 的 utf8 和我們所說的傳統(tǒng) utf8 有點(diǎn)區(qū)別。MySQL 的 utf8 編碼規(guī)定了最多只能有 3 個(gè)字節(jié),而 emoji 的 unicode 已經(jīng)超過了 3 個(gè)字節(jié),因此 MySQL 的 utf8 無法識(shí)別與存儲(chǔ) emoji。

為此可以查閱 MySQL 中關(guān)于 unicode 支持的資料,從中可以得知 MySQL 在 5.5 后開始支持 utf8mb4,這種編碼支持 1 ~ 4 個(gè)字節(jié),這種編碼可以表示 emoji。

另外 utf8mb4 向下兼容 utf8。

解決方案

將 MySQL 中對(duì)應(yīng)的字段改成 utf8mb4 編碼:

ALTER TABLE t1  DEFAULT CHARACTER SET utf8mb4,  MODIFY col1 char(10)    CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci NOT NULL,  MODIFY col2 char(10)    CHARACTER SET utf8mb4 COLLATE utf8mb4_bin NOT NULL;

參考:http://www.tjdsmy.cn/doc/refman/5.5/en/charset-unicode-upgrading.html

將連接庫的連接編碼改為 utf8mb4,以 erlang 的連接庫 emysql 為例:

emysql:add_pool(pool,[{size,1},{user,"user"},{password,"password"},{host,"host"},{port,3306},{encoding,utf8mb4}]).%%或者emysql:add_pool(pool,1,"user","password","host",3306,undefined, utf8mb4).

為了建表方便,可以修改 my.cnf:

# 服務(wù)器字符集[mysql]default-character-set=utf8mb4[mysqld]character-set-server=utf8mb4


提交成功!非常感謝您的反饋,我們會(huì)繼續(xù)努力做到更好!

這條文檔是否有幫助解決問題?

非常抱歉未能幫助到您。為了給您提供更好的服務(wù),我們很需要您進(jìn)一步的反饋信息:

在文檔使用中是否遇到以下問題: