python出現(xiàn)gbk編碼錯誤 python判斷一個字符能否用gbk和utf8編碼?
python判斷一個字符能否用gbk和utf8編碼?使用chardet庫。它將猜測文本文件的編碼并返回如下結(jié)果:編碼類型:UTF-8,置信度:0.9。也就是說,chardet得出結(jié)論,文件被UTF-8
python判斷一個字符能否用gbk和utf8編碼?
使用chardet庫。它將猜測文本文件的編碼并返回如下結(jié)果:編碼類型:UTF-8,置信度:0.9。也就是說,chardet得出結(jié)論,文件被UTF-8編碼的概率為90%。然而,chardet的缺點是它不能完全確定文件的編碼類型。目前,我的實踐是,如果置信度超過0.95,那么我認為chardet的判斷是正確的。否則,添加一些人機交互來判斷。目前chardet庫官方網(wǎng)站提供的版本僅適用于python2。如果您使用的是python3。十、 我可以上傳另一個版本。