国产成人毛片视频|星空传媒久草视频|欧美激情草久视频|久久久久女女|久操超碰在线播放|亚洲强奸一区二区|五月天丁香社区在线|色婷婷成人丁香网|午夜欧美6666|纯肉无码91视频

utf8和gbk能互相轉(zhuǎn)換嗎 為什么Linux系統(tǒng)默認(rèn)使用utf8編碼?

為什么Linux系統(tǒng)默認(rèn)使用utf8編碼?GBK是微軟為簡(jiǎn)體中文開(kāi)發(fā)的本地代碼,被工信部起訴。每個(gè)國(guó)家或地區(qū)都會(huì)制定和使用自己的地方代碼,一些企業(yè)也會(huì)制定某個(gè)國(guó)家或地區(qū)的地方代碼(GBK是微軟制定的簡(jiǎn)

為什么Linux系統(tǒng)默認(rèn)使用utf8編碼?

GBK是微軟為簡(jiǎn)體中文開(kāi)發(fā)的本地代碼,被工信部起訴。每個(gè)國(guó)家或地區(qū)都會(huì)制定和使用自己的地方代碼,一些企業(yè)也會(huì)制定某個(gè)國(guó)家或地區(qū)的地方代碼(GBK是微軟制定的簡(jiǎn)體中文代碼)。當(dāng)打開(kāi)用本地代碼編寫(xiě)的文件而不指定使用的本地代碼時(shí),可能會(huì)看到亂碼。

為了解決本地編碼混亂的問(wèn)題,Unicode和ISO這兩個(gè)組織已經(jīng)開(kāi)始開(kāi)發(fā)一種字符編碼系統(tǒng),可以容納不同國(guó)家的字符而不發(fā)生沖突。目前,這兩個(gè)組織相互承認(rèn),并有兼容的編碼。

目前,許多計(jì)算機(jī)系統(tǒng)使用2字節(jié)(16位整數(shù))或4字節(jié)(32位整數(shù))統(tǒng)一編碼。統(tǒng)一編碼只描述每個(gè)字符的編碼,但沒(méi)有解釋如何將編碼存儲(chǔ)在存儲(chǔ)介質(zhì)上。

目前,計(jì)算機(jī)系統(tǒng)中有前高字節(jié)和前低字節(jié)兩種整數(shù)存儲(chǔ)模式,因此前高字節(jié)的數(shù)據(jù)在前低字節(jié)的系統(tǒng)中會(huì)出現(xiàn)異常,反之亦然。同時(shí),我們知道很多編程系統(tǒng)在處理字符串時(shí),都會(huì)把值為0的字節(jié)作為字符串的結(jié)尾,不管是前高字節(jié)還是前低字節(jié),字符串中都會(huì)出現(xiàn)大量值為0的字節(jié),因此傳統(tǒng)的字符串處理功能無(wú)法使用。

為了解決統(tǒng)一編碼的存儲(chǔ)和與現(xiàn)有字符串處理函數(shù)兼容的問(wèn)題,引入了utf8編碼。這種編碼規(guī)定了統(tǒng)一編碼的存儲(chǔ)方式,并確保值為0的字節(jié)仍然用作字符串的結(jié)尾,這樣就可以繼續(xù)使用原來(lái)的字符串處理函數(shù),而不需要開(kāi)發(fā)新的集合。

當(dāng)然,utf8也有一個(gè)問(wèn)題,那就是它是可變長(zhǎng)度編碼。統(tǒng)一編碼的字符可以編碼為一個(gè)字節(jié)、兩個(gè)字節(jié)、三個(gè)字節(jié)、四個(gè)字節(jié)(版本1)或六個(gè)字節(jié)(版本2)。