unicode在線轉(zhuǎn)換網(wǎng)頁 關(guān)于unicode和ascii的區(qū)別?
關(guān)于unicode和ascii的區(qū)別?計(jì)算機(jī)發(fā)明后,為了在計(jì)算機(jī)中表達(dá)字符,人們開發(fā)了一種編碼,稱為ASCII碼。ASCII碼由一個(gè)字節(jié)中的7位表示,范圍從0x00到0x7F,總共128個(gè)字符。后來,
關(guān)于unicode和ascii的區(qū)別?
計(jì)算機(jī)發(fā)明后,為了在計(jì)算機(jī)中表達(dá)字符,人們開發(fā)了一種編碼,稱為ASCII碼。ASCII碼由一個(gè)字節(jié)中的7位表示,范圍從0x00到0x7F,總共128個(gè)字符。后來,他們發(fā)現(xiàn)“如果你需要打印這些字符的形式突然?!?。因此,ASCII的定義被擴(kuò)展為使用一個(gè)字節(jié)的所有8位來表示字符,這被稱為擴(kuò)展ASCII碼。范圍為0x00-0xff,共256個(gè)字符。中國人用兩個(gè)連續(xù)的擴(kuò)展ASCII區(qū)域(0xa0之后)來表示一個(gè)漢字。本方法的標(biāo)準(zhǔn)為gb-2312。后來,日本,韓國,阿拉伯,臺(tái)灣傳統(tǒng)(大5)。。。它們都采用相似的方法來擴(kuò)展局部字符集的定義,現(xiàn)在統(tǒng)一為MBCs字符集(multi-byte character set)。這種方法存在缺陷,因?yàn)椴煌瑖液偷貐^(qū)定義的字符集有交集,所以使用gb-2312軟件,不能在Big-5環(huán)境下運(yùn)行(顯示亂碼),反之亦然。為了對(duì)全世界人民的所有字符進(jìn)行編碼,人們建立了Unicode標(biāo)準(zhǔn)字符集。Unicode使用兩個(gè)字節(jié)來表示一個(gè)字符(unsigned shot int、wcharwcharuut、OLECHAR)。最后,世界上任何一個(gè)地區(qū)的軟件都可以在另一個(gè)地區(qū)運(yùn)行,而無需修改。雖然我用IE瀏覽日文網(wǎng)站,但它顯示了我不認(rèn)識(shí)的日文字符,但至少不會(huì)被亂碼。Unicode的范圍從0x0000到0xFFFF,總共超過60000個(gè)字符。僅漢字就占了4萬多個(gè)
ASCII編碼了26個(gè)英文字母和一些常用符號(hào),擴(kuò)展了一半??傊?,它是一個(gè)字節(jié)用于編碼,大于128的部分是一些特殊符號(hào)。但是ASCII不能編碼其他任何東西。例如,沒有說“中國ASCII碼需要2個(gè)字符”。ASCII只有一個(gè)字節(jié)。Unicode足以編碼地球上所有的語言,因此它包括所有可以用ASCII表示的語言。Unicode本身只有兩個(gè)字節(jié)。UTF-8、UTF-16等的出現(xiàn)是為了根據(jù)不同的應(yīng)用環(huán)境提高整體編碼效率。例如,如果一篇文章的大部分是英文的(可以用一個(gè)字節(jié)來表示),UTF-8更合適。如果文章大部分是中文(需要雙字節(jié)),utf-16可能更適合復(fù)制,但也正確,當(dāng)然Unicode是常見的。一般的移動(dòng)電子書只能是未編碼的TXT