2012年12月26日 星期三

記事本各種編碼說明 ANSI, Unicode, Unicode big endian, UTF-8

有時候開文件卻出現亂碼,換個編碼方式即可正常顯示文字
使用記事本另存新檔時,可選擇的編碼有
ANSI、Unicode、Unicode big endian、UTF-8
ANSI就是系統預設的編碼了,
但平平都是Unicode怎麼還有三個選項,要用哪一個阿?
原來Unicode制定了編碼,但儲存的方式卻有很多種
我自己分別試了一下中、英文檔案佔用空間的大小,
ANSI佔用空間最小、UTF-8佔用空間最大,另外兩個Unicode編碼則相同

1、ANSI是預設編碼
對於英文檔是ASCII編碼
如果Windows是繁體中文版會採用Big5編碼
如果Windows是簡體中文版就採用GB2312編碼

2、Unicode編碼
採用Unicode little endian,為Windows上Unicode的預設存儲方式
將Unicode中表示同一個字元的兩個位元組順序返過來。
主要目的是為了適應CPU處理字元的方式,加快處理速度。

3、Unicode big endian編碼
Unicode字元編碼以正序存儲。

4、UTF-8編碼
UTF-8是Unicode的實現方式之一,
是一種變長的編碼方式,用來在網際網路上使用

沒有留言:

張貼留言