字元編碼與存儲
Ⅰ 一個漢字占幾個字元
在 ASCII 編碼中,一個英文字母字元存儲需要1個位元組。在 GB 2312 編碼或 GBK 編碼中,一個漢字字元存儲需要2個位元組。在UTF-8編碼中,一個英文字母字元存儲需要1個位元組,一個漢字字元儲存需要3到4個位元組。
在UTF-16編碼中,一個英文字母字元或一個漢字字元存儲都需要2個位元組(Unicode擴展區的一些漢字存儲需要4個位元組)。在UTF-32編碼中,世界上任何字元的存儲都需要4個位元組。
字元指類字形單位或符號,包括字母、數字、運算符號、標點符號和其他符號,以及一些功能符號。字元是電子計算機或無線電通信中字母、數字、符號的統稱,其是數據結構中較小的數據存取單位,通常由8個二進制位(一個位元組)來表示一個字元。 字元是計算機中經常用到的二進制編碼形式,也是計算機中較常用到的信息形式。
1、字元是可使用多種不同字元方案或代碼頁來表示的抽象實體。
2、應用程序使用解碼將字元從非本機方案映至本機方案。
3、電腦和通訊設備會使用字元編碼的方式來表達字元。意思是會將一個字元指定給某個東西。
4、兩個常用的例子是ASCII和用於碼的UTF-8。
字元串主要用於編程,概念說明、函數解釋、用法詳述見正文,這里補充一點:字元串在存儲上類似字元數組,所以它每一位的單個元素都是可以提取的,如s=「abcdefghij」,則s[1]=「b」,s[9]=&34;,這可以給提供很多方便,如高精度運算時每一位都可以轉化為數字存入數組。
通常由8個二進制位(一個位元組)來表示一個字元,但也有少數計算機系統採用6個二進制的字元表示形式。一個系統中字元集的大小,完全由該系統自己規定。計算機可用字元一般為128~256個(不包括漢字時),每個字元進入計算機後,都將轉換為8位二進制數。不同的計算機系統和不同的語言,所能使用的字元范圍是不同的。
在 ASCII 編碼中,一個英文字母字元存儲需要1個位元組。在 GB 2312 編碼或 GBK 編碼中,一個漢字字元存儲需要2個位元組。在UTF-8編碼中,一個英文字母字元存儲需要1個位元組,一個漢字字元儲存需要3到4個位元組。在UTF-16編碼中,一個英文字母字元或一個漢字字元存儲都需要2個位元組(Unicode擴展區的一些漢字存儲需要4個位元組)。在UTF-32編碼中,世界上任何字元的存儲都需要4個位元組。