1. 程式人生 > >字元編碼:ANSI和ASCII區別、Unicode和UTF-8區別

字元編碼:ANSI和ASCII區別、Unicode和UTF-8區別

ANSI和ASCII區別

ANSI碼(American National Standards Institute)

美國國家標準學會的標準碼


ASCII碼(America Standard Code for Information Interchange)美國資訊交換標準碼
是基於拉丁字母的一套電腦編碼系統,主要用於顯示現代英語和其他西歐語言。它是現今最通用的單位元組編碼系統,並等同於國際標準ISO/IEC 646。

可以認為是不同的東西!
ANSI碼僅在前126個與ASCII碼相同。

在簡體中文Windows作業系統中,ANSI 編碼代表 GBK 編碼;在英文Windows作業系統中,ANSI 編碼代表 ASCII編碼;在繁體中文Windows作業系統中,ANSI編碼代表Big5;在日文Windows作業系統中,ANSI 編碼代表 Shift_JIS 編碼。

Unicode和UTF-8區別

Unicode is charset。
UTF-8 is encoding。

unicode是一個字符集,utf8是在這個字符集基礎上的一種具體的編碼方案為更好的儲存和傳輸,其他還有 UTF-16,UTF-32 等。

ASCII碼跟Unicode沒有本質的區別。只不過Unicode表示範圍比ASCII大。ASCII可以表示127個英文字母,其中每個英文字母都有一個十進位制編碼,並且通過這個十進位制編碼轉化成二進位制數(編碼)存入到記憶體當中(佔1位元組)。
而在Unicode中,英文字母的編碼與其在ASCII中沒有不同。只是Unicode每個字元佔2個位元組,於是轉化為二進位制時就變成‘000000 ASCII’。
同時Unicode支援中文字元以及其他字元的表示。這種非ASCII字元佔用的記憶體更多一些。
而UTF-8則是在Unicode的基礎上進行的再編碼。其中對於字母的編碼與Unicode和ASCII一致。
文字文件是用UTF-8編碼儲存的。這樣可以最大限度的節省空間。但是當你對這個文字文件進行操作的時候,計算機是先把UTF-8轉化為Unicode然後放到記憶體中,讓使用者進行操作,操作完成後在記憶體中還是Unicode模式。當你需要儲存的時候在轉化為UTF-8格式儲存(節省空間)。


相關推薦

字元編碼ANSIASCII區別UnicodeUTF-8區別

ANSI和ASCII區別 ANSI碼(American National Standards Institute) 美國國家標準學會的標準碼 ASCII碼(America Standard Code

字元編碼ANSIASCII區別UnicodeUTF-8區別

今天看了一個說法,說是入坑windows程式開發,必先掌握文字的編碼和字符集知識。本部落格就整理下資訊儲存和字元編碼的相關知識。 一.位: 計算機儲存資訊的最小單位,稱之為位(bit),音譯位元,二進位制的一個“0”或一個“1”叫一位。 二.位元組 位元

字符編碼ANSIASCII區別UnicodeUTF-8區別

span 編輯 日本 發展 不同語言 保存 code 導致 style ANSI碼ANSI編碼是一種對ASCII碼的拓展:ANSI編碼用0x00~0x7f (即十進制下的0到127)範圍的1 個字節來表示 1 個英文字符,超出一個字節的 0x80~0xFFFF 範圍來表示其

關於字元編碼asciiunicodeutf-8

轉自:https://foofish.net/unicode_utf-8.html   阮一峰老師對普及計算機基礎技術功不可沒,但畢竟老師不是神,因此也避免不了對某些概念有一些錯誤的理解,《字元編碼筆記:ASCII,Unicode 和 UTF-8 》 是阮老師10年前寫的一篇關於字元編

Python2.7 中文字元編碼 & Pycharm utf-8設定Unicodeutf-8區別

Python2.7 中文字元編碼 & Pycharm utf-8設定、Unicode與utf-8的區別 [email protected] 作者:Zhouwan  2017-6-6  一、關於編碼和亂碼,有以下幾個重要的概念需要搞清楚:     二、Pycharm 設定編碼, 可以

字符編碼ASCIIUnicodeUTF-8的理解

F5 標準化 一般來說 簡書 打開文件 說了 tps can 常用 首先我們先要明白的兩點是:1、計算機中的信息都是由二進制的0和1儲存的;2、我們再計算機屏幕上看到的各種字符都是計算機系統按照一定的規則將二進制數字轉換而來的。 一、基本概念。 1、字符集(charse

UNICODE,GBK,UTF-8區別

一、編碼歷史與區別         一直對字元的各種編碼方式懵懵懂懂,什麼ANSI UNICODE UTF-8 GB2312 GBK DBCS UCS……是不是看的很暈,假如您細細的閱讀本文你一定可以清晰的理解他們。Let's

【轉載】字元編碼ASCIIUnicodeUTF-8區別

1. ASCII碼 我們知道,在計算機內部,所有的資訊最終都表示為一個二進位制的字串。每一個二進位制位(bit)有0和1兩種狀態,因此八個二進位制位就可以組合出256種狀態,這被稱為一個位元組(byte)。也就是說,一個位元組一共可以用來表示256種不同的狀態,每一個狀態對應一個符

三種常見字元編碼ASCIIUnicodeUTF-8

什麼是字元編碼? 計算機只能處理數字,如果要處理文字,就必須先把文字轉換為數字才能處理。最早的計算機在設計時採用8個位元(bit)作為一個位元組(byte),所以,一個位元組能表示的最大的整數就是255(二進位制11111111=十進位制255),如果要表示更大的整數,就必須用更多的位元組。比如

字元編碼ASCIIUnicodeUTF-8

一、什麼是字元編碼?        字元編碼(英語:Character encoding)也稱字集碼,是把字符集中的字元編碼為指定集合中某一物件(例如:位元模式、自然數序列、8位組或者電脈衝),以便文字在計算機中儲存和通過通訊

編碼方式ASCIIUnicodeUTF-8區別及聯絡

最早的計算機在設計時採用8個位元(bit)作為一個位元組(byte),所以,一個位元組能表示的最大的整數就是255(二進位制11111111=十進位制255),如果要表示更大的整數,就必須用更多的位元組。比如兩個位元組可以表示的最大整數是65535,4個位元組可以表示的最大整

字元編碼ASCIIUnicodeUTF-8

  網際網路時代,知乎大V通過段子抖機靈,公眾號大V通過雞湯獲得關注,微博大V通過新聞搶眼球,我們作為普通看客則刷的不亦樂乎。但是這些文章都有一個不引人注意的共同點,那就是它們都是由字元組成的(好吧,果然說的是廢話☺)。字元君,也就是今天要講的主角。   這一

ASCIIUnicodeUTF-8編碼區別

歸納: 編碼大小支援語言 ASCII 1個位元組 英文 Unicode 2個位元組(生僻字4個) 所有語言 UTF-8 1-6個位元組,英文字母1個位元組,漢字3個位元組,生僻字4-6個位元組 所有語言 具體解釋: 最早只有127個字母被編碼到計算機裡,也就是大小寫英文字母、數字和一

字元編碼ASCIIUnicodeUTF-8

1. ASCII碼 我們知道,在計算機內部,所有的資訊最終都表示為一個二進位制的字串。每一個二進位制位(bit)有0和1兩種狀態,因此八個二進位制位就可以組合出256種狀態,這被稱為一個位元組(byte)。也就是說,一個位元組一共可以用來表示256種不同的狀態,每一個狀態對應一個符號,就是256個符號,從0

ASCIIUnicodeUTF-8編碼區別;中英文混合擷取

摘要總結: ASCII編碼是128個字元 中國把漢字編入GB2312,Shift_JIS/Euc-kr各國標準..... Unicode是為了解決各國亂碼的,但浪費儲存空間 UTF-8編碼把一個Unicode字元根據不同的數字大小編碼成1-6位元組,英文字母是1位元組,漢字

中文字元編碼GB2312GBKANSIUnicodeUTF-8

字元編碼 windows notepad、windows notepad++和sublime text的字元編碼顯示區別: windows notepad notepad++ su

字元編碼ASCIIUnicodeUTF-8

1. ASCII碼 我們知道,在計算機內部,所有的資訊最終都表示為一個二進位制的字串。每一個二進位制位(bit)有0和1兩種狀態,因此八個二進位制位就可以組合出256種狀態,這被稱為一個位元組(byte)。也就是說,一個位元組一共可以用來表示256種不同的狀態,每一個狀態對

Java 字符編碼 ASCIIUnicodeUTF-8

之間 family 打印 com 但是 例如 進制數 英語 utf-16   1 ASCII碼   統一規定英語字符與二進制位之間的關系。ASCII碼一共規定了128個字符的編碼。例如,空格“SPACE”是32(二進制00100000),大寫字母A是65(二進制010000

python中的字符串編碼問題——2.理解ASCIIANSIUnicode編碼UTF-8編碼

unicode編碼 統一 col 簡單 utf 文字 stand 二進制 pan ASCII碼:全名是American Standard Code for Information Interchange,ASCII碼中,一個英文字母(不分大小寫)占一個字節的空間,範圍0x0

Java虛擬機器7記憶體溢位記憶體洩露並行併發Minor GCFull GCClient模式Server模式的區別

記憶體溢位和記憶體洩露的區別 1、記憶體溢位 記憶體溢位指的是程式在申請記憶體的時候,沒有足夠大的空間可以分配了。 2、記憶體洩露 記憶體洩露指的是程式在申請記憶體之後,沒有辦法釋放掉已經申請到記憶體,它始終佔用著記憶體,即被分配的物件可達但無用。記憶體洩露一般都是因