Decode là gì

  -  

Chắc rằng tất cả đông đảo fan rất nhiều biết về điều đó ở một mức độ như thế nào kia, mà lại không hiểu sao phần đa kỹ năng đó lại bị mất đi trong các cuộc tranh luận về văn phiên bản, cần thứ nhất hãy kể lại một chút: Máy tính quan yếu như thế nào tàng trữ được “chữ”, “số”, “ảnh”, tuyệt bất cứ vật dụng gì khác. Thứ duy nhất nhưng nó hoàn toàn có thể lưu giữ được với thao tác làm việc thuộc sẽ là bit. Một bit chỉ rất có thể bao gồm 2 giá chỉ trị: gồm hoặc không, đúng hoặc sai, 1 hoặc 0, mình thích call theo cách làm sao cũng được. Vì laptop hoạt động bằng điện, một bit thực tế có thể được miêu tả bằng năng lượng điện áp, xung hiện nay hoặc tâm trạng năng lượng điện của mạch flip-flop. Đối với bé bạn, bit thường xuyên được biểu thị bởi 1 và 0 nên hãy coi đấy là quy ước trong veo nội dung bài viết này.

Bạn đang xem: Decode là gì

Đang xem: Decode là gì

Để sử dụng bit để biểu hiện mang đến bất cứ lắp thêm gì, họ đề nghị các phép tắc. Chúng ta cần phải thay đổi một chuỗi những bit thành lắp thêm gì đấy nlỗi chữ, số cùng hình ảnh bằng phương pháp thực hiện một encoding scheme (lược đồ gia dụng mã hóa), hoặc Gọi tắt là encoding. Như vắt này:

01100010 01101001 01110100 01110011b i t sTrong encoding này, 01100010 thay mặt đến chữ “b”, 01101001 đến chữ “i”, 01110100 mang đến chữ “t” với 01110011 mang lại chữ “s”. Một chuỗi các bit nhất thiết sẽ đại diện cho một chữ cùng một chữ đã thay mặt cho một chuỗi các bit một mực. Nếu bạn tất cả trí tuệ xuất sắc để ghi nhớ được chuỗi bit đến 26 chữ thì chúng ta cũng có thể hiểu bit nlỗi đọc sách vậy.

Encoding scheme trên được gọi là ASCII. Một chuỗi những tiên phong hàng đầu và 0 được chia ra thành phần nhiều, từng phần 8 bit (hoặc 1 byte). ASCII phương pháp một bảng nhằm dịch trường đoản cú byte quý phái chữ cái nhưng nhỏ tín đồ rất có thể đọc được. Dưới đấy là một phần bé dại của bảng đó:

bitscharacter
01000001A
01000010B
01000011C
01000100D
01000101E
01000110F

Có tổng số 95 ký tự hoàn toàn có thể đọc được khí cụ vào bảng ASCII, bao hàm chữ từ bỏ A đến Z nghỉ ngơi tinh thần hay cùng in hoa, số từ bỏ 0 cho 9, một số lốt chnóng câu và các ký từ như đồng đô la, vệt chnóng than với một vài ba sản phẩm công nghệ khác. Nó cũng bao hàm 33 quý hiếm mang đến một số đồ vật nlỗi vệt phương pháp, vệt xuống dòng, tab, backspace,… Những sản phẩm công nghệ này tất yếu cấp thiết in ra được, nhưng mà cũng vẫn hữu hình sinh sống một trong những dạng cùng có lợi thẳng với nhỏ bạn. Một vài ba cực hiếm thì chỉ bổ ích cùng với máy vi tính, nlỗi mã nhằm lưu lại ban đầu và dứt của văn phiên bản. Tộng cộng có 128 ký từ được có mang vào encoding ASCII, đó là một trong những con số đẹp mắt (với những người rất gần gũi với thứ tính), cũng chính vì nó thực hiện không còn tất cả các kết hợp hoàn toàn có thể của 7 bit (0000000 cho tới 1111111).

Và giờ thì chúng ta đã gồm phương pháp để miêu tả văn bản chỉ bởi vấn đề sử dụng 1 cùng 0:

01001000 01100101 01101100 01101100 01101111 00100000 01010111 01101111 01110010 01101100 01100100 “Hello World”Thuật ngữ quan lại trọngĐể encode một sản phẩm nào đó bởi ASCII, tuân theo bảng từ yêu cầu qua trái, thay thế các chữ bởi những bit. Để decode một chuỗi các bit thành những ký kết trường đoản cú có thể đọc được, làm theo bảng từ trái qua buộc phải, sửa chữa những bit bằng văn bản.

Encode tức thị áp dụng một sản phẩm nào đó nhằm biểu đạt cho 1 lắp thêm khác. encoding là một trong tập hòa hợp các quy tắc để triển khai Việc biến đổi đó.

Một số thuật ngữ không giống nên được làm rõ vào ngữ chình ảnh này:

character mix, charset

Tập đúng theo những cam kết từ bỏ có thể được encode. “Mã hóa ASCII gồm một cỗ ký từ bỏ bao gồm 128 ký tự.” Về cơ phiên bản thì đồng nghĩa cùng với “encoding”.

code page

Một “trang” các mã nhằm link các cam kết từ với cùng 1 chuỗi các bit tương xứng. Cũng hoàn toàn có thể phát âm là 1 “bảng”. Về cơ bản thì đồng nghĩa tương quan cùng với “encoding”.

Xem thêm: Game Khám Răng Trẻ Em - Coco Miguel At The Dentist

string

Một string là một số trong những các yếu tố được xâu lại với nhau. Một chuỗi bit là 1 trong những loạt những bit, nlỗi 01010011. Một chuỗi ký kết trường đoản cú là 1 loạt những ký kết trường đoản cú, như thế này. Đồng nghĩa với “sequence”.

Binary, Octal, Decimal, Hex

Có rất nhiều phương pháp để viết một số. 10011111 trong hệ nhị phân là 237 trong hệ bát phân, 159 trong hệ thập phân với 9F vào hệ thập lục phân. Chúng phần đa trình bày một cực hiếm, dẫu vậy số thập lục phân lại nđính thêm gọn rộng cùng dễ đọc rộng đối với số nhị phân. Dù vậy tôi đang sử dụng nhị phân trong veo bài viết này để gia công sự việc trngơi nghỉ đề xuất dễ dàng nắm bắt rộng cũng tương tự loại trừ giảm được một tấm trừu tượng. Đừng lo nếu như bạn thấy ở chỗ nào kia những mã cam kết trường đoản cú lại được viết ngơi nghỉ hệ không giống nhé, chúng như nhau cả thôi.

Excusez-Moi?

Sau Khi vẫn nắm rõ hồ hết ý bên trên rồi thì thuộc trúc thật với nhau nào: 95 cam kết từ bỏ là vượt hiếm khi chúng ta nói đến các ngữ điệu. Nó có thể áp dụng mang đến tiếng Anh cơ bạn dạng, nhưng lại sẽ thế nào trường hợp họ ao ước viết một risqué letter (tlỗi báo rủi ro) bởi giờ đồng hồ Pháp? Straßen­übergangs­änderungs­gesetz (phương pháp đường bộ) trong giờ Đức? Một lời mời mang lại tiệc smörgåsbord (tiệc đứng) bởi tiếng Thụy Điển? Ờm, các bạn tất yêu. Không thể bởi ASCII. Không bao gồm một hướng dẫn làm sao đến việc biểu thị các chữ như é, ß, ü, ä, ö or å vào ASCII, đề xuất họ chẳng thể dùng nó được.

“Nhưng chú ý coi,” dân châu Âu nói, “vào một cái máy vi tính thịnh hành với cùng một byte bởi 8 bit, mã hóa ASCII vẫn làm chi phí phạm hẳn 1 bit Khi luôn luôn mix cực hiếm của nó là 0! Chúng ta hoàn toàn có thể cần sử dụng bit này để nhét thêm tận 128 quý hiếm vào tấm bảng đó!” Và bọn họ sẽ làm như thế. Nhưng bao gồm cả nuốm, có rất nhiều rộng 128 cách để đặt lốt cho 1 nguyên âm. Chúng ta cấp thiết làm sao chuyển không còn tất cả những biến hóa thể của vần âm được sử dụng trong số ngôn ngữ của toàn Châu Âu vào vào và một bảng với về tối nhiều 256 quý giá được. Và sau đó trái đất chìm ngập trong một biển những encoding, các tiêu chuẩn chỉnh, các tiêu chuẩn chỉnh thực tiễn với thậm chí là… nửa tiêu chuẩn chỉnh để sử dụng cho những bộ ký kết tự khác nhau. Một tín đồ nào kia cần được viết một văn phiên bản về giờ Thụy Điển bởi tiếng Séc, tìm đâu ra encoding làm sao vận dụng cho cả 2 ngôn từ này yêu cầu đành từ chế ra một cái. Và chuyện kia diễn ra hàng vạn lần.

Và cũng hãy nhớ là giờ đồng hồ Nga, tiếng Ấn Độ, giờ đồng hồ Ả Rập, tiếng Do Thái, giờ đồng hồ Hàn cùng hàng chục ngàn ngôn từ không giống đang rất được dùng bên trên trái khu đất. Chưa nói những ngôn ngữ đã hết được dùng nữa. Một khi chúng ta vẫn giải được bài bác toán thù có tác dụng thay như thế nào nhằm viết các ngôn từ vào cùng một văn bạn dạng với các thiết bị giờ đồng hồ bên trên, hãy thử thách bản thân bởi giờ Trung. Hoặc tiếng Nhật. Cả 2 ngữ điệu này đựng cả chục ngàn ký kết từ. Bạn gồm buổi tối nhiều 256 giá trị trong một byte cất 8 bit. Triển!

Mã hóa nhiều byte (Multi-Byte Encodings)

Để tạo thành một bảng links các ký từ bỏ với chữ cái cho một ngữ điệu có nhiều rộng 256 cam kết từ bỏ, một byte đơn giản là không đủ. Với 2 byte (16 bit), bạn cũng có thể mã hóa tới 65,536 ký từ không giống nhau. BIG-5 là 1 trong encoding sử dụng cách đây. Txuất xắc bởi vì bóc một chuỗi những bit thành blochồng 8, nó bóc thành bloông chồng 16 với gồm một chiếc bảng mập mạp (ý tôi là, KHỔNG LỒ) pháp luật việc ký từ bỏ nào thì link thuộc chuỗi bit làm sao. BIG-5 sinh hoạt thể dễ dàng duy nhất sẽ cách xử lý phần đông các ký kết từ bỏ của giờ Trung phồn thể. GB18030 là một encoding không giống cũng có thể có biện pháp tiếp cận tương tự như, nhưng nó bao hàm cả giờ đồng hồ Trung giản thể và phồn thể luôn luôn. Và trước khi chúng ta hỏi, thì đúng vậy, bao gồm cả những encoding khác chỉ dành riêng cho tiếng Trung giản thể thôi. Tôi chỉ hy vọng cần sử dụng 1 encoding thôi cơ mà cũng trở ngại ráng sao?

Dưới đây là một trong những phần nhỏ của bảng mã hóa GB18030:

bitscharacter
10000001 01000000
10000001 01000001
10000001 01000010
10000001 01000011
10000001 01000100

GB18030 cách xử lý một lượng to những cam kết từ (bao hàm cả nhiều phần những cam kết trường đoản cú La tinh), tuy vậy ở đầu cuối thì nó cũng chỉ là một định hình mã hóa chuyên biệt vào hàng hà sa số các mẫu khác thôi.

Sự hoảng loạn sở hữu tên Unicode

Cuối thuộc thì cũng có bạn Chịu đựng hết nổi với vẫn đứng lên tạo thành một chuẩn mã hóa nhằm phù hợp tốt nhất tất cả các chuẩn chỉnh khác. Chuẩn này được gọi là Unicode. Về cơ phiên bản nó có mang một bảng bự cực đại với 1,114,112 những code point hoàn toàn có thể được dùng đến phần nhiều loại vần âm với biểu tượng. Nó quá đủ để mã hóa toàn cục tiếng châu Âu, Trung Đông, Viễn Đông, miền Nam, miền Bắc, miền Tây, tiểu sử từ trước với cả những ngôn ngữ tương lai nhưng nhỏ người chưa suy nghĩ ra. Sử dụng Unicode, bạn có thể soạn văn uống bạn dạng cất gần như là số đông ngữ điệu bằng phần lớn ký kết tự mà bạn cũng có thể gõ ra. Vấn đề này Hay là bất khả thi hoặc rất cực kỳ cạnh tranh để tiến hành trước lúc Unicode Thành lập và hoạt động. Thậm chí còn tồn tại một mục ko chính thức giành cho giờ đồng hồ Klingon (Star Trek) vào Unicode. Quý khách hàng thấy kia, Unicode to đến nỗi nó cũng cho phép dùng vào mục tiêu cá nhân luôn luôn.

Xem thêm: Sự Khác Biệt Giữa Điểm Sương Và Nhiệt Độ Bầu Ướt Là Gì ? Nhiệt Độ Bầu Khô Và Nhiệt Độ Bầu Ướt

*
*
*
Nghĩa Của Từ Decode Là Gì - Nghĩa Của Từ Decode Trong Tiếng Việt 8

(Hết phần 1)

Bài viết được dịch từ What Every Programmer Absolutely, Positively Needs To Know About Encodings And Character Sets To Work With Text.