Khái niệm mã hóa dữ liệu và giải mã
Mã hóa dữ liệu là tiến trình che dấu dữ liệu thật (plaintext), nghĩa là chuyển dữ liệu thật thành dữ liệu không có ý nghĩa hoặc có ý nghĩa khác xa với dữ liệu thật. Tiến trình đó gọi là mã hóa (encrytion). Kết quả của tiến trình gọi là bản mã (ciphertext). Từ “encrytion” được tạo ra từ “cryptography” (mật mã) xuất phát từ tiếng Hi Lạp cổ xưa “Kryptos” (Che dấu) và từ “graphia” (viết). Tiến trình mã hóa dữ liệu có thế được thực hiện bằng cách hoán vị dữ liệu thật hoặc thay thế chúng bằng dữ liệu khác.
Tiến trình ngược với tiến trình mã hóa tức là chuyển từ bản mã thành dữ liệu ban đầu gọi là giải mã.
Hệ mã Caesar
Trong mật mã học, mật mã Caesar (Xê da), còn gọi là mật mã dịch chuyển, là một trong những mật mã đơn giản và được biết đến nhiều nhất. Hệ mã Caesar là một hệ mã hóa thay thế đơn âm, làm việc trên bẳng chữ cái tiếng Anh 26 ký tự. Đó là một dạng của mật mã thay thế, trong đó mỗi ký tự trong văn bản được thay thế bằng một ký tự cách nó một đoạn trong bảng chữ cái để tạo thành bản mã.
Ví dụ:
Đối với bảng mã tiếng anh (ABCDEFGHI...), nếu độ dịch là 3, A sẽ được thay bằng D, B sẽ được thay bằng E, ..., W sẽ thay bằng Z, X sẽ thay bằng A, Y sẽ thay bằng B và Z thay bằng C. Phương pháp được đặt tên theo Caesar, vị hoàng đế đã sử dụng nó thường xuyên trong công việc. Không gian bản rõ P là các từ cần được mà hóa được tạo từ bảng chữ cái A. Không gian bản rỏ C là các từ đã được mã hóa.
Để mã hóa, người ta đánh số các chữ cái từ 0N-1 (N là tổng số phần tử của bản chữ cái). Không gian khóa K=ZN. Với mỗi khóa K K hàm mã hóa và giải mã một ký tự có số thứ tự là I sẽ được biểu diễn như sau:
a. Mã hóa : EK(i) = (i+k) mod N
b. Giải mã : DK(i) = (i-k) mod N
Trong đó:
N = 26
nếu hệ mã Caesar sử dụng trên bảng chữ cái tiếng Anh (nếu sử dụng trên bảng chữ cái khác thì N sẽ thay đổi).
k
: tương ứng với số thứ tự chữ cái trong bảng mã (ví dụ : a = 0, b = 1 ....)
Xét ví dụ sau:
Cho bản rõ : TOIYEUVIETNAM
Khóa k = 4
Tìm bản mã ? Theo công thức thay vào ta sẽ có kết quả sau.
Vậy bản mã là : YSMBYZWMIYREQ
Quá trình giải mã thì ngược lại với quá trình mã hóa.
Cài đặt
Mỗi ngôn ngữ khác nhau sẽ có cách cài đặt khác nhau. Mình sẽ sử dụng Python để cài đặt thuật toán:
Mặc định bạn có thể dụng bảng chữ cái Tiếng Anh nhưng trong phần cài đặt này. Để thực tế hơn. Mình sẽ sử dụng bảng mã Tiếng Việt.
1. Bảng mã
key = 'aáàạảãăắằặẳẵâấầậẩẫbcdđeéẹẻẽêếềệểễfghiíìịỉĩjklmnoóòọỏõôốồộổỗơớờợởỡpqrstuúùụủũưứừựửữvwxyýỳỵỷỹAÁÀẠẢÃĂẮẰẶẲẴÂẤẦẬẨẪBCDĐEÉẸẺẼÊẾỀỆỂỄFGHIÍÌỊỈĨJKLMNOÓÒỌỎÕÔỐỒỘỔỖƠỚỜỢỞỠPQRSTUÚÙỤỦŨƯỨỪỰỬỮVWXYÝỲỴỶỸ0123456789`_@.com#$%^&*()'
1. Hàm mã hóa
def encrypt(self, n, plaintext): """Encrypt the string and return the ciphertext""" result = '' for l in plaintext: try: i = (self.key.index(l) + n) % len(self.key) result += self.key[i] except ValueError: result += l return result
Nếu đã đọc xong đống lý thuyết bên trên thì chắc hẳn bạn sẽ không gặp khó khăn gì trong đoạn code cài đặt trên:
Mã hóa : EK(i) = (i+k) mod N
Trong đó:
self.key.index(l)
: tương ứng vớii
n
: tương ứng với khóak
len(self.key)
: tương ứng với độ dài của bản mã.
2. Hàm giải mã
def decrypt(self, n, ciphertext): """Decrypt the string and return the plaintext""" result = '' for l in ciphertext: try: i = (self.key.index(l) - n) % len(self.key) result += self.key[i] except ValueError: result += l return result
Áp dụng với công thực giải mã. Ta cũng sẽ viết được hàm tương tự.
3. Gọi hàm
def show_result(self, plaintext, n): """Generate a resulting cipher with elements shown""" encrypted = self.encrypt(n, plaintext) decrypted = self.decrypt(n, encrypted) print('Rotation: ', n) print('Plaintext: ', plaintext) print('Encrytped: ', encrypted) print('Decrytped: ', decrypted)
Tài liệu
Đến đây bài viết phần đầu về mã hóa cũng kết thúc. Mong rằng anh chị em đừng gạch đã nhiều quá. Và đưa ra những góp ý nhiều hơn để em có thể vững tâm trong quá trình tìm hiểu các hệ mã hóa .
Mọi người nếu lười cài đặt cũng có thể tham khảo link github bài em đã làm sẵn. Chỉ việc kéo về và chạy https://github.com/tuanquanghpvn/cipher