Menu

Dùng blockchain chống gian lận thi cử, không khả thi!

06:06 03/08/2018

pno
Vụ gian lận điểm thi trắc nghiệm ở Hà Giang, Sơn La và mới đây thêm Hòa Bình, Bạc Liêu cũng dính nghi vấn tiêu cực, đã chỉ ra những lỗ hổng lớn trong kỳ thi tốt nghiệp trung học phổ thông tại Việt Nam.

Một số ý kiến cho rằng, có thể dùng công nghệ blockchain để chống tiêu cực trong thi cử. 

“Điều này thoạt nghe có vẻ hợp lý nhưng nếu đi sâu, sẽ thấy nhiều thách thức về mặt công nghệ, quản lý, pháp lý”. Đây là ý kiến của tiến sĩ (TS) Nguyễn Ngọc Thành và TS Đặng Phạm Thiên Duy - giảng viên Khoa Khoa học và công nghệ, Đại học RMIT Việt Nam. 

Dung blockchain chong gian lan thi cu, khong kha thi!
Tiến sĩ Đặng Phạm Thiên Duy

* Phóng viên: Nhiều người trong ngành giáo dục và công nghệ thông tin cho rằng, khả năng chống sửa đổi dữ liệu của blockchain có thể giúp ngăn chặn việc sửa kết quả thi. Các ông cho rằng, “còn nhiều thách thức”, vậy những thách thức đó là gì?

- TS Nguyễn Ngọc Thành: Blockchain có khả năng chống sửa đổi dữ liệu, nhưng không phải mọi dữ liệu muốn tránh sửa đổi đều có thể dùng blockchain. Có rất nhiều yếu tố cần cân nhắc, đó là công nghệ này không phải miễn phí, lại giới hạn về tốc độ xử lý cũng như dung lượng lưu trữ, đồng thời không tương thích với Luật An ninh mạng của Việt Nam. 

- TS Đặng Phạm Thiên Duy: Đúng vậy. Việc sử dụng blockchain đòi hỏi mỗi bài thi sau khi số hóa, phải được lưu vào một khối trong blockchain. Mỗi lần ghi dữ liệu như vậy, đều mất phí. Mỗi giao dịch trên bitcoin hiện có phí là 0,2 USD. Một blockchain khác là ethereum thì rẻ hơn khoảng 0,01 USD. 

* Như vậy, chúng ta phải tốn chi phí không nhỏ cho số lượng 1 triệu thí sinh mỗi năm?

- TS Đặng Phạm Thiên Duy: Nếu tính mỗi thí sinh làm khoảng 5 bài thi, thì số giao dịch cần cập nhật lên hệ thống là khổng lồ. Số tiền phải trả có thể là cả triệu USD nếu dùng bitcoin. 

- TS Nguyễn Ngọc Thành: Hơn nữa, blockchain bị giới hạn về mặt dung lượng lưu trữ. Kích thước của mỗi khối được duy trì ở mức rất thấp (khoảng 1MB trong bitcoin), để tránh bùng nổ dữ liệu cần lưu trữ. Vì vậy, bài thi trên giấy sau khi scan thành file ảnh có kích thước đến vài MB, không thể ghi vào blockchain. Nếu có lưu thì chỉ có thể là file text đã được chuyển đổi từ phần mềm nhận dạng ký tự (OCR) hoặc “mã băm” (hash code - một chuỗi ký tự do các thuật toán mã hóa thông tin tạo ra) của file ảnh hoặc file text bài thi.

Mặt khác, blockchain còn bị giới hạn về tốc độ xử lý. Xét trên hệ thống bitcoin, thời gian trung bình để tính toán “mã băm” cho một khối là khoảng 10 phút và tốc độ giao dịch trung bình là 7 giao dịch/giây. Như vậy, cần đến 8 ngày để cập nhật 5 triệu bài thi với điều kiện hệ thống blockchain này được dùng độc quyền cho việc xử lý dữ liệu bài thi tại Việt Nam và ngưng các giao dịch khác trên thế giới.

* Trên kia, ông có nói về sự không tương thích của blockchain với Luật An ninh mạng Việt Nam. Xin ông giải thích rõ hơn?

- TS Đặng Phạm Thiên Duy: Luật An ninh mạng Việt Nam quy định, tất cả các dữ liệu của người dùng Việt Nam phải được lưu trữ trên máy chủ đặt tại nước ta. Nguyên tắc nền tảng của blockchain lại là phân tán dữ liệu. Mạng lưới này hoạt động dựa trên những quy luật được thiết lập tự động bằng phần mềm và không một tổ chức hoặc quốc gia nào có thể chi phối. Nếu sử dụng blockchain, dữ liệu của công dân Việt Nam bắt buộc phải được lưu trữ tại các quốc gia khác trong mạng lưới blockchain. 

* Vậy nếu Việt Nam muốn xây dựng một mạng blockchain riêng, có khả thi không?

- TS Đặng Phạm Thiên Duy: Muốn vậy, sẽ cần một chi phí rất lớn. Nhưng nguyên lý nền tảng của blockchain là phi tập trung hóa dữ liệu nhằm mục đích tối hậu là không cho phép ai có quyền kiểm soát mạng lưới để thay đổi cập nhật trái phép dữ liệu. Nếu Việt Nam có một mạng blockchain riêng thì nó tạo thành một trung tâm dữ liệu tập trung. Vậy thì có khác gì hệ thống cơ sở dữ liệu tập trung mà Bộ GD-ĐT cũng như các ngân hàng và các cơ quan khác tại Việt Nam đang dùng đâu. 

Dung blockchain chong gian lan thi cu, khong kha thi!
Tiến sĩ Nguyễn Ngọc Thành

- TS Nguyễn Ngọc Thành: Ở Hà Giang, dữ liệu quét thô được gửi về Bộ GD-ĐT là dữ liệu chưa bị can thiệp. Nhưng khi chuyển sang khâu chấm bài, hơn 1.000 file bài làm của thí sinh đã bị sửa đổi. Như vậy, ngay cả việc dùng blockchain để ghi dữ liệu bài thi ở cả hai bước, vẫn không phát hiện được gian lận. Còn ở Sơn La, bài thi được sửa chữa trước khi được đưa vào máy quét, nên dữ liệu có được ghi trên blockchain hay không, gian lận vẫn có thể xảy ra. 

Cũng có một số ý kiến cho rằng, nếu thí sinh được thi trên máy, dữ liệu được ghi trực tiếp lên blockchain thay vì phải đi qua nhiều khâu như hiện nay, sẽ ngăn chặn được gian lận. Việc này hoàn toàn “bất khả thi” trong hoàn cảnh hiện tại. Việc chuẩn bị hơn 1 triệu máy tính cùng lúc để đáp ứng được yêu cầu thi tốt nghiệp trung học phổ thông là vô cùng khó. 

Máy tính có được kết nối mạng hay không? Làm sao kiểm soát được các phần mềm cài sẵn trong máy (TeamViewer, Remote Desktop) khi có đến hơn 1 triệu máy tham gia kỳ thi? Và quan trọng nhất là việc sử dụng blockchain lại gắn với một hệ thống tập trung hóa dữ liệu như đề thi và đáp án thì sức mạnh phân tán của blockchain đã bị vô hiệu hóa bởi hệ thống tập trung này. 

* Như vậy, blockchain khó mà được dùng để chống gian lận thi cử tại Việt Nam?

- TS Đặng Phạm Thiên Duy: Ý tưởng sử dụng blockchain chống gian lận thi cử đáng để suy nghĩ. Nó thể hiện sự nhanh nhạy của trí thức Việt Nam trong việc lĩnh hội và áp dụng những công nghệ mới. Tuy nhiên, dùng blockchain trong hoàn cảnh này giống như “gọt chân cho vừa giày”. Ba đặc tính cơ bản của blockchain là minh bạch, an toàn và chống sửa đổi dữ liệu trái phép. Minh bạch vì mọi người đều có thể đọc được lịch sử giao dịch; an toàn vì có hàng ngàn máy lưu trữ cùng một bản dữ liệu, nếu máy này bị sập thì máy khác vẫn hoạt động; và blockchain làm cho quá trình sửa đổi dữ liệu cực kỳ khó khăn. 

Nhưng blockchain chỉ thích hợp cho những ứng dụng liên quan tới giao dịch như chuyển tiền, chuyển nhượng bất động sản, hợp đồng mua bán. Blockchain mạnh trong việc ngăn ngừa những gian lận (sửa đổi dữ liệu trái phép) sau thời điểm phát sinh giao dịch chứ không ngăn chặn được những ý định gian lận từ trước khi có giao dịch. Chẳng hạn như việc lưu hồ sơ bệnh án lên blockchain sẽ chống được việc sửa đổi dữ liệu trong trường hợp bệnh nhân có khiếu kiện... 

* Vậy có giải pháp nào khả thi hơn blockchain trong việc chống gian lận thi cử?

- TS Nguyễn Ngọc Thành: Chúng ta không sử dụng blockchain mà chỉ dùng cơ chế chống sửa đổi, đó là cơ chế “mã băm” đã được sử dụng rộng rãi trong ngành công nghệ thông tin. Đây được xem là một phát minh vĩ đại của toán học. Với một file đầu vào bất kể dung lượng và nội dung nào, hàm băm sẽ cho ra mỗi chuỗi ký tự có độ dài cố định, khoảng 32-128 ký tự (tùy hàm băm). Nếu dữ liệu đầu vào bị thay đổi, thậm chí chỉ sửa một dấu phẩy, lập tức sẽ tạo mã băm mới khác xa so với mã băm gốc. 

Đặc tính tuyệt vời này đã được sử dụng để mã hóa mật khẩu và đặc biệt là dùng để ngăn chặn sửa đổi file gốc. Như vậy, nếu dữ liệu bài thi này phải ghi lên blockchain để chống sửa đổi, ta có thể dùng mã băm để niêm phong bài thi. Nhưng đồng thời, chúng ta phải “niêm phong” mã băm bằng cách dùng cặp khóa phi đối xứng (public/private key) để niêm phong mã băm.

Khóa bí mật (private key) sẽ được lưu trong USB và cần phải được bảo vệ nghiêm ngặt, thường thông qua xác thực đa phương thức (mã PIN và OTP - mật khẩu sử dụng một lần). Cơ chế này thực chất đã được sử dụng phổ biến ở Việt Nam thông qua các ứng dụng như chữ ký điện tử (ở hải quan và thuế) hoặc trong giao dịch ngân hàng trực tuyến. 

- TS Đặng Phạm Thiên Duy: Ngoài ra, chúng ta cũng có thể sửa lỗi ngay trong quy trình chấm thi và công bố kết quả thi. Quy trình hiện nay có lỗ hổng lớn đã được chỉ ra trong các cuộc hội thảo gần đây, đó là dữ liệu bài thi được chuyển về Bộ GD-ĐT nhưng việc chấm thi lại được tổ chức ở địa phương.

Lẽ ra, nếu dữ liệu thi trắc nghiệm đã được quét và chuyển về bộ thì việc chấm thi nên được thực hiện ở bộ. Tất nhiên, điều này cũng không hoàn toàn ngăn chặn được gian lận trong công tác chấm bài.

* Xin cảm ơn hai ông về những thông tin trên. 

Xuân Lộc (thực hiện)