AI và pháp luật: Một số giải pháp phát triển phù hợp cho Việt Nam
Khi luật được viết, lưu trữ và vận hành như một hệ điều hành thống nhất, AI sẽ giúp tiết kiệm chi phí tinh chỉnh, giảm sai sót và nâng cao năng lực quản trị quốc gia trong kỷ nguyên số.
Pháp luật là lĩnh vực có tiềm năng đặc biệt cho ứng dụng trí tuệ nhân tạo (AI), bởi bản chất của nó gắn liền với ngôn ngữ, ký tự và logic diễn giải. Tuy nhiên, tại Việt Nam, việc phát triển AI trong lĩnh vực pháp lý còn hạn chế, đặc biệt do những đặc thù của tiếng Việt khiến việc xử lý chính xác ngữ nghĩa trở nên khó khăn hơn.
Bài viết này đề xuất các nhóm giải pháp nhằm giúp AI “hiểu” luật tốt hơn, đồng thời tiết kiệm chi phí huấn luyện, điều chỉnh và cá nhân hóa (tuning) và nâng cao hiệu quả khai thác dữ liệu pháp lý.

Trong thời đại kỷ nguyên số, AI sẽ giúp tiết kiệm chi phí tinh chỉnh, nâng cao năng lực, giảm sai sót… khi viết, lưu trữ và vận hành hệ thống luật. Ảnh minh họa: THUẬN VĂN
Tiềm năng của AI và thách thức từ ngôn ngữ tiếng Việt
Hơn bất kỳ lĩnh vực nào khác, pháp luật theo nghĩa rộng là lĩnh vực rất tiềm năng cho phát triển, ứng dụng AI, bởi nó liên quan rất nhiều tới các hệ thống ký tự và điều này đã thể hiện rất mạnh mẽ ở các hệ thống pháp luật tiên tiến như Mỹ, Anh, Đức, Trung Quốc.
Tuy nhiên, AIA - trợ lý AI chuyên dụng trong lĩnh vực pháp luật ở Việt Nam đang phát triển ở mức tra cứu pháp luật hiện tại, khả năng hiểu ngữ cảnh còn khá hạn chế. Các hạn chế này (trong tương quan so sánh tương đối) bắt nguồn từ trước hết từ đặc thù ngôn ngữ:
Ngôn ngữ tiếng Việt khi phát âm là (i) ngôn ngữ đơn lập tương tự tiếng Hoa; nhưng khi viết lại là (ii) ngôn ngữ tượng thanh tương tự tiếng Latinh với (iii) ngữ pháp khá đơn giản, chỉ viết hoa danh từ riêng và viết hoa đầu câu nên thị giác máy tính không dễ tự động phân biệt danh từ với các từ loại khác như tiếng Đức; không chia động từ nên rất khó phán đoán động từ ở đâu, ví dụ: “Hai anh em ra sân tập đánh nhau”; các thì thời gian không thể hiện bằng cách chia động từ mà chủ yếu phải diễn giải bổ nghĩa bằng trạng từ; các ngôi đơn giản, không biến cách theo ngôi (Deklination), ví dụ như tôi tôi tôi tạo nên cái tôi của tôi - cùng từ “tôi” là chủ ngữ, động từ, túc từ, tân ngữ. Tất cả yếu tố này giúp tiếng Việt rất dễ học để thoát mù chữ và hỗ trợ tính đa nghĩa trong thơ ca trào phúng nhưng vất vả nếu muốn phấn đấu trở thành ngôn ngữ ngoại giao thương mại pháp lý hàng đầu của nhân loại.
Những gì làm khó cho nhà nghiên cứu ngôn ngữ, cho luật sư, cho thẩm phán, cho trọng tài viên thì AI cũng sẽ không biết phải soạn quyết định thi hành án dân sự như thế nào với bản án ly hôn:
“Phó cho con Nguyễn Thị Đào
Nước trong leo lẻo chống sào đợi ai.”
Trong bối cảnh quá độ như trên, tôi đề xuất các giải pháp sau:
Để AI “hiểu” luật tốt hơn
Thứ nhất, sửa đổi các bộ luật Dân sự, Hình sự; Tố tụng dân sự, Tố tụng hình sự, Tố tụng hành chính theo chuẩn mực Liên hợp quốc, cụ thể theo đúng tinh thần Điều 38 Hiến chương Tòa án Công lý Quốc tế, ghi nhận: Học thuyết pháp lý là một trong bốn nguồn được sử dụng trong xét xử.
Thứ hai, các ấn phẩm khi đăng ký hoặc được phân loại là ấn phẩm liên quan lĩnh vực pháp luật, bao gồm nhưng không hạn chế, sách báo tạp chí luật học, luận án, luận văn, tiểu luận, tờ trình, đề án, đề tài, văn bản quy phạm pháp luật, văn bản thực hiện pháp luật được khuyến nghị tuân thủ quy chuẩn (standard) do TAND Tối cao ban hành định kỳ theo cách tương tự như Incorterm hay ISO. Các cơ quan cụ thể, lựa chọn một số quy chuẩn trong số này thành quy định bắt buộc để nâng cao hiệu quả.
Thứ ba, kỷ nguyên vươn mình có thể coi là một dấu mốc để có thể hệ thống hóa lại, quy ước lại các văn bản, thuật ngữ cơ sở, nòng cốt cho toàn bộ hệ thống pháp luật, như thể là nâng cấp phần lõi (kernel) của một hệ điều hành mới, bảo mật, sức mạnh không giới hạn, đa chức năng, giảm thiểu xung đột, mở nhưng có phân vùng phân cấp, phân quyền để vừa chủ động hội nhập quốc tế, vừa tương tác bổ trợ qua lại với các hệ thống quy phạm xã hội khác như quy phạm tôn giáo, đạo đức, hiệp hội…
Các văn bản được ban hành theo nguyên tắc: Rõ việc, rõ quy trình mới xác định rõ người; tránh nghĩ ra cơ quan, tổ chức rồi lại phải vắt não nghĩ việc cho cơ quan, tổ chức đó để khỏi bị sáp nhập. Nên mạo muội khuyến nghị bắt đầu từ Hiến pháp đánh số 0, Bộ luật Dân sự đánh số 0001, Bộ luật Hình sự đánh số 0002, Bộ luật Tố tụng dân sự đánh số 0003 (tố tụng hành chính hiện nay chỉ nên trở thành một phần/chương trong văn bản này), Bộ luật Tố tụng hình sự đánh số 0004, Luật Ban hành và Pháp điển văn bản quy phạm pháp luật đánh số 0005, Luật Tổ chức Quốc hội đánh số 0006, Luật Tổ chức Chính phủ đánh số 0007, Luật Tổ chức TAND đánh số 0008… cứ thế tiếp tục. Quy tắc này sẽ giảm bớt tác động của tư duy nhiệm kỳ, thuận tiện cho tính liên tục tiến hóa và kế thừa trong phát triển AI.
Cần một “phiên bản ngôn ngữ pháp lý”
Một số đặc thù của ngôn ngữ sẽ tạo ra những rào cản trong khai thác AI trong lĩnh vực pháp luật sẽ được giảm thiểu nếu cơ quan lập pháp, hành pháp, tòa án, xuất bản ban hành quy tắc phát triển thành một phiên bản ngôn ngữ pháp lý bên cạnh phiên bản tiếng Việt bình dân.
Đây có lẽ là hướng khả thi cho tới chừng nào người Việt vẫn chưa đủ năng lực sử dụng tiếng Anh để khai thác trực tiếp kho tàng kiến thức khổng lồ của nhân loại và tiếng Anh chưa trở hành ngôn ngữ song song thứ hai.
PGS-TS VÕ TRÍ HẢO
Thứ tư, trong phần căn cứ ban hành của các luật tránh viện dẫn chung chung, mà phải trích dẫn cụ thể điều khoản của Hiến pháp để bảo đảm tính thượng tôn Hiến pháp, giảm thiểu nguy cơ vi phạm Hiến pháp, bảo đảm mọi lời văn của Hiến pháp có ý nghĩa. Nghị định ghi rõ hướng dẫn điều khoản nào của luật (và không tự tạo ra quy phạm mới ngang tầm luật). Thông tư ghi rõ hướng dẫn điều khoản nào của nghị định. Cứ thế thì con người cũng như AI sẽ dễ tìm ra “phả hệ” của mỗi lời văn, mỗi quy định và hiểu đúng bối cảnh, đúng mục đích. Áp dụng quy tắc đặt mã số cho từng văn bản một cách chặt chẽ giống như ghi chép gia phả thì việc nghị định, thông tư đi chệch mục tiêu ban đầu, lạm quyền sẽ được AI tự động phát hiện kịp thời.
Nâng cao hiệu quả khai thác dữ liệu pháp lý và tiết kiệm chi phí
Thứ năm, trong thể thức văn bản của tất cả văn bản thực hiện pháp luật cần bổ sung thêm ba thành tố mới (bên cạnh tám thành tố hiện hữu): (i) Bảng từ khóa; (ii) Mã QR; (iii) Mã hash đặc định với từng văn bản, mã này do Trung tâm dữ liệu quốc gia generate và cấp.
Thứ sáu, xây dựng hệ thống sổ cái dựa trên nền tảng blockchain để thay thế hệ thống công báo. Nói cách khác, trừ văn bản thuộc phạm vi bí mật nhà nước, bí mật công tác, việc phát hành và có kéo theo hiệu lực của một văn bản gắn liền với việc được cấp địa chỉ trên hệ thống blockchain này. Việc ban hành văn bản quy phạm pháp luật chui hoặc gửi đăng công báo chậm hay “công văn siêu luật” tồn tại suốt 40 năm nay sẽ bị chấm dứt bởi công báo quốc gia dựa trên công nghệ blockchain này.
Thứ bảy, công báo quốc gia này giao cho Trung tâm dữ liệu quốc gia quản lý thay cho Văn phòng Chính phủ quản lý như hiện nay. Và công báo này quản lý không chỉ văn bản quy phạm pháp luật mà tất cả bản án, văn bản thực hiện pháp luật khác. Dữ liệu lớn sẽ được tự động hợp nhất, tổ chức, phân loại một cách khoa học, giảm bớt chi phí tagging, tuning dữ liệu cho huấn luyện AI.
Thứ tám, tất cả xuất bản phẩm phát hành ở Việt Nam đều phải cung cấp bản điện tử cho Trung tâm dữ liệu quốc gia để phục vụ huấn luyện AI. Quốc hội ban hành chính sách trả tiền bản quyền tương tự cách trưng mua khi sử dụng dữ liệu này cho huấn luyện AI.
(*) PGS-TS Võ Trí Hảo hiện công tác tại Viện Pháp luật quốc tế và so sánh Trường ĐH Kinh tế - Luật (ĐH Quốc gia TP.HCM).
AI chuyên biệt, hỗ trợ sâu cho nghiệp vụ tòa án
Hệ thống được xây dựng dựa trên mô hình ngôn ngữ mã nguồn mở, được phát triển và huấn luyện từ dữ liệu nội bộ; giúp AI hiểu và diễn giải
chính xác logic của hệ thống luật trong nước.
Trong tiến trình chuyển đổi số của ngành tư pháp, TAND khu vực 1 TP.HCM đang tiên phong xây dựng một mô hình trí tuệ nhân tạo (AI) chuyên biệt nhằm phục vụ trực tiếp cho công tác xét xử, hành chính tư pháp và quản lý hồ sơ. Đây là hướng đi được đánh giá là thực chất, gắn chặt với nhu cầu nghiệp vụ.
TAND khu vực 1 TP.HCM triển khai hệ thống quản lý thông tin nội bộ tòa án đến các tòa án khu vực trên địa bàn TP.HCM. Ảnh: TRẦN LINH
Mô hình AI này được xem là bước đột phá trong lộ trình xây dựng “tòa án điện tử” tại TP.HCM. Khi hoàn thiện, hệ thống sẽ giúp tối ưu hóa công việc cho thẩm phán, thư ký; rút ngắn thời gian xử lý hồ sơ và nâng cao chất lượng giải quyết án.
Không giống các mô hình AI thương mại hay ngôn ngữ lớn khác, hệ thống AI của TAND khu vực 1 TP.HCM được thiết kế để xử lý tức thời khối lượng tài liệu khổng lồ, từ công văn, hồ sơ vụ án đến các chứng cứ, tài liệu điện tử.
Với năng lực đọc hiểu và đánh giá vượt trội, AI có thể rà soát toàn bộ hồ sơ trong thời gian ngắn, hạn chế tối đa việc bỏ sót thông tin quan trọng.
AI còn tự động đánh bút lục, tóm tắt tài liệu, đảm bảo sự nhất quán trong việc hệ thống hóa hồ sơ. Khi cần tìm thông tin, thẩm phán chỉ cần đặt câu hỏi theo từ khóa, AI sẽ tra cứu và trích xuất nội dung liên quan từ hàng ngàn trang tài liệu, đưa ra câu trả lời chính xác trong vài giây.
Hệ thống cũng có chức năng làm mờ các phần thông tin mật, nhạy cảm, đáp ứng yêu cầu bảo mật trong xét xử.
Một điểm nổi bật khác là khả năng tương tác bằng giọng nói. Thẩm phán có thể ra lệnh tìm kiếm hoặc yêu cầu hệ thống hiển thị thông tin ngay trong phiên tòa, phiên họp mà không cần dùng bàn phím.
Tính năng này đặc biệt hữu ích trong các phiên tòa số hóa - xu hướng đang được ngành tòa án đẩy mạnh, giúp tăng tốc độ xử lý và tính linh hoạt trong điều hành.
AI còn có thể đề xuất căn cứ pháp lý và hướng giải quyết vụ án dựa trên kho dữ liệu được huấn luyện từ thực tiễn. Ngoài ra, hệ thống có khả năng vẽ sơ đồ tư duy từ hồ sơ vụ án, giúp thẩm phán và thư ký hình dung trực quan các mối quan hệ giữa các bên, diễn tiến và “nút thắt” của vụ việc.
Vấn đề hiện tại là hạ tầng các máy tính xử lý AI còn hạn chế, ảnh hưởng phần nào đến tốc độ xử lý hồ sơ, tài liệu có trong vụ án. Đối với các hình ảnh, bản vẽ, giấy tờ cũ cũng một phần nào gây ra khó khăn khi AI rút trích phân tích thông tin. Tuy nhiên, với khả năng công nghệ, các vấn đề này sớm được khắc phục và cải tiến.