'Không sao đâu'- bài học đắt giá không chỉ trong lĩnh vực công nghệ
Có lẽ không ai lường được tình huống chính phủ Hàn Quốc bị mất 858 terabytes dữ liệu dịch vụ công chỉ trong một đám cháy. Điều gây sửng sốt là dữ liệu bị mất lại không có bản sao dự phòng. Hai bài học đắt giá cần rút ra từ vụ này: sao lưu dữ liệu và cảnh giác với pin lithium.
Để dễ hình dung, 858 terabytes (TB) là lượng dữ liệu cực lớn, tương đương khoảng 150.000 bộ phim độ phân giải cao (HD) hay 400 triệu cuốn sách điện tử (ebook) hoặc 170 triệu ảnh số dung lượng mỗi ảnh 5MB. Hay lấy ví dụ dễ hiểu hơn, nếu ở dạng dữ liệu chữ thuần túy như file Word thì để in 858 TB văn bản bạn phải cần tới ...17 tỉ trang giấy A4.
Hậu quả vụ cháy xảy ra hôm 26-9 tại một trung tâm dữ liệu (data center) tại thành phố Daejeon, nơi đặt các máy chủ điện toán đám mây G-Drive của chính phủ Hàn Quốc mới được công bố. Bản tin ngày 8-10 của hãng tin Reuters mô tả đây là "sự kiện phơi bày sự cẩu thả đáng kinh ngạc của cơ quan nhà nước, phơi bày những lỗ hổng nghiêm trọng trong hạ tầng số thường được ca ngợi".
Vụ hỏa hoạn đã xóa sạch 858 TB dữ liệu quan trọng khiến chính phủ Hàn Quốc phải chật vật khôi phục các dịch vụ công thiết yếu do hoàn toàn không có bản sao lưu dự phòng (backup), một nền tảng cốt lõi lẽ ra không thể thiếu của hệ thống. Chính phủ Hàn Quốc quy định các tài liệu nhạy cảm không được phép lưu trên máy tính văn phòng của công chức mà chỉ được lưu trên các máy chủ G-Drive. Do đó, khi không có bản sao lưu, việc phục hồi dữ liệu là gần như không thể làm được.
Đám cháy kéo dài hàng giờ đã thiêu rụi các máy chủ G-Drive, làm tê liệt hoạt động của 125.000 nhân viên chính phủ và ảnh hưởng đến hàng triệu người dân. Sau vụ cháy là một cơn ác mộng hành chính vì khoảng 650 dịch vụ chính phủ bị đình trệ, làm tê liệt từ đăng ký kinh doanh, cấp visa đến chứng nhận an toàn thực phẩm hay nộp thuế. Ba ngày sau vụ hỏa hoạn, chỉ có 46 dịch vụ được khôi phục. Hệ thống email chính phủ cũng tê liệt khiến việc cung cấp thông tin cho người dân bị gián đoạn theo (*).
Quy trình tiêu chuẩn của sao lưu cất giữ dữ liệu quan trọng ở vài ba địa điểm độc lập cách xa nhau về địa lý đã bị bỏ qua trong trường hợp này. Trong khi nhiều nước như Estonia, hình mẫu cho chính phủ điện tử, sao lưu toàn bộ kho lưu trữ nhà nước ở Luxembourg hay chính phủ Singapore luôn sao chép dữ liệu theo thời gian thực trên ba dịch vụ của Amazon, Google và Microsoft. Việc không có bản backup dữ liệu được phỏng đoán là bắt nguồn từ việc người quản lý cho rằng không thể xảy ra sự cố mất dữ liệu, do đó họ có thể bỏ qua việc thiết lập sao lưu và tiết kiệm chi phí.
Vụ cháy bắt đầu do pin lithium trong bộ lưu trữ điện phát nổ khi đang được di dời. Đám cháy dữ dội và kéo dài nhiều giờ, một phần cũng do đặc điểm một khi đã cháy thì rất khó dập tắt của loại pin này. Có lẽ pin lithium là yếu tố đã bị bỏ quên khi thiết kế an toàn hệ thống tại trung tâm dữ liệu Daejeon.
Bài học kinh nghiệm từ vụ cháy ở Hàn Quốc cần được nghiêm túc rút ra không chỉ cho lĩnh vực dịch vụ công và trong ngành công nghệ mà còn cho nhiều lĩnh vực khác và các doanh nghiệp. Pin lithium càng phổ biến, càng được ứng dụng rộng rãi thì càng cần quy trình ứng phó cháy nổ chặt chẽ hơn. Ngoài ra phải luôn có bản backup dữ liệu cất giữ bên ngoài nơi đặt máy chủ, không thể chủ quan nghĩ rằng "không sao đâu" nên "không sao lưu".
--------------------
(*) https://quasa.io/media/south-korea-s-catastrophic-data-center-fire-858-terabytes-of-government-data-lost-forever-due-to-no-backup