Big Data và những hiểu lầm, thổi phồng quá mức

Dữ liệu lớn (Big Data) đã trở thành một trong những xu hướng công nghệ nổi bật nhất chục năm qua, tuy nhiên chúng cũng dễ bị hiểu sai hoặc thổi phồng quá mức.

Big Data - những hiểu lầm

Khác với dữ liệu truyền thống, dữ liệu lớn là tập hợp dữ liệu có quy mô khổng lồ. Chúng được sinh ra với tốc độ nhanh chóng từ nhiều nguồn như thiết bị IoT, mạng xã hội, giao dịch số… Sự bùng nổ của các nền tảng số đã biến dữ liệu trở thành “dòng chảy liên tục” và ngày càng phức tạp.

Có thể nói, dữ liệu lớn không chỉ là tài nguyên kỹ thuật, mà là “hệ thần kinh” của xã hội hiện đại, kết nối mọi lĩnh vực để ra quyết định thông minh, kịp thời và hiệu quả.

Dù vậy, dữ liệu lớn cũng dễ bị hiểu sai hoặc thổi phồng quá mức. Nhiều người cho rằng “càng nhiều dữ liệu thì càng tốt”, tuy nhiên, dữ liệu nhiều nhưng không được làm sạch, chuẩn hóa thì chỉ tạo ra nhiễu, không giá trị. Hệ quả là tốn chi phí lưu trữ, xử lý mà không tạo ra giá trị thực.

Cũng không ít người quan niệm rằng “dữ liệu lớn sẽ tự động tạo ra tri thức”. Nhưng dữ liệu không tự nói lên điều gì nếu không có quy trình phân tích bài bản và chuyên môn sâu. Điều này tạo ra kỳ vọng sai lệch, thất vọng khi không đạt được kết quả như mong đợi. Dữ liệu cần được phân tích có định hướng, không thể tự sinh ra tri thức.

Dữ liệu lớn không chỉ là tài nguyên kỹ thuật, mà còn là “hệ thần kinh” của xã hội hiện đại

Dữ liệu lớn không chỉ là tài nguyên kỹ thuật, mà còn là “hệ thần kinh” của xã hội hiện đại

Một trong những quan niệm được rất nhiều người đưa ra là “AI + Big Data sẽ thay thế hoàn toàn con người”. Nhưng thực tế, AI cần con người để thiết kế, giám sát, diễn giải và ra quyết định có trách nhiệm. Dữ liệu lớn là công cụ hỗ trợ, không phải người ra quyết định.

Việc thiếu đầu tư vào năng lực con người sẽ dẫn đến hệ thống thiếu kiểm soát. Ví dụ, Amazon từng triển khai hệ thống tuyển dụng tự động dựa trên dữ liệu ứng viên, nhưng sau đó phải hủy bỏ vì thuật toán có xu hướng loại bỏ ứng viên nữ do dữ liệu lịch sử thiên lệch.

Ngoài ra, cũng không có chuyện doanh nghiệp nào không dùng dữ liệu lớn sẽ bị đào thải. Thực tế, không phải mọi doanh nghiệp đều cần dữ liệu lớn. Quan trọng là dùng dữ liệu đúng quy mô, đúng mục tiêu. Việc chạy theo xu hướng, đầu tư sai hướng, lãng phí nguồn lực còn nguy hiểm hơn nhiều.

Có doanh nghiệp vừa ở TP.HCM đầu tư hệ thống phân tích dữ liệu khách hàng nhưng không có chiến lược khai thác cụ thể. Sau 2 năm, hệ thống gần như không được sử dụng, gây lãng phí hàng tỉ đồng.

Dữ liệu lớn đang bị cường điệu hóa

Không chỉ hiểu lầm, trong quá trình truyền thông và ứng dụng công nghệ, nhiều biểu hiện cường điệu hóa vai trò của dữ liệu lớn đã xuất hiện.

Đơn cử, chúng ta nghe nhiều về việc “dữ liệu là dầu mỏ mới của thế kỷ 21”. Điều này nghe hấp dẫn, nhưng dễ bị hiểu lầm rằng chỉ cần có dữ liệu là sẽ sinh lời như tài nguyên thiên nhiên.

Dữ liệu chỉ có giá trị khi được xử lý đúng cách, đúng mục tiêu và trong đúng ngữ cảnh. Google và Facebook sở hữu lượng dữ liệu khổng lồ, nhưng giá trị thực đến từ khả năng phân tích hành vi người dùng để tối ưu quảng cáo. Trong khi đó, nhiều doanh nghiệp nhỏ thu thập dữ liệu khách hàng nhưng không khai thác được, dẫn đến lãng phí.

Dữ liệu lớn ứng dụng vào rất nhiều lĩnh vực trong đời sống

Dữ liệu lớn ứng dụng vào rất nhiều lĩnh vực trong đời sống

Hiện nay cũng có nhiều tổ chức đánh đồng việc áp dụng dữ liệu lớn với toàn bộ quá trình chuyển đổi số. Tuy nhiên, chuyển đổi số là một chiến lược toàn diện, bao gồm con người, quy trình, văn hóa và công nghệ, không chỉ dữ liệu.

Ví dụ, một số bệnh viện ở Đông Nam Á đầu tư hệ thống lưu trữ dữ liệu bệnh án điện tử nhưng không tích hợp quy trình khám chữa bệnh, dẫn đến tình trạng “số hóa hình thức” mà không cải thiện hiệu quả vận hành.

Một số doanh nghiệp cũng kỳ vọng quá mức vào khả năng dự báo của dữ liệu và cho rằng “Big Data sẽ giúp dự báo chính xác tương lai”. Tuy nhiên, dự báo luôn có sai số, và dữ liệu lịch sử không thể phản ánh đầy đủ các yếu tố biến động xã hội, chính trị, môi trường.

Đơn cử, trước đại dịch COVID-19, nhiều mô hình dự báo kinh tế dựa trên dữ liệu lịch sử đã thất bại vì không tính đến yếu tố gián đoạn toàn cầu. Các thuật toán không thể dự đoán được cú sốc phi truyền thống này. Dữ liệu không thể thay thế hoàn toàn tư duy phản biện và khả năng thích ứng.

Nhìn chung, chúng ta cần tỉnh táo trước những tuyên bố cường điệu. Dữ liệu lớn là công cụ mạnh mẽ, nhưng không phải là “phép màu” giải quyết mọi vấn đề.

Nhiên liệu cho các hệ thống thông minh

Trong bối cảnh AI ngày càng phát triển, dữ liệu lớn sẽ đóng vai trò “nhiên liệu” cho các hệ thống thông minh.

Theo đó, các tổ chức không chỉ đầu tư hạ tầng, mà cần đào tạo nhân lực, xây dựng văn hóa dữ liệu. Kết hợp dữ liệu lớn với AI, blockchain, IoT để tạo ra nền tảng công nghệ đa chiều, phục vụ ra quyết định tự động, minh bạch và an toàn.

Trong bối cảnh AI ngày càng phát triển, dữ liệu lớn sẽ đóng vai trò “nhiên liệu” cho các hệ thống thông minh

Trong bối cảnh AI ngày càng phát triển, dữ liệu lớn sẽ đóng vai trò “nhiên liệu” cho các hệ thống thông minh

Ngoài ra, cần phát triển các trung tâm dữ liệu quốc gia để đảm bảo chủ quyền dữ liệu, phục vụ chiến lược số hóa toàn diện. Song song đó, cần giải quyết những thách thức đặt ra, đặc biệt là tệ nạn deepfake và các nội dung giả mạo.

Các đơn vị cũng cần lưu ý, bên cạnh những lợi ích vượt trội, công nghệ này cũng đặt ra nhiều thách thức nghiêm trọng về đạo đức, pháp lý, an ninh và xã hội.

Cụ thể, dữ liệu thường đến từ nhiều nguồn khác nhau với định dạng không đồng nhất, kéo theo nguy cơ dữ liệu sai lệch, thiếu giá trị, hoặc trùng lặp gây khó khăn cho việc phân tích chính xác.

Nhiều tổ chức có dữ liệu nhưng không có đội ngũ đủ năng lực để khai thác. Chưa kể, phân tích dữ liệu lớn cũng đòi hỏi hạ tầng mạnh, chi phí này là rào cản lớn với doanh nghiệp nhỏ.

Dữ liệu lớn cũng thường chứa thông tin cá nhân nhạy cảm, đặc biệt trong y tế, giáo dục, tài chính… Việc phân tích mà không tuân thủ quy định bảo mật có thể gây hậu quả pháp lý nghiêm trọng.

Ngoài ra, dữ liệu lớn có thể tạo ra các mô hình phức tạp, nhưng không phải lúc nào cũng dễ hiểu với lãnh đạo hoặc người ra quyết định. Đôi khi, một báo cáo phân tích hành vi khách hàng trình bày bằng thuật toán phức tạp khiến ban giám đốc không thể đưa ra quyết định chiến lược.

Do đó, dữ liệu lớn trong kỷ nguyên AI không chỉ là “tài nguyên số” mà còn là “năng lực chiến lược”. Việc phát triển phải đi đôi với quản trị, bảo mật và khả năng chuyển hóa thành giá trị thực tiễn. Tổ chức nào biết khai thác dữ liệu một cách thông minh, có đạo đức và có chiến lược sẽ dẫn đầu trong đổi mới và sáng tạo.

Để phát huy giá trị thực sự của dữ liệu lớn, Việt Nam cần đầu tư bài bản vào hạ tầng số, đào tạo nhân lực phân tích, phát triển công nghệ bản địa hóa và xây dựng khung pháp lý phù hợp. Quan trọng hơn, cần chuyển từ tư duy “sở hữu dữ liệu” sang “tạo giá trị từ dữ liệu”, lấy hiệu quả ứng dụng làm thước đo.

Dữ liệu không tự nói, nhưng nếu biết lắng nghe, ta sẽ thấy được tương lai.

TS Trần Ngọc Anh

Nguồn Một Thế Giới: https://1thegioi.vn/big-data-va-nhung-hieu-lam-thoi-phong-qua-muc-236845.html