Dùng dữ liệu sinh học và AI dự đoán chứng mất trí nhớ 15 năm trước khi các triệu chứng khởi phát

Các nhà khoa học Trung Quốc sử dụng ngân hàng dữ liệu sinh học khổng lồ và trí tuệ nhân tạo (AI) để cố gắng dự đoán chứng mất trí nhớ 15 năm trước khi các triệu chứng khởi phát.

Các nhà khoa học Trung Quốc đã thực hiện một bước quan trọng trong việc dự đoán nguy cơ mắc chứng mất trí nhớ của bệnh nhân 15 năm trước khi các triệu chứng khởi phát bằng cách phân tích mẫu máu của họ.

Các nhà khoa học đã sử dụng cơ sở dữ liệu của hơn 50.000 người để xác định những protein có liên quan đến nguy cơ phát triển các loại chứng mất trí khác nhau. Với sự trợ giúp của AI, nhóm này đã tạo ra mô hình dự đoán để đánh giá nguy cơ mắc bệnh.

Yu Jintai, tác giả nghiên cứu và giáo sư thần kinh học tại Bệnh viện Hoa Sơn trực thuộc Đại học Phúc Đán (Trung Quốc), nói việc sử dụng AI là “một trong những yếu tố then chốt dẫn đến sự thành công của nghiên cứu này”.

Bằng cách sử dụng chiến lược dựa trên dữ liệu, các nhà khoa học “đã sáng tạo cách xác định các dấu ấn sinh học huyết tương quan trọng để dự đoán chứng mất trí nhớ trong tương lai”, nhóm nghiên cứu viết trong bài báo đăng trên tạp chí bình duyệt Nature Aging.

Tạp chí bình duyệt là một loại tạp chí nghiên cứu khoa học, trong đó bài báo được chấp nhận xuất bản sau khi trải qua đánh giá và kiểm tra chất lượng bởi các chuyên gia đồng nghiệp. Đây là những chuyên gia có kiến thức và kinh nghiệm trong lĩnh vực tương ứng với nội dung bài báo.

Quá trình bình duyệt giúp đảm bảo rằng các nghiên cứu được công bố trong tạp chí đều trải qua quá trình kiểm tra chất lượng và tính khoa học cao. Bài báo sẽ được gửi đến một hoặc nhiều chuyên gia đồng nghiệp, những người sẽ xem xét kỹ lưỡng nội dung, phê duyệt hoặc từ chối dựa trên các tiêu chí như phương pháp nghiên cứu, dữ liệu, kết quả và đánh giá hợp lý.

Các tạp chí bình duyệt thường được xem là nguồn thông tin chính xác, đáng tin cậy trong cộng đồng nghiên cứu và giáo dục.

Xét nghiệm máu để chẩn đoán các loại bệnh mất trí nhớ, chẳng hạn bệnh Alzheimer, đang ngày càng phổ biến. Chỉ từ một giọt máu là có thể xác định liệu chúng ta đã bắt đầu có các triệu chứng của bệnh hay không.

Thế nhưng, các nhà khoa học đang hướng đến những mục tiêu lớn hơn với các công cụ sinh học đánh dấu trong máu, chẳng hạn sử dụng chúng để dự đoán chính xác liệu một người có thể phát bệnh trong tương lai hay không, ngay cả trước khi người đó có bất kỳ triệu chứng lâm sàng nào.

Theo các tác giả của bài báo trên Nature Aging, hiện chưa có cách chữa trị chứng mất trí nhớ và việc có thể hiểu được liệu một người có thể phát bệnh này hay không cho phép chẩn đoán và can thiệp sớm.

Nghiên cứu quy mô lớn về protein (còn được gọi là proteomics) có thể được sử dụng để tìm ra các loại thuốc tiềm năng hoặc những biện pháp can thiệp chẩn đoán bệnh và hiểu rõ hơn về cách hoạt động của cơ thể con người.

Tuy nhiên, nhóm nghiên cứu Trung Quốc viết rằng việc nghiên cứu một cách có hệ thống những protein trong máu tỏ ra khó khăn vì “hạn chế kỹ thuật” và thiếu phương pháp so sánh.

Để vượt qua rào cản này, nhóm nghiên cứu đã sử dụng sự trợ giúp của kho dữ liệu khổng lồ UK Biobank (ngân hàng sinh học Vương quốc Anh), nơi ghi danh hơn 50.000 người từ 40 đến 69 tuổi và có thời gian theo dõi trung bình là 14 năm, bắt đầu từ giữa những năm 2000.

Chỉ hơn 1.400 đối tượng trong nhóm nghiên cứu UK Biobank (tất cả cung cấp mẫu sinh học và thông tin nhân khẩu học) đã phát triển chứng mất trí nhớ trong vòng 10 năm sau khi thu thập dữ liệu ban đầu.

Gần đây, UK Biobank đã công bố một tập dữ liệu mới bao gồm hơn 1.400 protein huyết tương được tìm thấy trong mẫu của những người tham gia trong các phiên đăng ký ban đầu và theo dõi sau đó.

Việc công bố dữ liệu này đã mang lại cho nhóm khoa học Trung Quốc một “cơ hội chưa từng có” để tiến hành nghiên cứu về protein trong máu liên quan đến sự phát triển của chứng mất trí nhớ, theo bài báo trên Nature Aging.

Họ viết rằng điều này cho phép "theo dõi quỹ đạo của protein huyết tương từ thời điểm chẩn đoán chứng mất trí nhớ và đánh giá thời điểm mỗi protein bắt đầu lệch khỏi giá trị kiểm soát thông thường".

Các nhà khoa học đã tìm thấy hàng trăm protein liên quan, nhưng tập trung nghiên cứu vào một số ít “protein quan trọng” được phát hiện đã bắt đầu thay đổi biểu hiện ít nhất một thập kỷ trước khi chứng mất trí nhớ khởi phát lâm sàng.

Yu Jintai cho biết những protein này được đánh giá bằng thuật toán AI được gọi là light gradient boosting machine, sử dụng học máy để sàng lọc các protein và sự kết hợp có liên quan chặt chẽ nhất đến nguy cơ mất trí nhớ.

Thuật toán học máy được sử dụng để xác định protein nào tạo ra mô hình dự đoán tốt hơn và kiểm tra nó dựa trên dữ liệu UK Biobank cho thấy đối tượng nào mắc chứng mất trí nhớ.

Học máy là một lĩnh vực trong AI tập trung vào việc phát triển các thuật toán và mô hình máy tính có khả năng học hỏi từ dữ liệu và cải thiện hiệu suất của chúng theo thời gian mà không cần lập trình cụ thể. Các hệ thống học máy có khả năng tự động tìm hiểu và áp dụng kiến thức từ dữ liệu để thực hiện các nhiệm vụ cụ thể như phân loại, dự đoán, nhận dạng mẫu và tối ưu hóa quyết định.

Những ứng dụng của học máy rất đa dạng như xử lý ngôn ngữ tự nhiên, thị giác máy tính, xe tự hành, dự đoán thời tiết, quản lý dữ liệu lớn...

Học máy đã có sự tiến bộ đáng kể trong thập kỷ gần đây, nhờ sự phát triển của các mô hình học sâu và khả năng xử lý dữ liệu lớn (big data), mang lại nhiều cơ hội và tiềm năng trong việc giải quyết các vấn đề phức tạp và cải thiện hiệu suất trong nhiều lĩnh vực khác nhau.

Yu Jintai nói thuật toán đóng vai trò quan trọng trong nghiên cứu này, có khả năng dự đoán và nhận dạng mẫu mạnh mẽ, cho phép sàng lọc tập dữ liệu quy mô lớn hiệu quả hơn.

Nhóm nghiên cứu cho biết chỉ sử dụng dữ liệu protein trong mô hình "ít có khả năng đạt được độ chính xác dự đoán cao nhất".

Để phát triển “thuật toán dự đoán tối ưu không xâm lấn, tiết kiệm chi phí và dễ dàng truy cập”, họ đã kết hợp dữ liệu về một loại protein có tên GFAP (loại protein mà họ nhận thấy có liên quan đến nguy cơ mắc chứng mất trí nhớ cao hơn gấp đôi) với thông tin nhân khẩu học như tuổi tác và giới tính.

Theo bài báo, mô hình dự đoán kết hợp cuối cùng của họ cho thấy hứa hẹn về khả năng cung cấp "dự đoán chính xác về chứng mất trí nhớ trong tương lai, thậm chí hơn 10 năm trước khi được chẩn đoán".

So với quét hình ảnh hoặc chọc tủy sống được sử dụng để sàng lọc nguy cơ mắc bệnh cho con người, phương pháp của họ cũng có thể "mang lại lợi ích đáng kể về mặt chi phí".

Dữ liệu được công bố từ UK Biobank mang lại cho nhóm khoa học Trung Quốc một “cơ hội chưa từng có” để nghiên cứu các protein trong máu liên quan đến sự phát triển của chứng mất trí nhớ -- Ảnh: Shutterstock

Nhóm khoa học Trung Quốc cho biết vẫn còn những hạn chế trong nghiên cứu của họ, vì hơn 90% đối tượng trong nhóm nghiên cứu UK Biobank là người da trắng và do đó không đại diện cho dân số thế giới. Các protein được kiểm tra cũng không liên quan đến toàn bộ hệ protein của con người.

Tuy nhiên, Yu Jintai nói ông và các đồng nghiệp cũng đang tiến hành nghiên cứu trên một nhóm người Trung Quốc, điều này sẽ cho phép họ kiểm tra những điểm tương đồng và khác biệt với cơ sở dữ liệu có tại Vương quốc Anh.

Ông tiết lộ công việc của họ đến nay đã “cung cấp manh mối cho việc phát triển các phương pháp điều trị và chiến lược can thiệp mới”, đồng thời nói thêm rằng nhóm khoa học đang sử dụng UK Biobank để kiểm tra các tình trạng khác liên quan đến não, chẳng hạn trầm cảm và bệnh Parkinson.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/dung-du-lieu-sinh-hoc-va-ai-du-doan-chung-mat-tri-nho-15-nam-truoc-khi-cac-trieu-chung-khoi-phat-214192.html