Trang chủ Thời đại Trí tuệ Phật giáo cho một trí tuệ nhân tạo ít “nhân...

Trí tuệ Phật giáo cho một trí tuệ nhân tạo ít “nhân tạo” hơn và thông minh hơn

Đó là một buổi sáng mùa hè tươi sáng. Những tia nắng đỏ rực từ mặt trời đang mỉm cười hôn lên ngọn của những tán cây cao và các tòa tháp. Một làn gió mới cùng dàn hợp xướng vui nhộn của chim chóc đang tràn ngập bầu không khí tại trung tâm thiền ở Dharamshala trên dãy Himalaya. Sự tương đồng đáng kinh ngạc giữa trí tuệ nhân tạo học sâu (Deep Learning AI) và trí tuệ Phật giáo bất chợt hiện ra trong tôi khi đang tham dự một chương trình thiền Phật giáo tại trung tâm. Suốt hơn 2.500 năm qua, Phật giáo đã khảo sát tâm thức – thứ không phải vật chất và khác với não bộ, dù cả hai có mối liên hệ và phụ thuộc lẫn nhau. Trí tuệ Phật giáo là chìa khóa dẫn vào tâm thức. Mặc dù các nhà thần kinh học đã có những nghiên cứu sâu rộng về giải phẫu và chức năng của não bộ, hiểu biết về tâm, tư tưởng, ý thức, trực giác và trí tuệ vẫn còn rất hạn chế. Các mạng nơ-ron nhân tạo bỏ qua quá trình dịch từ não bộ sang tâm thức. Hiệu suất của AI học sâu – vốn bắt chước bộ não sinh học – có thể được nâng cao bằng cách hấp thụ tinh hoa từ giáo lý Phật giáo.

Thuật ngữ “Học sâu” (Deep Learning), được đặt cho mạng nơ-ron nhân tạo, đã được hình thành từ những năm 1940. Tuy nhiên, chỉ vài năm gần đây, hệ thống nhận thức dựa trên trực giác (học qua trải nghiệm) sử dụng toán học liên tục mới bổ sung cho trí tuệ nhân tạo cổ điển – vốn dựa vào hệ thống nhận thức lý trí (được lập trình sẵn). Sự trao quyền này chính là nguồn gốc cho những thành tựu ngoạn mục của AI trong nửa thập kỷ vừa qua. Nhưng hiện nay, đã bắt đầu xuất hiện sự vỡ mộng. AI đã đạt được những kỳ tích gần như con người hoặc siêu việt trong các lĩnh vực như trò chơi chiến lược, nhận diện hình ảnh, xử lý ngôn ngữ tự nhiên và xe tự hành. Học sâu sử dụng toán học nặng, nó giống như luyện kim hơn là hóa học. Chỉ một phần các lời giải hiệu suất cao của nó có thể được lý giải bằng lý trí, phần còn lại mang tính bản năng – một ngả rẽ so với trí tuệ con người. Nhưng do khả năng xử lý dữ liệu khổng lồ, hoạt động “hộp đen” khó hiểu, bất lực trong việc áp dụng khái niệm trừu tượng cho các tình huống khác nhau và khó khăn trong thiết kế mô hình, người ta e ngại rằng học sâu đang tiến gần đến bức tường giới hạn.

Quá trình của AI học sâu vấp phải các công cụ trí tuệ Phật giáo

Học sâu – một quy trình thống kê – mô phỏng não động vật có vú. Các nơ-ron nhân tạo (perceptron) là phiên bản số hóa, đồng nhất và đơn giản của các nơ-ron sinh học (Hình 1).

Não người có khoảng 100 tỷ nơ-ron và 1000 nghìn tỷ khớp thần kinh (synapse). Các mạng nơ-ron nhân tạo khác biệt đáng kể với cấu trúc não thật ở số lượng nơ-ron & synapse, hình dạng, kích thước và kiểu hoạt hóa của nơ-ron, cấu trúc bẩm sinh, khả năng tạo và chèn nơ-ron mới vào mạch hiện có và việc chọn lọc vùng hoạt động nhất định.

Trong mạng nơ-ron nhân tạo, các nơ-ron (perceptron) được sắp xếp thành lớp đầu vào, lớp ẩn và lớp đầu ra. Dữ liệu đầu vào được gán trọng số và độ lệch (bias) khi chuyển đến nơ-ron ở lớp liền kề. Dữ liệu này đi qua một hàm kích hoạt và đầu ra được chuyển đến các nơ-ron lớp kế tiếp. Quá trình này tiếp tục cho đến khi tín hiệu của nơ-ron nhân tạo chạm đến lớp đầu ra. Tại đây, chúng sẽ được xử lý thông qua thuật toán tối ưu hóa (hàm mất mát) và lan truyền ngược. Đầu ra thực tế và đầu ra kỳ vọng được so sánh, và sai số được truyền ngược về lớp đầu vào để tối ưu trọng số và độ lệch. Quá trình lặp đi lặp lại cho đến khi đầu ra gần như mong muốn đạt được. Cấu trúc của mạng nơ-ron “nông” và “sâu” được minh họa ở Hình 2.

Sau khi tối ưu hóa, mô hình mạng nơ-ron nhân tạo đưa ra các tham số đầu ra chính xác hơn để huấn luyện, xác thực và kiểm thử. Các nhiệm vụ kế tiếp có thể học từ việc học chuyển tiếp (transfer learning). Thuật toán học sâu cần hàng triệu ví dụ huấn luyện. Dù hấp thụ lượng dữ liệu chất lượng khổng lồ, AI học sâu vẫn còn rất xa mới đạt đến khả năng lý luận, thấu hiểu và lẽ thường của con người.

Trí tuệ Phật giáo (prajna) bao gồm ba công cụ: nghe (kinh điển – sutras), quán chiếu (Cinta), và thiền định (Bhavana). Để hiểu bằng trí năng, chúng ta phải nghe, học và nghiên cứu kinh điển (sutras). Kiến thức này có thể được nội hóa thông qua trí tuệ quán chiếu và suy niệm (Cinta). Dựa trên hai viên ngọc trí tuệ đó, chúng ta bắt đầu thực hành thiền định (Bhavana) – đánh thức thêm sự hiểu biết từ bên trong. Trong thiền định an chỉ (Samatha) và thiền minh sát (Vipassana), não bộ trở thành đối tượng của một tiến trình nhận thức quay vào trong, thay vì hướng ra ngoài. Giá trị được gán cho một số trạng thái để gia tăng sự hiện diện của chúng. Sự kết nối synapse cũng thay đổi theo. Điều này tương tự với những gì xảy ra trong quá trình học hỏi thông qua tương tác với thế giới bên ngoài.

AI học sâu dường như đã học một trang từ trí tuệ Phật giáo. Quá trình của AI học sâu gồm đầu vào, gán trọng số & độ lệch, tối ưu hóa và đầu ra rất giống với ba công cụ trí tuệ Phật giáo: nghe, quán chiếu, thiền định an chỉ (Samatha) và thiền minh sát (Vipassana). Thiền định an chỉ bao hàm chức năng hàm mất mát và lan truyền ngược đến khi tối ưu hóa. Thiền minh sát giống như giai đoạn thu nhận đầu ra từ mô hình đã được huấn luyện sau khi có đủ đầu vào.

Trí tuệ Phật giáo để củng cố AI học sâu

Việc AI học sâu phụ thuộc vào dữ liệu khổng lồ và các phép tính phức tạp chính là nguồn gốc của các vấn đề như: tính chất “hộp đen” (không biết đâu là đầu vào quan trọng), không thể áp dụng khái niệm trừu tượng vào các ứng dụng khác nhau (do mê cung dữ liệu), và khó thiết kế mô hình (số lớp và nơ-ron quá nhiều, khó lựa chọn thuật toán kích hoạt và hàm mất mát – đặc biệt trong các vấn đề phức tạp). Nếu tích hợp giáo lý Phật giáo, AI có thể sử dụng ít dữ liệu hơn, giảm bớt các phép toán phức tạp và kết hợp thuật toán với trải nghiệm và trực giác con người để giải các vấn đề như biến đổi khí hậu và các bệnh nan y đang đe dọa nhân loại. Một phát hiện được đặt theo tên nhà nghiên cứu AI Hans Moravec rất đáng chú ý:

Nghịch lý của Moravec – Trái với giả định truyền thống, suy luận cấp cao lại cần rất ít tính toán, còn kỹ năng cảm biến – vận động cấp thấp lại đòi hỏi tài nguyên tính toán khổng lồ.

Việc hấp thụ trí tuệ Phật giáo vào AI là một chủ đề phức tạp. Nó đòi hỏi sự phối hợp giữa các học giả Phật giáo, các nhà thần kinh học và chuyên gia AI để xác định cách thức giáo lý Phật giáo có thể làm lợi cho phương pháp tiếp cận AI hiện nay và phát triển các phương pháp tích hợp. Một số ví dụ đại diện như sau:

Tích hợp cấu trúc não bẩm sinh: Một đứa trẻ, chưa từng học Phật, vẫn có khả năng suy luận và hiểu kinh điển với lượng dữ liệu rất nhỏ. Cấu trúc não bẩm sinh đó đã có sẵn ngay từ khi sinh ra. AI cần có khả năng mô phỏng phần nào cấu trúc này thay vì chỉ dựa vào “nuôi dưỡng”. Mạch não chỉ ra sự đa dạng lớn trong loại nơ-ron để hình thành truyền tải thần kinh và xử lý thông tin. Có các loại nơ-ron như vận động, cảm giác, trung gian, và các nơ-ron kết nối gần – xa. Để vượt ra giai đoạn xử lý sớm của tri giác như thị giác, thính giác… và nắm bắt bước nhận thức sau đó, cần giới thiệu sự không đồng nhất trong loại nơ-ron và kết nối vào mạng nơ-ron nhân tạo vốn đang đồng nhất một cách quá mức.

Ưu tiên các lớp ngoài cùng bằng cấu trúc mạng thưa: Các nhà thần kinh học đã nghiên cứu cấu trúc não của các thiền sư lâu năm. Vỏ não – lớp ngoài cùng của mạng lưới sinh học não – có các nơ-ron liên kết gần và xa. Người ta quan sát thấy các hành giả phát triển độ dày vỏ não cùng mật độ nơ-ron và số lượng synapse cao ở vùng não liên quan đến sự chú ý và xử lý cảm giác. Trong AI, điều này tương đương với việc ưu tiên các lớp ngoài thay vì các lớp ẩn. Cấu trúc truyền thống của mạng nơ-ron với các lớp kết nối đầy đủ nên được điều chỉnh. Các khớp thần kinh giữa các lớp truyền tiếp nên được loại bỏ (dropout dạng mạng thưa), và có thể tạo khớp nhảy qua nhiều lớp. Một cấu trúc mạng tổng quát cho phép bất kỳ nút nào kết nối với bất kỳ nút nào khác bằng synapse sẽ giúp lớp ngoài có ưu tiên vượt trội so với lớp ẩn.

Chỉ sử dụng một phần mạng nơ-ron sâu: Các hành giả Phật giáo phát triển hoạt hóa mạnh mẽ phía não trái. Điều này cho thấy chỉ một vùng não – thay vì toàn bộ – được sử dụng để giải quyết phần lớn vấn đề. Khác với cấu trúc truyền thẳng truyền thống, mạng nơ-ron nhân tạo có thể sử dụng mạng liên kết tổng quát, cho phép chỉ dùng một phần mạng. Các đơn vị xử lý cho cấu trúc mạng thưa này đang được phát triển.

Việc tích hợp lợi ích từ công cụ trí tuệ Phật giáo vào AI học sâu là khả thi với bộ xử lý hiện tại và một số bộ đang được phát triển. Ví dụ, như bằng chứng khái niệm, “ưu tiên lớp ngoài cùng bằng cấu trúc mạng thưa” có thể được triển khai để giải một bài toán thực tế đơn giản bằng công nghệ hiện nay. Qua đó, ta có thể so sánh giải pháp từ AI tích hợp công cụ trí tuệ Phật giáo với AI học sâu truyền thống và thực nghiệm. Một cỗ máy suy luận theo trực giác được biến đổi như vậy – sử dụng giáo lý Phật giáo – sẽ có khả năng mở rộng để giải quyết các vấn đề lớn hơn như biến đổi khí hậu với lượng dữ liệu tối thiểu, xác thực quan sát của Moravec rằng năng lực tính toán lớn hơn không đồng nghĩa với hệ thống thông minh hơn.

Kết luận

AI học sâu hiện nay tiêu hóa và phân tích khối lượng dữ liệu khổng lồ trong các lớp ẩn để huấn luyện mô hình. Khi mô hình ngày càng phức tạp, càng khó giải thích cách chúng hoạt động. Không thực tế khi giải bài toán phức tạp bằng mô hình mờ mịt. AI học sâu có nét tương đồng với giáo lý Phật giáo và có thể tự nâng tầm bằng cách hấp thụ các công cụ trí tuệ Phật giáo. Kiến trúc, thuật toán chính, tối ưu hóa và phân tích mô hình – nếu được truyền cảm hứng từ trí tuệ Phật giáo – sẽ cần ít dữ liệu hơn và tạo ra các giải pháp kỹ thuật minh bạch, toàn diện cho các vấn đề lớn như bệnh tật và biến đổi khí hậu. Một AI ít “nhân tạo” hơn nhưng thông minh hơn sẽ làm tan đi nỗi lo về “mùa đông AI” tiếp theo và mối đe dọa hiện sinh mà AI có thể gây ra cho loài người.

Subodh Saxena