1. Kỷ nguyên của Dữ liệu loài người (Hiện tại)
Đặc điểm: Đây là kỷ nguyên mà chúng ta đang ở, với sự thống trị của các mô hình ngôn ngữ lớn (LLM) và các hệ thống AI khác. Những hệ thống này được huấn luyện trên các bộ dữ liệu khổng lồ do con người tạo ra (văn bản, hình ảnh, mã nguồn...).
Thành tựu: Phương pháp này đã tạo ra những AI có năng lực ấn tượng, có khả năng bắt chước và tái tạo lại kiến thức của con người ở mức độ cao.
Hạn chế: Năng lực của AI bị giới hạn bởi phạm vi và chất lượng của dữ liệu do con người cung cấp. AI chỉ có thể giỏi bằng hoặc kém hơn một chút so với kiến thức tổng hợp của nhân loại. Nó khó có thể tạo ra những đột phá thực sự vượt ngoài kinh nghiệm của con người.
2. Kỷ nguyên của Trải nghiệm (Tương lai)
Ý tưởng cốt lõi: Thay vì chỉ học từ dữ liệu có sẵn, các tác nhân AI (AI agents) sẽ học hỏi chủ yếu thông qua trải nghiệm của chính chúng khi tương tác với một môi trường (có thể là môi trường mô phỏng hoặc thế giới thực).
Phương pháp học: Quá trình này về cơ bản là học tăng cường (Reinforcement Learning) ở quy mô lớn. AI sẽ tự mình hành động, quan sát kết quả và nhận "tín hiệu phản hồi" (ví dụ: thành công hay thất bại, phần thưởng hay hình phạt) từ môi trường để tự cải thiện.
Vượt qua giới hạn của con người: Bằng cách tự tạo ra kinh nghiệm, AI có thể khám phá những kiến thức, chiến lược và giải pháp mà con người chưa từng nghĩ đến. Đây được xem là con đường để đạt tới trí tuệ siêu việt (Superhuman Intelligence), thay vì chỉ dừng lại ở việc bắt chước con người.
Mô hình thế giới (World Models): Để bắt đầu, AI có thể được cung cấp một "mô hình thế giới" mô phỏng. Nó sẽ dùng mô hình này để đưa ra dự đoán, thử nghiệm các giả thuyết trong môi trường ảo, sau đó đối chiếu với thế giới thực để liên tục tinh chỉnh mô hình và hành động của mình.
Các điểm chính và ý nghĩa
Từ Bắt chước đến Sáng tạo: AI sẽ không chỉ là một công cụ phản hồi các yêu cầu dựa trên dữ liệu đã học, mà sẽ trở thành một hệ thống chủ động có khả năng dự đoán nhu cầu, tối ưu hóa hoạt động và tự khám phá các cơ hội mới.
Dòng chảy kinh nghiệm liên tục: AI sẽ học hỏi từ một "dòng chảy kinh nghiệm" kéo dài, tương tự như cách con người học hỏi và phát triển qua thời gian, thay vì chỉ qua những tương tác ngắn gọn, rời rạc.
Thách thức về "Sự tương thích" (Alignment Problem): Kỷ nguyên này cũng đặt ra một thách thức lớn về an toàn AI. Khi một AI tự học từ trải nghiệm của chính nó, việc đảm bảo các mục tiêu của nó luôn phù hợp với giá trị và lợi ích của con người trở nên vô cùng khó khăn và là một vấn đề kỹ thuật chưa có lời giải đáp thỏa đáng.