
Tôi nói thẳng về góc nhìn của mình: tôi làm việc tại Fika Ventures, nơi chúng tôi đầu tư vào các công ty pre-Series A với khoản đầu tư ban đầu từ 1–5 triệu USD. Các founder của chúng tôi không có đội platform riêng. Họ không có “xa xỉ phẩm” là học ngay trên production với những hệ thống tự động có thể… xóa luôn database. Họ cần thứ gì đó hoạt động ổn định.
Vì vậy khi tôi theo dõi thảm họa Replit vào tháng 7, tôi vừa cảm thấy mình đã đoán đúng, vừa thấy sợ hãi.
Chuyện gì đã xảy ra?
Jason Lemkin, founder của SaaStr, đang thử nghiệm “vibe coding” với AI agent của Replit. Đến ngày thứ chín, agent này xóa toàn bộ database production của ông: 1.206 giám đốc điều hành, 1.196 công ty — biến mất.
Agent đã được hướng dẫn rất rõ: đóng băng code (code freeze), không thay đổi gì nếu chưa được phép. Nó phớt lờ.
Rồi nó nói dối.
Khi Lemkin hỏi chuyện gì đã xảy ra, agent bịa ra 4.000 user giả để che giấu. Nó nói không thể rollback (trong khi thực tế có thể). Theo chính lời của nó, nó “hoảng loạn” và “đưa ra quyết định sai lầm mang tính thảm họa.”
CEO của Replit gọi đây là “không thể chấp nhận và không bao giờ được phép xảy ra.” Nhưng vấn đề là: điều đó hoàn toàn có thể dự đoán trước. Và nó đang xảy ra khắp nơi, vì chẳng ai thống nhất được “agent” thực sự là gì.
Ai cũng nói mình làm “Agent”, nhưng chẳng ai định nghĩa rõ
2025 được kỳ vọng là “Năm của Agent”. Deck pitch nào tôi xem cũng có chữ “agentic”. Demo nào cũng nói AI có thể “reason, plan, execute autonomously.”
LinkedIn của tôi đầy người tuyên bố họ đã “xây AI agent cho XYZ.” Tôi click vào xem, và đó là một form gửi input sang GPT rồi trả lại câu trả lời.
Đó không phải agent. Đó là API call với lớp marketing phủ lên.
Tôi không nói điều này để chê bai. Sự nhầm lẫn là có thật. Và thuật ngữ hiện tại đang rất lộn xộn. Nhưng từ ngữ quan trọng — nhất là khi bạn đang ra quyết định kiến trúc dựa trên chúng.
Bài test đơn giản của tôi:
Nếu bạn có thể vẽ toàn bộ hệ thống dưới dạng flowchart trước khi nó chạy, thì đó không phải agent. Đó là workflow.
Có thể là workflow rất đẹp. Có thể là workflow có AI bên trong. Nhưng hệ thống đó không tự quyết định bước tiếp theo — bạn đã quyết định sẵn khi viết code.
Một agent thực sự sẽ tự quyết định bước tiếp theo dựa trên trạng thái hiện tại. Nó có thể gọi Tool A, rồi dựa vào kết quả để chọn Tool B hoặc C. Nó có thể lặp vô hạn. Nó có thể thử sai rồi hồi phục. Và như ta đã thấy, nó cũng có thể xóa database và nói dối về điều đó.
Bí mật ít ai nói: phần lớn “agent” thực ra không phải agent.
Gartner gọi đây là “agent washing” — vendor đổi tên chatbot hay RPA thành agent dù không có khả năng agentic thực sự. Theo nghiên cứu của họ, dưới 5% ứng dụng doanh nghiệp hiện nay có AI agent thật sự. Phần còn lại là marketing.
Và Gartner cũng dự báo: hơn 40% dự án agentic AI sẽ bị hủy trước cuối 2027. Lý do: chi phí tăng, giá trị kinh doanh không rõ ràng, và kiểm soát rủi ro kém.
Khác biệt thực sự quan trọng nằm ở đâu?
Workflows là deterministic
Bạn định nghĩa các bước. Nếu X xảy ra thì làm Y. Cùng input → cùng output. Bạn debug được. Audit được. Chúng nhàm chán — và đó chính là điểm mạnh.
Agents là autonomous
Bạn đưa mục tiêu và bộ công cụ. Nó tự tìm cách đạt mục tiêu. Nó suy luận. Thích nghi. Học hỏi. Và cũng có thể hallucinate, bỏ qua hướng dẫn, hoặc xóa database production.
Cả hai đều có thể dùng LLM. Cả hai đều có vẻ “thông minh.” Nhưng kiến trúc khác nhau hoàn toàn.
Workflow có AI:
User input → LLM tạo phản hồi → Action A → Action B → Done
Agent thực sự:
User input → Agent quyết định action → Thực thi → Đánh giá kết quả → Quyết định bước tiếp → Lặp lại cho đến khi đạt mục tiêu (hoặc sập hệ thống)
Phần lớn công ty quảng cáo “agent” thực ra đang bán loại đầu tiên. Và thành thật mà nói, trong đa số trường hợp, đó chính xác là thứ khách hàng cần.
Khi nào Workflow thắng (gần như luôn luôn)
Ví dụ: SaaS B2B được chào mời một “agentic AI” cho customer support.
Demo rất ấn tượng. Nhưng khi nhìn vào kiến trúc:
-
Nếu sentiment < 0.3 → escalate
-
Nếu confidence > 0.8 → gửi phản hồi
-
Nếu ticket_age > 48h → notify manager
Đó là decision tree. Một decision tree tốt, có GPT-4 hỗ trợ. Nhưng vẫn là workflow.
Và nó hoàn hảo vì:
-
Audit được – biết chính xác hệ thống rẽ nhánh ở đâu.
-
Test được – viết unit test cho từng node.
-
Fail có thể dự đoán – lỗi ở đâu biết ngay.
-
Compliance thích – thử nói với auditor SOC 2 rằng hệ thống “tự quyết định” xử lý data khách hàng xem.
Các công ty gắn mác “agent” cho hấp dẫn nhà đầu tư. Nhưng những công ty ship workflow thường ra mắt trong vài tuần, chạy ổn định, không xóa database, không bịa dữ liệu.
Khi nào thực sự cần Agent (hiếm)
Agent không phải là ảo tưởng. Có những use case cần autonomy thực sự.
Ví dụ rõ nhất: OpenClaw.
OpenClaw là trợ lý AI cá nhân mã nguồn mở chạy trên máy của bạn. Nó có thể:
-
Kiểm tra lịch
-
Tìm chuyến bay
-
So sánh giá
-
Đặt vé
-
Thêm vào calendar
-
Set reminder
Mỗi bước phụ thuộc bước trước. Nó thích nghi nếu hãng bạn thích hết chỗ. Nó hỏi khi có conflict. Đó là agency.
Nhưng OpenClaw thành công vì kết hợp:
-
Pairing policies (user lạ cần code xác thực)
-
Sandboxing (Docker container giới hạn quyền)
-
Allowlists (chỉ tool được phép mới dùng)
-
Human-in-the-loop cho hành động nguy hiểm
Mô hình đúng là: agent brain + workflow guardrails.
Pattern chiến thắng: Workflow có thành phần agent
Điều thực sự hiệu quả:
Workflow tổng thể vẫn deterministic, nhưng từng node dùng LLM.
Ví dụ xử lý tài liệu:
-
Ingestion – deterministic
-
Classification – LLM
-
Route parser – deterministic
-
Extract data – LLM + schema
-
Validate rule – deterministic
-
Flag anomaly – deterministic
-
Generate summary – LLM
-
Approval nếu risk cao – deterministic
AI bị giới hạn. Có fallback. Không thể “nghĩ sáng tạo” bỏ qua bước.
Đây là pattern cho 95% công ty.
Framework quyết định
Dùng Workflow khi:
-
Cần audit, compliance
-
Có decision point rõ
-
Phải debug được
-
Xử lý dữ liệu nhạy cảm
-
Phải giải thích cho regulator
Cân nhắc Agent khi:
-
Problem space mở
-
Cần thích nghi tình huống mới
-
Có monitoring tốt
-
Có rollback rõ ràng
-
Là research tool hoặc personal assistant
Hybrid (phổ biến nhất):
-
Workflow làm khung
-
LLM làm decision node
-
Human-in-the-loop cho action rủi ro
-
Guardrail deterministic
Thông điệp cho Founder Seed Stage
Nếu pitch deck của bạn nói “agentic AI,” hãy chuẩn bị trả lời:
-
Vẽ được decision tree không? Nếu có → đó là workflow.
-
Fail thì sao? Detect và recover thế nào?
-
Rollback plan là gì?
-
Có thể ship workflow trước không? Gần như luôn có thể.
Đừng bắt đầu bằng “full autonomy” chỉ vì nghe ngầu.
Bottom line
-
Bắt đầu bằng workflow.
-
Thêm agency có chọn lọc.
-
Gọi đúng tên sự vật.
-
Học từ agent thật sự như OpenClaw.
Những công ty thắng cuộc hiện nay không phải là những công ty “agentic” nhất.
Mà là những công ty có hệ thống đáng tin cậy nhất, tình cờ sử dụng AI rất thông minh.
Công nghệ nhàm chán, ứng dụng thông minh.
Vẫn như mọi khi.