AI agent có thực sự đang làm chậm chúng ta?

Nghe bài viết:

Khi nói về AI agents và các công cụ AI, phần lớn thảo luận đều tập trung vào khả năng tăng hiệu suất: iteration nhanh hơn, tạo nhiều code hơn trong thời gian ngắn hơn.

Tuần trước, chúng tôi đã phân tích cách Uber áp dụng AI nội bộ. Công ty này xây dựng gần một chục hệ thống để xử lý code do AI tạo ra. Tuy nhiên, khi đo lường tác động, họ chỉ tập trung vào việc output tăng lên — ví dụ các dev dùng AI nhiều tạo ra nhiều pull request hơn, với nhóm “power user” tạo nhiều PR hơn 52%.

Nhưng hoàn toàn không có bất kỳ đề cập nào đến chất lượng sản phẩm.

Và có những dấu hiệu cho thấy chất lượng sản phẩm đang giảm.

Bài viết này đi vào chủ đề ít được bàn tới này, bao gồm:

  1. Anthropic: website flagship bị giảm chất lượng UX

  2. Amazon: AI agent gây ra sự cố hệ thống (SEV)

  3. Big Tech: áp lực “phải dùng AI nếu không sẽ bị xem là kém hiệu quả”

  4. OpenCode: tốn nhiều thời gian dọn dẹp hơn

  5. Startup: AI làm chậm tốc độ dài hạn

  6. Research: AI agents không đạt như kỳ vọng

  7. Giải pháp: cần cách tiếp cận mới

1. Anthropic: website flagship bị giảm chất lượng

Ý tưởng cho bài viết này bắt đầu từ một bug UX rất khó chịu trên website của Claude.

Khi nhập prompt, nội dung thường xuyên bị mất trong quá trình load trang.

Quy trình xảy ra lỗi:

  1. Textbox hiển thị khi trang bắt đầu render

  2. Người dùng bắt đầu gõ

  3. Dữ liệu subscription load sau đó

  4. Textbox bị reset → mất nội dung đã nhập

Đây là một bug rất cơ bản — nhưng lại xảy ra trên landing page của Claude, ảnh hưởng đến hàng triệu người dùng trả phí, và xảy ra mỗi lần truy cập.

Không ai tại Anthropic phát hiện ra lỗi này trước khi người dùng phản ánh.

Trong khi đó, khoảng 80% code của công ty được tạo bởi AI.

Sau khi bị phản ánh công khai, bug được fix trong 3 ngày.

Tuy nhiên, câu hỏi đặt ra:

  • Còn bao nhiêu bug chưa được phát hiện?

  • Có bao nhiêu feature được ship với chất lượng chưa đủ?

Anthropic đang ưu tiên tốc độ hơn chất lượng.

Điều này có thể hợp lý về mặt kinh doanh:

  • Ship nhanh hơn đối thủ

  • Fix sau

  • Vẫn dẫn đầu thị trường

2. Amazon: AI agent gây sự cố hệ thống

Khác với Anthropic, Amazon ưu tiên độ ổn định.

Tuy nhiên, gần đây xuất hiện xu hướng gia tăng sự cố (SEV) liên quan đến AI agents.

Các sự cố có “phạm vi ảnh hưởng lớn” và liên quan đến các thay đổi được hỗ trợ bởi AI.

Một số điểm đáng chú ý:

  • AI usage còn mới → chưa có best practices

  • Các kỹ sư junior cần senior review khi dùng AI

Một sự cố cụ thể:

  • AI agent quyết định “delete và recreate environment”

  • Gây downtime 13 giờ

Về nguyên tắc:

Lỗi không phải do AI — mà do engineer không thiết lập guardrails.

Tuy nhiên:

AI agents có thể gây ra những hành vi mà dev không lường trước.

Điều này tạo ra một learning curve hoàn toàn mới.

3. Big Tech: “không dùng AI = kém hiệu quả”

Tại nhiều công ty lớn, việc sử dụng AI đang trở thành một KPI ngầm.

Ví dụ:

Meta theo dõi token usage trong performance review.

  • Low output + low AI usage → bị xem là low performer

  • High output + high AI usage → tín hiệu tích cực

Tại Uber:

  • “Power users” (dùng AI nhiều) tạo nhiều PR hơn

Nhưng vấn đề:

Số lượng PR không phản ánh chất lượng.

Tuy nhiên, narrative ở cấp CEO lại khác:

“Những người dùng AI nhiều đang tăng năng suất theo cách chưa từng thấy.”

Và xa hơn:

“Thay vì thuê thêm engineer, có thể chỉ cần thêm AI agents.”

Hệ quả:

Engineer bị ép phải dùng AI — dù ảnh hưởng đến chất lượng.

Không dùng AI → rủi ro về sự nghiệp.

4. OpenCode: tốn thời gian dọn dẹp hơn

Dax Raad, founder của OpenCode, cảnh báo rằng:

  • AI làm giảm tiêu chuẩn code

  • Khuyến khích ship nhanh thay vì refactor

  • Tăng tech debt

Kết quả:

Team tốn nhiều thời gian hơn để cleanup thay vì phát triển.

5. Startup: AI làm chậm tốc độ dài hạn

Nhiều founder và CTO bắt đầu nhận ra một nghịch lý:

AI giúp bắt đầu nhanh hơn — nhưng lại làm chậm về lâu dài.

Các công cụ LLM giúp:

  • Viết code nhanh

  • Tạo prototype nhanh

  • Giảm friction khi bắt đầu

Nhưng cái giá phải trả là:

  • Code phình to (bloated)

  • Khó maintain

  • Thiếu cấu trúc rõ ràng

CTO của Sentry và nhiều founder khác quan sát rằng:

Velocity ban đầu tăng — nhưng velocity dài hạn giảm.

Lý do:

  • Tech debt tăng nhanh

  • Refactor bị trì hoãn

  • Code khó hiểu hơn

Điều này đặc biệt nguy hiểm với startup — nơi tốc độ dài hạn quyết định sống còn.

6. Research: AI không đạt như kỳ vọng

Một số nghiên cứu bắt đầu cho thấy pattern tương tự:

  • Tăng tốc ngắn hạn

  • Giảm hiệu quả dài hạn

Các công cụ AI coding:

  • Tạo nhiều code hơn

  • Nhưng làm tăng tech debt đáng kể

Điều này dẫn đến:

  • Nhiều bug hơn

  • Chi phí maintain cao hơn

  • Giảm chất lượng hệ thống

Velocity “ảo” — nhìn nhanh hơn, nhưng thực tế chậm hơn.

Vấn đề cốt lõi

Các tổ chức đang đo lường sai:

  • Số dòng code

  • Số pull request

  • Mức độ sử dụng AI

Những metric này dễ đo — nhưng không phản ánh giá trị thực.

Những gì bị bỏ qua:

  • Chất lượng code

  • Maintainability

  • System design

  • User experience

Khi tối ưu sai metric, bạn tối ưu sai hệ thống.

AI agents đang thay đổi vai trò của engineer

Trong thế giới có AI agents:

  • Viết code trở nên dễ hơn

  • Nhưng đánh giá code trở nên khó hơn

Điều này làm tăng giá trị của:

  • System design

  • Code review

  • Architecture thinking

Engineer giỏi không phải là người viết code nhanh nhất — mà là người hiểu hệ thống tốt nhất.

Chúng ta nên làm gì?

Một số hướng tiếp cận được đề xuất:

1. Tăng cường validation

  • Test chặt hơn

  • Review kỹ hơn

  • Không tin output của AI mặc định

2. Thiết lập guardrails cho AI agents

  • Giới hạn quyền của agent

  • Tránh hành động tự động nguy hiểm

3. Quay lại các nguyên tắc cũ

  • QA nghiêm ngặt

  • Testing đầy đủ

  • Code review kỹ lưỡng

4. Đo lường đúng thứ quan trọng

  • Impact thay vì output

  • Quality thay vì quantity

Kết luận

AI agents không đơn giản là “tăng tốc phát triển”.

Trong nhiều trường hợp, chúng đang:

  • Tăng output

  • Nhưng giảm chất lượng

  • Và làm chậm hệ thống về lâu dài

Insight quan trọng:

AI không tự động làm bạn nhanh hơn — nó chỉ khuếch đại cách bạn làm việc.

Nếu quy trình tốt → nhanh hơn

Nếu quy trình kém → tệ hơn nhanh hơn

Cuối cùng:

AI agents không thay thế engineering discipline — chúng làm cho nó trở nên quan trọng hơn bao giờ hết.