Thành lũy hay tài nguyên chung

Nghe bài viết:

Tóm tắt: Vốn Mỹ đã tài trợ cho AI với giả định rằng nó sẽ trở thành độc quyền lớn tiếp theo. Các mô hình open-weight đang biến năng lực mà “thành lũy” đó được kỳ vọng bảo vệ thành hàng hóa. Sự va chạm giữa hai điều này hiện đang định hình hướng đi của ngành AI Hoa Kỳ — và cả quốc gia.

moat-260505203611


AI của Mỹ được tài trợ dựa trên một cược cụ thể. Cược đó là các mô hình tiên phong (frontier models) sẽ trở thành ngành kinh doanh độc quyền lớn tiếp theo — “kẻ thắng ăn tất cả”, chi tiêu vốn (capex) được biện minh bằng độc quyền, một thị trường được bảo vệ về cấu trúc đủ để hỗ trợ định giá nghìn tỷ đô và dòng vốn cần thiết để xây dựng chúng. Sau hai năm rưỡi, giả định đó đang vỡ. Không phải chậm rãi. Không phải ở rìa. Mà hiển hiện rõ trong các benchmark công khai, repo mã nguồn mở, số lượt tải trên Hugging Face, và bảng giá inference.

Sự đổ vỡ này rất dễ mô tả. Các mô hình open-weight — phần lớn do các phòng lab Trung Quốc phát hành, được phục vụ qua một stack hạ tầng mã nguồn mở chủ yếu của phương Tây — đang biến năng lực mà “thành lũy” lẽ ra phải bảo vệ thành hàng hóa. Năng lực mà một lab đóng của Mỹ có thể tính giá doanh nghiệp vào năm 2024 thì nay đã có thể tải xuống, triển khai trên phần cứng thuê, với chi phí chỉ còn vài phần trăm vào năm 2026. Khoảng cách giữa frontier mở và frontier đóng là sáu đến mười hai tháng. Và nó đang thu hẹp, không phải mở rộng.

Sự va chạm giữa hai thực tế — rằng vốn Mỹ đã trả tiền để xây “thành lũy”, và công nghệ không còn cung cấp được nó — là lực lượng quan trọng nhất trong ngành AI hiện nay. Mọi thứ khác, bao gồm cả hướng chính sách của chính phủ Mỹ trong 18 tháng tới, đều là hệ quả của cách mà va chạm này được giải quyết.


Luận điểm về vốn

Để hiểu điều gì đang bị đe dọa, hãy nhìn theo dòng tiền. Các lab frontier của Mỹ và các đối tác hyperscaler của họ đã cam kết khoảng một nghìn tỷ đô la chi tiêu vốn cho AI trong bốn năm tới — trung tâm dữ liệu, cụm GPU, hạ tầng điện, cáp quang, toàn bộ stack vật lý cần cho inference frontier. Những cam kết này không được đưa ra với giả định biên lợi nhuận kiểu SaaS. Biên lợi nhuận SaaS không thể gánh nổi quy mô vốn như vậy. Các cam kết được đưa ra với giả định rằng năng lực frontier sẽ hành xử, ở quy mô lớn, như một độc quyền được điều tiết: chi phí cố định cao, biên lợi nhuận cận biên cao, lợi nhuận bền vững, rất ít đối thủ.

Định giá của các lab cũng phản ánh giả định đó. OpenAI, Anthropic, và các bộ phận mô hình của Google và Meta đang được định giá — riêng lẻ hoặc qua công ty mẹ — ở mức chỉ hợp lý nếu năng lực frontier cuối cùng có thể áp đặt mức giá kiểu độc quyền. Loại bỏ giả định độc quyền, phép toán không còn đúng. Trung tâm dữ liệu vẫn tồn tại. Hóa đơn compute vẫn tồn tại. Các nhà đầu tư đã tài trợ cho việc xây dựng không có lối thoát dễ dàng nếu đây chỉ là một ngành với biên lợi nhuận hàng hóa.

Đây là áp lực mang tính cấu trúc. AI frontier được tài trợ như một “thành lũy”. Các cam kết tài chính là lớn và bền vững. Công nghệ lẽ ra phải tạo ra “thành lũy” lại đang thất bại. Vốn, khi đối mặt với khoảng cách này, không âm thầm chấp nhận lợi nhuận thấp hơn. Vốn sẽ tìm cách tạo “thành lũy” bằng các phương tiện khác. Và nỗ lực đó chính là nội dung của giai đoạn tiếp theo trong chính sách AI của Mỹ.


Tài nguyên chung (commons)

Hệ sinh thái open-weight không xuất hiện từng bước. Nó đến theo một làn sóng. Cuối năm 2024, một phòng lab Trung Quốc tên là DeepSeek phát hành một mô hình với chi phí huấn luyện khoảng 5,6 triệu đô compute, so với ước tính 500 triệu đến 1 tỷ đô cho mô hình frontier đóng của Mỹ mà nó được so sánh. Khoảng cách hiệu năng trên các benchmark chung là sáu đến mười hai tháng. Khoảng cách chi phí inference nghiêng về open-weight từ 10 đến 30 lần. Mô hình đi kèm giấy phép linh hoạt, có thể tải xuống, chỉnh sửa, triển khai trên một node 8 GPU bởi bất kỳ ai có đủ dung lượng và kiên nhẫn đọc README.

Đó là mũi nhọn đầu tiên, không phải toàn bộ câu chuyện. Đến giữa năm 2025, frontier open-weight từ hệ sinh thái Trung Quốc — DeepSeek, Qwen, Kimi, GLM, MiniMax — đã tích lũy thành một baseline cạnh tranh. Llama, Mistral và hàng loạt dự án cộng đồng nhỏ hơn lấp đầy phần còn lại. Các lab đóng của Mỹ vẫn dẫn đầu ở đỉnh cao năng lực. Nhưng bên dưới đỉnh đó, đường cong đang bị “đóng lại” từ phía dưới với tốc độ khiến khoảng cách chỉ còn là vấn đề sáu đến mười hai tháng, không còn là một thế hệ.

Bên dưới việc phát hành mô hình là hệ sinh thái mở cung cấp nó. vLLM phục vụ weights với throughput cấp production. llama.cpp chạy chúng trên laptop của developer. Ollama đóng gói trải nghiệm cho người dùng không kỹ thuật. LangChain và LlamaIndex cung cấp lớp orchestration mà hai năm trước chỉ tồn tại bên trong tổ chức sản phẩm của OpenAI. Không công cụ nào trong số này thuộc về các lab đóng. Phần lớn là dự án mã nguồn mở từ Mỹ hoặc Anglosphere. Hạ tầng mang tính trung lập về địa lý và kinh tế. Weights thì không.


Bài toán “đào thoát”

Bài viết tuần trước lập luận rằng AI frontier đang được bán dưới giá vốn cấu trúc vì người dùng cung cấp dữ liệu huấn luyện, và khi giai đoạn “học nghề” kết thúc, giá sẽ tăng mạnh. Nhưng có một giả định ngầm: khi giá tăng, người dùng không có nơi nào để đi.

Giả định đó không còn đúng. Một người dùng đang cân nhắc gói 250 đô/tháng khi giá tăng có thể, ngay hôm nay, chạy một mô hình open-weight tương đương với 15 đô tiền cloud compute hoặc 0 đô trên máy cá nhân đủ mạnh. Chi phí “đào thoát” là một cuối tuần tích hợp và giảm nhẹ năng lực — mức giảm mà với đa số workload, người dùng không nhận ra. Với doanh nghiệp, mức giảm còn nhỏ hơn và tiết kiệm lớn hơn.

Đây là vấn đề chiến lược với các lab đóng, nhưng là vấn đề cấu trúc với vốn Mỹ. Thỏa thuận ban đầu — trợ giá, huấn luyện, rồi tăng giá — giả định có lock-in tại thời điểm tăng giá. Lock-in không tồn tại nếu lựa chọn tốt thứ hai là miễn phí. Và nếu không có lock-in, thì mức giá sau “học nghề” mà toàn bộ cấu trúc vốn phụ thuộc cũng không tồn tại.

Định giá cần một “thành lũy”. Công nghệ không còn cung cấp nó. Vốn vẫn sẽ cố tạo ra nó.


Chủ nghĩa tư bản làm gì khi sự khan hiếm biến mất

Trong các ngành mà công nghệ không tạo được “thành lũy” tự nhiên như kỳ vọng tài chính, một động thái lặp lại là tạo ra sự khan hiếm bằng các phương tiện khác. Chủ nghĩa tư bản Mỹ, bất chấp hình tượng của nó, đặc biệt giỏi việc này. Nó đã làm điều đó trong dược phẩm (bằng sáng chế và độc quyền FDA), trong tài chính (độ phức tạp pháp lý), và trong viễn thông (phân bổ phổ tần và quyền hạ tầng).

Khi công nghệ tạo ra thứ có xu hướng trở thành hàng hóa, vốn không chấp nhận lợi nhuận hàng hóa. Nó dùng ba công cụ: bao vây bằng quy định, tích hợp dọc, và phân phối gộp.


Ba dự đoán cho hướng đi của Mỹ

1. Bao vây bằng quy định dưới danh nghĩa an ninh

(Mô hình open-weight Trung Quốc bị hạn chế dần qua compliance, không cần luật mới.)

2. Các lab trở thành nhà vận hành

(Lab không bán model nữa mà bán output — dịch vụ AI hoàn chỉnh.)

3. Thị trường phân mảnh

(Mỹ bị “đóng”, phần còn lại của thế giới dùng open + alternative stack.)


Tấm gương ngành ô tô

Bảo hộ không cứu ngành — chỉ kéo dài sự suy giảm.


Ai phải trả giá

  • Người dùng Mỹ

  • Developer & startup

  • Chính các lab Mỹ (dài hạn)

  • Ảnh hưởng toàn cầu


Nên làm gì

  • Xây trên commons

  • Thiết kế đa vùng

  • Tính yếu tố chính sách vào kiến trúc


Khung kết luận

Chủ nghĩa tư bản Mỹ rất giỏi trong phân bổ, nhưng không giỏi khi đối mặt với sự dồi dào.

Sự va chạm giữa cấu trúc vốn và commons open-weight sẽ định hình ngành AI trong thập kỷ tới.

Câu hỏi không phải là open-weight có đe dọa các lab hay không — mà là Mỹ sẽ chọn bảo vệ thành lũy hay phát triển tài nguyên chung.

Cho đến hiện tại, lựa chọn đang nghiêng về phía thành lũy.