Vậy các ứng dụng AI đang ở đâu?

Nghe bài viết:

Những người ủng hộ vibecoding và các công cụ agentic nói rằng họ làm việc hiệu quả hơn 2x, 10x – thậm chí có thể 100x! Có người còn tự xây dựng cả một trình duyệt web từ đầu. Thật ấn tượng!

Vì vậy, những người hoài nghi đặt câu hỏi hợp lý: vậy các ứng dụng đâu rồi? Nếu người dùng AI trở nên (hãy nói khiêm tốn) hiệu quả hơn gấp 2 lần, thì chúng ta nhìn vào đâu để thấy lượng phần mềm được tạo ra tăng gấp đôi? Những câu hỏi này đều xuất phát từ giả định rằng thế giới muốn nhiều phần mềm hơn, nên nếu chi phí tạo phần mềm giảm thì người ta sẽ làm nhiều hơn. Nếu bạn đồng ý với giả định đó, thì “hiệu ứng AI” – tức lượng phần mềm dư thừa mới – đang ở đâu?

Hãy xem PyPI, kho lưu trữ trung tâm cho các package Python. Nó lớn, công khai và được đo lường nhất quán, nên ta kỳ vọng sẽ thấy một chút hiệu ứng AI ở đây.

Đếm số lượng package

Cập nhật (Tháng 4/2026)

Đã có thay đổi kể từ khi bài này được xuất bản. Vào tháng 3/2026, số package mới trên PyPI đã vượt 25.000. Gần gấp đôi so với tháng 3/2025. Chúng tôi sẽ theo dõi xem liệu xu hướng này có được duy trì hay không.

Đó, bạn thấy không? Thời điểm phát hành ChatGPT. Biểu đồ phía trên có cho thấy một cuộc cách mạng năng suất phần mềm mang tính bước ngoặt không? Không.

một vài đỉnh nhỏ trong biểu đồ phía dưới (package mới mỗi tháng), trong cái mà ta có thể gọi là “kỷ nguyên AI” từ 2020 trở đi. Nhưng những đỉnh này phản ánh spam và malware, chứ không phải việc tạo package thực sự.1

chart_01_pypi_package_creation-260415205159

Biểu đồ hai phần cho thấy tổng số package trên PyPI tăng theo hàm mũ lên 800k, trong khi số package mới mỗi tháng dao động khoảng 5–15k, với thời điểm phát hành ChatGPT không tạo ra điểm bùng phát rõ rệt

Điều này khá kỳ lạ. Nếu AI giúp lập trình viên làm việc hiệu quả hơn, tại sao họ không tạo ra nhiều phần mềm hơn?

Đếm số lần cập nhật

Nhưng có thể bạn sẽ nói: việc tạo package không phải thước đo phù hợp. Ai cũng có thể tạo một “package” chỉ là demo hello world. Điều này luôn dễ hơn việc tạo ra thứ gì đó bền vững, được sử dụng thực tế. Ta cần nhìn vào các package “thực”, tức là những package được tải về, sử dụng và duy trì theo thời gian.

Vậy hãy xem một biểu đồ khác. Chúng ta lấy 15.000 package Python được tải nhiều nhất trên PyPI vào tháng 12/2025.2 Sau đó chia chúng thành các nhóm theo năm ra đời, và với mỗi nhóm, ta vẽ tần suất phát hành trung vị theo thời gian.3 Đây có vẻ là một chỉ số đại diện hợp lý cho việc sản xuất phần mềm thực sự được sử dụng.

Để thể hiện tần suất cập nhật của một nhóm, ta vẽ một đường. Mỗi đường bắt đầu bằng số lần phát hành trong 12 tháng đầu của các package ra đời năm đó, rồi tiếp tục khi package “già” đi.

Vậy chúng ta thấy gì? Các package có được cập nhật thường xuyên hơn sau khi ChatGPT xuất hiện không?

chart_02_releases_by_cohort_single-260415205250

Ờ… cũng có thể?

Rõ ràng các package ra đời sau ChatGPT được cập nhật thường xuyên hơn trong năm đầu (13 lần/năm) so với các package năm 2014 (6 lần/năm). Điều này thể hiện ở việc các đường bắt đầu cao hơn theo thời gian.

Nhưng xu hướng này dường như đã bắt đầu từ trước, quá sớm để quy cho AI. Tần suất cập nhật năm đầu đã tăng từ 2019 (10 lần/năm), trước khi các công cụ AI hiện đại xuất hiện. Có thể điều này đến từ việc phổ biến CI như GitHub Actions.

Một điểm nữa: các package càng lâu đời thì càng ít được cập nhật. Điều này vẫn không thay đổi. Nghĩa là AI không khiến người ta duy trì cập nhật thường xuyên hơn theo thời gian.

Liệu có phải do AI?

Nhưng chắc chắn một phần sự tăng này là do AI? Hãy đào sâu hơn.

Ta chia các package thành hai nhóm: có liên quan đến AI và không, dựa trên mô tả.4 Khi đó, có thấy hiệu ứng AI không?

chart_03_releases_by_cohort_and_ai-260415205315

Đây rồi! Hoặc ít nhất là có điều gì đó!

Các package không liên quan đến AI trông giống như trước thời ChatGPT: tăng nhẹ theo thời gian.

Ngược lại, các package liên quan đến AI có mức tăng mạnh về tần suất cập nhật. Ví dụ, các package AI ra đời năm 2023 đạt trung vị 20 lần phát hành trong 12 tháng đầu — gần gấp đôi các package không AI cùng năm.

Tóm lại: các package mới về AI được cập nhật thường xuyên hơn rất nhiều.

Hay là do độ phổ biến?

Tất nhiên, AI đang rất hot. Liệu việc package AI được cập nhật nhiều hơn chỉ đơn giản là vì chúng phổ biến hơn?

Ta chia tiếp 15.000 package thành hai nhóm: 7.500 phổ biến hơn và 7.500 ít phổ biến hơn.

Vậy quan sát trước đó có chỉ là do độ phổ biến?

chart_04_releases_2x2-260415205350

Không. Góc trên bên phải cho thấy rõ: các package AI phổ biến đạt 21–26 lần cập nhật/năm sau ChatGPT — hơn gấp đôi mức ~10 của package không AI.

Hiệu ứng >2x này tập trung ở các package AI phổ biến.

Nhưng câu hỏi quan trọng là: tại sao?

Vậy thì sao?

Hãy tóm tắt:

  1. Không có sự tăng rõ rệt về số package mới sau ChatGPT, và chỉ tăng nhẹ về cập nhật.

  2. Có xu hướng tăng nhẹ theo thời gian, nhưng đã tồn tại trước AI.

  3. Có sự tăng mạnh (>2x) ở các package AI phổ biến.

Từ đó, ta có thể loại trừ một số giả thuyết và đưa ra diễn giải hợp lý:5

  1. AI có làm tăng mạnh năng suất lập trình viên?

    Không. Không có dấu hiệu 10x hay 100x. Không có “bùng nổ package”.

    Bạn không bỏ lỡ điều gì cả.

  2. Một số dev có đang làm nhanh hơn nhờ AI?

    Có thể. Nhưng nếu có, thì số lượng không nhiều hoặc hiệu ứng không lớn. Tuy nhiên, có sự tăng ở các package AI phổ biến.

  3. Có phải mọi người đang xây dựng rất nhiều phần mềm để dùng AI?

    Có. Đây là hiệu ứng rõ nhất.

Vậy tại sao hiệu ứng này tập trung vào phần mềm AI?

“Skill issue”: Có thể người làm AI cũng là người giỏi dùng AI hơn, nên hiệu quả cao hơn. Nhưng nếu vậy, hiệu ứng phải xuất hiện ở tất cả package AI, không chỉ package phổ biến.

Tiền và hype 🤑💰: Dòng vốn và sự quan tâm đổ vào AI rất lớn. Có thể không phải dev làm nhanh hơn, mà là họ làm nhiều hơn vì được trả tiền nhiều hơn. Ví dụ: tỷ lệ package non-AI/AI năm 2021 là hơn 6:1, nhưng năm 2024 chỉ còn dưới 2:1.

Hiện chưa thể xác định yếu tố nào lớn hơn.

Nhưng có thể kết luận: tác động đo lường được rõ nhất của AI (ít nhất trên PyPI) không phải là bùng nổ phần mềm nói chung, mà là sự gia tăng mạnh và tập trung ở các package thuộc hệ sinh thái AI.