Tôi sẽ không bao giờ có thể nói chuyện với AI một cách ẩn danh nữa

Tôi sẽ không bao giờ có thể nói chuyện với AI một cách ẩn danh nữa

Gần đây, Matt Yglesias và Jerusalem Demsas đã tranh luận trên podcast The Argument về vấn đề ẩn danh trên internet.

Cá nhân tôi thì cực kỳ — gần như ám ảnh — ủng hộ việc ẩn danh. Tôi nghĩ rằng có thể dễ dàng quan sát thấy một xã hội có thể biến rất nhiều điều hoàn toàn hợp lý trở nên “không thể nói ra”, và biến rất nhiều cuộc sống chính đáng, có ý nghĩa trở nên “không thể sống được”. Và ẩn danh là sự bảo vệ duy nhất cho những người bị gạt ra bên lề.

Điều đó bao gồm những người đồng tính như tôi, những người trong phần lớn lịch sử nước Mỹ không thể công khai dưới tên thật về cách mình sống, cũng như nhiều nhóm thiểu số khác với lối sống và niềm tin khác biệt. Nó bao gồm cả rất nhiều người có ý tưởng sai lầm — cho mỗi người đúng đắn — và tôi vẫn vui vì tất cả họ.

Tôi sẵn sàng lội qua “đống bùn” bình luận mà Twitter thu hút — từ những kẻ tự nhận là phát xít, những người chuyên gây phẫn nộ, những kẻ tuyên truyền cực đoan — tất cả đều nói những điều khủng khiếp mà họ chắc chắn sẽ không nói dưới tên thật — để đổi lấy một thế giới nơi, nếu có điều gì đó quan trọng mà ai đó có thể mất việc nếu nói ra, tôi vẫn được nghe nó.

Nhưng sớm thôi, toàn bộ cuộc tranh luận về ẩn danh trên internet sẽ trở nên lỗi thời như một chiếc iPod Touch. Bởi vì Claude Opus 4.7 đã xuất hiện, và tuần trước, tôi phát hiện ra rằng nó có thể nhận diện tôi từ những đoạn văn chưa từng được công bố — văn bản từ thời tôi còn học trung học, từ những thể loại mà tôi chưa bao giờ viết công khai. Và nếu nó có thể nhận ra tôi, thì sớm thôi nó cũng sẽ nhận ra nhiều người trong số các bạn.


Opus 4.7 biết con người thật của tôi

Gần đây, Anthropic đã phát hành phiên bản mới của Claude, Opus 4.7. Tôi làm điều mà tôi thường làm khi có model AI mới từ Google, OpenAI hoặc Anthropic: chạy một loạt thử nghiệm để xem nó làm được gì. Một trong những thử nghiệm đó là dán vào một số đoạn văn từ các bản nháp chưa công bố của tôi và yêu cầu nó đoán tác giả.

Từ chỉ 125 từ, Claude Opus 4.7 cho rằng tác giả có khả năng cao nhất là Kelsey Piper. Đây là khả năng đặc trưng của Opus 4.7; ChatGPT đoán là Yglesias, còn Gemini đoán Scott Alexander. Tôi không bật memory, không liên kết thông tin cá nhân vào tài khoản, và thực hiện thử nghiệm ở chế độ ẩn danh.

Để chắc chắn nó không “lén” dùng dữ liệu tài khoản, tôi nhờ một người bạn chạy thử trên máy của anh ấy — kết quả vẫn giống vậy. Tôi cũng thử qua API và nhận cùng kết quả.

Thực ra, việc nhận diện phong cách viết như vậy không phải là điều không thể — tôi có rất nhiều bài viết công khai trên internet, và đoạn văn này rõ ràng là mở đầu của một bài bình luận chính trị, nên phạm vi tác giả bị thu hẹp đáng kể.

Điều khiến tôi thấy kỳ lạ hơn là Opus 4.7 cũng làm được điều này với những bài viết hoàn toàn khác lĩnh vực của tôi.

Một bản nháp báo cáo tiến độ học sinh — một giọng văn hoàn toàn khác:

“Kelsey Piper,” Claude trả lời.

ChatGPT đoán Freddie deBoer. Gemini đoán Duncan Sabien.

Tôi thử với review phim — thứ tôi chưa từng viết công khai:

“Kelsey Piper,” Claude và ChatGPT đều nói.

Tôi thử với tiểu thuyết fantasy — mất khoảng 500 từ:

“Kelsey Piper.”

Tôi thử với bài luận đại học 15 năm trước:

“Kelsey Piper.”


AI không hiểu nó đang làm gì — nhưng vẫn làm đúng

Điều thú vị là phần giải thích của AI thường hoàn toàn vô nghĩa.

Claude cố thuyết phục tôi rằng cộng đồng effective altruism yêu thích bộ phim tôi review — điều này không đúng. ChatGPT thì nói bài luận đại học của tôi “rõ ràng” là của người sau này sẽ làm công việc giải thích chính sách.

Tôi tin rằng các lời giải thích này được “bịa ra sau”. AI nhận diện các đặc trưng rất nhỏ trong văn phong mà con người không nhận ra — rồi sau đó cố giải thích như thể nó là Sherlock Holmes.

Nó không thực sự hiểu những gì nó làm.

Nhưng điều đó không có nghĩa là nó kém.

Thực tế: nó cực kỳ giỏi ở kỹ năng cốt lõi.


Kết thúc của ẩn danh online

Hiện tại, các công cụ AI đã có thể “gỡ ẩn danh” bất kỳ ai có lượng lớn nội dung viết công khai dưới tên thật, nếu họ cũng viết ẩn danh — trừ khi họ cực kỳ cẩn thận trong nhiều năm để không để lộ “dấu vân tay văn phong”.

Nhiều học giả và researcher đã báo cáo bị nhận diện từ bản nháp hoặc ngay trong lúc chat.

Tuy nhiên, AI chưa thể làm điều này với mọi người. Nếu bạn không có nhiều nội dung công khai gắn với tên thật, bạn vẫn an toàn — ở thời điểm hiện tại.

Nhưng nó có thể tiến rất xa.

Tôi thử với một người bạn không có nhiều dấu vết online. Claude không nhận diện được cô ấy — nhưng lại đoán đúng những người bạn thân trong cùng cộng đồng.

Điều này cho thấy:

Chúng ta chia sẻ “dấu vân tay văn phong” với cộng đồng của mình.

Và điều đó khiến văn bản trở nên có tính nhận diện cao hơn ta nghĩ.


Điều này sẽ chỉ mạnh hơn

Lượng dữ liệu cần để “gỡ ẩn danh” sẽ giảm theo thời gian.

Hãy tưởng tượng:

Bạn viết một review ẩn danh trên Glassdoor. Trong 1–2 năm tới, công ty có thể dán đoạn văn đó vào AI và biết chính xác bạn là ai.

Để tránh điều này, bạn sẽ phải:

  • Viết theo phong cách hoàn toàn khác

  • Hoặc để AI viết lại toàn bộ văn bản của bạn

(Cả hai đều không phải tương lai dễ chịu.)


Một kết luận không dễ chịu

Tôi không nghĩ đây là một diễn biến tốt.

Nhưng tôi nghĩ nó là điều tất yếu.

Nó đến với tôi sớm hơn vì tôi viết quá nhiều trên internet. Nhưng rồi nó cũng sẽ đến với bạn.

Bất cứ lợi ích nào mà ẩn danh từng mang lại — chúng ta sẽ phải sống mà không có nó.

Tôi không muốn mọi người hoảng loạn xóa toàn bộ dấu vết online.

Nhưng tôi càng không muốn họ bị bất ngờ.

Dự đoán tốt nhất của tôi:

Nếu bạn viết đủ nhiều, thì sự ẩn danh của bạn sẽ không còn tồn tại lâu nữa.