Giới thiệu
Xin chào! Gần đây tôi đã gặp khó khăn trong một dự án sử dụng Claude. "Tại sao AI này không hiểu ý định của tôi..." Trong lúc đang trăn trở, Anthropic đã chính thức công bố các kỹ thuật prompt engineering nội bộ của họ! Đây thực sự là một trải nghiệm mở mang tầm mắt.
Anthropic cuối cùng đã công bố các kỹ thuật prompt mà họ sử dụng nội bộ. Mặc dù chủ yếu được thiết kế cho Claude, nhưng hầu hết các kỹ thuật này có thể áp dụng cho các mô hình LLM khác. Điều họ nhấn mạnh là prompt engineering hiệu quả hơn so với việc fine-tuning mô hình. Lý do rất đơn giản: yêu cầu tài nguyên thấp hơn, chi phí thấp hơn và lặp lại nhanh hơn.
Nguyên tắc cốt lõi: 4 nguyên tắc cơ bản để tận dụng Claude 4
Đối với mô hình Claude 4 mới nhất, Anthropic đặc biệt nhấn mạnh 4 nguyên tắc cơ bản:
-
Hãy rõ ràng (Be Explicit)
Claude 4 là một người thực hiện chính xác hơn là một người mở rộng sáng tạo. Nếu bạn muốn hiệu suất "vượt quá mong đợi", bạn cần yêu cầu rõ ràng. Ban đầu tôi đã hướng dẫn một cách gián tiếp nhưng nó hoàn toàn không hiệu quả. -
Thêm ngữ cảnh (Add Context)
Giải thích lý do đằng sau hướng dẫn của bạn rất hiệu quả. Ví dụ, "đừng bao giờ sử dụng dấu chấm lửng" không hiệu quả bằng "đừng sử dụng dấu chấm lửng vì nội dung sẽ được đọc to", Claude 4 sẽ phản hồi phù hợp hơn. -
Cẩn thận với ví dụ (Vigilant with Examples)
Claude 4 quan sát cẩn thận đến từng chi tiết và học hỏi từ các ví dụ. Nếu bạn cung cấp ví dụ không phù hợp, bạn sẽ nhận được phản hồi không phù hợp tương tự. -
Hướng dẫn chủ động (Tell What TO Do)
"Hãy trả lời bằng các đoạn văn trôi chảy" hiệu quả hơn "đừng sử dụng markdown". Hãy cho biết nên làm gì thay vì không nên làm gì.
12 kỹ thuật cốt lõi được sắp xếp theo thứ tự ưu tiên
Dựa trên trải nghiệm thực tế của tôi, tôi giới thiệu theo thứ tự hiệu quả nhất!
1. Tận dụng trình tạo prompt
Việc yêu cầu AI viết prompt cho chính nó có thể cảm thấy hơi meta, nhưng nó thực sự hiệu quả! Ban đầu tôi đã hoài nghi, nhưng sau khi sử dụng trình tạo prompt trong Anthropic Console, nó tạo ra các prompt tốt hơn nhiều so với những gì tôi có thể nghĩ ra.
Nếu bạn không có bản nháp prompt, tốt nhất nên bắt đầu với trình tạo prompt trong Anthropic Console. Chỉ cần truyền đạt "Tôi cần một câu trả lời có cảm giác như thế này..." và nó sẽ đề xuất prompt phù hợp.
2. Hướng dẫn rõ ràng và trực tiếp
Anthropic có một quy tắc vàng: Hãy cho đồng nghiệp của bạn xem prompt của bạn, đặc biệt là người không quen với nhiệm vụ đó. Nếu họ cảm thấy bối rối, Claude cũng sẽ bối rối.
Tránh diễn đạt gián tiếp. Bạn cần truyền đạt cụ thể những gì bạn muốn cho AI. Ví dụ, "liệt kê 5 điểm" tốt hơn "cung cấp một số thông tin".
Hãy tưởng tượng Claude như một "nhân viên mới thông minh nhưng không có kiến thức nền tảng". Nó cần hướng dẫn rõ ràng. Các điểm chính:
- Cung cấp thông tin ngữ cảnh: Mục đích của nhiệm vụ, đối tượng độc giả, vị trí trong quy trình làm việc, tiêu chí thành công
- Chỉ định yêu cầu cụ thể: Nếu bạn chỉ cần mã, hãy nói rõ "chỉ xuất mã và không bao gồm nội dung khác"
- Hướng dẫn từng bước: Sử dụng danh sách đánh số hoặc dấu đầu dòng để đảm bảo thực hiện theo yêu cầu
So sánh ví dụ thực tế:
Hướng dẫn mơ hồ:
Hãy xóa thông tin cá nhân từ phản hồi của khách hàng này
Hướng dẫn rõ ràng:
Tôi đang ẩn danh phản hồi của khách hàng cho đánh giá hàng quý. 1. Thay thế tất cả tên khách hàng bằng "CUSTOMER_[ID]" (ví dụ: "Nguyễn" → "CUSTOMER_001")
2. Thay thế địa chỉ email bằng "EMAIL_[ID]@example.com"
3. Sửa số điện thoại thành "PHONE_[ID]"
4. Giữ nguyên tên sản phẩm cụ thể nếu được đề cập
5. Sao chép nguyên văn nếu không có thông tin cá nhân
6. Chỉ xuất thông tin đã xử lý và phân tách bằng "---"
Sự khác biệt về kết quả là rõ ràng! Với hướng dẫn mơ hồ, Claude vẫn bỏ sót tên khách hàng, nhưng với hướng dẫn rõ ràng, việc xử lý hoàn toàn chính xác. Điều này cũng đúng trong dự án của tôi. Ban đầu tôi nói "hãy tóm tắt phù hợp", nhưng khi chuyển sang hướng dẫn cụ thể, kết quả đã cải thiện đáng kể!
3. Prompt với nhiều ví dụ (Multi-shot Prompting)
Việc cho AI xem một vài ví dụ tốt hiệu quả hơn nhiều so với mô tả văn bản thuần túy. Ví dụ là người thầy tốt nhất.
Bằng cách cung cấp một vài ví dụ được tạo cẩn thận, bạn có thể cải thiện đáng kể độ chính xác, tính nhất quán và chất lượng đầu ra của AI.
Tại sao ví dụ lại hiệu quả như vậy?
- Độ chính xác: Giảm hiểu lầm về hướng dẫn
- Tính nhất quán: Đảm bảo cấu trúc và phong cách thống nhất
- Hiệu suất: Các ví dụ được chọn lọc cải thiện khả năng xử lý nhiệm vụ phức tạp của Claude
Trong trường hợp của tôi, ban đầu tôi chỉ nói "hãy phân tích dữ liệu này", nhưng khi tôi cho xem ví dụ "hãy phân tích như thế này", tôi nhận được phân tích chất lượng cao hoàn toàn khác!
Điểm cần lưu ý khi tạo ví dụ hiệu quả:
- Liên quan: Ví dụ phải phản ánh trường hợp sử dụng thực tế
- Đa dạng: Bao gồm các trường hợp biên và vấn đề tiềm ẩn, đảm bảo AI không học các mẫu không mong muốn
- Rõ ràng: Bọc bằng thẻ
<example>
(nhiều ví dụ được lồng trong thẻ<examples>
)
Phương pháp tốt nhất: Bao gồm 3-5 ví dụ đa dạng và liên quan. Càng nhiều ví dụ càng cải thiện hiệu suất cho các nhiệm vụ phức tạp.
So sánh hiệu quả: Phân tích phản hồi của khách hàng
- Phiên bản không có ví dụ: Claude viết mô tả dài dòng, định dạng không nhất quán và có thể bỏ sót nhiều phân loại
- Phiên bản có ví dụ: Đầu ra ngắn gọn, nhất quán, xác định chính xác nhiều danh mục và định dạng hoàn toàn như mong đợi
Bạn cũng có thể yêu cầu Claude đánh giá chất lượng ví dụ của bạn hoặc tạo thêm mẫu dựa trên ví dụ ban đầu. Điều này thực sự hữu ích!
4. Yêu cầu AI suy nghĩ (Chuỗi suy nghĩ)
Đối với các nhiệm vụ phức tạp, hãy yêu cầu AI trình bày rõ ràng quá trình lập luận. Chỉ cần thêm một câu "hãy suy nghĩ từng bước" có thể cải thiện đáng kể chất lượng.
Ban đầu tôi chỉ nói "hãy giải quyết vấn đề này", nhưng khi bắt đầu nói "hãy giải quyết từng bước", chất lượng câu trả lời đã cải thiện đáng kể!
Khi nào sử dụng chuỗi suy nghĩ:
- Tính toán toán học phức tạp, phân tích nhiều bước, viết tài liệu phức tạp
- Ra quyết định liên quan đến nhiều yếu tố
- Các nhiệm vụ chung yêu cầu suy nghĩ như con người
3 phương pháp chuỗi suy nghĩ:
- Phương pháp cơ bản: Chỉ cần thêm "suy nghĩ từng bước"
Hãy phân tích đề xuất đầu tư này. Hãy suy nghĩ từng bước.
- Phương pháp hướng dẫn: Làm rõ các bước suy nghĩ
Hãy phân tích đề xuất đầu tư. Đầu tiên, xem xét các yếu tố rủi ro, sau đó đánh giá tiềm năng lợi nhuận, và cuối cùng đưa ra lời khuyên.
- Phương pháp cấu trúc: Sử dụng thẻ XML để tách biệt suy nghĩ và câu trả lời
Hãy phân tích đề xuất đầu tư. Suy nghĩ trong thẻ <thinking> và đưa ra lời khuyên cuối cùng trong thẻ <answer>.
Điểm quan trọng: Claude không thực sự "suy nghĩ" theo nghĩa đúng nếu bạn không yêu cầu nó xuất ra quá trình suy nghĩ.
So sánh hiệu quả:
- Không có chuỗi suy nghĩ: Lời khuyên hợp lý nhưng thiếu chiều sâu
- Có chuỗi suy nghĩ: Tính toán số cụ thể, xem xét biến động trong quá khứ, phân tích sâu về khả năng chịu đựng rủi ro
Điều này cũng đúng trong dự án của tôi. Trong nhiệm vụ tạo mã phức tạp, chỉ cần nói "hãy suy nghĩ từng bước" đã tạo ra mã chất lượng cao với ít lỗi hơn!
5. Sử dụng thẻ XML
Thẻ XML là kỹ thuật bị đánh giá thấp nhưng cực kỳ hiệu quả trong prompt engineering. Khi prompt của bạn bao gồm nhiều thành phần (ngữ cảnh, hướng dẫn, ví dụ, v.v.), việc sử dụng thẻ XML cho phép Claude phân tích chính xác, cải thiện đáng kể chất lượng đầu ra.
Ban đầu tôi chỉ viết bằng văn bản đơn giản, nhưng sau khi bắt đầu sử dụng thẻ XML, sự hiểu biết của Claude đã cải thiện đáng kể!
Tại sao nên sử dụng thẻ XML?
- Rõ ràng: Phân tách rõ ràng các phần khác nhau của prompt và cải thiện cấu trúc
- Chính xác: Giảm lỗi khi Claude hiểu sai nội dung prompt
- Linh hoạt: Dễ dàng thêm, xóa, thay đổi hoặc truy vấn nội dung mà không cần viết lại toàn bộ prompt
- Khả năng phân tích: Yêu cầu Claude sử dụng thẻ trong đầu ra để dễ dàng xử lý sau các phần cụ thể
Phương pháp tốt nhất:
- Duy trì tính nhất quán: Sử dụng cùng tên thẻ trong toàn bộ prompt
- Sử dụng lồng nhau: Sử dụng cấu trúc
<outer><inner></inner></outer>
cho nội dung phân cấp - Đặt tên theo ngữ nghĩa: Tên thẻ phù hợp với nội dung (ví dụ:
<instructions>
,<example>
,<data>
)
So sánh hiệu quả thực tế:
-
Không có thẻ (hiệu quả thấp):
Hãy phân tích rủi ro của hợp đồng cấp phép phần mềm này: {{nội dung hợp đồng}}. Tập trung vào các điều khoản bồi thường, giới hạn trách nhiệm và sở hữu trí tuệ. Đây là hợp đồng tiêu chuẩn của chúng tôi: {{hợp đồng tiêu chuẩn}}. Cung cấp phân tích và lời khuyên.
-
Có thẻ (hiệu quả cao):
Hãy phân tích rủi ro pháp lý của hợp đồng cấp phép phần mềm. <agreement> {{nội dung hợp đồng}} </agreement> <standard_contract>{{hợp đồng tiêu chuẩn}}</standard_contract> <instructions> 1. Phân tích điều khoản: bồi thường, giới hạn trách nhiệm, sở hữu trí tuệ 2. Đánh dấu các điều khoản bất thường 3. So sánh với hợp đồng tiêu chuẩn 4. Tóm tắt phát hiện trong thẻ <findings> 5. Liệt kê lời khuyên trong thẻ <recommendations> </instructions>
Kỹ thuật nâng cao: Kết hợp thẻ XML với các phương pháp khác. Ví dụ, kết hợp <examples>
với multi-shot prompting, <thinking>
và <answer>
với chuỗi suy nghĩ để tạo prompt có cấu trúc cao và hiệu suất cao.
Không có thẻ XML "tiêu chuẩn". Điều quan trọng là tên thẻ có ý nghĩa. Các thẻ thường được sử dụng bao gồm <context>
, <task>
, <format>
, <output>
, <data>
, <rules>
, v.v.
Kỹ thuật này đơn giản nhưng rất mạnh mẽ, đặc biệt là trong các nhiệm vụ phức tạp, đầu ra của AI chuyển từ hỗn loạn sang có tổ chức. Trên thực tế, không chỉ XML mà JSON, thậm chí các ngôn ngữ có cấu trúc như Lisp cũng hiệu quả. Điều này cũng được ghi trong tài liệu của OpenAI.
6. Gán vai trò cho AI (System Prompt)
Việc truyền đạt một danh tính như "bạn là một nhà phân tích dữ liệu có kinh nghiệm" cho AI làm cho câu trả lời chính xác hơn.
Đây là kỹ thuật prompt mà nhiều người đã sử dụng như một thói quen cơ bản. Thông qua việc thiết lập vai trò đúng, bạn có thể biến Claude từ một trợ lý đa năng thành một chuyên gia trong lĩnh vực cụ thể.
Ban đầu tôi sử dụng mà không chỉ định vai trò, nhưng khi thiết lập "bạn là một kỹ sư backend cấp cao", chất lượng mã đã cải thiện đáng kể!
Tại sao prompt vai trò hiệu quả?
- Cải thiện độ chính xác: Hiệu suất được cải thiện đáng kể trong các kịch bản phức tạp như phân tích pháp lý hoặc mô hình hóa tài chính
- Điều chỉnh giọng điệu: Prompt vai trò có thể điều chỉnh phong cách giao tiếp, từ sự ngắn gọn của CFO đến tài năng văn chương của người viết quảng cáo
- Tối ưu hóa tập trung: Thiết lập ngữ cảnh vai trò giúp Claude tập trung hơn vào nhu cầu cụ thể
Cách triển khai cụ thể:
system="Bạn là một nhà khoa học dữ liệu cấp cao tại một công ty Fortune 500"
Mẹo thiết lập vai trò: Hãy thử nhiều vai trò khác nhau! Cùng một bộ dữ liệu nhưng "nhà khoa học dữ liệu" và "nhà chiến lược tiếp thị" sẽ cung cấp những hiểu biết khác nhau. Nói "nhà khoa học dữ liệu chuyên về phân tích thông tin khách hàng tại một công ty Fortune 500" có thể mang lại kết quả hoàn toàn khác.
So sánh hiệu quả thực tế:
Trong phân tích pháp lý không có vai trò, Claude chỉ nói "hợp đồng có vẻ tiêu chuẩn", nhưng với vai trò "cố vấn pháp lý của một công ty công nghệ Fortune 500", nó phát hiện ra những rủi ro quan trọng có thể gây thiệt hại hàng triệu đô la và đưa ra lời khuyên chuyên nghiệp "đừng ký hợp đồng này".
Trong phân tích tài chính không có vai trò, Claude chỉ tóm tắt các con số, nhưng khi được thiết lập là "CFO của một công ty SaaS B2B tăng trưởng cao", nó cung cấp những hiểu biết chiến lược có thể thực hiện trong kịch bản hội đồng quản trị: phân bổ lại ngân sách, đóng băng tuyển dụng không cần thiết, tối ưu hóa phễu bán hàng, v.v.
7. Nhập trước câu trả lời (Prefill phản hồi của Claude)
Cung cấp phần mở đầu của câu trả lời để hướng AI đi đúng hướng.
Đây là một tính năng mạnh mẽ độc đáo của Claude, cho phép bạn nhập trước văn bản mở đầu trong tin nhắn Assistant để hướng dẫn hướng câu trả lời. Kỹ thuật này ảnh hưởng trực tiếp đến định dạng đầu ra, bỏ qua lời mở đầu không cần thiết và cũng giúp AI duy trì tính nhất quán của vai trò.
Sau khi biết điều này, tôi thấy nó đặc biệt hữu ích khi cần đầu ra JSON hoặc CSV!
Nguyên tắc cốt lõi: Thêm một tin nhắn có vai trò "assistant" vào mảng messages trong lệnh gọi API, Claude sẽ tiếp tục tạo từ nội dung đã nhập trước này.
Hạn chế quan trọng: Lỗi sẽ xảy ra nếu có khoảng trắng ở cuối nội dung đã nhập trước. Không được hỗ trợ trong chế độ suy nghĩ mở rộng.
2 kịch bản thực tế
-
Kiểm soát định dạng và bỏ qua lời mở đầu Kỹ thuật chuyên nghiệp: Nhập trước
{
buộc Claude xuất trực tiếp JSON và bỏ qua những câu không cần thiết như "Đây là thông tin được trích xuất ở định dạng JSON".Không có nhập trước, Claude nói:
"Đây là thông tin được trích xuất ở định dạng JSON: `json{...}` Tôi đã trích xuất các chi tiết sau từ mô tả sản phẩm..."
Với nhập trước
{
, Claude xuất trực tiếp:"name": "SmartHome Mini", "size": "5 inches wide", "price": "$49.99", "colors": ["black", "white"] }
-
Tính nhất quán trong đóng vai Trong các cuộc trò chuyện dài, bạn có thể nhập trước
[Tên vai trò]
để ngăn Claude thoát khỏi vai trò. Ví dụ, sau 50 lượt trò chuyện với Sherlock Holmes, không có nhập trước có thể dẫn đến "Với tư cách là trợ lý AI, tôi sẽ giúp phân tích...", nhưng với nhập trước[Sherlock Holmes]
, nó duy trì giọng điệu "Ah, Watson, đây là một mẫu vật kỳ lạ làm sao!"Bản chất của kỹ thuật này là "cải thiện lớn với nhập trước nhỏ"—chỉ với vài ký tự, bạn có thể cải thiện đáng kể hiệu suất của Claude.
8. Liên kết các prompt phức tạp
Khi đặt nhiệm vụ phức tạp trong một prompt duy nhất, Claude dễ bỏ sót các bước. Prompt chaining là phương pháp phân tách nhiệm vụ phức tạp thành các nhiệm vụ con có thể quản lý.
Trong một dự án tạo mã quy mô lớn, tôi đã thất bại khi cố gắng tạo mọi thứ cùng một lúc. Nhưng khi chia thành "đầu tiên hãy nghĩ về thiết kế", "tiếp theo tạo các lớp chính" và "cuối cùng viết các bài kiểm tra", mã chất lượng cao đã được tạo ra một cách đáng ngạc nhiên!
Lợi ích chính:
- Độ chính xác - Mỗi nhiệm vụ con nhận được sự chú ý đầy đủ của Claude
- Rõ ràng - Nhiệm vụ con đơn giản có nghĩa là hướng dẫn và đầu ra rõ ràng hơn
- Khả năng theo dõi - Dễ dàng xác định và sửa chữa vấn đề trong chuỗi
Kịch bản sử dụng:
- Tích hợp nghiên cứu, phân tích tài liệu, tạo nội dung lặp lại
- Nhiệm vụ bao gồm nhiều biến đổi, trích dẫn, hướng dẫn
Cách triển khai:
- Xác định nhiệm vụ con - Phân tách nhiệm vụ thành các bước tuần tự khác nhau
- Cấu trúc với thẻ XML - Sử dụng thẻ XML để truyền đầu ra giữa các prompt
- Mục tiêu nhiệm vụ đơn - Mỗi nhiệm vụ con phải có mục tiêu đơn lẻ và rõ ràng
- Tối ưu hóa lặp đi lặp lại - Tối ưu hóa nhiệm vụ con dựa trên hiệu suất của Claude
Quy trình làm việc điển hình:
- Tạo nội dung: Nghiên cứu → Phác thảo → Bản nháp → Chỉnh sửa → Định dạng
- Xử lý dữ liệu: Trích xuất → Chuyển đổi → Phân tích → Trực quan hóa
- Ra quyết định: Thu thập thông tin → Liệt kê tùy chọn → Phân tích từng mục → Đề xuất
Kỹ thuật nâng cao: Hỗ trợ chuỗi tự sửa - Yêu cầu Claude xem xét công việc của chính nó, đặc biệt phù hợp cho các nhiệm vụ có rủi ro cao. Chu kỳ 3 bước "tóm tắt→phản hồi→cải thiện" có thể cải thiện đáng kể chất lượng đầu ra.
9. Mẹo xử lý văn bản dài
Chiến lược đặc biệt khi xử lý lượng lớn văn bản, đảm bảo không bỏ sót thông tin quan trọng. Nói đơn giản: tài liệu ở phía trước, câu hỏi ở phía sau; phân chia bằng thẻ; trích dẫn trước, phân tích sau.
Tôi đã sử dụng phương pháp này khi yêu cầu Claude phân tích một tài liệu đặc điểm kỹ thuật dài và kết quả đã cải thiện đáng kể!
Anthropic cung cấp 3 mẹo chính cho khả năng xử lý văn bản dài 200K token của Claude:
-
Đặt tài liệu dài ở đầu Đặt tài liệu dài hơn 20K token ở đầu prompt và đặt truy vấn và hướng dẫn ở cuối. Theo kiểm tra, điều này cải thiện chất lượng câu trả lời lên 30%.
-
Cấu trúc nhiều tài liệu với thẻ XML Bọc nhiều tài liệu bằng các thẻ như
<document>
,<document_content>
,<source>
, v.v. để Claude dễ hiểu cấu trúc tài liệu hơn. -
Trích dẫn trước, phân tích sau Yêu cầu Claude trước tiên trích dẫn các phần liên quan từ tài liệu dài, sau đó thực hiện nhiệm vụ. Điều này giúp tập trung vào nội dung quan trọng trong biển thông tin.
10. Sử dụng mẫu prompt
Xây dựng mẫu có thể tái sử dụng và sử dụng lặp đi lặp lại sau khi viết một lần. Đây là chìa khóa để cải thiện hiệu quả.
Điều này chia nội dung thành hai phần: nội dung cố định (hướng dẫn tĩnh) và nội dung biến (các yếu tố động như đầu vào của người dùng, nội dung tìm kiếm, v.v.). Trong Anthropic Console, biến được đánh dấu bằng {{dấu ngoặc nhọn kép}}.
Sau khi tạo mẫu trong dự án sử dụng API, hiệu quả làm việc của tôi đã cải thiện đáng kể!
Lợi ích chính
- Tính nhất quán: Duy trì cấu trúc prompt thống nhất
- Hiệu quả: Thay thế nhanh chóng nội dung biến
- Khả năng kiểm tra: Dễ dàng kiểm tra các đầu vào khác nhau
- Quản lý phiên bản: Có thể tách biệt phần cố định và phần động
Nguyên tắc sử dụng Sử dụng mẫu khi bạn cần sử dụng lặp đi lặp lại các phần tùy ý của prompt. Hiện tại chỉ API và Anthropic Console hỗ trợ.
Ví dụ:
Hãy dịch văn bản tiếng Anh này sang tiếng Việt: {{text}}
Tính năng đơn giản này là nền tảng để xây dựng ứng dụng AI có thể bảo trì, đặc biệt phù hợp cho các kịch bản yêu cầu nhiều lệnh gọi lặp lại.
11. Công cụ cải thiện prompt
Anthropic cũng cung cấp công cụ chuyên dụng để tối ưu hóa prompt hiện có. Tôi đã sử dụng công cụ này để cải thiện prompt của mình nhiều lần. Đặc biệt đối với các nhiệm vụ phức tạp, các đề xuất của công cụ này rất hữu ích!
12. Mẹo prompt suy nghĩ mở rộng
Kỹ thuật đặc biệt cho mô hình yêu cầu suy nghĩ sâu. Thông qua tính năng suy nghĩ mở rộng của Claude, AI xử lý các vấn đề phức tạp theo từng bước và cải thiện đáng kể hiệu suất cho các nhiệm vụ khó.
Tôi đã sử dụng chế độ suy nghĩ mở rộng cho một vấn đề tối ưu hóa phức tạp và nó đã đề xuất giải pháp mà chế độ thông thường không thể nghĩ ra!
Điểm kỹ thuật:
- Token suy nghĩ tối thiểu là 1024, tốt nhất nên tăng dần từ ngân sách tối thiểu
- Xử lý theo lô để tránh hết thời gian chờ khi vượt quá 32K
- Suy nghĩ bằng tiếng Anh hiệu quả nhất, đầu ra có thể bằng bất kỳ ngôn ngữ nào
Kỹ thuật cốt lõi:
Hướng dẫn chung vượt trội hơn các bước chi tiết "Hãy suy nghĩ kỹ về vấn đề này, xem xét nhiều phương pháp và đưa ra lập luận đầy đủ" tốt hơn "Ở bước 1, xác định biến, ở bước 2, thiết lập phương trình".
Kết hợp với nhiều ví dụ
Hiển thị mẫu suy nghĩ với thẻ <thinking>
giúp AI tổng quát hóa điều này trong suy nghĩ mở rộng chính thức.
Tự xác thực Yêu cầu AI xác thực công việc trước khi hoàn thành, và đối với nhiệm vụ lập trình, yêu cầu chạy các trường hợp kiểm tra trong suy nghĩ.
Kịch bản áp dụng:
- Vấn đề STEM phức tạp: Yêu cầu chuyên môn và lập luận logic
- Tối ưu hóa ràng buộc: Đáp ứng đồng thời nhiều yêu cầu cạnh tranh
- Khung cấu trúc: Áp dụng nhiều phương pháp phân tích theo từng bước
Suy nghĩ mở rộng không phải để có nhiều đầu ra hơn mà để cung cấp cho AI nhiều không gian lập luận hơn để đưa ra giải pháp chất lượng cao hơn.
Kỹ thuật tối ưu hóa nâng cao: Gọi công cụ song song: Đối với Claude 4, thêm câu này cải thiện tỷ lệ thành công của thực thi song song gần 100%:
Để hiệu quả tối đa, hãy gọi đồng thời tất cả các công cụ liên quan khi cần nhiều tác vụ độc lập.
Tạo mã frontend: Sử dụng từ ngữ khuyến khích như "đừng bảo thủ, hãy cố gắng hết sức" giúp Claude 4 tạo mã frontend phức tạp hơn.
Tránh hardcoding: Yêu cầu rõ ràng "hãy triển khai giải pháp tổng quát, không chỉ cho các trường hợp kiểm tra".
Anthropic cũng nhấn mạnh một số điều kiện tiên quyết quan trọng: làm rõ tiêu chí thành công, thiết lập phương pháp kiểm tra và chuẩn bị phiên bản ban đầu. Không có nền tảng này, không kỹ thuật nào có thể giúp ích.
Tài liệu cũng bao gồm hướng dẫn tương tác, với phiên bản GitHub và phiên bản nhẹ trong Google Sheets, phù hợp với nhiều thói quen học tập khác nhau.
Tóm tắt
Sau khi thử nghiệm các kỹ thuật này trong dự án thực tế, tôi thấy "hướng dẫn rõ ràng" và "sử dụng thẻ XML" là hiệu quả nhất. Đặc biệt trong các nhiệm vụ phức tạp, kết hợp chuỗi suy nghĩ và thiết lập vai trò có thể mang lại kết quả đáng ngạc nhiên.
Prompt engineering AI vẫn là một lĩnh vực đang phát triển. Trong tương lai, Anthropic và các công ty AI khác sẽ tiếp tục phát triển các kỹ thuật tinh vi hơn. Tôi tin rằng chúng ta, những nhà phát triển, có thể tận dụng tối đa tiềm năng của các công cụ AI bằng cách học hỏi, thực hành và chia sẻ những phương pháp tốt nhất này.
Hãy thử nghiệm các kỹ thuật này và cho tôi biết kết quả bạn đạt được trong phần bình luận! Hãy cùng nhau mở rộng khả năng của AI.
Tham khảo: https://docs.anthropic.com/en/docs/build-with-claude/prompt-engineering/overview