Cách viết sao cho các hệ thống máy đọc hiểu ngôn ngữ (LLM, AI, chat, công cụ tìm kiếm, AI overviews, agent) thực sự có thể sử dụng được nội dung bạn muốn truyền tải.
Và không, phương pháp này KHÔNG mang tính kỹ thuật. Nó nằm ở cách viết.
Một bài tập (rất) nhỏ nhưng hữu ích để bắt đầu
Trước khi đi sâu, tôi có một yêu cầu nhỏ. Bạn có thể giúp tôi một việc không? Rất đáng để làm. Bạn sẽ hiểu bài viết này tốt hơn và không tốn nhiều thời gian. Chỉ cần một chút trung thực.
Được chứ?
Tốt, đây là bài tập của bạn: truy cập vào website của bạn và chọn một trang có giá trị cao. Trang trả lời câu hỏi quan trọng nhất đối với doanh nghiệp của bạn. Sản phẩm chính, hoặc một trong số đó.
Sau đó, chọn một câu ở giữa nội dung. Không phải phần mở đầu, không phải kết luận. Ở giữa.
Sao chép câu đó vào một nơi khác ngoài ngữ cảnh website. Một file text mới, hoặc bản nháp email. Không quan trọng, chỉ cần tách nó ra.
Bây giờ đọc câu đó trong trạng thái hoàn toàn độc lập. Hãy giả vờ bạn không phải là bạn, mà là một người khác: khách hàng tiềm năng, người dùng bất kỳ. Sau đó, trả lời trung thực các câu hỏi sau bằng có hoặc không:
-
Bạn có thể hiểu chính xác nội dung đó nói về cái gì không? Không phải mơ hồ, mà cụ thể: sản phẩm gì, thứ gì, ở đâu?
-
Thứ đó có được liên kết rõ ràng với yếu tố khác không, như giá, tên, địa điểm, tính năng?
-
Và câu đó có nói rõ bản chất của mối quan hệ không: tốt/xấu, rẻ/đắt, nhanh/chậm?
Nếu có bất kỳ câu trả lời nào là “không”, bạn đã tìm ra vấn đề mà bài viết này nói đến.
Và bạn không phải là người duy nhất. Tôi đã thử nghiệm rất nhiều, và tỷ lệ thất bại lên tới khoảng 99%. Ngay cả với những trang viết tốt, xếp hạng cao. Vì vậy, có 99% khả năng điều này cũng áp dụng với bạn.
Đây không phải vấn đề ranking. Đây là vấn đề utility (tính hữu dụng). Năm kỹ thuật bên dưới sẽ cho bạn thấy cần sửa gì, với rất nhiều ví dụ trước–sau.
Một điều nữa trước khi bắt đầu. Nghiên cứu về hệ thống Gemini của Google cho thấy mỗi trang thường chỉ có khoảng 380 từ được chọn, bất kể độ dài trang. Dan Petrovic đã test chính bài này: trong 6.107 từ, chỉ 948 từ (15.5%) được dùng để tạo câu trả lời cho truy vấn “How to write to satisfy both LLMs and humans?”.

Xem phân tích của Petrovic tại LinkedIn. Phân tích bắt đầu từ bài post này.
Framework này vẫn đang phát triển
Một điều cần nói trước: mọi thứ trong bài này vẫn đang thay đổi. Tôi đã phát triển và tinh chỉnh nó hơn một năm, và mỗi khi đọc thêm nghiên cứu, bằng sáng chế hoặc bài viết mới, tôi lại điều chỉnh lại.
Mục tiêu không phải là khoa học. Mà là ứng dụng. Tôi có thể dùng gì ngay hôm nay để đo lường và cải thiện utility của nội dung?
Vì vậy hãy xem đây là snapshot hiện tại, không phải câu trả lời cuối cùng.
Ý chính của bài viết: thêm cấu trúc vào ngôn ngữ
SEO đã quen với structured data. Chúng ta đã dành hàng chục năm thêm Schema.org, JSON-LD, và giờ nhiều người còn tranh luận có nên thêm markdown cho bot LLM hay không.
Nhưng tôi nghĩ chúng ta đang quên điều cốt lõi.
Nhiều người xem cấu trúc là thứ gắn bên ngoài nội dung. Một lớp kỹ thuật tách biệt.
Nhưng thực tế, thứ chúng ta cần là ngôn ngữ có cấu trúc tốt hơn.
Structured data chuyển đổi text sang dạng máy hiểu. Structured language là viết sao cho text tự nó đã machine-readable.
Ví dụ:
The Sony WH-1000XM5 noise-cancelling headphones reduce ambient noise by up to 30dB, weigh 250g (18% lighter than the XM4), and deliver 30 hours of battery life with ANC enabled. At €349, they're priced between the Apple AirPods Max (€549) and the Bose QuietComfort 45 (€279), with a noise cancellation benchmark score of 94/100 from RTINGS.com.
Câu này không cần schema. Nó đã machine-readable: có entity, quan hệ, so sánh, điều kiện.
Một ví dụ khác:
A property in Flanders with an EPC score above 400 kWh/m² qualifies for the Mijn VerbouwPremie subsidy of up to €4,750 for insulation work, on the condition that a certified contractor registered with the Flemish Energy Agency performs the work.
Đây chính là “utility-writing”.
Utility-writing là cách viết ngôn ngữ tự nhiên nhưng có thể được máy xử lý trực tiếp: có entity rõ ràng, quan hệ rõ ràng, điều kiện đầy đủ, và câu tự đứng độc lập.
Mọi thứ còn lại trong bài là kỹ thuật để làm điều này tốt hơn.
Tại sao điều này quan trọng (và đáng lẽ đã quan trọng từ lâu)
Có một khoảng cách giữa nội dung “hay với con người” và “hữu dụng với máy”. Duane Forrester gọi đó là Utility Gap.
Con người đọc để hiểu. AI thì tách nội dung thành các đoạn nhỏ và trích xuất thông tin để trả lời.
Một trang có thể rất hay với người, nhưng vô dụng với AI.
Điều này không chỉ liên quan đến LLM.
Từ 2021, Google đã đánh giá nội dung ở mức đoạn (passage-level). Những yếu tố giúp AI hiểu nội dung (rõ ràng, self-contained, quan hệ rõ ràng) cũng là yếu tố giúp ranking.
Bạn không tối ưu cho nhiều hệ thống khác nhau. Bạn đang tối ưu cho một hệ thống chung.
Framework này KHÔNG đảm bảo bạn được trích dẫn
Nhiều lời khuyên GEO hiện nay mắc lỗi “correlation = causation”.
Các trang được AI trích dẫn thường có số liệu, quote chuyên gia, cấu trúc tốt → nên mọi người nghĩ thêm những thứ đó sẽ được trích dẫn.
Sai.
Đó là đặc điểm của nội dung mạnh, không phải nguyên nhân.
Kỹ thuật trong bài này không phải tín hiệu gián tiếp. Nó là yêu cầu mang tính cơ chế.
Ví dụ: nếu câu có “it” hoặc “this” không rõ nghĩa, hệ thống không thể trích xuất. Đây là lỗi kỹ thuật, không phải tương quan.
Framework này dựa trên cơ chế, không phải mẹo
Trang của bạn phải vượt qua lớp đánh giá uy tín (E-E-A-T).
Nhưng sau đó, từng đoạn nội dung sẽ cạnh tranh với nhau.
Trang giúp bạn “lọt vào cửa”. Đoạn nội dung giúp bạn được trích dẫn.
Các hệ thống đều hỏi một câu giống nhau:
“Đoạn này có khả năng trả lời câu hỏi không?”
Và cách viết tốt sẽ tăng xác suất đó.
Nghiên cứu của Dan Petrovic:
- ~1900 từ được dùng cho mỗi truy vấn
- Top source ~530 từ
- Trang trung bình ~380 từ được dùng
Trang dài hơn không giúp gì. Ngược lại còn làm loãng nội dung.
Không phải viết dài hơn. Mà là viết dày hơn (dense).
Utility của mỗi đoạn quyết định:
- Có được retrieve không
- Xếp hạng ở đâu
- Có được trích dẫn không
Đó là logic nền tảng của toàn bộ bài viết này.
```html id="qk1vzp"
Xem framework hoạt động thực tế: bio-rewriter
Bạn muốn thấy framework này hoạt động thực tế? Tôi đã tạo một công cụ tối ưu cho việc viết lại bio hội thảo hoặc guest post.
Bạn nhập bio của mình, có thể thêm một vài chi tiết. Công cụ sẽ phân tích và trả về phiên bản machine-readable, kèm góp ý để cải thiện.
Xem tại đây → bio-rewriter
Checklist 5 điểm về tính hữu dụng (Eikhart Language Utility Framework)
Tôi đánh giá utility của nội dung qua 5 góc nhìn. Đây là checklist thực tế để áp dụng utility-writing.
Tôi sẽ dùng rất nhiều ví dụ, vì cách tốt nhất để hiểu là nhìn trực tiếp cách nó được viết.
1. Đặt nội dung quan trọng ở nơi hệ thống có thể tìm thấy
Nghiên cứu cho thấy vị trí thông tin rất quan trọng. Nội dung ở đầu hoặc cuối có khả năng được dùng cao hơn so với nội dung nằm giữa.
Nếu phần quan trọng nhất nằm ở giữa bài, hãy đưa nó lên đầu hoặc nhắc lại ở dạng cô đọng.
Điều này áp dụng trực tiếp cho web:
Nếu kết luận nằm giữa một bài 3000 từ → gần như vô hình với hệ thống.
Ví dụ: review công nghệ
The Galaxy S25 Ultra is the strongest Android choice for photography enthusiasts who prioritize zoom quality.
Kết luận ở cuối là ổn.
Nhưng dữ liệu quan trọng nếu nằm giữa:
At 10x zoom, the S25 Ultra produces 38% sharper images than the Pixel 9 Pro in our lab measurements.
→ có thể không bao giờ được trích xuất.
Ví dụ: y tế
Most patients can walk with assistance within 24 hours of anterior approach hip replacement, compared to 48-72 hours for posterior approach, but anterior approach carries a 2.1% higher risk of femoral fracture in patients over 75.
Nếu đoạn này nằm giữa bài → AI có thể dùng nội dung từ site khác chỉ vì họ đặt thông tin này ở đầu.
Ví dụ: SaaS
Unlike Salesforce, which requires a minimum 5-seat commitment at $25/user/month, HubSpot CRM offers a free plan for up to 5 users with contact management, deal tracking, and email integration.
Đây chính là nội dung mà AI cần. Nhưng nếu nằm giữa bài → khả năng bị bỏ qua cao.
Nguyên tắc: mỗi bài có ~500–600 từ quan trọng nhất. Hãy đặt nó ở 20% đầu hoặc 20% cuối, không phải ở giữa.
2. Cho hệ thống lý do để chọn bạn thay vì đối thủ
Được retrieve ≠ được trích dẫn.
Nghiên cứu cho thấy nội dung tốt thường có:
- Phù hợp intent
- Có so sánh
- Có dữ liệu bên ngoài (review, benchmark)
- Giữ đúng fact
Duane Forrester tóm lại thành công thức:
nó là gì → dành cho ai → giải quyết việc gì → thắng trong điều kiện nào
Ví dụ: bất động sản
Không hữu dụng:
Charming family home in a green, family-friendly neighborhood. This beautiful property offers everything you need for comfortable living.
Hữu dụng:
This three-bedroom terraced house in Berchem, Antwerp is listed at €385,000. Berchem offers direct tram access to Antwerp Central Station (12 minutes), three primary schools within 800 meters, and average property price growth of 4.2% per year over the past five years.
E-commerce
Premium noise-cancelling headphones that deliver an incredible audio experience.
vs
The Sony WH-1000XM5 noise-cancelling headphones reduce ambient noise by up to 30dB using dual-processor adaptive noise cancellation, weigh 250g, and deliver 30 hours of battery life. At $349, they're priced between competitors with a benchmark score of 94/100.
SaaS
Our analytics platform transforms your data into insights.
vs
Mixpanel tracks user behavior with event-based analytics, supports 20 million events/month on the free plan, and includes funnel analysis, retention cohorts, and A/B testing.
Kết luận: khác biệt không nằm ở văn phong, mà ở utility.
3. Mỗi câu phải đứng được một mình
Lỗi phổ biến nhất: đại từ mơ hồ (it, this...).
Khi bị tách khỏi ngữ cảnh, câu sẽ mất nghĩa.
Ví dụ sai:
It supports the latest Wi-Fi standard, which gives it an advantage.
Ví dụ đúng:
The ASUS ROG Ally X supports Wi-Fi 6E, providing up to 40% faster speeds than Wi-Fi 6 in the original ROG Ally.
Healthcare
The medication has shown promising results.
vs
Ozempic (semaglutide) reduced HbA1c by 1.4% in a 104-week trial with 3,297 patients.
Finance
This account offers a competitive rate.
vs
The Marcus High-Yield Savings Account pays 4.40% APY with no minimum deposit.
Nguyên tắc: nếu câu không trả lời được 5W (who, what, when, where, why, how) → máy không dùng được.
4. Nêu rõ quan hệ, không chỉ liệt kê
Hầu hết nội dung chỉ liệt kê entity mà không nối chúng lại.
Nhưng hệ thống graph cần (subject – verb – object).
Ví dụ sai:
Energy label D. Subsidies available. EPC 450. Renovation increases value.
Ví dụ đúng:
This property has an EPC score of 450, qualifying for subsidies up to €4,750. Renovation to label B requires €35,000-45,000 investment and increases property value.
Healthcare
Metformin is a diabetes medication. Exercise helps.
vs
Metformin reduces A1C by 1.0–1.5% over 12 weeks, and combining it with 150 minutes of exercise weekly adds another 0.5–0.7% reduction.
Nguyên tắc: không phải nói gì, mà là bạn nối chúng lại như thế nào.
5. Luôn có ít nhất một câu có thể được AI trích dẫn trực tiếp
Đây là test đơn giản nhất.
Có câu nào mà AI có thể copy-paste vào câu trả lời không?
Ví dụ không dùng được:
This is a great coffee maker.
Ví dụ dùng được:
The Breville Barista Express produces espresso at 9 bars, includes a built-in grinder, and is rated 4.6/5 across 12,000+ reviews.
Đây gọi là “anchorable statement” — câu có thể được trích dẫn trực tiếp.
```
Tổng hợp nhanh: những lỗi khiến nội dung “không thể trích xuất”
Dưới đây là các pattern phổ biến khiến nội dung không usable với AI — xuất hiện ở mọi ngành:
| Pattern | Ví dụ | Vấn đề |
|---|---|---|
| Đại từ không rõ | "It features a 120Hz display" | “It” là cái gì? |
| Chỉ định mơ hồ | "This gives it an advantage" | “This” là gì? Advantage gì? |
| Phụ thuộc ngữ cảnh | "The above specs outperform competitors" | Specs nào? Competitor nào? |
| Thiếu điều kiện | "The price dropped significantly" | Từ bao nhiêu? Khi nào? |
| Giả định người đọc biết | "The popular supplement helps recovery" | Supplement nào? Recovery gì? |
| So sánh tương đối | "Our fastest-selling product" | Nhanh nhất so với cái gì? |
Rule đơn giản: nếu câu không vượt qua bài test 5W (who, what, when, where, why, how) → máy không dùng được.
6. Nêu rõ quan hệ, không chỉ liệt kê entity
Đây là điểm mà phần lớn content strategy bỏ qua.
Không quan trọng bạn nhắc tới khái niệm gì. Quan trọng là bạn có kết nối rõ ràng chúng hay không.
Các hệ thống graph trích xuất dữ liệu theo dạng (subject – predicate – object).
Nội dung có cấu trúc câu rõ ràng sẽ được hiểu tốt hơn so với:
- bullet không có động từ
- bảng không có context
- câu rời rạc cần suy diễn
Ví dụ bất động sản
Không có quan hệ:
This property has an energy label D. Subsidies available. EPC score 450. Insulation improves value.
Có quan hệ:
This property at Lange Leemstraat 45 in Antwerp has an EPC score of 450 (energy label D). Renovating to label B requires €35,000–45,000 for insulation and windows. The Flemish 'Mijn VerbouwPremie' covers up to €4,750 for properties above EPC 400.
Healthcare
Không có quan hệ:
Metformin is a diabetes drug. Exercise helps. A1C should be checked.
Có quan hệ:
Metformin (500mg twice daily) reduces A1C by 1.0–1.5% over 12 weeks. Combining it with 150 minutes of weekly exercise reduces A1C by an additional 0.5–0.7%. Patients should test A1C every 3–6 months.
Finance
A 30-year mortgage at 6.8% APR applies to borrowers with credit scores above 740 and 20% down payment. Reducing the down payment to 10% adds PMI of 0.5–1% annually.
SaaS
Datadog's Pro plan at $23/host/month includes APM and 15-month retention. The Enterprise plan at $33 adds SSO and advanced monitoring. Teams with 500+ hosts can reduce costs by 20–35% via custom contracts.
Insight quan trọng:
Nhiều câu hỏi của người dùng yêu cầu chuỗi suy luận (multi-hop reasoning).
Ví dụ:
- Có nên mua nhà cần sửa không?
- Có nên refinance mortgage không?
- Cloud nào rẻ nhất?
Mỗi câu hỏi cần nhiều bước logic:
A → B → C → D
Nếu thiếu một mắt xích → hệ thống không thể xây câu trả lời → sẽ dùng content của người khác.
7. Luôn có ít nhất một câu mà AI có thể trích dẫn
Đây là bài test đơn giản nhất.
Nội dung của bạn có chứa một câu mà AI có thể “copy-paste” vào câu trả lời không?
Duane Forrester gọi đây là “anchorable statements”.
Không trích dẫn được:
This is a great coffee maker that customers love.
Trích dẫn được:
The Breville Barista Express produces espresso at 9 bars of pressure, includes a built-in grinder, and is rated 4.6/5 across 12,000+ reviews, making it the top-rated semi-automatic espresso machine under $700.
Healthcare
Ibuprofen reduces inflammation and pain within 30–60 minutes at doses of 200–400mg, with effects lasting up to 6 hours.
Finance
The Vanguard S&P 500 ETF (VOO) has an expense ratio of 0.03% and has returned an average of 10.2% annually over the past 10 years.
Nguyên tắc:
Mỗi bài nên có ít nhất một đoạn:
- định nghĩa rõ ràng
- có số liệu
- có điều kiện
- có quan hệ nguyên nhân–kết quả
→ đây là đoạn có khả năng được trích dẫn cao nhất.
Kết luận
Utility-writing không phải là kỹ thuật SEO mới. Nó là cách viết tốt hơn.
Không phải thêm layer kỹ thuật. Mà là:
- viết rõ hơn
- viết cụ thể hơn
- viết có cấu trúc ngay trong câu chữ
Những gì hiệu quả với AI cũng chính là những gì hiệu quả với search.
Và thực tế là:
AI không “hiểu” nội dung của bạn tốt hơn con người.
Nó chỉ nghiêm khắc hơn trong việc chọn cái gì đủ rõ để sử dụng.
Vì vậy nếu nội dung của bạn:
- không rõ
- không đầy đủ
- không self-contained
→ nó sẽ bị bỏ qua.
Không phải vì nội dung kém.
Mà vì nó không usable.