
ChatGPT vừa triển khai hai model mới. GPT-5.3 Instant trở thành model mặc định. GPT-5.4 Thinking là model cao cấp mới.
Tôi muốn biết:
- Hai model này tìm kiếm web khác nhau thế nào?
- Chúng trích dẫn nguồn khác nhau ra sao?
- Điều đó có ý nghĩa gì với các brand muốn xuất hiện trong AI search?
Để trả lời, tôi đã test 50 prompt trên cả hai model, trích xuất mọi fan-out query mà model gửi đi, và phân loại toàn bộ citation mà chúng trả về.
Phiên bản ngắn gọn:
GPT-5.3 gửi người dùng tới các bài blog nói về thương hiệu của bạn. GPT-5.4 gửi họ tới chính website của bạn.
Cùng một câu hỏi. Kết quả hoàn toàn khác.
Dưới đây là phiên bản chi tiết.
Cách chúng tôi thực hiện nghiên cứu
Chúng tôi chạy 50 prompt trên ChatGPT với:
- GPT-5.3 Instant (default mới)
- GPT-5.4 Thinking (premium mới)
- GPT-5.2 Instant
- GPT-5.2 Thinking
Hai model GPT-5.2 được dùng làm baseline.
Tổng cộng thu được 119 cuộc hội thoại.
Sau mỗi phản hồi, chúng tôi trích xuất toàn bộ JSON hội thoại thông qua API nội bộ của ChatGPT. Điều này cho phép thấy:
- mọi fan-out query
- mọi web search result
- mọi citation URL
Chúng tôi cũng chạy 30 truy vấn qua Bing và Google bằng SerpAPI để so sánh với search engine truyền thống.
Quy mô dữ liệu
| Chỉ số | Số lượng |
|---|---|
| Tổng số cuộc hội thoại | 119 |
| Fan-out queries | 532 |
| Web search results phân tích | 7,896 |
| Citations phân loại | 1,161 |
| Số từ trong AI responses | 74,478 |
| SerpAPI queries | 30 |
50 prompt được chia thành 16 category:
- SaaS
- ecommerce
- healthcare
- finance
- travel
- education
- home
- food
- legal
- marketing
- productivity
- fitness
- shopping intent
- comparisons
- trends
Với mỗi prompt sản phẩm/dịch vụ, chúng tôi phân loại citation thành:
- First-party: website chính thức của brand
- Third-party: review site, blog, Reddit, media
GPT-5.3 và GPT-5.4 trích dẫn nguồn hoàn toàn khác nhau
Đây là phát hiện quan trọng nhất.
56% citation của GPT-5.4 dẫn tới website thương hiệu. GPT-5.3 chỉ 8%.

Điều bất ngờ hơn:
GPT-5.3 thậm chí còn tệ hơn GPT-5.2 đối với brand.
| Model | First-party citation |
|---|---|
| GPT-5.2 Instant | 22% |
| GPT-5.3 Instant | 8% |
| GPT-5.4 Thinking | 56% |
Điều đó có nghĩa:
Model mặc định hiện tại của ChatGPT gửi 92% traffic citation tới site bên thứ ba.
Mẫu hình này xuất hiện ở gần như mọi prompt
Dưới đây là ví dụ khi hỏi cùng một câu hỏi.
| Prompt | GPT-5.3 first-party | GPT-5.4 first-party | GPT-5.3 cites | GPT-5.4 cites |
|---|---|---|---|---|
| Best CRM for B2B SaaS | 0% | 100% | designrevision.com, techradar.com | hubspot.com, salesforce.com |
| Marathon running shoes | 0% | 88% | irunfar.com, reddit.com | nike.com, asics.com |
| QuickBooks vs Xero vs FreshBooks | 0% | 100% | gentelfrog.com | quickbooks.intuit.com |
| HubSpot vs Salesforce vs Pipedrive | 0% | 100% | emailtooltester.com | hubspot.com |
| Password managers | 14% | 100% | cybernews.com | 1password.com |
| iPhone vs Samsung vs Pixel | 0% | 100% | tomsguide.com | apple.com |
| Tesla vs BMW vs Polestar | 0% | 67% | drivingelectric.com | tesla.com |
| Smart home security | 0% | 86% | safehome.org | ring.com |
| Coursera vs Udemy | 0% | 83% | coursmos.com | coursera.org |
| SEO tools | 0% | 33% | morningscore.io | ahrefs.com |
Ở các prompt comparison (“X vs Y vs Z”):
- GPT-5.3 không cite brand nào
- GPT-5.4 cite 83-100% brand site
Khoảng cách theo ngành
| Category | GPT-5.3 first-party | GPT-5.4 first-party |
|---|---|---|
| Comparison | 0% | 83% |
| SaaS | 12% | 82% |
| Shopping | thấp | tăng gấp đôi |
Hai model hầu như không cite cùng nguồn
Với cùng prompt:
Overlap trung bình chỉ 7%.
Trong 22/50 prompt, overlap = 0%.
Điều này có nghĩa:
Một brand đứng đầu trên GPT-5.3 có thể hoàn toàn vô hình trên GPT-5.4.
Các website “kingmaker” của GPT-5.3
Do GPT-5.3 gần như chỉ cite third-party, một số domain trở thành gatekeeper.
| Domain | Citations | Type |
|---|---|---|
| forbes.com | 15 | media |
| techradar.com | 10 | tech review |
| tomsguide.com | 10 | tech review |
| reddit.com | 7 | forum |
| money.com | 5 | finance |
Nếu Forbes hoặc TechRadar không viết về bạn, GPT-5.3 gần như không biết bạn tồn tại.
GPT-5.4 gửi nhiều fan-out query hơn 8.5 lần
| Model | Avg queries | Avg results | Avg citations | Avg response |
|---|---|---|---|---|
| GPT-5.2 | 0.9 | 36.6 | 4.5 | 388 words |
| GPT-5.3 | 1.0 | 27.3 | 5.8 | 548 words |
| GPT-5.4 | 8.5 | 109.4 | 14.8 | 769 words |
GPT-5.4 còn dùng hai kỹ thuật mà model khác không dùng:
- domain-restricted queries
- site: operators
Tổng cộng 304 truy vấn có mục tiêu.
Ví dụ fan-out query của GPT-5.4
Email marketing platforms
Phase 1 — brand sites:
site:klaviyo.com pricing email marketing
site:omnisend.com pricing ecommerce email marketing
site:mailchimp.com pricing email marketing
Phase 2 — validation:
site:g2.com email marketing software reviews
site:apps.shopify.com klaviyo review
Đây là lý do 56% citation của GPT-5.4 là first-party.
Mức độ nghiên cứu theo danh mục

| Category | GPT-5.3 queries | GPT-5.4 queries | GPT-5.4 results |
|---|---|---|---|
| Productivity | 1 | 14.7 | 156 |
| Marketing | 1 | 11.7 | 144 |
| Legal | 1 | 12.5 | 165 |
| Services | 1 | 14.0 | 184 |
| Travel | 1 | 11.7 | 148 |
| SaaS | 1 | 6.3 | 76 |
| Shopping | 1 | 4.6 | 56 |
B2B software trigger nhiều search hơn B2C products.
Cùng search index, khác chiến lược query
| Metric | GPT-5.3 | GPT-5.4 |
|---|---|---|
| Queries per prompt | 1 | 8.5 |
| Results per prompt | 27.3 | 109.4 |
| Results per query | 27.3 | 12.9 |
Cả hai dùng cùng index.
Sự khác biệt nằm ở fan-out strategy.

GPT-5.4 thay đổi hoàn toàn AEO
GPT-5.4 gửi 156 truy vấn site:.
| Query type | Count | % |
|---|---|---|
| Domain restricted | 142 | 34% |
| site: queries | 156 | 37% |
| Open queries | 125 | 30% |
Top validation sites:
| Site | Queries |
|---|---|
| apps.shopify.com | 6 |
| g2.com | 4 |
| capterra.com | 6 |

GPT-5.4 cite pricing page nhiều hơn 35 lần
| Page type | GPT-5.3 | GPT-5.4 |
|---|---|---|
| Pricing pages | 4 (1%) | 138 (19%) |
| Blog pages | 92 (32%) | 61 (8%) |
| Homepage | 42 (15%) | 161 (22%) |
| Product pages | 13 (5%) | 73 (10%) |
GPT-5.3 = blog reader GPT-5.4 = pricing page checker
Google ranking ảnh hưởng GPT-5.3 nhưng không ảnh hưởng GPT-5.4
| Metric | GPT-5.3 |
|---|---|
| Citation từ domain rank Google | 47% |
| Citation từ domain rank Bing | 27% |
| Citation không xuất hiện trên search engine | 44% |
GPT-5.4:
75% citation không xuất hiện trên Google hoặc Bing.
GPT-5.4 cho phép tracking traffic từ AI search
| Model | First-party rate | Trackable traffic |
|---|---|---|
| GPT-5.2 | 22% | ~13% |
| GPT-5.3 | 8% | ~8% |
| GPT-5.4 | 56% | ~49% |
Các link citation đều có:
utm_source=chatgpt.com
Một số prompt không kích hoạt web search
| Model | Prompts skipped |
|---|---|
| GPT-5.2 | 1/10 |
| GPT-5.3 | 1/49 |
| GPT-5.4 | 4/50 |
Ví dụ GPT-5.4 bỏ qua:
- standing desk deals
- gift ideas
Shopping intent hoạt động khác trên GPT-5.4
| Prompt | GPT-5.3 search | GPT-5.4 search |
|---|---|---|
| Buy earbuds under $150 | Yes | Yes |
| Cheapest MacBook Air | Yes | Yes |
| Standing desk deals | Yes | No |
| Gift under $100 | Yes | No |
GPT-5.4 đôi khi trả lời từ training data thay vì search.
GPT-5.3 sử dụng content cũ hơn
| Model | Content <30 ngày |
|---|---|
| GPT-5.2 | 33% |
| GPT-5.3 | 6% |
| GPT-5.4 | 18% |
Kết luận
| Capability | GPT-5.2 | GPT-5.3 | GPT-5.4 |
|---|---|---|---|
| First-party citation | 22% | 8% | 56% |
| Queries per prompt | 1 | 1 | 8.5 |
| Domain-targeted queries | 0 | 0 | 304 |
| Avg citations | 4.5 | 5.8 | 14.8 |
GPT-5.3 → blog-driven discovery GPT-5.4 → brand-driven verification
Ý nghĩa đối với brand
- Tối ưu pricing page trước tiên
- Xuất hiện trên Forbes / TechRadar
- Tối ưu profile G2 và Capterra
- Theo dõi GA4 utm_source=chatgpt.com
- Test cả GPT-5.3 và GPT-5.4
TLDR
GPT-5.4 trích dẫn website thương hiệu nhiều hơn GPT-5.3 gấp 7 lần.
- GPT-5.3 → blog và review site
- GPT-5.4 → brand site và pricing page
Hai model có chỉ 7% nguồn trùng nhau.
Chiến lược AI search cần tách riêng cho từng model.
Appendix: all 50 prompts
| ID | Category | Prompt |
|---|---|---|
| A1 | SaaS | What's the best CRM for a 50-person B2B SaaS company? |
| A2 | SaaS | Compare Shopify vs WooCommerce vs BigCommerce for a DTC brand doing $5M in revenue |
| A3 | SaaS | Best project management tools for remote engineering teams in 2026 |
| B1 | Ecommerce | Best noise cancelling headphones under $300 for working from home |
| B2 | Ecommerce | What running shoes do marathon runners recommend in 2026? |
| B3 | Ecommerce | Best organic skincare brands for sensitive skin |
| C1 | Services | Best digital marketing agencies for ecommerce brands in the US |
| C2 | Services | Top accounting software for small businesses with under 20 employees |
| D1 | Trends | What are the biggest trends in ecommerce for 2026? |
| D2 | Trends | How is AI changing the recruiting and hiring process? |
| E1 | Healthcare | Best telehealth platforms for small medical practices in 2026 |
| E2 | Healthcare | What supplements do doctors recommend for sleep in 2026? |
| E3 | Healthcare | Best EHR software for independent physicians in 2026 |
| F1 | Finance | Best business credit cards for startups with no revenue history |
| F2 | Finance | Compare QuickBooks vs Xero vs FreshBooks for freelancers |
| F3 | Finance | Best payroll software for small businesses with under 50 employees in 2026 |
| G1 | Travel | Best travel insurance companies for international trips in 2026 |
| G2 | Travel | Top hotel booking sites with the best price guarantees |
| G3 | Travel | Best carry-on luggage brands for frequent business travelers |
| H1 | Education | Best online learning platforms for professional development in 2026 |
| H2 | Education | Compare Coursera vs Udemy vs LinkedIn Learning for tech skills |
| H3 | Education | Best coding bootcamps for career changers in 2026 |
| I1 | Home | Best smart home security systems under $500 in 2026 |
| I2 | Home | Top robot vacuums for pet owners in 2026 |
| I3 | Home | Best air purifiers for allergies recommended by doctors |
| J1 | Food | Best meal delivery services for families in 2026 |
| J2 | Food | Top rated coffee subscription services |
| J3 | Food | Best protein powder brands for muscle building in 2026 |
| K1 | Legal | Best contract management software for small businesses |
| K2 | Legal | Top legal document automation tools in 2026 |
| L1 | Marketing | Best email marketing platforms for ecommerce brands in 2026 |
| L2 | Marketing | Compare HubSpot vs Salesforce vs Pipedrive for sales teams under 20 people |
| L3 | Marketing | Best SEO tools for small business websites in 2026 |
| M1 | Productivity | Best AI writing tools for content marketers in 2026 |
| M2 | Productivity | Top password managers for small business teams |
| M3 | Productivity | Best video conferencing software for remote teams in 2026 |
| N1 | Fitness | Best fitness trackers for marathon training in 2026 |
| N2 | Fitness | Top rated yoga mats for home practice |
| N3 | Fitness | Best home gym equipment under $1000 in 2026 |
| S1 | Shopping | I want to buy wireless earbuds under $150 for running, what should I get? |
| S2 | Shopping | Where can I buy the cheapest MacBook Air M4 right now? |
| S3 | Shopping | Best deals on standing desks this week |
| S4 | Shopping | I need to buy a gift for my wife under $100, what are good options? |
| S5 | Shopping | Buy the best rated espresso machine under $500 |
| V1 | Comparison | Notion vs Obsidian vs Roam Research for personal knowledge management |
| V2 | Comparison | iPhone 17 Pro vs Samsung Galaxy S26 Ultra vs Google Pixel 10 Pro |
| V3 | Comparison | Tesla Model 3 vs BMW i4 vs Polestar 2 for daily commuting in 2026 |
| T1 | Trends | What are the top cybersecurity threats businesses should prepare for in 2026? |
| T2 | Trends | How is AI changing the legal industry in 2026? |
| T3 | Trends | What are the biggest challenges for DTC brands in 2026? |