Tôi đã bỏ việc đoán xem nên viết gì — và bắt đầu “nghe lén”

Nghe bài viết:

Phần lớn kế hoạch nội dung bắt đầu bằng keyword research và nhìn vào số liệu tìm kiếm quá khứ.

Tôi thì làm ngược lại.

Tôi bắt đầu bằng cách nghe xem mọi người thực sự nói gì về vấn đề của họ.

Trong một dự án gần đây, tôi phải xây roadmap nội dung cho một công ty B2B SaaS trong một ngành bị quản lý khá chặt. Thay vì mở tool để xem volume từ khóa, tôi đi thẳng đến nơi khách hàng của họ đang nói chuyện — một cộng đồng với hàng nghìn người trong ngành.

Tôi lấy khoảng 50 bài đăng, đưa vào một pipeline phân tích định tính bằng Claude Cowork.

Kết quả không phải là một list keyword.

Mà là một backlog nội dung — được sắp ưu tiên dựa trên những thứ người ta đang thật sự than phiền, hỏi han, tranh luận.

1. Chuẩn bị dữ liệu

Phần này đơn giản hơn bạn nghĩ.

Tôi chỉ lấy các bài đăng trong khoảng 3 tháng, copy cả bài viết và comment đáng chú ý vào một file text. Nếu muốn tự động hóa thì có thể dùng Apify để scrape.

Quan trọng nhất là cách lọc:

Tôi chỉ giữ bài của thành viên, bỏ hết thông báo admin. Chọn một khoảng thời gian rõ ràng. Và giữ nguyên dữ liệu thô — không chỉnh sửa, không “clean” kiểu làm mất ngữ cảnh.

2. Setup workspace

Tôi chạy mọi thứ trong Claude Cowork — tool desktop của Anthropic cho phép Claude đọc file local.

Trước khi chạy, tôi luôn chuẩn bị 3 thứ:

  • Một file giới thiệu công ty: họ làm gì, bán gì

  • Một file mô tả audience: họ là ai, đang gặp vấn đề gì

  • Và file dữ liệu thô vừa thu thập

Chỉ cần vậy là đủ để model hiểu context.

Khi chạy pipeline, hệ thống sẽ tự tạo các thư mục output. Bạn không cần đụng vào — chỉ việc đọc kết quả.

3. Chạy pipeline

Pipeline này gồm 8 system prompt. Mỗi cái xử lý một bước.

Điểm hay là tất cả output đều ở dạng JSON, nên dữ liệu đi từ bước này sang bước khác rất “sạch”.

Tôi chỉ việc bỏ prompt vào thư mục, chạy Cowork, và đợi.

Cuối cùng, tôi nhận được một file DOCX chứa toàn bộ phân tích + content plan.

Bên trong pipeline có gì?

1. Tách “tín hiệu”

Bước đầu tiên là lấy ra những câu nói đáng chú ý từ dữ liệu.

Không suy diễn. Không viết lại. Chỉ lấy nguyên văn.

Mỗi câu được gắn nhãn: pain, objection, mong muốn, trigger, nhắc đến đối thủ, hoặc những cách nói đặc trưng.

Ngoài ra còn có cảm xúc và mức độ (1–5).

Điểm quan trọng nhất: ngôn ngữ của người dùng là tài sản.

Từ 50 bài, thường sẽ ra khoảng 50–150 “tín hiệu”.

2. Gom thành theme

Sau đó, các tín hiệu được gom lại thành các nhóm — gọi là theme.

Chỉ giữ tối đa 10 theme.

Nếu một nhóm không có ít nhất 3 câu trích dẫn, nó bị loại hoặc gộp vào nhóm khác.

Bước này giúp biến một đống dữ liệu lộn xộn thành một danh sách rõ ràng: người ta đang quan tâm cái gì lặp đi lặp lại.

3. Đào sâu từng theme

Mỗi theme được phân tích kỹ hơn theo từng persona.

Bạn sẽ thấy đầy đủ bức tranh: họ đau ở đâu, điều gì khiến họ hành động, điều gì khiến họ chần chừ, họ lo cái gì, họ phản đối ra sao — tất cả đều dựa trên chính lời họ nói.

Một thứ rất đáng giá là những gì không nên nói.

Trong một dataset, tôi nhận ra audience cực kỳ khó chịu với kiểu content “chia sẻ số liệu ngành”. Với họ, mấy con số đó vô nghĩa — thậm chí còn khiến bạn trông như không hiểu gì về thực tế họ đang sống.

4. Thêm các lớp phân tích

Đến đây mới bắt đầu thú vị.

Tôi thêm 4 lớp nhìn vào dữ liệu:

Tần suất — để biết nên ưu tiên cái gì trước.

Ngôn ngữ — để biết nên viết kiểu gì. Trong case này, cộng đồng dùng khá nhiều dark humor, và họ thích kể chuyện thực tế hơn là lý thuyết.

Cảm xúc — để chọn góc tiếp cận. Nội dung cho người đang lo lắng sẽ khác hoàn toàn với nội dung cho người đang tò mò.

Và cuối cùng là cạnh tranh — họ đang nói về tool nào, thích gì, ghét gì.

Khi ghép tất cả lại, bạn không chỉ hiểu vấn đề — bạn hiểu cách nói về vấn đề đó.

5. Biến thành topic

Bước cuối là chuyển tất cả thành các chủ đề nội dung cụ thể.

Không phải kiểu “viết blog gì hôm nay”, mà là map theo funnel.

Những thứ liên quan đến phản đối và lo lắng sẽ thành nội dung chuyển đổi.

Những nỗi đau thực tế sẽ thành how-to hoặc case study.

Những insight và pattern sẽ thành bài dẫn dắt tư duy.

Mỗi topic đều có góc kể chuyện rõ ràng, có lý do tồn tại, có persona cụ thể, và có CTA phù hợp.

Và quan trọng nhất: mỗi topic đều phải truy ngược lại được về một câu nói thật của người dùng.

Kết quả cuối cùng

Sau khi chạy xong, thứ tôi có không chỉ là một content plan.

Tôi hiểu audience đang nghĩ gì.

Tôi biết họ đang kẹt ở đâu.

Tôi thấy rõ những khoảng trống nội dung trên thị trường.

Tôi có chính ngôn ngữ của họ — không phải bản viết lại cho “hay”, mà là cách họ thực sự nói.

Và tôi có bằng chứng cho mọi thứ.

Khi ai đó hỏi:

“Vì sao lại viết chủ đề này?”

Câu trả lời rất đơn giản:

“Vì người dùng đã nói về nó 35 lần trong 3 tháng — và chưa ai trả lời họ cho ra hồn.”