Tag LLM

Tìm kiếm bài viết trong Tag LLM

16/05/2025 - vừa được xem lúc 21/07/2025

Better prompt engineering - Prompt techniques

#Prompt Engineering

Trong bài viết trước (Factors influencing LLM Output) , tôi đã đề cập những yếu tố ảnh hưởng đến output của LLM. Những yếu tố này đóng vai trò nền tảng giúp chúng ta khai thác tốt hơn sức mạnh của LLM

0 0 12

15/05/2025 - vừa được xem lúc 19/07/2025

Xây Dựng Mô Hình Ngôn Ngữ Lớn (Phần 1): LLM là cái gì ?

Nếu đã click vào bài viết này thì chắc hẳn các bạn cũng đã dùng qua ChatGPT hay các công cụ tương tự ít nhất một lần Khả năng biểu đạt ngôn ngữ một cách tự nhiên của chatbot làm nhiều người kinh ngạc

0 0 14

15/05/2025 - vừa được xem lúc 16/07/2025

Xây Dựng Mô Hình Ngôn Ngữ Lớn (Phần 2): Xử lý dữ liệu văn bản

Một phần bài viết được thể hiện dưới dạng Jupyter NoteBook tại đây. 1.

0 0 12

15/05/2025 - vừa được xem lúc 19/07/2025

Xây Dựng Mô Hình Ngôn Ngữ Lớn (Phần 3): Cơ chế Attention

Ở bài viết trước chúng ta đã cùng tìm hiểu qua các kỹ thuật tiền xử lý dữ liệu văn bản. Với đầu ra input embeddings thu được, chúng ta sẽ tiếp tục dành toàn bộ bài viết để hiểu cơ chế Attention, thứ đ

0 0 11

15/05/2025 - vừa được xem lúc 15 giờ trước

Xây Dựng Mô Hình Ngôn Ngữ Lớn (Phần 4): Triển khai mô hình GPT

File Jupyter notebook của bài viết này nằm tại đây. 1.

0 0 12

15/05/2025 - vừa được xem lúc 20/07/2025

Xây Dựng Mô Hình Ngôn Ngữ Lớn (Phần 5): Tiền huấn luyện với dữ liệu không gán nhãn

#Machine Learning

File Jupyter Notebook của bài viết này có thể xem tại đây. 1.

0 0 12

15/05/2025 - vừa được xem lúc 20/07/2025

Xây Dựng Mô Hình Ngôn Ngữ Lớn (Phần 6): Tinh chỉnh cho nhiệm vụ phân loại văn bản

Ở các bài viết trước, ta đã triển khai gần như hoàn chỉnh việc xây dựng 1 mô hình ngôn ngữ lớn, từ việc xử lý dữ liệu đầu vào, cơ chế attention, logic trong khối Transformer cho đến tiền huấn luyện. B

0 0 12

15/05/2025 - vừa được xem lúc 20/07/2025

Xây Dựng Mô Hình Ngôn Ngữ Lớn (Phần 7): Tinh chỉnh mô hình với phương pháp follow instructions

File Jupyter NoteBook của bài viết này có thể xem tại đây. 1. Instruction fine-tuning. Sau giai đoạn tiền huấn luyện, mô hình đã có thể sinh văn bản khá tốt.

0 0 12

14/05/2025 - vừa được xem lúc 16/07/2025

Cài đặt DeerFlow Dễ Dàng: ServBay Cung Cấp Giải Pháp Toàn Diện

Thế giới AI gần đây có sôi động như Super Bowl không? Sức nóng của DeepSeek chưa kịp lắng xuống, Qwen3 đã đến chiếm sóng, và giờ đây, DeerFlow của ByteDance đang có một màn ra mắt ấn tượng với hào qua

0 0 10

07/05/2025 - vừa được xem lúc 16/07/2025

[Advanced-LLM] Reasoning LLM và Những Điều Thú Vị Mà Có Thể Bạn Đã Biết Phần 1.

#ContentCreator

#Slow Thinking Model

Mở đầu. Bài viết này thì sẽ là paper này, một paper khá khủng .

0 0 10

04/05/2025 - vừa được xem lúc 16/07/2025

Thời đại viết SQL Query đã kết thúc? Hướng dẫn sử dụng MySQL MCP Server kết hợp Claude Desktop

#Model Context Protocol

MCP - Model Context Protocol là gì. Mô hình kiến trúc MCP.

0 0 19

04/05/2025 - vừa được xem lúc 21/07/2025

Hướng dẫn finetune mô hình LLM đơn giản và miễn phí với Unsloth

Chào mừng các bạn đến với bài viết hướng dẫn chi tiết cách finetune (tinh chỉnh) một mô hình ngôn ngữ lớn (LLM) một cách đơn giản và hoàn toàn miễn phí sử dụng thư viện Unsloth. Trong bài viết này, ch

0 0 14

21/04/2025 - vừa được xem lúc 20/07/2025

Tận dụng khả năng AI cục bộ của ServBay: Dịch hàng loạt tài liệu Markdown một cách dễ dàng

#Advance Python

Giới thiệu. Trong thế giới ngày càng toàn cầu hóa hiện nay, nhu cầu về nội dung đa ngôn ngữ đang bùng nổ.

0 0 11

13/04/2025 - vừa được xem lúc 16/07/2025

So sánh MCP và A2A: Hai Giao thức Quan trọng Cho Tương Lai AI

Trong bối cảnh AI đang bùng nổ với các mô hình ngôn ngữ lớn (LLMs) và các Autonomous agents, việc giao tiếp giữa các hệ thống (cả nội bộ lẫn bên ngoài) trở nên cần thiết hơn bao giờ hết. Hai giao thức

0 0 16

10/04/2025 - vừa được xem lúc 16/07/2025

Hướng dẫn trực quan về LLM Agents

Văn bản gốc đang được dịch và xem xét với sự cho phép của tác giả gốc (Maarten Grootendorst). Mình đã dịch văn bản gốc và thêm một số liên kết.

0 0 11

09/04/2025 - vừa được xem lúc 16/07/2025

Model Context Protocol: Giao thức ngữ cảnh cho mô hình AI hiện đại

#Model Context Protocol

Trong thời đại trí tuệ nhân tạo (AI) phát triển mạnh mẽ, việc tối ưu hóa cách các mô hình xử lý thông tin ngữ cảnh trở thành yếu tố then chốt để nâng cao hiệu suất và trải nghiệm người dùng. Một khái

0 0 17

08/04/2025 - vừa được xem lúc 8 giờ trước

Reward Modeling trong các mô hình LLM

#Machine Leaning

Reward Modeling là gì. Thay vì chỉ học từ dữ liệu đầu vào và đầu ra như trước kia, bây giờ ta dạy mô hình học cách đánh giá chất lượng của một câu trả lời.

0 0 10

03/04/2025 - vừa được xem lúc 5 giờ trước

Tối Ưu Hóa RAG: Khám Phá 5 Chiến Lược Chunking Hiệu Quả Bạn Cần Biết

#ChunkingStrategies

#RetrievalAugmentedGeneration

Trong thế giới Trí tuệ nhân tạo đang phát triển vũ bão, Retrieval-Augmented Generation (RAG) nổi lên như một kỹ thuật đột phá, giúp các Mô hình Ngôn ngữ Lớn (LLM) truy cập và tận dụng kiến thức bên ng

0 0 10

31/03/2025 - vừa được xem lúc 20/07/2025

[Vintern-1B-v3.5] Mô hình kết hợp OCR và xử lý văn bản nhỏ nhẹ dành cho tiếng Việt

#Computer Vision

#Giới thiệu về công nghệ OCR

1. Giới thiệu.

0 0 18

31/03/2025 - vừa được xem lúc 17 giờ trước

[Paper Explain] A new direction in text generations. Let's deep into Large Language Diffusion Model.

#diffusion-model

#ContentCreator

#Content Creator

Mở đầu. Thế thì thử đi sâu vào xem các pháp sư đã làm gì model nào . Paper : Large Language Diffusion Models. Hold up :.

0 0 19

23/03/2025 - vừa được xem lúc 16/07/2025

RLHF - Cơ bản về Reinforcement Learning from Human Feedback

#Reinforcement learning

#NLP (Natural Language Processing)

Giới thiệu. Trong bài viết này, chúng ta sẽ tìm hiểu về “Learning from Human Feedback”.

0 0 11

1
2
3
4
...
7