[Machine Learning] Một số nguồn hay cho việc tìm hiểu cơ chế "Attention"

0 0 43

Người đăng: Phan Ngoc

Theo Viblo Asia

head-attention-mechanism

https://data-science-blog.com/blog/2021/04/07/multi-head-attention-mechanism/

Giải thích về mặt toán học cơ chế head attention.

The Illustrated Transformer

http://jalammar.github.io/illustrated-transformer/

Giải thích khá hay, có ví dụ minh hoạ trực quan cho cơ chế xác xuất của Transformer

The Attention Mechanism from Scratch

https://machinelearningmastery.com/the-attention-mechanism-from-scratch/

Giải thích sơ về mặt toán học, có code ví dụ về python, khá sát với thực tiễn, xong khi đọc cũng khó hiểu cho các bạn mới

Getting meaning from text: self-attention step-by-step video

https://peltarion.com/blog/data-science/self-attention-video

Giải thích cũng khá dễ hiểu, có video hướng dẫn từng step, và mô hình visual nhìn cũng khá ổn

How Attention works in Deep Learning: understanding the attention mechanism in sequence models

Giải thích từng bước sự tiến hoá của các mô hình để đạt tới Attention method, qua đó chúng ta dễ có cách nhìn sâu sắc hơn về căn nguyên và các bước phát triển

https://theaisummer.com/attention/

Bình luận

Bài viết tương tự

29/03/2021 - vừa được xem lúc 18 giờ trước

Tản mạn về Self Attention

Trending

Self attention hay intra-attention - cụm từ chắc hẳn đã được đồng đạo trong giới Machine Learning biết đến nhiều qua một bài báo rất nổi tiếng Attention is All You Need đề cập đến mô hình Transfomer đ

0 0 81

27/07/2021 - vừa được xem lúc 21/09/2025

Cơ chế Attention và các hàm tính Attention Scoring

Cơ chế Attention là gì. Như vậy, trạng thái ẩn cuối cùng phải tải toàn bộ thông tin của chuỗi nguồn, nhưng 1 token trong chuỗi đích có thể chỉ liên quan đến một vài token trong chuỗi nguồn.

0 0 64

20/02/2023 - vừa được xem lúc 17/09/2025

Khám phá sức mạnh của cơ chế Self Attention trong Transformers

Lời nói đầu. Transformers đã cách mạng hóa quá trình xử lý ngôn ngữ tự nhiên (NLP) bằng cách đạt được hiệu suất tiên tiến nhất trên nhiều tác vụ như dịch máy, lập mô hình ngôn ngữ và phân tích tình cả

0 0 48

17/04/2025 - vừa được xem lúc 23/09/2025

Local Attention trong Mô hình Học Sâu

Local Attention là gì. Thay vì để mỗi phần tử trong chuỗi đầu vào chú ý đến toàn bộ các phần tử còn lại như trong Global Attention, Local Attention giới hạn phạm vi chú ý trong một cửa sổ cục bộ — thư

0 0 21

04/01/2023 - vừa được xem lúc 5 giờ trước

Trực quan hóa thuật toán Machine Leaning bằng Python

Thuật toán ML(machine learning) thường được sử dụng để tìm mối quan hệ đặc trưng giữa các features và labels. Features là các biến độc lập mà chúng ta đưa vào thuật toán để huấn luyện mô hình ML, còn

0 0 39

07/01/2023 - vừa được xem lúc 16/09/2025

Machine Learning Cơ bản || Lesson 01: Sơ lược về Machine Learning

Sơ lược về Machine Learning (ML). 1) Định nghĩa về ML:.

0 0 37