Vượt qua Giới hạn của Mô hình Sequence-to-Sequence Truyền thống. Trước khi Attention ra đời, các mô hình Sequence-to-Sequence (Seq2Seq) phổ biến, ví dụ như trong dịch máy, thường bao gồm một Encoder (
0 0 1