Tag Transformer

Tìm kiếm bài viết trong Tag Transformer

07/07/2025 - vừa được xem lúc 17/07/2025

Transformer: Hiện đại hơn LSTM

#Transformer

#NLP

#RNN

#deeplearning

#LSTM

Transformer: Kiến Thức Cơ Bản. 1.

0 0 3

19/01/2025 - vừa được xem lúc 23/07/2025

MHA vs MQA vs GQA vs MLA: Các cơ chế chiến thuật khác nhau trong quá trình tính toán Attention trong Transformer

#Transformer

Trong các mô hình Transformer, cơ chế Attention đóng vai trò cốt lõi trong việc xử lý và học tập ngữ cảnh chuỗi dữ liệu. Để tối ưu hóa hiệu suất tính toán và quản lý bộ nhớ, nhiều chiến thuật chú ý đã

0 0 10

19/01/2025 - vừa được xem lúc 16/07/2025

KV Cache: Phương án tối ưu bộ nhớ trong Transformers

#Transformer

Trong những năm gần đây, Transformer đã trở thành một trụ cột vũng chãi trong lĩnh vực xử lý ngôn ngữ tự nhiên (NLP) và trí tuệ nhân tạo (AI) như một mô hình địa cốt cho các tác vụ như dịch máy, sinh

0 0 5

13/01/2025 - vừa được xem lúc 20/07/2025

NaViT: Thuật toán Transformer với Tầm nhìn Đa phân giải - Cải thiện khả năng nhìn của Transformer trong xử lý hình ảnh

#Computer Vision

#Transformer

#Artificial Intelligence

#NLP (Natural Language Processing)

Transformer, ban đầu được thiết kế cho xử lý ngôn ngữ tự nhiên (NLP), đã nhanh chóng trở thành một kiến trúc quan trọng trong thị giác máy tính. Các mô hình như Vision Transformer (ViT) đã chứng minh

0 0 11

07/01/2025 - vừa được xem lúc 16/07/2025

Rotary Position Embedding - RoPE: Sợi dây thắt chặt mối liên hệ về mặt vị trí trong mô hình Transformer

#AI

#Transformer

Trong những năm gần đây, các mô hình Transformer đã trở thành xương sống của hầu hết các tiến bộ trong lĩnh vực xử lý ngôn ngữ tự nhiên (NLP) và thị giác máy tính (CV). Tuy nhiên, bản chất không tuần

0 0 8

20/06/2024 - vừa được xem lúc 16/07/2025

Paper reading | Fastformer: Additive Attention Can Be All You Need

#Transformer

1. Động lực.

0 0 20

08/11/2023 - vừa được xem lúc 16/07/2025

Paper reading | Video Swin Transformer

#Deep Learning

#Transformer

Đóng góp của bài báo. Kiến trúc Transformer ngày càng chiếm xong trên mọi mặt trận cụ thể trong các bài toán liên quan tới lĩnh vực Computer Vision.

0 0 26

07/09/2023 - vừa được xem lúc 03/08/2025

Attention và sự hình thành của mô hình Transformer

1. Mở đầu.

0 0 32

27/05/2023 - vừa được xem lúc 30/07/2025

Transformer - Từ những khái niệm cơ bản nhất (P.1)

#Transformer

Bài viết trình bày về kiến trúc Transformer (Bộ chuyển đổi) từ những khái niệm và thành phần cơ bản nhất, với mong muốn giúp bạn đọc có thể nắm bắt được phương thức hoạt động của một mạng dựa trên Tra

0 0 34

20/05/2023 - vừa được xem lúc 16/07/2025

Tổng quan: Các thành phần cấu tạo nên Transformer (Phần 1)

#PyTorch

#Transformer

#NLP

Transformer - một kiến trúc state-of-the-art được giới thiệu bởi Vaswani và cộng sự tại Google Brain vào năm 2017. Đã có rất nhiều những bài viết, tutorial để giải thích các thành phần của Transformer

0 0 36

19/05/2023 - vừa được xem lúc 20/07/2025

[Từ Transformer Đến Language Model] Bài 2: Kiến trúc và phương pháp Generative-Pretraining của GPT model

Tiếp nối series kiến thức nền tảng của large language model. Ở Bài 1: Bắt đầu với kiến trúc mô hình - Transformer, mình đã giới thiệu với các bạn về kiến trúc khởi nguồn của large language model - tra

0 0 36

10/05/2023 - vừa được xem lúc 16/07/2025

[Từ Transformer Đến Language Model] Bài 1: Bắt đầu với kiến trúc mô hình - Transformer

Chỉ trong vòng vài tháng trở lại đây, thế giới công nghệ đã bị khuynh đảo bởi các mô hình AI như ChatGPT, GPT-4, DALLE-2, Midjourney... Các mô hình AI đã và đang thực sự thay đổi cách thế giới này vận

0 0 32

08/05/2023 - vừa được xem lúc 20/07/2025

Giữa Convolutional Neural Network, Transformer và Graph Neural Network

#Graph Neural Network

#Graph Convolution Network

#Convolutional Neural Network

#Transformer

Caveat. Công thức của một lớp tích chập trong Convolutional Neural Network(CNN) có thể được viết dưới dạng như Hình 1:.

0 0 39

07/03/2023 - vừa được xem lúc 03/08/2025

Tính chất của Self-Attention và Transformer trong Computer Vision

Mở đầu. Qua 2 bài viết: cơ chế Attention trong Computer Vision và MetaFormer với cái tiêu đề đầy chế giễu, thì giống như mình là một hater của Self-Attention.

0 0 42

19/12/2022 - vừa được xem lúc 23/07/2025

[Paper Explain] EfficientFormer: Vision Transformers at MobileNet Speed

#AI

#Transformer

#ContentCreator

I. Mở Đầu:.

0 0 33

27/09/2022 - vừa được xem lúc 16/07/2025

DINO: SOTA của Object Detection có gì hay ho

#Deep Learning

#Transformer

#Object detection

1. Lời mở đầu.

0 0 46

25/08/2022 - vừa được xem lúc 23/07/2025

[Paper Explain] Colonformer: mô hình SOTA thuần việt cho bài toán xử lý ảnh y tế

1. Giới thiệu chung.

0 0 48

24/08/2022 - vừa được xem lúc 16/07/2025

GLiT: Neural Architecture Search for Global and Local Image Transformer

#Machine Learning

#Deep Leanring

#Transformer

#Neural Architecture Search

Mở đầu. Trong thời gian qua, các kiến trúc dựa trên Convolutional Neural Networks (CNN) đã và đang có những thành công đáng kể trong các tác vụ học sâu.

0 0 40

04/08/2022 - vừa được xem lúc 16/07/2025

Object Detection with Transfromer: DETR

#Transformer

#Object detection

1. Sơ bộ về Self-Attention và Transformer. 1.1 Self Attention.

0 0 40

12/07/2022 - vừa được xem lúc 16/07/2025

Giới thiệu SegFormer - Mô hình Transformer đơn giản, hiệu quả cho bài toán segmentation

#Deep Learning

#Computer Vision

#Transformer

#Semantic Segmentation

Giới thiệu. Bài toán semantic segmentation là một trong những bài toán rất quan trọng trong lĩnh vực computer vision, nhiệm vụ của bài toán là phân loại từng pixel trong ảnh.

0 0 44

06/07/2022 - vừa được xem lúc 02/08/2025

Giới thiệu Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

#Computer Vision

#Deep Learing

#Transformer

Mở đầu. Gần đây, các kiến trúc Transformer đã dần dần trở nên phổ biến trong các bài toán về computer vision.

0 0 49