Tag Deep Learning

Tìm kiếm bài viết trong Tag Deep Learning

17/07/2025 - vừa được xem lúc 30/09/2025

Paper reading | CoAtNet: Marrying Convolution and Attention for All Data Sizes

Giới thiệu. Kể từ sự ra đời của AlexNet, mạng ConvNets đã trở thành một kiến trúc mô hình quan trọng trong lĩnh vực thị giác máy tính.

0 0 12

16/07/2025 - vừa được xem lúc 10 giờ trước

Paper reading | CLIP4STR: A Simple Baseline for Scene Text Recognition with Pre-trained Vision-Language Model

#Deep Learning

#ocr

Đóng góp của bài báo. Các mô hình pretrained Vision-language (VL) với dữ liệu lớn như CLIP và ALIGN thể hiện sự mạnh mẽ trong đa dạng task về hình ảnh và ngôn ngữ.

0 0 11

15/07/2025 - vừa được xem lúc 11/09/2025

Paper reading | MaxViT: Multi-Axis Vision Transformer

#Deep Learning

Đóng góp của bài báo. Các mô hình ViT nếu như không pretrained trước đó sẽ có hiệu suất kém hơn so với các mô hình ConvNets.

0 0 15

14/07/2025 - vừa được xem lúc 01/10/2025

Paper reading | Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning

#Deep Learning

#Resnet

Đóng góp bài báo. Trong bài báo, nhóm tác giả nghiên cứu sự kết hợp của 2 ý tưởng có thể coi là kinh điển trong lịch sử các mô hình CNN nổi tiếng là Residual connection và phiên bản mới nhất của kiến

0 0 15

13/07/2025 - vừa được xem lúc 11/09/2025

Paper reading | Tóm tắt mô hình ResNeSt: Split-Attention Networks

#Deep Learning

Đóng góp của bài báo. Bài báo giới thiệu một kiến trúc mô hình đơn giản có tên ResNeSt sử dụng channel-wise attention trên các nhánh của mạng với mục tiêu tận dụng sức mạnh capture thông tin tương tác

0 0 12

10/07/2025 - vừa được xem lúc 30/09/2025

Paper reading | FastViT: A Fast Hybrid Vision Transformer using Structural Reparameterization

#Deep Learning

Đóng góp của bài báo. Bài báo giới thiệu mô hình FastViT có kiến trúc hybrid vision transformer, mô hình đạt kết quả SOTA trong việc cân bằng giữa latency-accuracy.

0 0 14

10/07/2025 - vừa được xem lúc 23/09/2025

Toán học nền tảng của mạng nơ-ron – Từ trực giác đến Backpropagation

#Deep Learning

#algonest

#nơ-ron

https://algonest.io.vn/toan-hoc-nen-tang-cua-mang-no-ron-tu-truc-giac-den-backpropagation/. Hiểu cấu trúc một nơ-ron nhân tạo hoạt động như thế nào.

0 0 20

09/07/2025 - vừa được xem lúc 23/09/2025

Paper reading | ACTION-Net: Multipath Excitation for Action Recognition

#Deep Learning

#Efficient Video Understanding

Đóng góp của bài báo. Trong các bài toán liên quan tới video, thông tin cần nắm bắt không chỉ là thông tin về mặt không gian (spatial information) giống như hình ảnh mà còn là thông tin về thời gian (

0 0 13

08/07/2025 - vừa được xem lúc 25/09/2025

Paper reading | Scene Text Recognition with Permuted Autoregressive Sequence Models

#Deep Learning

#ocr

Đóng góp của bài báo. Bài toán Scene Text Recognition (STR) luôn nhận được sự quan tâm nhờ tính ứng dụng thực tiễn cao.

0 0 17

02/07/2025 - vừa được xem lúc 13/09/2025

LSTM: RNN phiên bản nâng cấp

Giới thiệu về LSTM. Hi mọi người, mình là Hiếu, ở bài viết trước mình có giới thiệu về RNN.

0 0 15

19/05/2025 - vừa được xem lúc 8 giờ trước

Giới thiệu PyTorch: Có bột mới gột nên hồ

Trong loạt bài viết xây dựng mô hình ngôn ngữ lớn, PyTorch chính là công cụ quan trọng nhất được sử dụng. Tuy nhiên, chúng ta mới chỉ dừng ở mức sử dụng mà chưa có thời gian tìm hiểu kỹ hơn.

0 0 21

15/05/2025 - vừa được xem lúc 30/09/2025

Xây Dựng Mô Hình Ngôn Ngữ Lớn (Phần 4): Triển khai mô hình GPT

File Jupyter notebook của bài viết này nằm tại đây. 1.

0 0 19

15/05/2025 - vừa được xem lúc 27/09/2025

Xây Dựng Mô Hình Ngôn Ngữ Lớn (Phần 5): Tiền huấn luyện với dữ liệu không gán nhãn

File Jupyter Notebook của bài viết này có thể xem tại đây. 1.

0 0 17

15/05/2025 - vừa được xem lúc 28/09/2025

Xây Dựng Mô Hình Ngôn Ngữ Lớn (Phần 6): Tinh chỉnh cho nhiệm vụ phân loại văn bản

Ở các bài viết trước, ta đã triển khai gần như hoàn chỉnh việc xây dựng 1 mô hình ngôn ngữ lớn, từ việc xử lý dữ liệu đầu vào, cơ chế attention, logic trong khối Transformer cho đến tiền huấn luyện. B

0 0 19

15/05/2025 - vừa được xem lúc 23/09/2025

Xây Dựng Mô Hình Ngôn Ngữ Lớn (Phần 7): Tinh chỉnh mô hình với phương pháp follow instructions

File Jupyter NoteBook của bài viết này có thể xem tại đây. 1. Instruction fine-tuning. Sau giai đoạn tiền huấn luyện, mô hình đã có thể sinh văn bản khá tốt.

0 0 18

10/04/2025 - vừa được xem lúc 7 giờ trước

Tập hợp các câu hỏi phỏng vấn trong cuốn DEEP LEARNING INTERVIEWS (ví dụ Dịch bệnh Ebola)

#Algorithm

#Deep Learning

REAL-WORLD DEEP LEARNING INTERVIEW. Muốn cuốn sách khá hay cho a.e ôn luyện các thuật toán deep learning . PROBLEMS & SOLUTIONS.

0 0 36

31/03/2025 - vừa được xem lúc 16/09/2025

[Vintern-1B-v3.5] Mô hình kết hợp OCR và xử lý văn bản nhỏ nhẹ dành cho tiếng Việt

#Deep Learning

#Computer Vision

#LLM

#Giới thiệu về công nghệ OCR

#@AI

1. Giới thiệu.

0 0 23

30/03/2025 - vừa được xem lúc 15/09/2025

Machine Learning Lifecycle: Từ thu thập dữ liệu đến triển khai

1. Giới thiệu.

0 0 34

29/03/2025 - vừa được xem lúc 16/09/2025

MLOps là gì? Ba cấp độ MLOps bạn cần biết!

1. Giới thiệu.

0 0 31

12/01/2025 - vừa được xem lúc 26/09/2025

Parameter vs. Floating-point - Ông thầy mắt cận và thằng bé mắt sáng

#Deep Learning

#AI

#Mechine Learning

NVIDIA vừa tuyên bố sắp ra Project Digits - một chiếc PC mini có thể chạy các mô hình AI "não to" trong một thiết bị bé bằng... cái hộp cơm của bạn! Nhưng để làm được điều này, họ buộc phải đánh đổi:

0 0 15

30/12/2024 - vừa được xem lúc 22/09/2025

Molmo: Hướng đến OpenSource VLM

#Deep Learning

#vlm

I. Giới thiệu.

0 0 17