Tag Computer Vision
Tìm kiếm bài viết trong Tag Computer Vision
YOLOv4 - Kỷ nguyên mới cho những mô hình họ YOLO
Trong lĩnh vực Computer Vision, bài toán Object Detection là một bài toán hết sức phổ biến. Như cái tên gọi của nó, mục tiêu của bài toán này là phát hiện và phân loại ra những vật thể tồn tại ở trong
0 0 2
Tính chất của Self-Attention và Transformer trong Computer Vision
Mở đầu. Qua 2 bài viết: cơ chế Attention trong Computer Vision và MetaFormer với cái tiêu đề đầy chế giễu, thì giống như mình là một hater của Self-Attention.
0 0 1
"Dạy AI làm bác sỹ" - Thực hành bài toán phân vùng ảnh y tế với mô hình Transformer
1. Giới thiệu bài toán.
0 0 4
[Paper Explained] PSPNet - Mô hình Deep Learning kinh điển cho bài toán Semantic Segmentation
1. Giới thiệu.
0 0 2
Introduction Backpropagation CNN(Series 2)
Nhân dịp năm mới mình kính mong tất cả mọi người năm mới an lạnh thật nhiều niềm vui . Chúc mừng năm mới ngập tràn tiếng cười.
0 0 2
[Paper Explain] MetaFormer: Khi Attention is NOT all you need cho bài toán phân loại ảnh
Yêu cầu nhỏ. Hiểu về các lớp Norm khác nhau hoạt động như nào: BatchNorm (BN), GroupNorm (GN), LayerNorm (LN) và biết cách sử dụng Pytorch. . Hình 0.
0 0 2
Phân loại hình ảnh với Vision Transformer
Ví dụ này triển khai mô hình Vision Transformer (ViT) của Alexey Dosovitskiy để phân loại hình ảnh và thể hiện mô hình đó trên tập dữ liệu CIFAR-100. Mô hình ViT áp dụng kiến trúc Transformer với khả
0 0 4
[Paper Explain] TOOD: Thống nhất Classification và Localization cho Object Detection
Tại sao lại là TOOD. Cách giải quyết vấn đề dễ hiểu, trực quan, kèm theo chứng minh về mặt hình ảnh rõ ràng. Author thân thiện :v. .
0 0 5
[Paper Explain] Rep-Optimizer: Re-params Optimizer thay vì Re-params model của bạn
Một số khái niệm cần nắm được. .
0 0 3
Imagen - Mô hình SOTA giải quyết bài toán Text-to-Image
Imagen - mô hình mới được công bố gần đây bởi Google với khả năng generate hình ảnh với đoạn text mô tả bất kỳ, cho dù ảnh đó không có thật hoặc phi vật lý. Phía trên là một ví dụ của ảnh được sinh ra
0 0 13
Một chút về cơ chế Attention trong Computer Vision
Mở đầu. Cơ chế Attention (Attention mechanism) là một cơ chế vô cùng hay và nhận được rất nhiều sự phát triển gần đây.
0 0 7
Hình ảnh độ phân giải cao với Latent Diffusion Models
1. Giới thiệu vấn đề.
0 0 8
[Paper Explain] RAFT: Recurrent All-Pairs Field Transforms - Mô hình Deep Learning cho bài toán Optical Flow
Bài toán ước lượng Optical Flow là một trong những bài toán quan trọng trong Computer Vision. Nhiệm vụ của bài toán là ước lượng vector 2 chiều mô tả chuyển động đối ứng với từng pixel trong ảnh.
0 0 8
Giới thiệu về Diffussion model
1 . Giới thiệu về sơ lược về diffussion model.
0 0 13
Giới thiệu SegFormer - Mô hình Transformer đơn giản, hiệu quả cho bài toán segmentation
Giới thiệu. Bài toán semantic segmentation là một trong những bài toán rất quan trọng trong lĩnh vực computer vision, nhiệm vụ của bài toán là phân loại từng pixel trong ảnh.
0 0 15
Giới thiệu Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
Mở đầu. Gần đây, các kiến trúc Transformer đã dần dần trở nên phổ biến trong các bài toán về computer vision.
0 0 18
[Paper Explain][End-to-End Dense Video Captioning with Parallel Decoding] PDVC - Hướng tiếp cận end-to-end với giải mã song song cho bài toán Dense Video Captioning
Xin chào các bạn. Chắc hẳn mọi người cũng đã từng nghe qua đến cái tên Video Understanding với rất nhiều các tác vụ con kèm theo đó là khá model nổi tiếng như:.
0 0 13
Các chỉ số đánh giá được sử dụng cho bài toán Image Generation: IS, FID, PSNR, SSIM,...
1. Giới thiệu về bài toán Image Generation.
0 0 14