Tag Computer Vision
Tìm kiếm bài viết trong Tag Computer Vision
Scope and Applications of Computer Vision
Computer vision represents one of the multidisciplinary areas focused on enabling machines to understand visual information from the world. It is founded on the application of additional capabilities,
0 0 5
[Paper reading] Towards Multi-Lingual Visual Question Answering
Giới thiệu chung. Visual Question Answering (VQA) là một bài toán thú vị mô phỏng gần nhất khả năng của con người.
0 0 11
Góc nhìn tổng quan về bài toán Blind Image Super-Resolution
Blind image super-resolution (hay siêu phân giải mù), là bài toán nhằm siêu phân giải hình ảnh chất lượng thấp với degradation chưa biết, đã thu hút sự chú ý do tầm quan trọng trong việc phát triển cá
0 0 39
Inpaint Anything - Công cụ chỉnh sửa ảnh bằng cách kết hợp SAM với Stable Diffusion
Mở đầu. Inpaint Anything được giới thiệu trong bài báo Inpaint Anything: Segment Anything Meets Image Inpainting (Yu et al.
0 0 19
[Paper Explain] YOLOF: Lời tạm biệt cho multi-scale features trong Object Detection?
Ôn lại kiến thức. Multi-scale features là gì và tại sao chúng lại cần thiết cho Object Detection.
0 0 20
[Paper Explain] RTMDet: YOLO của OpenMMLab
Mở đầu. Mình khá là thích OpenMMLab, một team nghiên cứu đã cung cấp rất nhiều repo tăng tốc các thử nghiệm như MMDetection, MMSegmentation, MMCV,.
0 0 24
Tổng quan về SAM - Công cụ segment vật thể bằng prompt cho bài toán Image Segmentation
Mở đầu. SAM (Segment Anything Model) được Meta AI công bố vào tháng 4 năm 2023 trong dự án "Segment Anything" với vai trò là một foundation model có thể segment vật thể trong ảnh sử dụng prompt, hay n
0 0 23
Zero-shot Object Detection with Detic
Gần đây chúng ta đã quá quen thuộc với từ khóa "zero-shot", một trong những ví dụ điểm hình của nó chính là ChatGPT của OpenAI đang làm mưa làm gió trên khắp các diễn đàn kể cả không liên quan tới trí
0 0 30
[Paper Explain] Clustering trong Computer Vision: Hướng đi mới thay thế CNN và Transformer?
Tóm tắt. Ảnh là gì và làm thế nào để trích xuất features.
0 0 25
YOLOv4 - Kỷ nguyên mới cho những mô hình họ YOLO
Trong lĩnh vực Computer Vision, bài toán Object Detection là một bài toán hết sức phổ biến. Như cái tên gọi của nó, mục tiêu của bài toán này là phát hiện và phân loại ra những vật thể tồn tại ở trong
0 0 42
Tính chất của Self-Attention và Transformer trong Computer Vision
Mở đầu. Qua 2 bài viết: cơ chế Attention trong Computer Vision và MetaFormer với cái tiêu đề đầy chế giễu, thì giống như mình là một hater của Self-Attention.
0 0 29
"Dạy AI làm bác sỹ" - Thực hành bài toán phân vùng ảnh y tế với mô hình Transformer
1. Giới thiệu bài toán.
0 0 25
[Paper Explained] PSPNet - Mô hình Deep Learning kinh điển cho bài toán Semantic Segmentation
1. Giới thiệu.
0 0 37
Introduction Backpropagation CNN(Series 2)
Nhân dịp năm mới mình kính mong tất cả mọi người năm mới an lạnh thật nhiều niềm vui . Chúc mừng năm mới ngập tràn tiếng cười.
0 0 29
[Paper Explain] MetaFormer: Khi Attention is NOT all you need cho bài toán phân loại ảnh
Yêu cầu nhỏ. Hiểu về các lớp Norm khác nhau hoạt động như nào: BatchNorm (BN), GroupNorm (GN), LayerNorm (LN) và biết cách sử dụng Pytorch. . Hình 0.
0 0 24
Phân loại hình ảnh với Vision Transformer
Ví dụ này triển khai mô hình Vision Transformer (ViT) của Alexey Dosovitskiy để phân loại hình ảnh và thể hiện mô hình đó trên tập dữ liệu CIFAR-100. Mô hình ViT áp dụng kiến trúc Transformer với khả
0 0 33
[Paper Explain] TOOD: Thống nhất Classification và Localization cho Object Detection
Tại sao lại là TOOD. Cách giải quyết vấn đề dễ hiểu, trực quan, kèm theo chứng minh về mặt hình ảnh rõ ràng. Author thân thiện :v. .
0 0 26
[Paper Explain] Rep-Optimizer: Re-params Optimizer thay vì Re-params model của bạn
Một số khái niệm cần nắm được. .
0 0 24
Imagen - Mô hình SOTA giải quyết bài toán Text-to-Image
Imagen - mô hình mới được công bố gần đây bởi Google với khả năng generate hình ảnh với đoạn text mô tả bất kỳ, cho dù ảnh đó không có thật hoặc phi vật lý. Phía trên là một ví dụ của ảnh được sinh ra
0 0 43