Tag Computer Vision

Tìm kiếm bài viết trong Tag Computer Vision

- vừa được xem lúc

Scope and Applications of Computer Vision

Computer vision represents one of the multidisciplinary areas focused on enabling machines to understand visual information from the world. It is founded on the application of additional capabilities,

0 0 1

- vừa được xem lúc

[Paper reading] Towards Multi-Lingual Visual Question Answering

Giới thiệu chung. Visual Question Answering (VQA) là một bài toán thú vị mô phỏng gần nhất khả năng của con người.

0 0 9

- vừa được xem lúc

Góc nhìn tổng quan về bài toán Blind Image Super-Resolution

Blind image super-resolution (hay siêu phân giải mù), là bài toán nhằm siêu phân giải hình ảnh chất lượng thấp với degradation chưa biết, đã thu hút sự chú ý do tầm quan trọng trong việc phát triển cá

0 0 37

- vừa được xem lúc

Inpaint Anything - Công cụ chỉnh sửa ảnh bằng cách kết hợp SAM với Stable Diffusion

Mở đầu. Inpaint Anything được giới thiệu trong bài báo Inpaint Anything: Segment Anything Meets Image Inpainting (Yu et al.

0 0 18

- vừa được xem lúc

[Paper Explain] YOLOF: Lời tạm biệt cho multi-scale features trong Object Detection?

Ôn lại kiến thức. Multi-scale features là gì và tại sao chúng lại cần thiết cho Object Detection.

0 0 19

- vừa được xem lúc

[Paper Explain] RTMDet: YOLO của OpenMMLab

Mở đầu. Mình khá là thích OpenMMLab, một team nghiên cứu đã cung cấp rất nhiều repo tăng tốc các thử nghiệm như MMDetection, MMSegmentation, MMCV,.

0 0 23

- vừa được xem lúc

Tổng quan về SAM - Công cụ segment vật thể bằng prompt cho bài toán Image Segmentation

Mở đầu. SAM (Segment Anything Model) được Meta AI công bố vào tháng 4 năm 2023 trong dự án "Segment Anything" với vai trò là một foundation model có thể segment vật thể trong ảnh sử dụng prompt, hay n

0 0 21

- vừa được xem lúc

Zero-shot Object Detection with Detic

Gần đây chúng ta đã quá quen thuộc với từ khóa "zero-shot", một trong những ví dụ điểm hình của nó chính là ChatGPT của OpenAI đang làm mưa làm gió trên khắp các diễn đàn kể cả không liên quan tới trí

0 0 29

- vừa được xem lúc

[Paper Explain] Clustering trong Computer Vision: Hướng đi mới thay thế CNN và Transformer?

Tóm tắt. Ảnh là gì và làm thế nào để trích xuất features.

0 0 22

- vừa được xem lúc

YOLOv4 - Kỷ nguyên mới cho những mô hình họ YOLO

Trong lĩnh vực Computer Vision, bài toán Object Detection là một bài toán hết sức phổ biến. Như cái tên gọi của nó, mục tiêu của bài toán này là phát hiện và phân loại ra những vật thể tồn tại ở trong

0 0 40

- vừa được xem lúc

Tính chất của Self-Attention và Transformer trong Computer Vision

Mở đầu. Qua 2 bài viết: cơ chế Attention trong Computer Vision và MetaFormer với cái tiêu đề đầy chế giễu, thì giống như mình là một hater của Self-Attention.

0 0 26

- vừa được xem lúc

Introduction Backpropagation CNN(Series 2)

Nhân dịp năm mới mình kính mong tất cả mọi người năm mới an lạnh thật nhiều niềm vui . Chúc mừng năm mới ngập tràn tiếng cười.

0 0 27

- vừa được xem lúc

[Paper Explain] MetaFormer: Khi Attention is NOT all you need cho bài toán phân loại ảnh

Yêu cầu nhỏ. Hiểu về các lớp Norm khác nhau hoạt động như nào: BatchNorm (BN), GroupNorm (GN), LayerNorm (LN) và biết cách sử dụng Pytorch. . Hình 0.

0 0 22

- vừa được xem lúc

Phân loại hình ảnh với Vision Transformer

Ví dụ này triển khai mô hình Vision Transformer (ViT) của Alexey Dosovitskiy để phân loại hình ảnh và thể hiện mô hình đó trên tập dữ liệu CIFAR-100. Mô hình ViT áp dụng kiến trúc Transformer với khả

0 0 32

- vừa được xem lúc

[Paper Explain] TOOD: Thống nhất Classification và Localization cho Object Detection

Tại sao lại là TOOD. Cách giải quyết vấn đề dễ hiểu, trực quan, kèm theo chứng minh về mặt hình ảnh rõ ràng. Author thân thiện :v. .

0 0 25

- vừa được xem lúc

[Paper Explain] Rep-Optimizer: Re-params Optimizer thay vì Re-params model của bạn

Một số khái niệm cần nắm được. .

0 0 24

- vừa được xem lúc

Imagen - Mô hình SOTA giải quyết bài toán Text-to-Image

Imagen - mô hình mới được công bố gần đây bởi Google với khả năng generate hình ảnh với đoạn text mô tả bất kỳ, cho dù ảnh đó không có thật hoặc phi vật lý. Phía trên là một ví dụ của ảnh được sinh ra

0 0 42