Tag Computer Vision

Tìm kiếm bài viết trong Tag Computer Vision

03/07/2025 - vừa được xem lúc 13 giờ trước

GStreamer cho người mới bắt đầu - Phần 2: Cài đặt, chạy, debug pipeline GStreamer với Python

#Computer Vision

Trong phần 1, mình đã trình bày lý thuyết về các thành phần cơ bản trong một GStreamer pipeline rồi, giờ thì bắt tay vào phần thực hành nào . À vì các bạn đã tìm hiểu đến GStreamer, nên mình mặc định

0 0 14

18/06/2025 - vừa được xem lúc 12 giờ trước

GStreamer cho người mới bắt đầu - Phần 1: Giới thiệu thuật ngữ.

#Computer Vision

Khi chạy các bài toán Computer Vision cần phải xử lý các stream camera, mình hay đọc stream và lưu video bằng OpenCV. Vì nó đơn giản, dễ dùng, và code trên mạng sử dụng đầy .

0 0 13

28/04/2025 - vừa được xem lúc 12 giờ trước

Image stitching

#Image Processing

#Computer Vision

#image stitching

Giới thiệu. Image Stitching hay còn được biết đến là ghép ảnh là một kỹ thuật trong thị giác máy tính nhằm kết hợp ảnh của cùng một khung cảnh nhưng được chụp ở nhiều góc khác nhau để tạo thành một bứ

0 0 16

31/03/2025 - vừa được xem lúc 11/09/2025

[Vintern-1B-v3.5] Mô hình kết hợp OCR và xử lý văn bản nhỏ nhẹ dành cho tiếng Việt

#Computer Vision

#Giới thiệu về công nghệ OCR

1. Giới thiệu.

0 0 22

13/01/2025 - vừa được xem lúc 14/09/2025

NaViT: Thuật toán Transformer với Tầm nhìn Đa phân giải - Cải thiện khả năng nhìn của Transformer trong xử lý hình ảnh

#Computer Vision

#Artificial Intelligence

#NLP (Natural Language Processing)

Transformer, ban đầu được thiết kế cho xử lý ngôn ngữ tự nhiên (NLP), đã nhanh chóng trở thành một kiến trúc quan trọng trong thị giác máy tính. Các mô hình như Vision Transformer (ViT) đã chứng minh

0 0 16

30/09/2024 - vừa được xem lúc 11/09/2025

Scope and Applications of Computer Vision

#Computer Vision

#Artificial Intelligence

Computer vision represents one of the multidisciplinary areas focused on enabling machines to understand visual information from the world. It is founded on the application of additional capabilities,

0 0 20

07/06/2024 - vừa được xem lúc 11/09/2025

[Paper reading] Towards Multi-Lingual Visual Question Answering

#Machine Learning

#Computer Vision

Giới thiệu chung. Visual Question Answering (VQA) là một bài toán thú vị mô phỏng gần nhất khả năng của con người.

0 0 28

23/08/2023 - vừa được xem lúc 11/09/2025

Góc nhìn tổng quan về bài toán Blind Image Super-Resolution

#Computer Vision

Blind image super-resolution (hay siêu phân giải mù), là bài toán nhằm siêu phân giải hình ảnh chất lượng thấp với degradation chưa biết, đã thu hút sự chú ý do tầm quan trọng trong việc phát triển cá

0 0 54

11/08/2023 - vừa được xem lúc 11/09/2025

[AI-Avatar] Tạo sinh Avatar cùng với Stable Diffusion

#Computer Vision

#Generative Adversarial Network

#diffusion-model

#Stable Diffusion

1. GIỚI THIỆU.

0 0 55

07/05/2023 - vừa được xem lúc 11/09/2025

Inpaint Anything - Công cụ chỉnh sửa ảnh bằng cách kết hợp SAM với Stable Diffusion

#Computer Vision

#Image Inpainting

Mở đầu. Inpaint Anything được giới thiệu trong bài báo Inpaint Anything: Segment Anything Meets Image Inpainting (Yu et al.

0 0 34

05/05/2023 - vừa được xem lúc 11/09/2025

[Paper Explain] YOLOF: Lời tạm biệt cho multi-scale features trong Object Detection?

#Computer Vision

#Object detection

#ContentCreator

Ôn lại kiến thức. Multi-scale features là gì và tại sao chúng lại cần thiết cho Object Detection.

0 0 40

04/05/2023 - vừa được xem lúc 11/09/2025

[Paper Explain] RTMDet: YOLO của OpenMMLab

#Computer Vision

#Object detection

#ContentCreator

Mở đầu. Mình khá là thích OpenMMLab, một team nghiên cứu đã cung cấp rất nhiều repo tăng tốc các thử nghiệm như MMDetection, MMSegmentation, MMCV,.

0 0 44

03/05/2023 - vừa được xem lúc 11 giờ trước

Tổng quan về SAM - Công cụ segment vật thể bằng prompt cho bài toán Image Segmentation

#Computer Vision

#Image Segmentation

Mở đầu. SAM (Segment Anything Model) được Meta AI công bố vào tháng 4 năm 2023 trong dự án "Segment Anything" với vai trò là một foundation model có thể segment vật thể trong ảnh sử dụng prompt, hay n

0 0 36

13/04/2023 - vừa được xem lúc 11/09/2025

Zero-shot Object Detection with Detic

#Machine Learning

#Computer Vision

#Object detection

Gần đây chúng ta đã quá quen thuộc với từ khóa "zero-shot", một trong những ví dụ điểm hình của nó chính là ChatGPT của OpenAI đang làm mưa làm gió trên khắp các diễn đàn kể cả không liên quan tới trí

0 0 48

03/04/2023 - vừa được xem lúc 11/09/2025

[Paper Explain] Clustering trong Computer Vision: Hướng đi mới thay thế CNN và Transformer?

#Computer Vision

#ContentCreator

Tóm tắt. Ảnh là gì và làm thế nào để trích xuất features.

0 0 42

09/03/2023 - vừa được xem lúc 11/09/2025

YOLOv4 - Kỷ nguyên mới cho những mô hình họ YOLO

#Computer Vision

#Convolutional Neural Network

#Object detection

Trong lĩnh vực Computer Vision, bài toán Object Detection là một bài toán hết sức phổ biến. Như cái tên gọi của nó, mục tiêu của bài toán này là phát hiện và phân loại ra những vật thể tồn tại ở trong

0 0 57

07/03/2023 - vừa được xem lúc 8 giờ trước

Tính chất của Self-Attention và Transformer trong Computer Vision

#Computer Vision

#ContentCreator

Mở đầu. Qua 2 bài viết: cơ chế Attention trong Computer Vision và MetaFormer với cái tiêu đề đầy chế giễu, thì giống như mình là một hater của Self-Attention.

0 0 48

03/03/2023 - vừa được xem lúc 14/09/2025

"Dạy AI làm bác sỹ" - Thực hành bài toán phân vùng ảnh y tế với mô hình Transformer

#Computer Vision

#ContentCreator

1. Giới thiệu bài toán.

0 0 41

23/02/2023 - vừa được xem lúc 11/09/2025

[Paper Explained] PSPNet - Mô hình Deep Learning kinh điển cho bài toán Semantic Segmentation

#Computer Vision

#Semantic Segmentation

1. Giới thiệu.

0 0 49

18/02/2023 - vừa được xem lúc 11/09/2025

Introduction Backpropagation CNN(Series 2)

#Computer Vision

#KhaiButDauXuan

#Machine Leaning

#backpropagation

Nhân dịp năm mới mình kính mong tất cả mọi người năm mới an lạnh thật nhiều niềm vui . Chúc mừng năm mới ngập tràn tiếng cười.

0 0 44

01/02/2023 - vừa được xem lúc 11/09/2025

[Paper Explain] MetaFormer: Khi Attention is NOT all you need cho bài toán phân loại ảnh

#Computer Vision

#image classification

#KhaiButDauXuan

#ContentCreator

Yêu cầu nhỏ. Hiểu về các lớp Norm khác nhau hoạt động như nào: BatchNorm (BN), GroupNorm (GN), LayerNorm (LN) và biết cách sử dụng Pytorch. . Hình 0.

0 0 39

1
2
3