- vừa được xem lúc

🏷️ Contrastive Learning

0 0 5

Người đăng: Nguyễn Văn Đức

Theo Viblo Asia

🔍 Trong ngữ cảnh bạn đang làm (ghép text ↔ image), nó cụ thể là: 📛 Cross-Modal Contrastive Learning hoặc

📛 Multimodal Contrastive Learning 💥 Ví dụ nổi bật: Mô hình Ý tưởng chính CLIP (OpenAI) Học không gian chung cho text & image embeddings. Dùng contrastive loss để ghép caption đúng với ảnh. ALIGN (Google) Giống CLIP nhưng scale lên hàng tỷ dữ liệu. SimCLR Contrastive learning cho ảnh (image-only). MoCo Momentum contrast – image-only nhưng cũng dùng similarity matrix.

🧠 Các kỹ thuật chính dùng trong đó: Tên kỹ thuật Mô tả Contrastive Loss Phân biệt cặp dương (positive) và cặp âm (negative) InfoNCE Phiên bản chuẩn hoá của contrastive loss, dùng softmax + CE Cosine Similarity Đo độ gần giữa vector embedding Softmax over similarities Xem mỗi dòng (text) như bài toán phân loại ảnh đúng trong batch

📌 Tóm lại: Technique này là một dạng Contrastive Learning, cụ thể là Cross-Modal Contrastive Learning nếu bạn áp dụng trên ảnh và văn bản.

Bạn cũng có thể nói: → “CLIP-style contrastive loss” → “InfoNCE loss over similarity matrix”

Muốn mình gửi tài liệu đọc nhanh hoặc hình minh họa CLIP không?

Bình luận

Bài viết tương tự

- vừa được xem lúc

Giới thiệu về DeepFaceLab công cụ để tạo ra Deepfake thật sự hoàn hảo

I.Làm thế nào 'Furious 7' đã đưa Paul Walker quá cố trở lại cuộc sống. Dưới đây là video. .

0 0 29

- vừa được xem lúc

Hiểu sâu về You Only Look One-YOLOv1

Object detection: bài toán phát hiện + nhận diện vật thể. Bước một là đi tìm vị trí của vật thể trong toàn ảnh rồi bao quanh vật thể ấy bằng một khung hình chữ nhật được gọi là bounding box.

0 0 25

- vừa được xem lúc

TOP 5 BLOG VỀ IT ĐÁNG ĐỌC

Vào những lúc rảnh rỗi, các bạn thường sẽ làm gì? Coi phim, đi chơi, ...Có ai như mình lúc rảnh thì tìm 1 chỗ yên tĩnh nào đó đeo tai phone nghe những bài nhạc chill và đọc truyện và tìm các blog hay

0 0 33

- vừa được xem lúc

Học với tôi(bebuoi1) : BLOG! -> Tại sao lại có cookie và session

Câu hỏi của mình : Tại sao lại có cookie và session trong khi đã có tài khoản mật khẩu . --Tk mk nó giống như 1 cái cccd rồi mà tại sao CÓ NGƯỜI NÓI COOKIE NÓ LẠI GIỐNG CCCD ĐỂ ĐỊNH DANH NHỈ.

0 0 16

- vừa được xem lúc

Tại Sao Sử Dụng Ứng Dụng Lark

Bạn muốn tìm hiểu cách sử dụng Lark Messenger đơn giản, hiệu quả nhất? Trong bài viết sau Tanca sẽ hướng dẫn bạn các bước từ cơ bản đến nâng cao, giúp bạn tận dụng tối đa công cụ giao tiếp Lark Messen

0 0 21

- vừa được xem lúc

Tóm Tắt : YOLOv10: Real-Time End-to-End Object Detection

Tổng quan những cải tiến chính của YOLOv10 bao gồm có:. . NMS-Free Training. Spatial-channel decoupled downspamling.

0 0 22