Trong video này mình sẽ chia sẻ với các bạn video giải thích chi tiết về cách thức hoạt động của mô hình Segment Anything hay còn có tên gọi khác là SAM. Đây là một foundation model rất tiềm năng trong lĩnh vực Computer Vision. Mình tin rằng việc nắm bắt được cách thức hoạt động của mô hình này sẽ giúp các bạn rất nhiều trong việc phát triển các ứng dụng liên quan cũng như tuỳ biến nó cho các trường hợp cụ thể.
Các phần chính trong video này như sau
- 00:00 Giới thiệu chủ đề
- 00:40 Image Segmentation là gì
- 02:57 Ý tưởng của Segment Anything
- 03:50 Demo Segment Anything trên web
- 06:20 Segment Anything Task
- 07:40 Kiến trúc tổng quan
- 09:27 Inage Encoder
- 18:19 Prompt Encoder
- 19:46 Mask Convolution
- 21:06: Positional Encoding
- 23:16: Mask Decoder
Hi vọng rằng thông qua video này sẽ giúp các bạn có thêm một góc nhìn tổng quan nhất về SAM. Rất mong nhận được nhiều sự đóng góp ý kiến của các bạn.