Tag Deep Learning

Tìm kiếm bài viết trong Tag Deep Learning

[Paper Explain] Mixtral of Experts: Lắm thầy thì model khỏe

Mở đầu. Với những người sử dụng Large Language Model (LLM), hẳn cái tên Mixtral 8x7B đã không còn xa lạ gì nữa.

0 0 0

- vừa được xem lúc

NeuralNotes — Music generation using Transformers

Introduction. Currently, I have pursued a topic that using deep learning for automatic music generation during my bachelor thesis at VGU.

0 0 1

- vừa được xem lúc

Text Summarization — What is it?

Introduction. Recently, text summarization in deep learning strikes my mind, making me obsess with it for days and nights.

0 0 1

- vừa được xem lúc

Few-Shot Learning cho phân loại hình ảnh

Giới thiệu chung. Một vấn đề khi sử dụng các model Deep Learning là không phải lúc nào ta cũng có đủ lượng dữ liệu để train.

0 0 1

- vừa được xem lúc

Paper reading | X3D: Expanding Architectures for Efficient Video Recognition

Đóng góp của bài báo. Ý tưởng cơ bản để xây dựng model cho các bài toán liên quan tới video đó là mở rộng kiến trúc mạng cho ảnh từ 2D theo chiều thời gian lên 3D.

0 0 4

- vừa được xem lúc

Paper reading | MaxViT: Multi-Axis Vision Transformer

Đóng góp của bài báo. Các mô hình ViT nếu như không pretrained trước đó sẽ có hiệu suất kém hơn so với các mô hình ConvNets.

0 0 2

- vừa được xem lúc

Paper reading | CoAtNet: Marrying Convolution and Attention for All Data Sizes

Giới thiệu. Kể từ sự ra đời của AlexNet, mạng ConvNets đã trở thành một kiến trúc mô hình quan trọng trong lĩnh vực thị giác máy tính.

0 0 4

- vừa được xem lúc

Paper reading | CLIP4STR: A Simple Baseline for Scene Text Recognition with Pre-trained Vision-Language Model

Đóng góp của bài báo. Các mô hình pretrained Vision-language (VL) với dữ liệu lớn như CLIP và ALIGN thể hiện sự mạnh mẽ trong đa dạng task về hình ảnh và ngôn ngữ.

0 0 2

- vừa được xem lúc

Paper reading | Tóm tắt mô hình ResNeSt: Split-Attention Networks

Đóng góp của bài báo. Bài báo giới thiệu một kiến trúc mô hình đơn giản có tên ResNeSt sử dụng channel-wise attention trên các nhánh của mạng với mục tiêu tận dụng sức mạnh capture thông tin tương tác

0 0 2

- vừa được xem lúc

Paper reading | Tìm hiểu mô hình ResNeXt

Đóng góp của bài báo. Bài báo giới thiệu một kiến trúc mô hình mới có tên ResNeXt (Residual Next) là phiên bản nâng cấp từ ResNet.

0 0 1

- vừa được xem lúc

Paper reading | Deep High-Resolution Representation Learning for Visual Recognition

Đóng góp của bài báo. Bài báo đề xuất kiến trúc High-Resolution Net (HRNet) là một kiến trúc mạng nơ-ron sâu được phát triển cho các ứng dụng trong lĩnh vực thị giác máy tính, đặc biệt là trong bài to

0 0 1

- vừa được xem lúc

Paper reading | EfficientNetV2: Smaller Models and Faster Training

Đóng góp của bài báo. Kết quả training có độ chính xác cao là rất tốt tuy nhiên việc tối ưu thời gian, tài nguyên training và inference của model cũng quan trọng không kém Được giới thiệu lần đầu vào

0 0 1

- vừa được xem lúc

Paper reading | Xception phiên bản nâng cấp của Inception V3

Đóng góp của bài báo. Bài báo giới thiệu mô hình Xception (Extreme Inception) là một kiến trúc mạng neural được phát triển dựa trên ý tưởng của Inception và sử dụng các convolution depthwise separable

0 0 2

- vừa được xem lúc

Paper reading | Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning

Đóng góp bài báo. Trong bài báo, nhóm tác giả nghiên cứu sự kết hợp của 2 ý tưởng có thể coi là kinh điển trong lịch sử các mô hình CNN nổi tiếng là Residual connection và phiên bản mới nhất của kiến

0 0 3

- vừa được xem lúc

Paper reading | Self-Supervised Learning from Images with a Joint-Embedding Predictive Architecture

Đặt vấn đề. Self-supervised learning là một phương pháp học máy mà trong đó mô hình được huấn luyện từ dữ liệu mà không yêu cầu nhãn rõ ràng từ con người.

0 0 4

- vừa được xem lúc

Paper reading | GRAPH ATTENTION NETWORKS

Giới thiệu. Các mô hình CNN thể hiện sự mạnh mẽ khi áp dụng vào những bài toán có dữ liệu là hình ảnh ví dụ như image classification, semantic segmentation, object detection,.

0 0 3

- vừa được xem lúc

Paper reading | ACTION-Net: Multipath Excitation for Action Recognition

Đóng góp của bài báo. Trong các bài toán liên quan tới video, thông tin cần nắm bắt không chỉ là thông tin về mặt không gian (spatial information) giống như hình ảnh mà còn là thông tin về thời gian (

0 0 4

- vừa được xem lúc

[Paper Explain] Segment Anything in High Quality

Title: Segment Anything in High Quality . Original Paper: https://arxiv.org/pdf/2306.01567.

0 0 4

- vừa được xem lúc

Paper reading | Video Swin Transformer

Đóng góp của bài báo. Kiến trúc Transformer ngày càng chiếm xong trên mọi mặt trận cụ thể trong các bài toán liên quan tới lĩnh vực Computer Vision.

0 0 5

- vừa được xem lúc

Dự báo chuỗi thời gian là gì? Các loại dự báo và phương pháp thực hiện

1. Dự báo chuỗi thời gian là gì.

0 0 6