- vừa được xem lúc

Hành trình cùng Junction X Hanoi 2023

0 0 22

Người đăng: Duy Ta

Theo Viblo Asia

Hành trình Junction X (P1)

Xin chào các bạn ! Mình là Duy , là một kẻ thích phá cách và tìm tòi về AI 😂 , mình hiện tại vẫn là sinh viên năm thứ 4 thôi ,nên về kiến thức bài viết nếu còn thiếu sót mong mọi người bỏ quá cho 😅

Mình viết blog này với mong muốn chia sẻ và truyền cảm hứng đến toàn thể các bạn đọc về hành trình chinh phục track AI cũng như chức vô địch JunctionX Hanoi Hackathon 2023 của team mình – MTA_Warrior , alright bắt đầu thoiiii !!

Hai tuần trước ngày thi đấu , mình và team có nhận được thư của BTC , cũng chả nghĩ gì nhiều =)) team và bộ môn đăng kí luôn track AI năm nay với đề bài làm mình hết sức mông lung khi nhìn cái ảnh chưa biết task cụ thể sẽ là gì đây , đó là Overlap Area Estimation 🤣🤣

image.png

Mục tiêu giải quyết cuối cùng của bài toán mà BTC đặt ra là làm sao để xác định vùng chồng lấn giữa các camera một cách chính xác nhất có thể với thời gian xử lí là ngắn nhất .

Trước khi đi thẳng vào hướng giải quyết bài toán thì chắc ở phần này mình sẽ giới thiệu một số kiến thức liên quan và bài toán có thể áp dụng được task này nhé .

1. Image stiching

Lạ mà quen , tên gọi khá lạ nhưng ứng dụng lại cực kì quen thuộc , đây chính là công nghệ được sử dụng để chụp những bức ảnh có góc rộng và view khá lớn trong những chiếc smart phone hiện nay . Có một bài viết mình nghĩ là khá hay của anh @TrungThanhNguyen0502 về công nghệ này , xin chia sẻ với các bạn 😀

image.png

2. Image transformation and something more than that

Thực sự thì mình cũng không biết nên viết những gì cho đủ ở đây vì kiến thức liên quan nó quá nhiều =))) Nên là mình sẽ gói gọn ở một số từ khóa như

Hormography transformation

image.png

Keypoint descriptor and localization

image.png

Feature matching

image.png

3. Deep Learning knowledge

Chà chà , qua cái mớ kiến thức về image processing hơi có phần khô khan kia thì ta cùng đến với phần thú vị hơn rất nhiều =))) học sâu . Đến nay , với sự tăng trưởng cực kì đáng kinh ngạc của các mô hình SOTA bây giờ , ta phần nào có thể thấy Deep Learning đang được quan tâm nhiều đến thế nào . Vậy module nào sẽ liên quan đến bài toán mà Junction đề ra ?

Multi-Target Multi-Camera Tracking task (MTMCT)

Nếu ai hay tìm hiểu về computer vision chắc hẳn cũng biết bài toán nổi tiếng này . Một bài toán mở rộng của object tracking nhưng thay vì một camera , chúng ta sẽ đồng loạt tracking trên nhiều cam đồng thời tổng hợp và đồng bộ kết quả

Pipeline cơ bản của module MTMCT như sau :

image.png

Ồ , vậy bài toán mà Junction đưa ra có liên quan gì đến module này nhỉ ?

Cùng tưởng tượng toán cướp ngân hàng bỏ chạy trên ô tô. Hệ thống SmartCam thành phố phát hiện, ghi nhận biển số và các đặc điểm nhận dạng xe. Nhờ phân tích đối tượng truy nã di chuyển qua các vùng chồng lấn quan sát và áp dụng các mô hình AI, máy tính trung tâm dự báo hướng đi và đề xuất phương án chặn bắt. Tính năng xác định vùng chống lấn chính xác của SmartCam góp phần giúp giám sát tự động và ra quyết định chính xác kịp thời, duy trì trật tự an toàn xã hội.

Mình trích nguyên văn đề bài của BTC luôn , thật sự thì đến lúc nhận đề rồi mình mới nhận ra là bài toán của mình cần giải quyết chỉ là một phần siêu siêu nhỏ của module lớn này 😂

Bạn đọc có thể tìm hiểu về module này , mình rất recommend vì thật sự bài toán này rất thực tế , rất đáng thời gian tìm hiểu của bạn . Nếu có thời gian mình sẽ viết hẳn một series riêng về MTMTC nhé 🤯

Được rồi , phần 1 nên viết sương sương vậy thôi . Bắt đầu từ phần 2 sẽ là nội dung chính nhaa , mong mọi người sẽ thích series của mình . Thanks everyone 😁😁 !

Bình luận

Bài viết tương tự

- vừa được xem lúc

Tấn công và phòng thủ bậc nhất cực mạnh cho các mô hình học máy

tấn công bậc nhất cực mạnh = universal first-order adversary. Update: Bleeding edge của CleverHans đã lên từ 3.1.0 đến 4.

0 0 42

- vừa được xem lúc

[Deep Learning] Key Information Extraction from document using Graph Convolution Network - Bài toán trích rút thông tin từ hóa đơn với Graph Convolution Network

Các nội dung sẽ được đề cập trong bài blog lần này. . Tổng quan về GNN, GCN. Bài toán Key Information Extraction, trích rút thông tin trong văn bản từ ảnh.

0 0 219

- vừa được xem lúc

Trích xuất thông tin bảng biểu cực đơn giản với OpenCV

Trong thời điểm nhà nước đang thúc đẩy mạnh mẽ quá trình chuyển đổi số như hiện nay, Document Understanding nói chung cũng như Table Extraction nói riêng đang trở thành một trong những lĩnh vực được quan tâm phát triển và chú trọng hàng đầu. Vậy Table Extraction là gì? Document Understanding là cái

0 0 230

- vừa được xem lúc

Con đường AI của tôi

Gần đây, khá nhiều bạn nhắn tin hỏi mình những câu hỏi đại loại như: có nên học AI, bắt đầu học AI như nào, làm sao tự học cho đúng, cho nhanh, học không bị nản, lộ trình học AI như nào... Sau nhiều lần trả lời, mình nghĩ rằng nên viết hẳn một bài để trả lời chi tiết hơn, cũng như để các bạn sau này

0 0 157

- vừa được xem lúc

[B5'] Smooth Adversarial Training

Đây là một bài trong series Báo khoa học trong vòng 5 phút. Được viết bởi Xie et. al, John Hopkins University, trong khi đang intern tại Google. Hiện vẫn là preprint do bị reject tại ICLR 2021.

0 0 45

- vừa được xem lúc

Deep Learning với Java - Tại sao không?

Muốn tìm hiểu về Machine Learning / Deep Learning nhưng với background là Java thì sẽ như thế nào và bắt đầu từ đâu? Để tìm được câu trả lời, hãy đọc bài viết này - có thể kỹ năng Java vốn có sẽ giúp bạn có những chuyến phiêu lưu thú vị. DJL là tên viết tắt của Deep Java Library - một thư viện mã ng

0 0 139