Hành trình Junction X (P1)
Xin chào các bạn ! Mình là Duy , là một kẻ thích phá cách và tìm tòi về AI 😂 , mình hiện tại vẫn là sinh viên năm thứ 4 thôi ,nên về kiến thức bài viết nếu còn thiếu sót mong mọi người bỏ quá cho 😅
Mình viết blog này với mong muốn chia sẻ và truyền cảm hứng đến toàn thể các bạn đọc về hành trình chinh phục track AI cũng như chức vô địch JunctionX Hanoi Hackathon 2023 của team mình – MTA_Warrior , alright bắt đầu thoiiii !!
Hai tuần trước ngày thi đấu , mình và team có nhận được thư của BTC , cũng chả nghĩ gì nhiều =)) team và bộ môn đăng kí luôn track AI năm nay với đề bài làm mình hết sức mông lung khi nhìn cái ảnh chưa biết task cụ thể sẽ là gì đây , đó là Overlap Area Estimation 🤣🤣
Mục tiêu giải quyết cuối cùng của bài toán mà BTC đặt ra là làm sao để xác định vùng chồng lấn giữa các camera một cách chính xác nhất có thể với thời gian xử lí là ngắn nhất .
Trước khi đi thẳng vào hướng giải quyết bài toán thì chắc ở phần này mình sẽ giới thiệu một số kiến thức liên quan và bài toán có thể áp dụng được task này nhé .
1. Image stiching
Lạ mà quen , tên gọi khá lạ nhưng ứng dụng lại cực kì quen thuộc , đây chính là công nghệ được sử dụng để chụp những bức ảnh có góc rộng và view khá lớn trong những chiếc smart phone hiện nay . Có một bài viết mình nghĩ là khá hay của anh @TrungThanhNguyen0502 về công nghệ này , xin chia sẻ với các bạn 😀
2. Image transformation and something more than that
Thực sự thì mình cũng không biết nên viết những gì cho đủ ở đây vì kiến thức liên quan nó quá nhiều =))) Nên là mình sẽ gói gọn ở một số từ khóa như
Hormography transformation
Keypoint descriptor and localization
Feature matching
3. Deep Learning knowledge
Chà chà , qua cái mớ kiến thức về image processing hơi có phần khô khan kia thì ta cùng đến với phần thú vị hơn rất nhiều =))) học sâu . Đến nay , với sự tăng trưởng cực kì đáng kinh ngạc của các mô hình SOTA bây giờ , ta phần nào có thể thấy Deep Learning đang được quan tâm nhiều đến thế nào . Vậy module nào sẽ liên quan đến bài toán mà Junction đề ra ?
Multi-Target Multi-Camera Tracking task (MTMCT)
Nếu ai hay tìm hiểu về computer vision chắc hẳn cũng biết bài toán nổi tiếng này . Một bài toán mở rộng của object tracking nhưng thay vì một camera , chúng ta sẽ đồng loạt tracking trên nhiều cam đồng thời tổng hợp và đồng bộ kết quả
Pipeline cơ bản của module MTMCT như sau :
Ồ , vậy bài toán mà Junction đưa ra có liên quan gì đến module này nhỉ ?
Cùng tưởng tượng toán cướp ngân hàng bỏ chạy trên ô tô. Hệ thống SmartCam thành phố phát hiện, ghi nhận biển số và các đặc điểm nhận dạng xe. Nhờ phân tích đối tượng truy nã di chuyển qua các vùng chồng lấn quan sát và áp dụng các mô hình AI, máy tính trung tâm dự báo hướng đi và đề xuất phương án chặn bắt. Tính năng xác định vùng chống lấn chính xác của SmartCam góp phần giúp giám sát tự động và ra quyết định chính xác kịp thời, duy trì trật tự an toàn xã hội.
Mình trích nguyên văn đề bài của BTC luôn , thật sự thì đến lúc nhận đề rồi mình mới nhận ra là bài toán của mình cần giải quyết chỉ là một phần siêu siêu nhỏ của module lớn này 😂
Bạn đọc có thể tìm hiểu về module này , mình rất recommend vì thật sự bài toán này rất thực tế , rất đáng thời gian tìm hiểu của bạn . Nếu có thời gian mình sẽ viết hẳn một series riêng về MTMTC nhé 🤯
Được rồi , phần 1 nên viết sương sương vậy thôi . Bắt đầu từ phần 2 sẽ là nội dung chính nhaa , mong mọi người sẽ thích series của mình . Thanks everyone 😁😁 !