Một số papers về xử lý nội dung Manga

Vừa rồi mình có viết một bài về Nhận diện khung hình trong Manga, nay tìm ra một vài bài báo nghiên cứu thêm nhiều thứ khác cũng trong lĩnh vực nghiên cứu này, note lại để đọc dần dần :D

1. A Robust Panel Extraction Method for Manga

Tương tự như nội dung bài viết vừa rồi của mình, nhưng sâu hơn rất nhiều, giải quyết được nhiều trường hợp đặc biệt của các khung truyện hơn, đồng thời còn có nói về kĩ thuật lọc bỏ các nội dung nối giữa các khung truyện (ví dụ như text, sfx,...) để phân tách chính xác hơn.

2. Manga Content Extraction Method for Automatic Mobile Comic Content Creation

Bài báo nói về phương pháp bóc tách các nội dung như khung truyện, khung thoại, lời thoại (tiếng Nhật) ra từ bản scan và tổng hợp lại sử dụng ComicXML để lưu thông tin, nội dung của từng khung hình. Kết quả nghiên cứu này cho độ chính xác 81.6% khi nhận diện khung hình đối với các bản scan thô (non-flat, scan không phẳng), chính xác 100% khi nhận diện các khung thoại và 93.75% khi nhận diện các kí tự tiếng Nhật.

Bình luận

Bài viết tương tự

17/03/2021 - vừa được xem lúc 11/09/2025

Paper Review: Why Functional Programming Matters

Paper Review: Why Functional Programming Matters. Như đã có lần mình đề cập, việc đọc paper cũng khá là quan trọng, vì bên cạnh việc được đọc từ những nguồn kiến thức "sạch", và chất lượng, chúng ta c

0 0 176

17/03/2021 - vừa được xem lúc 16/09/2025

Mô hình toán học và DotA 2

Mô hình toán học và DotA 2. Có thể bạn đã được nghe rất nhiều về cái chữ "mô hình" này.

0 0 41

17/03/2021 - vừa được xem lúc 3 giờ trước

Một vài papers về DotA 2 và Machine Learning

Một vài papers về DotA 2 và Machine Learning. How Does He Saw Me.

0 0 45

10/02/2023 - vừa được xem lúc 18 giờ trước

Các bài viết ngắn phần 24

Cơ sở dữ liệu và ngữ cảnh sử dụng. Có rất nhiều loại cơ sở dữ, phải đến hàng trăm loại, phổ biến hiện nay như PostgresSQL, Oracle, MySQL, MariaDB, SQLite, MongoDB, S3, Ceph, ….

0 0 54

26/02/2023 - vừa được xem lúc 11/09/2025

[Research Paper GPT-3] Large Language Models are Zero-Shot Reasoners

Bạn có thể download Research Paper ở cuối bài viết. "Large Language Models are Zero-Shot Reasoners" là một khái niệm chỉ tính năng mới của các mô hình ngôn ngữ lớn như GPT-3, cho phép chúng có khả năn

0 0 60

24/03/2023 - vừa được xem lúc 11/09/2025

[Research Article] - ChatGPT: The Evolution of Natural Language Processing

This document focuses on ChatGPT, a natural language processing (NLP) model built by the transformer neural network. The document provides a comprehensive overview of the architecture, training, and f

0 0 43