- vừa được xem lúc

Một số mẫu hình thường thấy trong phép toán với ma trận ở những mạng neuron nhân tạo

0 0 6

Người đăng: cxntrxl

Theo Viblo Asia

Trước khi đến với bài viết, bạn đọc nên có kiến thức trước đó về một số góc nhìn khác nhau của phép nhân ma trận. Nếu chưa biết hoặc đã quên, bạn có thể tham khảo bài viết này: https://eli.thegreenplace.net/2015/visualizing-matrix-multiplication-as-a-linear-combination/.

Tổ hợp tuyến tính của tập hợp đặc trưng

pic1.png

Chú ý rằng, như ở biểu diễn ở hình trên, trong bài này các vector đặc trưng sẽ được thể hiện là vector hàng.

Tuỳ vào giá trị của vector trọng số, ta có thể phân loại ra các mẫu hình sau:

  • Chọn cứng nếu vector trọng số là vector one-hot.

oic2Untitled Diagram.drawio.png

  • Chọn mềm nếu vector trọng số có tất cả các phần từ dương và tổng của tất cả các phần tử bằng 1.

pic3.png

  • Vector trọng số có các phần tử không âm, có thể có các phần tử bằng 0.

pic4.png

Ví dụ

  1. Ví dụ của chọn cứng là lớp Embedding(https://pytorch.org/docs/stable/generated/torch.nn.Embedding.html) thường sử dụng ở những mạng neuron xử lý dữ liệu văn bản. Ở đây, ma trận là tham số cần học còn vector trọng số lại là đặc trưng của dữ liệu. embedding.png
  2. Ví dụ của chọn mềm là self-attention của kiến trúc Transformer(https://arxiv.org/abs/1706.03762). image.png. Ở đây, ma trận đặc trưng là ma trận value V, còn vector trọng số được tính toán từ các ma trận query Q và key K. Hình dưới đây là ví dụ cho lớp attention của Transformer, đầu vào là một điểm dữ liệu có 4 từ. transformer_attention.png
  3. Mẫu hình vector trọng số thứ ba có những phần tử bằng 0, có thể coi là những phần tử này bị đàn áp về 0 do áp dụng một luật rời rạc, ví dụ như luật kề cận trong dữ liệu đồ thị hay luật không được nhìn về các từ ở tương lai (look-ahead) trong thành phần decoder của Transformer. Một ví dụ là kiến trúc mạng neuron đồ thị Graph Isomorphism Network(GIN)(https://arxiv.org/abs/1810.00826): image.png

Hình dưới mô tả phép kết tập đồ thị của GIN tại đỉnh thứ 2 của đồ thị hữu hướng: gin.png

Khi thể hiện công thức kết tập đồ thị GIN dưới dạng ma trận, ta có thể thấy rõ sự xuất hiện của mẫu hình vector trọng số thứ ba (epsilon có thể là hằng số hoặc là tham số mô hình):

gin2.png

Quay lại một chút với mẫu hình chọn mềm. Giả sử như thay attention score, ta sử dụng một đại lượng d_i tương ứng cho đơn vị thứ i, điểm số giữa đơn vị thứ i và j được tính là d_i * d_j. Ta có ma trận sau đây thay cho softmax(QK^T/sqrt(d)): dd.png Áp dụng ma trận điểm số này cho kiểu dữ liệu đồ thị, ta sẽ đàn áp đi những điểm số giữa những đỉnh không có quan hệ hàng xóm, tức thực hiện phép tích Hadamard sau: dda.png

Trước khi tiếp tục, ta sẽ chứng minh bổ đề sau đây. Để cho ngắn gọn, tôi sẽ không trình bày hình thức bổ đề đó ra, và chứng minh cho bổ đề này là không khó, xin nhường lại cho bạn đọc. theorem.png

Như vậy, phép tích Hadamard ở trên có thể được viết lại thành tích của hai ma trận đường chéo với một ma trận vuông. Đó chính là công thức của mạng neuron đồ thị Graph Convolutional Network(https://arxiv.org/abs/1609.02907). Trong đó, đại lượng cụ thể mà d đại diện là bậc của đỉnh. image.png

Dot product similarity giữa tập hợp đặc trưng này và tập hợp đặc trưng khác

dotproductsimilarity.drawio.png

Ví dụ là self-attention của Transformer qk.png

Bình luận

Bài viết tương tự

- vừa được xem lúc

Cài đặt server với Apache từ A-Z

I, Cần cài những gì bây giờ. Bạn là 1 newbie, và vào một ngày đẹp trời, bạn nhận 1 request từ "sếp" của bạn: "Tình hình là anh có 1 con server linux, chaỵ ubuntu 20, a cần em cài giúp anh môi trường đ

0 0 7

- vừa được xem lúc

Hỗ trợ xây dựng web bằng Wordpress

WordPress là một hệ thống quản lý nội dung (CMS) miễn phí và mã nguồn mở được phát triển bằng ngôn ngữ lập trình PHP và sử dụng cơ sở dữ liệu MySQL. Nó được sử dụng rộng rãi như một nền tảng để xây dự

0 0 65

- vừa được xem lúc

Spring Data Elasticsearch - Tận dụng Elasticsearch trong ứng dụng Spring Boot

Elasticsearch là một hệ thống tìm kiếm và phân tích văn bản mã nguồn mở dựa trên Lucene. Nó được thiết kế để xử lý và tìm kiếm dữ liệu với tốc độ cực kỳ nhanh, giúp bạn tìm thấy thông tin cần thiết từ

0 0 8