- vừa được xem lúc

Phân biệt Sigmoid với Softmax function UwU

0 0 2

Người đăng: uwwu

Theo Viblo Asia

Phân biệt sigmoid và softmax

Sigmoid và softmax là hai hàm activation vô cùng phổ biến. Bây giờ chúng ta hãy tới công thức cùng với ứng dụng của chúng nhé ╰(°▽°)╯

1.Sigmoid

1.1. Công thức

Đây là công thức của hàm 6 moi hay còn gọi là logistic function image.png

1.2. Tính chất và ứng dụng của hàm sigmoid

image.png

Nhìn vào hình trên, với đường màu xanh lá chính là hàm sigmoid, đường màu hồng là đạo hàm của nó.

Các bạn có thể nhận ra được một số điều như sau

  • hàm sigmoid có thể được chia ra hai phần, phần bên phải 0 và phần bên trái 0
  • phần bên phải 0 có range từ (0.5, 1), phần bên trái có range từ (0, 0.5)
  • hai phần thay đổi nhanh vl, kiểu nó cố chạy về hai ngưỡng 0 hoặc 1

Việc với đa số x, thì hàm sigmoid sẽ nhận giá trị 0 hoặc 1 là vô cùng quan trọng. Tại saooo ? Vì nó phù hợp với bài toán binary classification, khi mà nhãn sẽ là 0 hoặc 1

1.3. Nhược điểm của sigmoid

Nhược điểm của nó nằm ở phần đạo hàm, khi hàm không thay đổi, thì đạo hàm của nó càng bé. Vì vậy, ở hai phần ngoài khoảng [-5, 5], đạo hàm của hàm sigmoid gần như bằng 0, mà đạo hàm bằng 0 thì làm sao mà update cho mô hình để mô hình học được.

2.Softmax

Dưới đây là công thức của hàm softmax image.png

Mình thấy hai cái quần què này cũng k liên quan với nhau lắm, công thức của softmax bản chất là để chuyển cái weight sang xác suất nhằm phục vụ cho bài toán classification.

Để dễ tưởng tượng, các bạn có thể nhìn vào hình sau:

image.png

Có thể thấy, từ một đống các weight nhìn không hiểu gì lắm, sau khi đi qua hàm softmax, chúng ta có thể đọc chúng dưới dạng xác suất -> i zì.

Bình luận

Bài viết tương tự

- vừa được xem lúc

Giới thiệu về DeepFaceLab công cụ để tạo ra Deepfake thật sự hoàn hảo

I.Làm thế nào 'Furious 7' đã đưa Paul Walker quá cố trở lại cuộc sống. Dưới đây là video. .

0 0 29

- vừa được xem lúc

Hiểu sâu về You Only Look One-YOLOv1

Object detection: bài toán phát hiện + nhận diện vật thể. Bước một là đi tìm vị trí của vật thể trong toàn ảnh rồi bao quanh vật thể ấy bằng một khung hình chữ nhật được gọi là bounding box.

0 0 25

- vừa được xem lúc

TOP 5 BLOG VỀ IT ĐÁNG ĐỌC

Vào những lúc rảnh rỗi, các bạn thường sẽ làm gì? Coi phim, đi chơi, ...Có ai như mình lúc rảnh thì tìm 1 chỗ yên tĩnh nào đó đeo tai phone nghe những bài nhạc chill và đọc truyện và tìm các blog hay

0 0 33

- vừa được xem lúc

Học với tôi(bebuoi1) : BLOG! -> Tại sao lại có cookie và session

Câu hỏi của mình : Tại sao lại có cookie và session trong khi đã có tài khoản mật khẩu . --Tk mk nó giống như 1 cái cccd rồi mà tại sao CÓ NGƯỜI NÓI COOKIE NÓ LẠI GIỐNG CCCD ĐỂ ĐỊNH DANH NHỈ.

0 0 16

- vừa được xem lúc

Tại Sao Sử Dụng Ứng Dụng Lark

Bạn muốn tìm hiểu cách sử dụng Lark Messenger đơn giản, hiệu quả nhất? Trong bài viết sau Tanca sẽ hướng dẫn bạn các bước từ cơ bản đến nâng cao, giúp bạn tận dụng tối đa công cụ giao tiếp Lark Messen

0 0 21

- vừa được xem lúc

Tóm Tắt : YOLOv10: Real-Time End-to-End Object Detection

Tổng quan những cải tiến chính của YOLOv10 bao gồm có:. . NMS-Free Training. Spatial-channel decoupled downspamling.

0 0 22