Tag cuda

Ở bài viết này mình sẽ giới thiệu các bạn cách dùng shared memory trên GPU bằng cuda, trước khi đọc bài viết này thì hãy xem qua bài viết Các bộ nhớ trong GPU. Shared memory.

0 0 30

29/05/2024 - vừa được xem lúc 30/09/2025

[NVIDIA Tools] Bài 8: Occupancy

Ở bài 7 mình đã đề cập đến vấn đề: làm sao để chọn ra số thread phù hợp thì ở bài viết này mình sẽ chia sẽ 1 cách khá phổ biến để xác định - ở đây sẽ có nhiều bạn thắc mắc là tại sao chúng ta không đơ

0 0 27

29/02/2024 - vừa được xem lúc 30/09/2025

[NVIDIA Tools] Bài 7:Warp Scheduler

Ở trong bài Synchronization - Asynchronization mình có nhắc đến khái niệm latency hiding, một khái niệm rất thường thấy khi nhắc về cuda và khi nói đến latency hiding là sẽ nói đến always keep thread

0 0 28

23/02/2024 - vừa được xem lúc 30/09/2025

[NVIDIA Tools] Bài 6: Global Memory Coalescing

Global memory là bộ nhớ lớn nhất NHƯNG cũng là chậm nhất ở GPU vậy nên ở bài viết này chúng ta sẽ phân tích những yếu tố nào dẫn đến "low performance" cũng như cách khác phục chúng. .

0 0 24

18/02/2024 - vừa được xem lúc 22/09/2025

[NVIDIA Tools] Bài 5: NVIDIA Compute Sanitizer Phần 2

#NVIDIA Compute Sanitizer

#nvidia tools

Ở bài viết này mình sẽ viết tiếp về cách sử dụng NVIDIA Compute Sanitizer, hãy đọc những bài này: NVIDIA Compute Sanitize phần 1, Data Hazard trước khi đọc bài viết này. NVIDIA Compute Sanitizer.

0 0 23

31/01/2024 - vừa được xem lúc 22/09/2025

[Lập trình song song] Bài 12: Atomic function

Ở bài này mình sẽ giới thiệu các bạn một cái built in function khá là xịn trong cuda, và 1 lưu ý là hãy đọc các bài này Data Hazard và Synchronization - Asynchronization trước khi đọc bài viết này. At

0 0 28

31/01/2024 - vừa được xem lúc 30/09/2025

[Lập trình song song] Bài 11: Data Hazard

Khi chúng ta nhắc đến song song chúng ta sẽ nhắc tới hiện tượng data hazard, 1 bug khiến chúng ta khá là đau đầu khi fix vì đây là lỗi về mặt logic NHƯNG bây giờ chúng ta đã có công cụ NVIDIA Compute

0 0 32

29/01/2024 - vừa được xem lúc 22/09/2025

[NVIDIA Tools] Bài 4: NVIDIA Compute Sanitizer Phần 1

#NVIDIA Compute Sanitizer

#nvidia tools

Ở bài viết này mình sẽ hướng dẫn các bạn sử dụng NVIDIA Compute Sanitizer, 1 công cụ rất tuyệt vời để hỗ trợ cho các bạn mới bắt đầu về cuda. .

0 0 31

29/01/2024 - vừa được xem lúc 30/09/2025

[NVIDIA Tools] Bài 3: Cuda toolkit - Cuda driver

Trước khi sử dụng các công cụ của Nvidia trong việc profile thì chúng ta phải có kiến thức về nguyên lí hoạt động của cuda nên ở bài mình sẽ đề cập tới 2 khái niệm thường được nhắc đến khi nói về cuda

0 0 28

16/01/2024 - vừa được xem lúc 22/09/2025

[Lập trình song song] Bài 10: Streaming

Ở bài này mình sẽ hướng dẫn các bạn 1 kĩ thuật để optimize 1 chương trình trong cudaC ( kĩ thuật này cũng khá đơn giản nhưng sẽ tốt hơn nếu các bạn đã đọc qua bài Pinned memory và Async-Sync ). Stream

0 0 39

15/12/2023 - vừa được xem lúc 17/09/2025

[Lập trình song song] Bài 9: Pinned memory