Tag profiling

Tìm kiếm bài viết trong Tag profiling

- vừa được xem lúc

[NVIDIA Tools] Bài 10: Bandwidth - Throughput - Latency

Ở bài viết này mình sẽ giới thiệu 3 khái niệm rất quan trọng trong việc profiling là Bandwidth - Throughput - Latency. Bandwidth - Throughput - Latency.

0 0 9

- vừa được xem lúc

[NVIDIA Tools] Bài 9: Occupancy Phần 2

Ở phần 1 mình đã giới thiệu occupancy thì ở phần 2 mình sẽ đi sâu hơn về occupancy trong việc cải thiện achieved occupancy. Trước khi đi vào bài học mình xin giải thích 2 khái niệm khá quan trọng tron

0 0 7

- vừa được xem lúc

[NVIDIA Tools] Bài 8: Occupancy

Ở bài 7 mình đã đề cập đến vấn đề: làm sao để chọn ra số thread phù hợp thì ở bài viết này mình sẽ chia sẽ 1 cách khá phổ biến để xác định - ở đây sẽ có nhiều bạn thắc mắc là tại sao chúng ta không đơ

0 0 11

- vừa được xem lúc

[NVIDIA Tools] Bài 7:Warp Scheduler

Ở trong bài Synchronization - Asynchronization mình có nhắc đến khái niệm latency hiding, một khái niệm rất thường thấy khi nhắc về cuda và khi nói đến latency hiding là sẽ nói đến always keep thread

0 0 11

- vừa được xem lúc

[NVIDIA Tools] Bài 6: Global Memory Coalescing

Global memory là bộ nhớ lớn nhất NHƯNG cũng là chậm nhất ở GPU vậy nên ở bài viết này chúng ta sẽ phân tích những yếu tố nào dẫn đến "low performance" cũng như cách khác phục chúng. .

0 0 9