Tag profiling

Tìm kiếm bài viết trong Tag profiling

- vừa được xem lúc

[NVIDIA Tools] Bài 12: Compute - Memory Bound Phần 2

Ở bài trước chúng ta đã sử dụng SoL để xác định liệu code của chúng có bị memory/compute bound hay không thì ở bài này mình sẽ hướng dẫn các bạn 1 phương pháp khác để xác định là roofline chart. Roofl

0 0 3

- vừa được xem lúc

[NVIDIA Tools] Bài 11: Compute - Memory Bound Phần 1

Khi nói về performance trong 1 đoạn code thì chúng ta sẽ xem xét 2 khái niệm chính là memory và compute. Vậy memory và compute là gì mà lại quan trọng như vậy.

0 0 3

- vừa được xem lúc

[NVIDIA Tools] Bài 10: Bandwidth - Throughput - Latency

Ở bài viết này mình sẽ giới thiệu 3 khái niệm rất quan trọng trong việc profiling là Bandwidth - Throughput - Latency. Bandwidth - Throughput - Latency.

0 0 11

- vừa được xem lúc

[NVIDIA Tools] Bài 9: Occupancy Phần 2

Ở phần 1 mình đã giới thiệu occupancy thì ở phần 2 mình sẽ đi sâu hơn về occupancy trong việc cải thiện achieved occupancy. Trước khi đi vào bài học mình xin giải thích 2 khái niệm khá quan trọng tron

0 0 8

- vừa được xem lúc

[NVIDIA Tools] Bài 8: Occupancy

Ở bài 7 mình đã đề cập đến vấn đề: làm sao để chọn ra số thread phù hợp thì ở bài viết này mình sẽ chia sẽ 1 cách khá phổ biến để xác định - ở đây sẽ có nhiều bạn thắc mắc là tại sao chúng ta không đơ

0 0 12

- vừa được xem lúc

[NVIDIA Tools] Bài 7:Warp Scheduler

Ở trong bài Synchronization - Asynchronization mình có nhắc đến khái niệm latency hiding, một khái niệm rất thường thấy khi nhắc về cuda và khi nói đến latency hiding là sẽ nói đến always keep thread

0 0 12

- vừa được xem lúc

[NVIDIA Tools] Bài 6: Global Memory Coalescing

Global memory là bộ nhớ lớn nhất NHƯNG cũng là chậm nhất ở GPU vậy nên ở bài viết này chúng ta sẽ phân tích những yếu tố nào dẫn đến "low performance" cũng như cách khác phục chúng. .

0 0 9