Tag cuda

Tìm kiếm bài viết trong Tag cuda

- vừa được xem lúc

[NVIDIA Tools] Bài 7:Warp Scheduler

Ở trong bài Synchronization - Asynchronization mình có nhắc đến khái niệm latency hiding, một khái niệm rất thường thấy khi nhắc về cuda và khi nói đến latency hiding là sẽ nói đến always keep thread

0 0 1

- vừa được xem lúc

[NVIDIA Tools] Bài 6: Global Memory Coalescing

Global memory là bộ nhớ lớn nhất NHƯNG cũng là chậm nhất ở GPU vậy nên ở bài viết này chúng ta sẽ phân tích những yếu tố nào dẫn đến "low performance" cũng như cách khác phục chúng. .

0 0 1

- vừa được xem lúc

[NVIDIA Tools] Bài 5: NVIDIA Compute Sanitizer Phần 2

Ở bài viết này mình sẽ viết tiếp về cách sử dụng NVIDIA Compute Sanitizer, hãy đọc những bài này: NVIDIA Compute Sanitize phần 1, Data Hazard trước khi đọc bài viết này. NVIDIA Compute Sanitizer.

0 0 1

- vừa được xem lúc

[Lập trình song song] Bài 12: Atomic function

Ở bài này mình sẽ giới thiệu các bạn một cái built in function khá là xịn trong cuda, và 1 lưu ý là hãy đọc các bài này Data Hazard và Synchronization - Asynchronization trước khi đọc bài viết này. At

0 0 2

- vừa được xem lúc

[Lập trình song song] Bài 11: Data Hazard

Khi chúng ta nhắc đến song song chúng ta sẽ nhắc tới hiện tượng data hazard, 1 bug khiến chúng ta khá là đau đầu khi fix vì đây là lỗi về mặt logic NHƯNG bây giờ chúng ta đã có công cụ NVIDIA Compute

0 0 2

- vừa được xem lúc

[NVIDIA Tools] Bài 4: NVIDIA Compute Sanitizer Phần 1

Ở bài viết này mình sẽ hướng dẫn các bạn sử dụng NVIDIA Compute Sanitizer, 1 công cụ rất tuyệt vời để hỗ trợ cho các bạn mới bắt đầu về cuda. .

0 0 6

- vừa được xem lúc

[NVIDIA Tools] Bài 3: Cuda toolkit - Cuda driver

Trước khi sử dụng các công cụ của Nvidia trong việc profile thì chúng ta phải có kiến thức về nguyên lí hoạt động của cuda nên ở bài mình sẽ đề cập tới 2 khái niệm thường được nhắc đến khi nói về cuda

0 0 4

- vừa được xem lúc

[Lập trình song song] Bài 10: Streaming

Ở bài này mình sẽ hướng dẫn các bạn 1 kĩ thuật để optimize 1 chương trình trong cudaC ( kĩ thuật này cũng khá đơn giản nhưng sẽ tốt hơn nếu các bạn đã đọc qua bài Pinned memory và Async-Sync ). Stream

0 0 9

- vừa được xem lúc

[Lập trình song song] Bài 9: Pinned memory

Ở baì viết này mình sẽ nói về khái niệm pinned memory - xin lưu ý là nó sẽ liên quan tới bài tiếp theo ( streaming ) nên sẽ rất tốt nếu các bạn nắm được kiến thức ở bài này. .

0 0 2

- vừa được xem lúc

[Lập trình song song] Bài 8 : Unified memory

Ở bài này mình sẽ giới thiệu về Unified memory - có thể nói Unified memory là 1 bước đột phá lớn vào thời kì cuda 6.0.

0 0 2

- vừa được xem lúc

[NVIDIA Tools] Bài 2: Cài đặt Nsight system - Nsight compute

Ở bài viết này mình sẽ hướng dẫn các bạn cách cài đặt Nsight system và Nsight compute và nó sẽ dễ 1 cách bất ngờ nên yên tâm nha. .

0 0 3

- vừa được xem lúc

How to Set Up Deep Learning with Nvidia, CUDA, CUDAToolkit, cuDNN on Ubuntu 22.04

Installing cuDNN on Linux. 1. Prerequisites. Update the System.

0 0 7

- vừa được xem lúc

[Lập trình song song] Bài 7: Synchronization - Asynchronization

Để trả lời cho câu hỏi của bài 6 thì chúng ta phải đi qua 2 khái niệm synchronize và asynchronize. .

0 0 4

- vừa được xem lúc

[Lập trình song song] Bài 6: Sử dụng các bộ nhớ trong GPU

Ở bài 5 mình đã giới thiệu về các bộ nhớ nằm trong GPU ( công dụng/tốc độ/phạm vi truy cập của các thread (scope) ), thì ở bài này mình sẽ hướng dẫn các bạn sử dụng chúng bằng ngôn ngữ cuda-C. Các bộ

0 0 6

- vừa được xem lúc

[NVIDIA Tools] Bài 1: Giới thiệu Nsight Systems - Nsight Compute

Ở bài này mình sẽ giới thiệu sơ lược Nsight Systems - Nsight Compute để các bạn có 1 cái nhìn tổng quát nên sử dụng công cụ nào cho phù hợp với nhu cầu của mình. Xin lưu ý là bài viết này chỉ là giới

0 0 5

- vừa được xem lúc

[Lập trình song song] Bài 5: Các bộ nhớ trong GPU

Một trong những điểm thú vị khi ta code bằng cuda là chúng ta có thể tùy ý sử dụng bộ nhớ nào mà ta thích (tức là khi khởi tạo 1 giá trị, 1 biến bất kì ta có thể chỉ định nó được lưu vào bộ nhớ nào 1

0 0 12

- vừa được xem lúc

[Lập trình song song] Bài 4: Cách thức hoạt động CPU-GPU

Ở bài này mình sẽ đi sâu hơn 1 tí về cách thức vận hành của CPU và GPU và thông qua đó chúng ta sẽ trả lời được câu hỏi cuối cùng mà mình đã đề cập ở bài 3. CPU và GPU.

0 0 23

- vừa được xem lúc

[Lập trình song song] Bài 3: Hello world cuda-C

Ở các bài trước chúng ta đã học quá nhiều lý thuyết rùi, nên ở bài này chúng ta sẽ bắt đầu code những dòng đầu tiên bằng ngôn ngữ cuda-C và 1 lần nữa nếu máy tính các bạn không có GPU thì không sao cả

0 0 18

- vừa được xem lúc

[Lập trình song song] Bài bonus 2: Các thuật ngữ trong lập trình song song

Ở bài này mình sẽ giải thích các thuật ngữ thường hay được đề cập tới trong lập trình song song. .

0 0 13

- vừa được xem lúc

[Lập trình song song] Bài bonus 1: Cách thức hoạt động của máy tính

Ở bài này mình sẽ nói qua về cách máy tính hoạt động trong việc lấy và xử lí data qua ví dụ cực kì trực quan và dễ hiểu . Và xin lưu ý là ví dụ này sẽ được nhắc lại khá nhiều trong các bài học về lập

0 0 12

- vừa được xem lúc

[Lập trình song song] Bài 2: Cài đặt môi trường code CudaC

Trước khi code thì chúng ta phải setup môi trường để code thì ở bài này mình sẽ hướng dẫn các bạn cách setup và đối với những ai sở hữu máy tính mà không có GPU thì cũng đừng có lo vì chúng ta sẽ code

0 0 11