Tag Deep Learning

Tìm kiếm bài viết trong Tag Deep Learning

- vừa được xem lúc

Giới thiệu PyTorch: Có bột mới gột nên hồ

Trong loạt bài viết xây dựng mô hình ngôn ngữ lớn, PyTorch chính là công cụ quan trọng nhất được sử dụng. Tuy nhiên, chúng ta mới chỉ dừng ở mức sử dụng mà chưa có thời gian tìm hiểu kỹ hơn.

0 0 3

- vừa được xem lúc

Xây Dựng Mô Hình Ngôn Ngữ Lớn (Phần 4): Triển khai mô hình GPT

File Jupyter notebook của bài viết này nằm tại đây. 1.

0 0 2

- vừa được xem lúc

Xây Dựng Mô Hình Ngôn Ngữ Lớn (Phần 5): Tiền huấn luyện với dữ liệu không gán nhãn

File Jupyter Notebook của bài viết này có thể xem tại đây. 1.

0 0 2

- vừa được xem lúc

Xây Dựng Mô Hình Ngôn Ngữ Lớn (Phần 6): Tinh chỉnh cho nhiệm vụ phân loại văn bản

Ở các bài viết trước, ta đã triển khai gần như hoàn chỉnh việc xây dựng 1 mô hình ngôn ngữ lớn, từ việc xử lý dữ liệu đầu vào, cơ chế attention, logic trong khối Transformer cho đến tiền huấn luyện. B

0 0 2

- vừa được xem lúc

Xây Dựng Mô Hình Ngôn Ngữ Lớn (Phần 7): Tinh chỉnh mô hình với phương pháp follow instructions

File Jupyter NoteBook của bài viết này có thể xem tại đây. 1. Instruction fine-tuning. Sau giai đoạn tiền huấn luyện, mô hình đã có thể sinh văn bản khá tốt.

0 0 1

- vừa được xem lúc

Tập hợp các câu hỏi phỏng vấn trong cuốn DEEP LEARNING INTERVIEWS (ví dụ Dịch bệnh Ebola)

REAL-WORLD DEEP LEARNING INTERVIEW. Muốn cuốn sách khá hay cho a.e ôn luyện các thuật toán deep learning . PROBLEMS & SOLUTIONS.

0 0 5

- vừa được xem lúc

MLOps là gì? Ba cấp độ MLOps bạn cần biết!

1. Giới thiệu.

0 0 15

- vừa được xem lúc

Parameter vs. Floating-point - Ông thầy mắt cận và thằng bé mắt sáng

NVIDIA vừa tuyên bố sắp ra Project Digits - một chiếc PC mini có thể chạy các mô hình AI "não to" trong một thiết bị bé bằng... cái hộp cơm của bạn! Nhưng để làm được điều này, họ buộc phải đánh đổi:

0 0 5

- vừa được xem lúc

Molmo: Hướng đến OpenSource VLM

I. Giới thiệu.

0 0 6

- vừa được xem lúc

Setup Cực Đơn Giản Tensorflow GPU Jupyter Notebooks trên Docker Window WSL2

Mở Đầu. Docker trên WSL2 (Windows Subsystem for Linux) cho phép bạn tránh những sự không tương thích mà bạn có thể thấy khi chạy trực tiếp trên Windows bằng cách chạy trong một container Docker cho Li

0 0 7

- vừa được xem lúc

Triton Inference Server Tutorial

Overview. Trong bài viết lần trước, mình đã trình bày về tổng quan lý thuyết về Triton Inference Server bao gồm kiến trúc của Triton, các tính năng chính, thông tin cơ bản và một số Triton Server Tool

0 0 11

- vừa được xem lúc

MiniCPM-V: Mang sức mạnh của Multimodal LLM ngang tầm GPT4-V lên thiết bị di động

Hai bé "cún phi hành gia" đang thám hiểm sao Hỏa cùng trợ lý MiniCPM-V được triển khai trên một thiết bị nhỏ gọn (Nguồn: AI generated). Như đã đề cập trong bài viết trước về MiniCPM, mình đã giới thi

0 0 9

- vừa được xem lúc

[GPU in AI] Bài 1: Lời mở đầu

Ngày nay, với sự phát triển nhanh chóng của AI khiến nhu cầu sử dụng ngày càng tăng, dẫn đến việc dữ liệu ngày càng phong phú và các tác vụ ngày càng đa dạng. Điều này khiến các bài toán về Machine-Le

0 0 19

- vừa được xem lúc

Tùy chỉnh LLM với dữ liệu của bạn

Tùy chỉnh mô hình ngôn ngữ lớn (LLM) với dữ liệu của bạn. Trong bối cảnh các mô hình ngôn ngữ lớn (LLM) ngày càng được ứng dụng rộng rãi, việc tối ưu hóa và tùy chỉnh các mô hình này để phù hợp với cá

0 0 13

- vừa được xem lúc

So Sánh Generative AI và AI Thông Thường: Hiểu Rõ Hơn Về Tương Lai Của AI

1. Giới Thiệu. . Lời chào mừng: Xin chào các bạn độc giả thân mến! Chào mừng các bạn đến với bài viết hôm nay.

0 0 18

- vừa được xem lúc

Trí Tuệ Nhân Tạo, Học Máy Và Học Sâu: Tất Cả Những Gì Bạn Cần Biết

I. Giới Thiệu. . Giới thiệu về tầm quan trọng của việc hiểu trí tuệ nhân tạo (AI), học máy (Machine Learning), và học sâu (Deep Learning):.

0 0 22

- vừa được xem lúc

YOLO v9: Mô hình nhận diện vật thể tiên tiến nhất hiện nay!

1. Giới thiệu.

0 0 20

- vừa được xem lúc

Exponential Moving Average trong Deep Learning

Chất lượng của mô hình học sâu (deep learning) có liên quan chặt chẽ đến quá trình huấn luyện chúng. Để huấn luyện được mô hình tốt, việc giảm nhiễu (noise) từ quá trình cập nhật ngẫu nhiên (stochasti

0 0 21