Tag MayFest2024

Tìm kiếm bài viết trong Tag MayFest2024

- vừa được xem lúc

[LLM - Paper reading] Tóm tắt về phương pháp Direct Preference Optimization sử dụng trong RLHF

Giới thiệu. Trong bài viết này mình sẽ tóm tắt các ý tưởng chính của phương pháp DPO trong bài báo DPO Paper.

0 0 2

- vừa được xem lúc

[LLM 101] Tìm hiểu RLHF trong InstructGPT và Llama 2

Giới thiệu. Nếu từng làm về LLM thì hẳn bạn sẽ không còn thấy xa lạ gì với RLHF (Reinforcement Learning with Human Feedback).

0 0 2

- vừa được xem lúc

[LLM - Paper reading] RLAIF: Scaling Reinforcement Learning from Human Feedback with AI Feedback

Giới thiệu. Các bạn đều biết rằng Reinforcement Learning from Human Feedback (RLHF) là một phương pháp hiệu quả để align các mô hình ngôn ngữ lớn (LLMs) theo preference của con người, đóng vai trò qua

0 0 1

- vừa được xem lúc

[LLM] Sử dụng RAGAs và LlamaIndex để đánh giá chất lượng RAG

Giới thiệu. Nếu bạn đã phát triển một ứng dụng Retrieval Augmented Generation (RAG) cho hệ thống kinh doanh thực tế, bạn có thể quan tâm đến hiệu quả của nó.

0 0 2

- vừa được xem lúc

[LLM 101] Thảo luận các vấn đề về Finetune Large Language Models

Giới thiệu. Như các bạn đã biết, lĩnh vực trí tuệ nhân tạo đang phát triển nhanh chóng và việc sử dụng hiệu quả các mô hình ngôn ngữ lớn (large language models - LLMs) trở nên ngày càng quan trọng.

0 0 2

- vừa được xem lúc

[LLM 101] Thử cài đặt Decomposed Low-Rank Adaptation (DoRA)

Giới thiệu. Low-rank adaptation (LoRA) là một phương pháp trong học máy được sử dụng để finetune một mô hình pretrain (ví dụ, một Large Language Model hoặc mô hình Vision Transformer) nhằm align nó vớ

0 0 3

- vừa được xem lúc

Quy hoạch động trên cây

I. Giới thiệu.

0 0 1

- vừa được xem lúc

Rời rạc hóa (Nén số)

I. Giới thiệu chung.

0 0 9

- vừa được xem lúc

Two Pointers

I. Tổng quan về kĩ thuật Two Pointers.

0 0 9

- vừa được xem lúc

Quy hoạch động 7.6: Top-down và Bottom-up

I. Giới thiệu chung.

0 0 12

- vừa được xem lúc

Sắp xếp với thời gian tuyến tính

Mở đầu. Ta đã làm quen với rất nhiều thuật toán sắp xếp.

0 0 15

- vừa được xem lúc

JWT là gì? Tại sao JWT trở nên phổ biến như vậy?

JWT là gì. Ứng dụng JWT. Một số trường hợp sử dụng JWT:. .

0 0 18

- vừa được xem lúc

Flutter Cross-Platform Development: Making it Easy and Efficient

In today's fast-paced technological landscape, cross-platform development has become increasingly popular as it allows developers to create applications that can run on multiple platforms with a singl

0 0 16

- vừa được xem lúc

Access control vulnerability - Phân biệt Authentication và Authorization

1. Kiểm soát truy cập là gì. Ví dụ:. Nhân viên A bất kỳ thuộc bộ phần A1 có quyền tạo request đi muộn, nghỉ phép --> Nhân viên A có vai trò Staff.

0 0 13

- vừa được xem lúc

Ứng dụng Generative AI_Tester học và làm việc đã trở nên dễ dàng hơn

Trước đây, việc tạo data test CRUD trong dự án của tester hay gặp một số vấn đề phổ biến như. Data test tào lao, không có ý nghĩa: Vd như : test 1, test 2, case 1, case 2, ….

0 0 11

- vừa được xem lúc

Design Pattern cùng Flutter. Tập 1: Introduce

Tổng quan về Series. .

0 0 13

- vừa được xem lúc

ChatGPT Series 7.2: Prompt Engineering (2)

Tiếp nối bài viết trước ChatGPT Series 7.1: Prompt Engineering (1) về kỹ thuật Prompt Engineering, bài viết này mình sẽ giới thiệu một số phương pháp nâng cao hơn được nghiên cứu và áp dụng cho kỹ thu

0 0 15

- vừa được xem lúc

Finetune BERT cho bài toán che thông tin cá nhân - Phần 1: Xử lý dữ liệu

Tổng quan. Với sự phát triển nhanh chóng của công nghệ xử lý ngôn ngữ tự nhiên (NLP), việc bảo vệ thông tin cá nhân trên các nền tảng trực tuyến đã trở thành một vấn đề quan trọng.

0 0 15

- vừa được xem lúc

Finetune BERT cho bài toán che thông tin cá nhân - Phần 2: Huấn luyện và đánh giá mô hình

Tổng quan. Phần 1 chúng ta đã cùng nhau xác định các bước để tạo ra một mô hình xử lý bài toán NER thông qua việc finetuning BERT.

0 0 14

- vừa được xem lúc

YOLO-Pose: Yolo đã phát hiện tư thế con người như thế nào? [Phần 1]

Hầu hết chúng ta đã quá quen thuộc với bài toán phát hiện đối tượng người: chỉ đơn giản là vẽ bounding box quanh đối tượng được cho là người. Vậy làm thế nào để biết người đó đang hoạt động hay đang l

0 0 13