Tag MayFest2024
Tìm kiếm bài viết trong Tag MayFest2024
[LLM - Paper reading] Tóm tắt về phương pháp Direct Preference Optimization sử dụng trong RLHF
Giới thiệu. Trong bài viết này mình sẽ tóm tắt các ý tưởng chính của phương pháp DPO trong bài báo DPO Paper.
0 0 2
[LLM 101] Tìm hiểu RLHF trong InstructGPT và Llama 2
Giới thiệu. Nếu từng làm về LLM thì hẳn bạn sẽ không còn thấy xa lạ gì với RLHF (Reinforcement Learning with Human Feedback).
0 0 2
[LLM - Paper reading] RLAIF: Scaling Reinforcement Learning from Human Feedback with AI Feedback
Giới thiệu. Các bạn đều biết rằng Reinforcement Learning from Human Feedback (RLHF) là một phương pháp hiệu quả để align các mô hình ngôn ngữ lớn (LLMs) theo preference của con người, đóng vai trò qua
0 0 1
[LLM] Sử dụng RAGAs và LlamaIndex để đánh giá chất lượng RAG
Giới thiệu. Nếu bạn đã phát triển một ứng dụng Retrieval Augmented Generation (RAG) cho hệ thống kinh doanh thực tế, bạn có thể quan tâm đến hiệu quả của nó.
0 0 2
[LLM 101] Thảo luận các vấn đề về Finetune Large Language Models
Giới thiệu. Như các bạn đã biết, lĩnh vực trí tuệ nhân tạo đang phát triển nhanh chóng và việc sử dụng hiệu quả các mô hình ngôn ngữ lớn (large language models - LLMs) trở nên ngày càng quan trọng.
0 0 2
[LLM 101] Thử cài đặt Decomposed Low-Rank Adaptation (DoRA)
Giới thiệu. Low-rank adaptation (LoRA) là một phương pháp trong học máy được sử dụng để finetune một mô hình pretrain (ví dụ, một Large Language Model hoặc mô hình Vision Transformer) nhằm align nó vớ
0 0 3
Sắp xếp với thời gian tuyến tính
Mở đầu. Ta đã làm quen với rất nhiều thuật toán sắp xếp.
0 0 15
JWT là gì? Tại sao JWT trở nên phổ biến như vậy?
JWT là gì. Ứng dụng JWT. Một số trường hợp sử dụng JWT:. .
0 0 18
Flutter Cross-Platform Development: Making it Easy and Efficient
In today's fast-paced technological landscape, cross-platform development has become increasingly popular as it allows developers to create applications that can run on multiple platforms with a singl
0 0 16
Access control vulnerability - Phân biệt Authentication và Authorization
1. Kiểm soát truy cập là gì. Ví dụ:. Nhân viên A bất kỳ thuộc bộ phần A1 có quyền tạo request đi muộn, nghỉ phép --> Nhân viên A có vai trò Staff.
0 0 13
Ứng dụng Generative AI_Tester học và làm việc đã trở nên dễ dàng hơn
Trước đây, việc tạo data test CRUD trong dự án của tester hay gặp một số vấn đề phổ biến như. Data test tào lao, không có ý nghĩa: Vd như : test 1, test 2, case 1, case 2, ….
0 0 11
ChatGPT Series 7.2: Prompt Engineering (2)
Tiếp nối bài viết trước ChatGPT Series 7.1: Prompt Engineering (1) về kỹ thuật Prompt Engineering, bài viết này mình sẽ giới thiệu một số phương pháp nâng cao hơn được nghiên cứu và áp dụng cho kỹ thu
0 0 15
Finetune BERT cho bài toán che thông tin cá nhân - Phần 1: Xử lý dữ liệu
Tổng quan. Với sự phát triển nhanh chóng của công nghệ xử lý ngôn ngữ tự nhiên (NLP), việc bảo vệ thông tin cá nhân trên các nền tảng trực tuyến đã trở thành một vấn đề quan trọng.
0 0 15
Finetune BERT cho bài toán che thông tin cá nhân - Phần 2: Huấn luyện và đánh giá mô hình
Tổng quan. Phần 1 chúng ta đã cùng nhau xác định các bước để tạo ra một mô hình xử lý bài toán NER thông qua việc finetuning BERT.
0 0 14
Hướng dẫn cơ bản về Cheat Engine - Graphical Game Tutorials (Phần 4)
Mở đầu. .
0 0 14
YOLO-Pose: Yolo đã phát hiện tư thế con người như thế nào? [Phần 1]
Hầu hết chúng ta đã quá quen thuộc với bài toán phát hiện đối tượng người: chỉ đơn giản là vẽ bounding box quanh đối tượng được cho là người. Vậy làm thế nào để biết người đó đang hoạt động hay đang l
0 0 13