- vừa được xem lúc

Những đột phá mới nhất trong Machine Learning (19/08 - 25/08/2024)

0 0 5

Người đăng: Minh Le

Theo Viblo Asia

Lưu ý: Đây là một bài dịch từ bài viết của DAIR.AI đăng hằng tuần trên LinkedIn. Link của DAIR.A Itrên LinkedIn: https://www.linkedin.com/company/dair-ai/

1. Automate Design of Agentic Systems

Tóm tắt:

  • Giới thiệu Meta Agent Search, một tác nhân siêu việt tự động lập trình và thử nghiệm các tác nhân mới.
  • Dựa trên kho lưu trữ phát hiện trước đó để học bất kỳ hệ thống tác nhân nào, bao gồm lời nhắc, sử dụng công cụ, luồng điều khiển và hơn thế nữa.
  • Tập trung vào ba thành phần chính: không gian tìm kiếm, thuật toán tìm kiếm và hàm đánh giá.

Link:

2. LLM Pruning and Distillation in Practice

Tóm tắt:

  • Trình bày các phương pháp hiệu quả để nén các mô hình Llama 3.1 và Mistral NeMo.
  • Áp dụng cắt tỉa và chưng cất để tạo ra các mô hình có 4B và 8B tham số.
  • Tinh chỉnh mô hình giáo viên trên bộ dữ liệu để cải thiện chưng cất.
  • Tạo ra một mô hình 8B hiệu suất cao, vượt trội hơn các mô hình tương tự về kích thước.

Link:

3. Vizier Gaussian Process Bandit Algorithm

Tóm tắt:

  • Giới thiệu Vizier, một thuật toán dựa trên tối ưu hóa bandit Gaussian process.
  • Được Google sử dụng cho hàng triệu lần tối ưu hóa và nghiên cứu.
  • Cung cấp triển khai Python mã nguồn mở với kết quả đánh giá hiệu năng.

Link:

4. Language Modeling on Tabular Data

Tóm tắt:

  • Khảo sát các kỹ thuật mô hình hóa ngôn ngữ cho dữ liệu bảng.
  • Bao gồm các chủ đề như phân loại cấu trúc dữ liệu, bộ dữ liệu, kỹ thuật mô hình, xử lý dữ liệu, kiến trúc phổ biến và thách thức.

Link:

5. Enhancing Robustness in LLMs

Tóm tắt:

  • Đề xuất kỹ thuật nhắc nhở hai giai đoạn để loại bỏ thông tin không liên quan.
  • Giúp tăng cường độ ổn định của mô hình và hiệu suất suy luận.

Link:

6. A Comprehensive Overview of GraphRAG Methods

Tóm tắt:

  • Tập trung vào các kỹ thuật áp dụng cho quy trình làm việc GraphRAG (chỉ mục dựa trên đồ thị, truy vấn dựa trên đồ thị và tạo dựa trên đồ thị).
  • Khám phá các tác vụ, ứng dụng, đánh giá và trường hợp sử dụng công nghiệp.

Link:

7. MagicDec

Tóm tắt:

  • Cho thấy cách giải mã dự đoán có thể tăng cường năng suất, giảm độ trễ và duy trì độ chính xác trong tạo ngữ cảnh dài.
  • Sử dụng giải mã dự đoán hiệu quả hơn cho các chuỗi dài, ngay cả khi sử dụng các kích thước lô lớn.

Link:

8. Controllable Text Generation for LLMs

Tóm tắt:

  • Khảo sát các phương pháp để tạo văn bản có thể điều khiển trong LLM.
  • Thảo luận về sự an toàn, nhất quán, phong cách và tính hữu ích.

Link:

9. PEDAL

Tóm tắt:

  • Sử dụng tự tập hợp lai để cải thiện hiệu suất của LLM.
  • Tạo nhiều phản hồi ứng viên và tổng hợp chúng bằng cách sử dụng LLM.
  • Đạt được độ chính xác cao hơn và chi phí thấp hơn.

Link:

10. Challenges and Responses in the Practice of LLMs

Tóm tắt:

  • Tổng hợp các câu hỏi quan trọng với câu trả lời sâu sắc về LLM.
  • Phân loại câu hỏi theo chủ đề như cơ sở hạ tầng, kiến trúc phần mềm, dữ liệu, ứng dụng và khoa học thần kinh.

Link:

Bình luận

Bài viết tương tự

- vừa được xem lúc

Các thuật toán cơ bản trong AI - Phân biệt Best First Search và Uniform Cost Search (UCS)

Nếu bạn từng đọc các thuật toán trong AI (Artificial Intelligence - Trí tuệ nhân tạo), rất có thể bạn từng nghe qua về các thuật toán tìm kiếm cơ bản: UCS (thuộc chiến lược tìm kiếm mù) và Best First Search (thuộc chiến lược tìm kiếm kinh nghiệm). Khác nhau rõ từ khâu phân loại rồi, thế nhưng hai th

0 0 169

- vừa được xem lúc

Con đường AI của tôi

Gần đây, khá nhiều bạn nhắn tin hỏi mình những câu hỏi đại loại như: có nên học AI, bắt đầu học AI như nào, làm sao tự học cho đúng, cho nhanh, học không bị nản, lộ trình học AI như nào... Sau nhiều lần trả lời, mình nghĩ rằng nên viết hẳn một bài để trả lời chi tiết hơn, cũng như để các bạn sau này

0 0 157

- vừa được xem lúc

[ChatterBot] Thư viện chatbot hay ho dành cho Python| phần 3

Trong bài trước mình đã trình bày về Training data cho chatbot và tiền xử lý dữ liệu. Trong phần này sẽ trình bày với các bạn về logic adapter.

0 0 62

- vừa được xem lúc

[Deep Learning] Kỹ thuật Dropout (Bỏ học) trong Deep Learning

. Trong bài viết này, mình xin phép giới thiệu về Dropout (Bỏ học) trong mạng Neural, sau đó là mình sẽ có 1 số đoạn code để xem Dropout ảnh hưởng thế nào đến hiệu suất của mạng Neural. 1.1. Dropout trong mạng Neural là gì.

0 0 68

- vừa được xem lúc

Kỹ thuật Dropout (Bỏ học) trong Deep Learning

Trong bài viết này, mình xin phép giới thiệu về Dropout (Bỏ học) trong mạng Neural, sau đó là mình sẽ có 1 số đoạn code để xem Dropout ảnh hưởng thế nào đến hiệu suất của mạng Neural. 1.

0 1 81

- vừa được xem lúc

Blockchain dưới con mắt làng Vũ Đại 4.0

Mở bài. Hey nhô các bạn, lại là mình đây .

0 0 50