Tag LLM
Tìm kiếm bài viết trong Tag LLM
[LLM 101 - Paper reading] Large Language Models are Superpositions of All Characters: Attaining Arbitrary Role-play via Self-Alignment
Đóng góp của bài báo. Các Mô hình Ngôn ngữ Lớn (LLMs) như GPT-4 thể hiện khả năng đáng kinh ngạc trong việc hiểu ý định (understanding intent), tuân theo hướng dẫn (following instructions), và thực hi
0 0 0
[LLM 101 - Paper reading] Tìm hiểu Corrective Retrieval Augmented Generation (CRAG)
Giới thiệu. Hãy tưởng tượng bạn đang trong giờ kiểm tra và thầy của bạn cho mở sách Chúng ta sẽ có 3 chiến lược để làm bài kiểm tra như sau:. . .
0 0 0
LLM 101 | FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness
Đóng góp của bài báo. Nếu quen thuộc với Self-attention thì chúng ta đều biết rằng Self-attention có độ phức tạp bậc 2 với độ dài của chuỗi đầu vào.
0 0 0
MiniCPM-V: Mang sức mạnh của Multimodal LLM ngang tầm GPT4-V lên thiết bị di động
Hai bé "cún phi hành gia" đang thám hiểm sao Hỏa cùng trợ lý MiniCPM-V được triển khai trên một thiết bị nhỏ gọn (Nguồn: AI generated). Như đã đề cập trong bài viết trước về MiniCPM, mình đã giới thi
0 0 1
MiniCPM: Khai Phá Tiềm Năng Của Các Mô Hình Ngôn Ngữ Nhỏ (SLMs)
Trong những năm gần đây, cả thế giới và cộng đồng AI đều chứng kiến sự bùng nổ ấn tượng của các mô hình ngôn ngữ lớn (LLMs), với quy mô hàng tỷ đến hàng chục tỷ tham số. Tuy nhiên, chính vì kích thước
0 0 3
[LLM 101] Thảo luận về finetune model LLM sử dụng LoRA (Low-Rank Adaptation)
Giới thiệu về LoRA. Các bạn đều biết rằng các LLM hiện nay đều có kích thước rất lớn và và việc cập nhật tất cả các tham số của mô hình trong quá trình training có thể rất tốn kém do giới hạn bộ nhớ G
0 0 1
Claude Sonnet 3.5 vs Gemini: Nên trải nghiệm nếu bạn đang cần một phương án khác ngoài GPT
Lời mở đầu. Trong thế giới ngày càng phát triển của trí tuệ nhân tạo, việc tìm kiếm những công cụ hỗ trợ thông minh để tối ưu hóa công việc và cuộc sống hàng ngày ngày càng trở nên quan trọng.
0 0 8
Những đột phá mới nhất trong Machine Learning (12/08 - 18/08/2024)
Lưu ý: Đây là một bài dịch từ bài viết của DAIR.AI đăng hằng tuần trên LinkedIn. Link của DAIR.A Itrên LinkedIn: https://www.
0 0 7
Những đột phá mới nhất trong Machine Learning (05/08 - 11/08/2024)
Lưu ý: Đây là một bài dịch từ bài viết của DAIR.AI đăng hằng tuần trên LinkedIn. Link của DAIR.A Itrên LinkedIn: https://www.
0 0 5
Những đột phá mới nhất trong Machine Learning (29/07 - 04/08/2024)
Lưu ý: Đây là một bài dịch từ bài viết của DAIR.AI đăng hằng tuần trên LinkedIn. Link của DAIR.A Itrên LinkedIn: https://www.
0 0 6
Nâng cao hiệu suất RAG của bạn với Tavily Search API
Mở khóa kết quả nhanh hơn, phù hợp hơn. . Giới thiệu. Các mô hình ngôn ngữ lớn (LLM) và hệ thống RAG đã chứng tỏ sự vượt trội của chúng theo thời gian.
0 0 6
RAG 2.0: Một số kỹ thuật được đề cập để cải thiện thêm về RAG
Trong thời gian gần đây, việc phát triển của các mô hình ngôn ngữ lớn (LLMs) đang phát triển chóng mặt, từ những open source model đến những close source model từ các ông lớn trong ngành. Và có lẽ nhữ
0 0 5
RAG 2.0: Một số kỹ thuật được đề cập để cải thiện thêm về RAG - Tiếp
Trong bài này chúng ta sẽ đi tiếp một số kỹ thuật còn lại để cải thiện cho bài toán RAG. Điểm “có thể thay đổi” là việc họ thêm phần rerank có thể training được.
0 0 6
KeyBERT: Trích xuất từ khóa một cách dễ dàng
Phát hiện những từ khóa quan trọng nhất từ văn bản của bạn một cách dễ dàng. .
0 0 6
MLOps Tooling: Các Công Cụ Hỗ Trợ Quản Lý Vòng Đời Mô Hình ML/ DL/ LLM
Overview. .
0 0 10
GraphRAG - Một sự nâng cấp mới của RAG truyền thống chăng?
Mở đầu. Chắc hẳn anh em làm về AI không còn quá mới lạ về RAG (Retrieval Augmented generation) nữa rồi.
0 0 7
Ra mắt mô hình “mã nguồn mở” lên tới 405 tỉ tham số, Meta AI kiếm tiền bằng cách nào?
Mở đầu. Chắc hẳn các bạn vẫn chưa quên màn ra mắt đầy ấn tượng của hệ thống các mô hình thế hệ Llama 3.
0 0 7
Chúng ta sẽ có được gì sau màn ra mắt “hoành tráng” của Meta AI với con “quái vật” mới nhất của họ - Llama 3.1 405B?
Mở đầu. Thế giới công nghệ một lần nữa chao đảo trước những bước tiến thần tốc của trí tuệ nhân tạo.
0 0 7
Tùy chỉnh LLM với dữ liệu của bạn
Tùy chỉnh mô hình ngôn ngữ lớn (LLM) với dữ liệu của bạn. Trong bối cảnh các mô hình ngôn ngữ lớn (LLM) ngày càng được ứng dụng rộng rãi, việc tối ưu hóa và tùy chỉnh các mô hình này để phù hợp với cá
0 0 8