Tag LLM

Tìm kiếm bài viết trong Tag LLM

05/08/2025 - vừa được xem lúc 05/08/2025

Qwen 3 Cập Nhật: Thách Thức Mới Cho DeepSeek và Kimi

Thế giới AI đang thay đổi từng ngày. Mới đây, Alibaba đã tung ra bản cập nhật lớn cho mô hình ngôn ngữ Qwen 3, tạo ra một cuộc cạnh tranh mới với các mô hình hàng đầu như DeepSeek và Kimi.

0 0 1

29/07/2025 - vừa được xem lúc 08/08/2025

Ứng dụng AI vào Slack để tăng trải nghiệm và hiệu suất làm việc

Có hôm đang làm dở task, tôi quay lại Slack để tìm đoạn trao đổi hôm trước với anh dev backend — mất đúng 20 phút. Thread hôm đó dài cả cây số, toàn reaction với sticker, thi thoảng mới có vài comment

0 0 9

23/07/2025 - vừa được xem lúc 31/07/2025

LLM 101 - Paper reading | Think-in-Memory: Recalling and Post-thinking Enable LLMs with Long-Term Memory

#LLM

Giới thiệu. Việc thiết kế Large Language Models (LLMs) có Long-term memory là rất quan trọng và hữu ích trong các đoạn hội thoại dài giữa người và máy.

0 0 3

20/07/2025 - vừa được xem lúc 25/07/2025

LLM 101 | FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness

#LLM

Đóng góp của bài báo. Nếu quen thuộc với Self-attention thì chúng ta đều biết rằng Self-attention có độ phức tạp bậc 2 với độ dài của chuỗi đầu vào.

0 0 6

19/07/2025 - vừa được xem lúc 22/07/2025

[#1] - Khái niệm về AI Agent

#LLM

#Artificial Intelligent

#GenAI

#AI Agent

#Multi-agents LLMs

AI Agent là gì. . Để chuyến đi thành hiện thực, bạn sẽ phải làm gì? Chắc chắn sẽ có một danh sách dài những việc cần làm:. .

0 0 3

14/07/2025 - vừa được xem lúc 17/07/2025

Các Bước Thực Tiễn Để Chạy Các Mô Hình LLM Mở Mới Nhất Trên macOS Của Bạn

#MacOS

#LLM

#ollama

Thế giới của các Mô Hình Ngôn Ngữ Lớn (LLM) hiện nay đang thật sự rất hấp dẫn, phải không? Mỗi tuần dường như lại có những mô hình mới, những khả năng mới và những làn sóng phấn khích không ngừng. Cơn

0 0 4

12/07/2025 - vừa được xem lúc 17/07/2025

Paper reading | Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

#LLM

Giới thiệu. Nếu trong tay có dữ liệu lớn và muốn tăng hiệu suất mô hình, hầu như chúng ta sẽ nghĩ ngay tới việc scale kích thước mô hình lên.

0 0 5

11/07/2025 - vừa được xem lúc 3 giờ trước

Mô Hình Mới R1 Của DeepSeek Bước Vào Sàn Đấu

Thế giới trí tuệ nhân tạo (AI) là một sân chơi năng động, luôn phát triển với những đột phá và sự cạnh tranh khốc liệt. Mới đây, thông tin về việc DeepSeek của Trung Quốc ra mắt mô hình AI R1 đã được

0 0 5

28/06/2025 - vừa được xem lúc 02/08/2025

Better prompt engineering - Pair programming với Coding Agent

#AI

#LLM

#Prompt Engineering

Chào anh em, lại là tôi với series Better Prompt Engineering đây. Coding agent về cơ bản là anh em tương tác với một bạn senior kiến thức rất sâu, nhiệt tình, chăm chỉ, nhưng điểm yếu là bạn này là kh

0 0 10

26/06/2025 - vừa được xem lúc 10/08/2025

Google Chơi Lớn! Gemini CLI Mã Nguồn Mở + Miễn Phí, Bạn Vẫn Còn Dùng Claude Code Sao?

Google lại lặng lẽ tung ra một quả bom tấn khác. Hãy cùng tìm hiểu Gemini CLI là gì và cách cài đặt nó.

0 0 7

07/06/2025 - vừa được xem lúc 16/07/2025

vLLM – Giải pháp nhanh, gọn để triển khai mô hình ngôn ngữ lớn (LLM)

#LLM

#@AI

#vLLM

| Thiết lập vLLM để triển khai nhanh chóng. .

0 0 6

05/06/2025 - vừa được xem lúc 19/07/2025

DeepSeek R1-0528: Mô hình AI Trung Quốc gây "bão" vì quá thông minh, lại còn chạy được trên 1 GPU

#AI

#Artificial Intelligence

#LLM

#deepseek

Trong thời điểm cuộc đua AI đang cực kỳ khốc liệt, một cái tên đến từ Trung Quốc – Deepseek – đã khiến cộng đồng công nghệ phải trầm trồ khi ra mắt phiên bản nâng cấp DeepSeek R1-0528. Không chỉ mạnh

0 0 11

04/06/2025 - vừa được xem lúc 16/07/2025

Dễ sử dụng ngay cả với người mới! Tất cả về phát triển dựa trên AI với Cursor+Apidog MCP Server

Gần đây, ngay cả một lập trình viên mới như tôi cũng có thể viết mã cấp chuyên nghiệp nhờ sức mạnh của AI. Tuy nhiên, khi nói đến phát triển API, việc phải đối chiếu với tài liệu đặc tả và viết mã một

0 0 9

03/06/2025 - vừa được xem lúc 6 giờ trước

Bắt buộc cho lập trình viên! Hướng dẫn đầy đủ về công cụ lập trình Vibe năm 2025

#LLM

#eveloperProductivity

#ProgrammingEfficiency

#AIDevelopmentTools

#VibeCoding

Xin chào, Sự phát triển của các công cụ lập trình AI gần đây thực sự đáng kinh ngạc, phải không? Bản thân tôi đã được hỗ trợ rất nhiều bởi những công cụ này trong công việc phát triển hàng ngày, và th

0 0 10

31/05/2025 - vừa được xem lúc 19/07/2025

[Advanced-LLM] Điều gì thật sự "ẩn dấu" sau "sự suy luận" của LLM ? Vén màn một chút sự thật....

#LLM

#MayFest2025

#Reasoning LLM

Mở đầu. Thì 3 bài trước đó mình đã viết loanh quanh về khả năng của LLM.

0 0 10

31/05/2025 - vừa được xem lúc 19/07/2025

Memory in LLM Agent

Introduction. Khi bạn bắt tay vào xây dựng một agent dùng mô hình ngôn ngữ lớn (LLM) để thực hiện một nhiệm vụ nào đó, thì chuyện "nhớ nhớ quên quên" không còn là chuyện cá nhân nữa — mà là yếu tố sốn

0 0 11

29/05/2025 - vừa được xem lúc 18 giờ trước

Tôi tìm thấy máy chủ DeepWiki MCP trên cursor nên tôi đã thử.

#ModelContextProtocol

Xin chào mọi người! Gần đây, tôi có cơ hội đọc mã nguồn của một dự án mã nguồn mở và suýt nữa thì bỏ cuộc (cười). Tôi đã ôm đầu trước hàng chục nghìn dòng mã, tự hỏi "Khi nào mình mới hiểu được cái nà

0 0 10

27/05/2025 - vừa được xem lúc 19/07/2025

Xây dựng AI Trading Team Vietnam: Ứng dụng giao thức Agent-to-Agent (A2A) trong đầu tư chứng khoán

Chào các bạn ! Lâu lắm mới ngoi lên để chia sẻ một cái gì đó và hi vọng bài này có thể giúp ích được cho nhiều anh em. Như mọi người cũng biết, MCP và A2A là 2 giao thức nổi đình nổi đám hiện nay mà v

0 0 10

25/05/2025 - vừa được xem lúc 19/07/2025

[Paper Notes] Implicit Reasoning in Transformers is Reasoning through Shortcuts

#LLM

#MayFest2025

#Reasoning LLM

Paper Link: Implicit Reasoning in Transformers is Reasoning through Shortcuts. Các mô hình ngôn ngữ hiện đại như OpenAI’s o1, o3 hay DeepSeek’s R1 cho thấy rằng tính toán thời gian kiểm tra (test-time

0 0 13

24/05/2025 - vừa được xem lúc 19/07/2025

[Paper Notes] Reasoning models can be effective without thinking

#LLM

#MayFest2025

#Reasoning LLM

Trong lĩnh vực trí tuệ nhân tạo, các mô hình ngôn ngữ lớn (LLMs) đã đạt được những bước tiến vượt bậc trong việc xử lý các nhiệm vụ suy luận phức tạp, từ giải toán đến lập trình và chứng minh định lý.

0 0 9

24/05/2025 - vừa được xem lúc 10/08/2025

Không còn ClickOps, giờ là TalkOps! Những MCP Servers hữu ích cho Devops Engineer

Mở đầu. Trong những tháng gần đây MCP Server nổi lên nhưng một chuẩn chung giúp các mô hình ngôn ngữ lớn (LLM) thực hiện được nhiều công việc thay cho người dùng.

0 0 12