Giới thiệu AI Agent - Bộ não thông minh cho Workflow của bạn

Ở các bài trước, chúng ta đã làm quen với LLM và các node AI cơ bản như Information Extractor, Text Classifier, Basic LLM Chain... Những node này hoạt động theo kiểu đầu vào → AI xử lý → đầu ra - rất đơn giản và dễ hiểu.

Nhưng có điều gì đó còn thiếu...

Hãy tưởng tượng bạn có một trợ lý AI thực tế. Khi bạn nói "Hãy tìm cho tôi nhà hàng Việt Nam ngon ở Berlin", trợ lý AI đó sẽ phải:

  1. Mở Google Maps để tìm kiếm
  2. Xem đánh giá, so sánh các địa điểm
  3. Gọi điện hỏi thêm về giờ mở cửa
  4. Cuối cùng báo cáo lại cho bạn top 3 lựa chọn tốt nhất

Đó chính là cách AI Agent hoạt động!

Khác với các node AI thông thường chỉ xử lý dữ liệu theo luồng cố định, Agent có thể tự suy nghĩ, ra quyết định và sử dụng công cụ để hoàn thành nhiệm vụ.

Trong bài này, chúng ta sẽ khám phá cách AI Agent hoạt động, cách sử dụng và biến nó thành một trợ lý thông minh trong workflow của bạn!

agent

AI Agent là gì?

AI Agent là một hệ thống tự động có khả năng:

  • Thu thập thông tin từ môi trường xung quanh
  • Suy nghĩ, lên kế hoạch, ra quyết định dựa trên mục tiêu được giao
  • Thực hiện kế hoạch (gọi API, tìm kiếm web, chạy code, ...) để đạt được mục tiêu đó
  • Lặp đi lặp lại cho đến khi hoàn thành nhiệm vụ được giao

Nói đơn giản, AI Agent giống như một trợ lý có thể tự đưa ra quyết định thông minh, thay vì chỉ làm theo kịch bản có sẵn.

Vào những ngày ChatGPT mới ra mắt, khi bạn hỏi những tin tức mới nhất, địa điểm v...v, nó chỉ biết trả lời bậy dựa theo kiến thức đã có.

Còn bây giờ thì sao? Khi bạn hỏi ChatGPT hoặc Gemini, nó sẽ tự động tìm kiếm thông tin trên internet rồi trả lời cho bạn. Nó có thể tạo file PDF, Excel, Slide, hoặc viết code và chạy code để tính toán kết quả cho bạn luôn.

Đây chính là sức mạnh của AI Agent.

AI Agent là bước tiến hóa tiếp theo của Large Language Model (LLM). Thay vì chỉ tạo ra văn bản, mục tiêu của nó là hoàn thành công việc thực tế (tìm thông tin mới nhất, làm báo cáo, viết code, tạo slide, ...)

agent

Lợi ích của AI Agent

Theo khảo sát của LangChain's State of AI Agents report, 51% các công ty đã sử dụng AI Agent trong production. Điều này cho thấy AI Agent không còn là công nghệ thử nghiệm mà đã trở thành công cụ thiết yếu trong doanh nghiệp.

Về mặt xử lý dữ liệu và năng suất, AI Agent giúp phân tích dữ liệu nhanh hơn bằng cách xử lý lượng lớn dữ liệu, trích xuất insights và tạo báo cáo tự động. Nó cũng tăng năng suất team thông qua việc tự động hóa các task lặp đi lặp lại, giải phóng thời gian cho công việc sáng tạo. Ngoài ra, Agent còn cải thiện chất lượng dữ liệu bằng cách tự động clean, validate và enrich data.

Về mặt trải nghiệm, AI Agent cải thiện trải nghiệm khách hàng với chatbot hỗ trợ 24/7 và cá nhân hóa tương tác. Đồng thời, nó tăng tốc phát triển phần mềm bằng cách hỗ trợ coding, review code và tạo documentation tự động.

Tất nhiên, AI Agent vẫn không thể hoàn toàn thay thế con người, mà vẫn cần trợ giúp, quản lý hoặc điều hành nữa!

Chain vs Agent - Khác nhau ở đâu?

Trước khi đi sâu vào Agent, hãy hiểu rõ sự khác biệt giữa LLM (Basic LLM Chain ta đã học ở bài trước) và AI Agent.

LLM Chain: Làm theo kịch bản có sẵn

Bạn có thể hình dung LLM (Basic LLM Chain) như cái lò vi sóng. Bỏ đồ ăn vào rồi bấm nút là lò sẽ tự hâm, bạn có thể chỉnh thêm nhiệt độ và thời gian nấu.

LLM nhận đầu vào là văn bản (hoặc ảnh) và trả về kết quả là văn bản (hoặc ảnh).

Ví dụ thực tế:

  1. Người dùng gửi prompt Tóm tt nội dung sau: [đoạnn bản dài]
  2. LLM nhận văn bản và tóm tắt lại
  3. Trả về bản tóm tắt (Chỉ có 1 bước duy nhất: gửi prompt → nhận kết quả)

Mọi thứ diễn ra theo thứ tự định trước. Không có quyết định nào cần đưa ra, chỉ cần làm theo từng bước một.

LLM Chain có ưu điểm là đơn giản và dễ hiểu, bạn đễ debug và biết chính xác điều gì sẽ xảy ra. Nó cũng nhanh và ổn định hơn vì không cần suy nghĩ, chỉ chạy đúng 1 lần.

Tuy nhiên, Chain cũng có nhược điểm là cứng nhắc, không thể thích ứng với tình huống mới. Ngoài ra, Chain không có bộ nhớ, mỗi lần chạy như cũng lần đầu tiên.

Do vậy, đây sẽ là những thứ mà LLM Chain KHÔNG làm được (hoặc bạn sẽ phải code từng workflow riêng để làm từng thứ):

  • Trả lời Bitcoin giá bao nhiêu? → Không thể tra cứu trên mạng, chỉ trả lời dựa trên kiến thức cũ
  • Tìm email của Hoàng trong database → Không thể truy cập database
  • Gửi tin nhắn Slack cho team → Không thể thực hiện hành động, phải dùng node khác trong n8n
  • Tính 15% của $1,234.56 → Có thể sai vì LLM không giỏi tính toán chính xác

AI Agent: Suy nghĩ, lên kế hoạch và ra quyết định

Khác với LLM, AI Agent hoạt động như một đầu bếp chuyên nghiệp:

Yêu cu: Khách mun món Vit Nam, nhưng không ăn cay.

Suy nghĩ: Tlnh có gì nhỉ? À có mm tôm, đậu, bún... Bếp có ni, cho... Vy làm bún đậu mm tôm là hp lý nht!

Lên kế hoch: Ly mm tôm, đậu, bún, ni, cho...

Thc hin: Trng bún, chiên đậu, pha mm tôm

Đánh giá: Đồ ăn đã chín chưa
Đánh giá: Đồ ăn chưa chín, tiếp tc nu
...
Đánh giá: Đồ ăn đã chín, đã nêm nếm đầy đủ

→ Đưa món bún đậu mm tôm ra cho khách!

Ví dụ thực tế:

Yêu cầu: "Tìm tin tức mới nhất về AI và tóm tắt cho tôi"

Agent suy nghĩ: Cần tìm kiếm trên internet rồi tổng hợp

Lên kế hoạch: Tìm kiếm 5 bài trên Google, chọn từ các trang chính thống, sau đó tổng hợp

Thực hiện: Dùng Google Search với từ khoá `AI News` → Lấy được 5 bài báo → Đọc nội dung từng bài → Có đủ thông tin → Tóm tt

→ Trả lời cho người dùng tintức đã tổng hợp!

Dựa theo yêu cầu, agent suy nghĩ, lên kế hoạch và quyết định hành động phù hợp nhất.

AI Agent có nhiều ưu điểm nổi bật hơn hẳn LLM:

  • Đầu tiên là sự linh hoạt, Agent có thể tự điều chỉnh dựa trên tình huống thực tế.
  • Agent cũng có bộ nhớ nên nhớ được ngữ cảnh các câu hỏi trước đó, giúp cuộc hội thoại tự nhiên hơn.
  • Ngoài ra, Agent có khả năng sử dụng công cụ như gọi API, tìm kiếm web hay chạy code.
  • Quan trọng nhất là Agent có thể tự ra quyết định về việc dùng công cụ nào và khi nào cần dùng.

Tuy nhiên, Agent cũng có một số nhược điểm cần lưu ý:

  • Agent chậm hơn Chain vì cần thời gian suy nghĩ và ra quyết định qua nhiều bước (thay vì chỉ chạy 1 lần).
  • Chi phí cũng cao hơn do tiêu tốn nhiều token hơn, gọi API nhiều hơn cho mỗi lần xử lý.
  • Agent còn khó debug vì hành vi không cố định, khó dự đoán chính xác Agent sẽ làm gì.

agent

So sánh nhanh LLM vs AI Agent

Tiêu chí LLM AI Agent
Cách làm việc Theo kịch bản cố định Tự suy nghĩ và quyết định
Bộ nhớ Không có Có thể nhớ ngữ cảnh
Công cụ Không dùng Có thể dùng nhiều tools
Linh hoạt Cứng nhắc Rất linh hoạt
Tốc độ Nhanh Chậm hơn (cần suy nghĩ)
Chi phí Thấp Cao hơn (nhiều bước hơn)
Phù hợp cho Quy trình đơn giản, rõ ràng Tác vụ phức tạp, cần lên kế hoạch, ra quyết định

Khi nào dùng LLM, khi nào dùng AI Agent?

Dùng LLM khi

  • Biết chính xác các bước cần làm từ đầu đến cuối
  • Quy trình cố định, không cần ra quyết định phức tạp giữa chừng
  • Cần tốc độ xử lý nhanh, chi phí thấp
  • Không cần nhớ ngữ cảnh từ các lần tương tác trước
  • Ví dụ cụ thể:
    • Tóm tắt văn bản đầu vào.
    • Dịch ngôn ngữ.
    • Phân loại email.
    • Trích xuất thông tin từ hóa đơn.
    • Trả lời FAQ đơn giản.

Bản thân mình vẫn dùng LLM Chain rất nhiều trong các workflow hiện tại.

Dùng 1 số node để lấy dữ liệu, đưa vào cho AI xử lý, sau đó dưa dữ liệu đầu ra của AI cho node khác tiếp tục xử lý.

Dùng AI Agent khi

  • Cần tự động hóa quy trình phức tạp, nhiều bước không xác định trước
  • Ra quyết định dựa trên ngữ cảnh và thông tin thu thập được trong quá trình xử lý
  • Cần tương tác với nhiều hệ thống khác nhau (database, API, web search, email...)
  • Cần xử lý các yêu cầu mở, không có câu trả lời cố định
  • Ví dụ cụ thể:
    • Chatbot hỗ trợ khách hàng có thể tra cứu đơn hàng và gửi email xác nhận,
    • Trợ lý nghiên cứu tự tìm kiếm và tổng hợp thông tin từ nhiều nguồn,
    • Bot phân tích dữ liệu có thể query database và tạo báo cáo.

💡 Mẹo đơn giản: Nếu bạn có thể viết ra từng bước cần làm như một checklist cố định → Dùng LLM Chain.

Nếu bạn nghĩ "Tuỳ tình huống mà quyết định bước tiếp theo" hoặc "Cần kết hợp nhiều công cụ để lấy thông tin" → Dùng AI Agent!

chain_vs_agent

Tạm kết

Trong bài này, chúng ta đã tìm hiểu về AI Agent là gì, các đặc điểm của nó, cũng như khi nào nên dùng LLM ChainAI Agent.

Đây là một công cụ rất mạnh mẽ, tiện lợi và linh hoạt mà các bạn sẽ được trải nghiệm ở những bài sau.

Ở bài sau, chúng ta sẽ đi sâu vào tìm hiểu kĩ hơn về cách AI Agent hoạt động trong n8n nhé!

📚 Tài liệu tham khảo

Facebook Messenger

fb.com/toidicodedao

Email Support

[email protected]

Telegram

t.me/hoccodeai