multi-agents · Vietnamese · 9 min

Tại Sao Hầu Hết Dự Án Agentic AI Thất Bại Ở Bước Cuối Cùng

May 16, 2026

Dữ liệu tính đến tháng 5/2026

Andrew Ng và Laurence Moroney đưa ra framework 4 bước cho agentic workflow — Intent, Planning, Tools, Reflection. Ba bước đầu kỹ sư AI đang làm tốt. Bước thứ tư là nơi mọi thứ sụp đổ trong im lặng.

Dữ liệu tính đến tháng 5/2026 — Lĩnh vực này thay đổi nhanh. Một số số liệu, mô hình, hoặc công cụ có thể đã được cập nhật.

Có một khoảnh khắc trong bài giảng CS230 của Stanford khiến tôi phải dừng lại. Không phải vì tôi không đồng ý — mà vì nó dừng đúng chỗ quan trọng nhất.

Laurence Moroney — Director of AI tại Arm, 10 năm trước là Lead AI Advocate tại Google — mô tả agentic workflow (quy trình agent tự động) bằng bốn bước: Intent (hiểu ý định người dùng), Planning (chia nhỏ thành các bước), Tools (cấp quyền truy cập công cụ), và Reflection (xác minh kết quả đầu ra có đáp ứng ý định ban đầu không). Framework (khung làm việc) này là một trong những cấu trúc cụ thể nhất hiện đang lưu hành về thiết kế hệ thống agent. Nó làm rõ một thuật ngữ đang bị dùng quá nhiều theo kiểu mơ hồ.

Nhưng bài giảng dừng lại sau khi đặt tên cho Reflection. Không một từ nào về cách làm cho bước đó hoạt động được.

Và đó chính xác là nơi mọi dự án agentic AI tôi từng thấy thất bại.

Framework đúng, nhưng thiếu một nửa quan trọng

Ba bước đầu của framework — Intent, Planning, Tools — đã được kỹ nghệ hóa đến mức tương đối trưởng thành. Prompt engineering (kỹ thuật viết câu lệnh) cho việc trích xuất ý định, chain-of-thought (chuỗi suy luận từng bước) cho lập kế hoạch, function calling (gọi hàm công cụ): cả ba đều có tài liệu tốt, có benchmark, có thư viện hỗ trợ. Bạn có thể học chúng từ tài liệu của OpenAI hay LangChain trong một buổi chiều.

Reflection thì khác. Về mặt khái niệm, nó đơn giản: agent tự hỏi "kết quả này có thực sự trả lời câu hỏi ban đầu không?" Nhưng trong thực tế triển khai, câu hỏi đó đòi hỏi một cơ chế đánh giá — và đây là khoảng trống kỹ thuật mà cả Andrew Ng lẫn Moroney đều không chạm đến.

Vấn đề không phải là model không biết reflect. Vấn đề là chúng ta không biết cách đo xem reflection đã thành công hay chưa.

Hãy thử với một ví dụ cụ thể.

Tình huống: Agent hỗ trợ phân tích hợp đồng cho một công ty luật. Người dùng hỏi: "Điều khoản nào trong hợp đồng này tạo ra rủi ro về sở hữu trí tuệ cho bên tôi?"

Intent: Xác định điều khoản IP (sở hữu trí tuệ) có rủi ro.
Planning: Tách hợp đồng thành các phần, ưu tiên điều khoản IP, xác định vấn đề.
Tools: Công cụ đọc tài liệu, cơ sở tri thức pháp lý, bộ phân loại điều khoản.
Reflection (theo framework): Agent xác nhận rằng nó đã trả lời câu hỏi.

Nhưng "xác nhận" theo nghĩa nào? Agent có thể tự báo cáo rằng nó đã hoàn thành nhiệm vụ — đây là tự đánh giá, không phải kiểm chứng độc lập. LLM (mô hình ngôn ngữ lớn) nổi tiếng là tự tin ngay cả khi sai. Nếu agent bỏ sót một điều khoản trọng tài ngầm định có thể vô hiệu hóa quyền IP của khách hàng — và nó vẫn tự đánh giá là nhiệm vụ hoàn thành — thì reflection đã thất bại hoàn toàn mà không ai biết.

Trong bối cảnh luật, y tế, hay tài chính — những lĩnh vực mà Moroney gọi là "Small AI" tiềm năng lớn nhất vì lý do chủ quyền dữ liệu và bảo vệ sở hữu trí tuệ — loại thất bại im lặng này không phải là trường hợp ngoại lệ. Nó là rủi ro nền.

Tại sao bước Reflection thất bại trong im lặng

Reflection trong hệ thống agent tự động thất bại theo ba dạng thức chính:

Dạng 1: Tự đánh giá thay vì kiểm chứng độc lập. Agent được yêu cầu tự đánh giá xem nó có hoàn thành nhiệm vụ không. Điều này tương đương với việc để học sinh tự chấm bài thi của mình. LLM có xu hướng thiên kiến mạnh về độ tự tin — chúng thường tự tin thái quá về kết quả của mình, đặc biệt khi được viết câu lệnh theo hướng hoàn thành nhiệm vụ.

Dạng 2: Intent drift (trôi dạt ý định) không được phát hiện. Trong các quy trình phức tạp có nhiều bước lập kế hoạch, ý định ban đầu dần bị "pha loãng" qua các vòng tinh chỉnh. Ví dụ: "Tìm rủi ro IP" trở thành "tìm toàn bộ điều khoản rủi ro" rồi "tóm tắt hợp đồng" — mỗi bước có logic riêng, nhưng mục tiêu đã thay đổi hoàn toàn. Agent hoàn thành một phiên bản đã bị biến đổi của ý định gốc — và vì không có bản lưu nào của ý định gốc để so sánh, reflection không có điểm tham chiếu.

Dạng 3: Tiêu chí đánh giá không được chỉ định. "Kết quả có đáp ứng ý định không?" là câu hỏi mở. Trong nhiều lĩnh vực thực tế, câu trả lời phụ thuộc vào tiêu chí nghiệp vụ mà agent không được cung cấp. Thiếu bộ tiêu chí cụ thể, reflection trở thành đối chiếu mẫu bề mặt — nó kiểm tra xem kết quả trông có đúng không, không phải là kết quả có đúng không.

Khi làm việc với khách hàng doanh nghiệp ở Nhật — môi trường không khoan nhượng với lỗi triển khai và yêu cầu nhật ký kiểm toán rõ ràng — đây là ba điểm sụp đổ mà tôi thấy lặp đi lặp lại nhất. Không phải vì kỹ sư kém, mà vì framework phổ biến không cung cấp mẫu xử lý nào cho ba vấn đề này.

Cái gì thực sự làm cho Reflection hoạt động

Reflection đáng tin cậy cần một lớp nằm ngoài vòng Intent-Plan-Tools-Reflect: lớp đánh giá độc lập.

Không phải thêm bước — mà là tách vai trò: bộ thực thi (executor) vs. bộ kiểm tra (checker), giống như người kiểm thử không nên là lập trình viên đã viết code đó.

Đây không phải ý tưởng mới trong AI — đây là nguyên tắc cơ bản của kiểm thử phần mềm: đừng dùng code để test chính nó. Nhưng trong hệ thống agent tự động, nguyên tắc này thường bị bỏ qua vì framework "tự Reflect" nghe có vẻ đủ.

Trong thực tế, lớp đánh giá cần trả lời ba câu hỏi tách biệt với câu hỏi của agent:

Độ bao phủ: Kết quả có bao phủ toàn bộ phạm vi của ý định không? (Không chỉ "đã trả lời" mà là "đã trả lời đủ")
Độ chính xác: Với những phần kết quả có thể kiểm chứng được, chúng có chính xác không? (Xác thực thực tế, tính toàn vẹn trích dẫn, nhất quán logic)
Phù hợp nghiệp vụ: Kết quả có sử dụng được trong bối cảnh nghiệp vụ cụ thể không? (Đây là câu hỏi mà model không thể tự trả lời mà không có bộ tiêu chí đặc thù theo lĩnh vực)

Câu hỏi 1 và 2 có thể được xử lý bằng một mô hình đánh giá tách biệt — một model nhỏ hơn hoặc một LLM judge (AI làm trọng tài) được viết câu lệnh riêng, không biết gì về cách agent đi đến kết quả. Câu hỏi 3 đòi hỏi human-in-the-loop (con người trong vòng kiểm soát) hoặc bộ tiêu chí được mã hóa sẵn từ chuyên gia lĩnh vực.

Trong quy trình của tôi khi làm việc với hệ thống đa tác nhân cho tự động hóa quy trình nghiệp vụ, lớp đánh giá này không phải là tính năng tùy chọn — nó là điều kiện để đưa vào môi trường thực. Không có nó, "Reflection" trong framework chỉ là một bước tạo ra sự tự tin sai lầm.

Lời khuyên từ Stanford — đúng, nhưng đọc với một bản đồ khác

Quay lại bài giảng của Andrew Ng và Moroney: lời khuyên sự nghiệp của họ về cơ bản là đúng. Depth + Business Focus + Delivery Bias (Chiều sâu + Tập trung vào kinh doanh + Thiên hướng triển khai) là bộ ba vững chắc cho bất kỳ người làm AI nào muốn tồn tại sau 2023. "Big AI vs. Small AI" — mô tả sự phân kỳ giữa các model tập trung lớn (OpenAI, Google, Anthropic) và các model nhỏ, tự lưu trữ, chuyên biệt theo lĩnh vực — là một dự đoán cấu trúc thực sự, không phải marketing.

Nhưng bản đồ đó được vẽ từ Silicon Valley. Đọc nó từ Việt Nam hoặc Tokyo cần điều chỉnh:

Cơ hội "Small AI" ở đây lớn hơn ở đó. Chủ quyền dữ liệu, bảo vệ sở hữu trí tuệ, và ràng buộc chi phí điện toán đám mây không phải là lý thuyết tại các doanh nghiệp Nhật hay Việt Nam — chúng là rào cản mua hàng thực tế. Điều đó có nghĩa là model trên thiết bị đầu cuối, tự lưu trữ, và đã tinh chỉnh không phải là thị trường ngách. Chúng là cửa vào của AI doanh nghiệp trong khu vực này.

Ngưỡng business alignment cao hơn. Quy trình mua hàng doanh nghiệp tại Nhật và Việt Nam chậm và khắt khe hơn Silicon Valley. Một thử nghiệm ban đầu đẹp không đủ — khách hàng muốn thấy rằng bạn hiểu rủi ro của họ, không chỉ là năng lực model. "Trusted Advisor" mà Moroney mô tả — người có thể quản lý rủi ro triển khai như ảo giác, lỗ hổng bảo mật, và tổn hại uy tín — không phải là cấp độ sự nghiệp cao; đó là điều kiện tối thiểu để vào được cuộc chơi doanh nghiệp.

Khoảng trống kỹ năng multi-agent lớn hơn. Nếu đây là nơi ROI thực sự của AI cho tự động hóa quy trình nghiệp vụ — và tôi tin là vậy — thì người làm AI nào thành thạo được khâu đánh giá agentic workflow, không chỉ xây dựng, sẽ có lợi thế cạnh tranh bất thường. Không phải vì họ giỏi hơn, mà vì khoảng trống này đang được hầu hết framework và chương trình đào tạo hiện tại bỏ qua.

Sai Lầm Thường Gặp

1. Để agent tự báo cáo "nhiệm vụ hoàn thành" mà không có kiểm chứng độc lập. Cách khắc phục: Tách bộ đánh giá khỏi bộ thực thi. Dùng một LLM judge riêng hoặc bộ kiểm tra theo quy tắc để đánh giá kết quả — không để agent tự chấm điểm cho mình.

2. Không lưu lại bản sao ý định gốc. Cách khắc phục: Lưu câu lệnh ý định ở đầu quy trình và truyền nó đến lớp đánh giá ở cuối — không để ý định bị ghi đè bởi các bước lập kế hoạch trung gian.

3. Câu lệnh reflection quá chung chung. Ví dụ tệ: "Bạn đã hoàn thành nhiệm vụ chưa?" Ví dụ tốt hơn: "Người dùng muốn biết X. Kết quả của bạn có bao phủ [độ bao phủ / độ chính xác / phù hợp nghiệp vụ] không? Liệt kê những gì còn thiếu."

4. Bỏ qua phù hợp nghiệp vụ vì nó không thể tự động hóa hoàn toàn. Cách khắc phục: Mã hóa tiêu chí lĩnh vực vào bộ tiêu chí trước khi triển khai, ngay cả khi bộ tiêu chí đó chưa hoàn hảo. Một checklist cứng với 5 mục vẫn tốt hơn không có gì.

5. Coi Reflection là bước cuối thay vì bước lặp. Cách khắc phục: Thiết kế quy trình để Reflection có thể kích hoạt lại bước Planning — không phải chỉ đánh dấu lỗi, mà còn có thể quay lại bước 2 với ý định đã được làm rõ hơn.

6. Áp dụng framework mà không điều chỉnh cho lĩnh vực rủi ro cao. Trong luật, y tế, và tài chính, sự tự tin sai lầm từ tự đánh giá không phải là lỗi trải nghiệm người dùng — nó là trách nhiệm pháp lý. Lớp đánh giá ở đây không phải tùy chọn.

Tóm tắt:

Framework Intent-Plan-Tools-Reflect của Moroney là cấu trúc đúng — nhưng nó dừng ở chỗ khó nhất.
Reflection thất bại vì agent tự đánh giá kết quả của mình, không có điểm tham chiếu cho ý định gốc, và thiếu tiêu chí đánh giá đặc thù theo lĩnh vực.
Lớp đánh giá độc lập — tách khỏi bộ thực thi — là điều kiện cần để Reflection hoạt động trong môi trường thực.
Cơ hội "Small AI" lớn hơn đáng kể trong thị trường châu Á so với cách bài giảng Stanford đóng khung nó: chủ quyền dữ liệu và cơ chế mua hàng doanh nghiệp tạo ra lợi thế cấu trúc cho model trên thiết bị và tự lưu trữ.
Người làm AI thành thạo được khâu đánh giá agentic workflow, không chỉ xây dựng, đang nhắm đến khoảng trống mà hầu hết chương trình đào tạo hiện tại bỏ qua.

agentic-aimulti-agentsai-careerllmproduction-aivietnamese-context

Nguồn tham khảo

Stanford CS230 | Autumn 2025 | Lecture 9: Career Advice in AI — Stanford Online / CS230