Writing
Articles & Notes
On multi-agent systems, LLMs, data science, and the simulation of human behavior. Mostly Vietnamese, sometimes English.
AgentSociety: Khi 10.000 agent AI mô phỏng cả một xã hội
AgentSociety của Tsinghua chạy 10.000 agent LLM tạo ra 5 triệu tương tác — mô phỏng phân cực chính trị, chính sách UBI, và cú sốc bão nhiệt đới. Bài này phân tích kỹ điều đó có nghĩa là gì, và quan trọng hơn, nó chưa chứng minh được điều gì.
Multi-Agent AI Simulation Tháng 5/2026: Bản Đồ Thực Trạng và Những Quyết Định Sắp Tới
Lĩnh vực multi-agent simulation đang ở điểm gãy: quy mô đã được chứng minh, nhưng phương pháp kiểm chứng vẫn chưa có. Bài này phân tích ba domain, bốn xu hướng xuyên suốt, và ba quyết định mang tính định hình tương lai của lĩnh vực.
Mô phỏng hành vi người dùng với AI: Từ Markov đến LLM Persona
Từ chuỗi Markov đơn giản đến 25 tác nhân AI tự tổ chức tiệc Valentine — đây là hành trình kỹ thuật của một trong những bài toán thú vị nhất trong Data Science: dạy máy tính hiểu con người.
Tại sao dùng ChatGPT để mô phỏng người dùng là sai về bản chất — và Microsoft đã làm gì để giải quyết điều này
Khi bạn hỏi ChatGPT 'hãy đóng vai một người dùng 35 tuổi quan tâm đến sức khỏe', nó sẽ trả lời rất lịch sự, rất cân nhắc, rất... AI. TinyTroupe của Microsoft đặt ra một câu hỏi khác hơn: điều gì xảy ra khi bạn thiết kế agent *không phải để hữu ích*, mà để *giống người thật*?
Khi AI agents học cách hành xử như con người
Các mô hình ngôn ngữ lớn đang được dùng để xây dựng những agent mô phỏng hành vi con người với độ chính xác đáng ngạc nhiên. Điều này mở ra hướng nghiên cứu mới trong khoa học xã hội tính toán.
Git và GitHub: Công cụ không thể thiếu trong kỷ nguyên Vibe Coding
AI như Claude Code hay GitHub Copilot viết code ngày càng tốt. Nhưng chính vì thế, Git lại trở nên quan trọng hơn bao giờ hết — để bạn biết AI đã làm gì, và hoàn tác khi cần.
SHAP Không Chỉ Để Giải Thích — Mà Để Tìm Lỗi Mô Hình
Trong dự án dự báo doanh số này, SHAP không chỉ là công cụ thuyết trình cho stakeholder — nó là kính hiển vi để thấy mô hình đang sai ở đâu. Weather features đóng góp 0.4%. Store-level factors đôi khi overpredict. SHAP tìm ra cả hai.
RecVAE: Khi mô hình tuyến tính đánh bại mạng nơ-ron — và khi thì không
RecVAE (WSDM 2020) cải thiện Mult-VAE với bốn thay đổi kỹ thuật có chủ đích — nhưng trên tập MSD, một mô hình tuyến tính đơn giản vẫn thắng. Đây là bài học thực tế nhất từ bài báo.
Xây dựng hệ thống gợi ý: Từ Collaborative Filtering đến Two-Tower Model
Từ Netflix đến Shopee — hệ thống gợi ý hoạt động thế nào, các thuật toán chính là gì, và bạn nên chọn cái nào cho bài toán của mình?
Dự báo doanh thu bằng Data Science: Từ thống kê cổ điển đến AI
Từ Holt-Winters đến XGBoost rồi đến Chronos — mỗi phương pháp dự báo doanh thu có vị trí riêng của nó. Bài này giúp bạn chọn đúng công cụ cho đúng bài toán.
Đánh Giá Mô Hình Machine Learning Đúng Cách: Từ Accuracy Đến NDCG
Một mô hình đạt 99% accuracy mà không bắt được một giao dịch gian lận nào. Bài này giải thích toàn bộ hệ thống chỉ số đánh giá ML — từ confusion matrix đến NDCG — và cách chọn đúng metric cho bài toán kinh doanh của bạn.
AI Tuần W20/2026: Khi AI Vượt Ngưỡng Khai Thác Bảo Mật — Và Những Tín Hiệu Kiến Trúc Quan Trọng Hơn
Claude Mythos Preview hoàn thành 181 lần khai thác lỗ hổng Firefox thành công — so với 2 lần của thế hệ trước. Cùng lúc đó, cả cộng đồng Nhật Bản lẫn Việt Nam đang độc lập đi đến cùng một kết luận kiến trúc về vai trò của Small Language Models trong hệ thống đa tác nhân.
AI Tuần W10/2026: Mistral Small 4 Đặt Lại Mốc Chi Phí — Và Cả Hai Cộng Đồng Đang Tìm Ra Kiến Trúc Giống Nhau
Mistral Small 4 — 22B tham số, Apache 2.0, vượt qua nhiều mô hình đóng lớn gấp 3–5 lần trên benchmark suy luận — ra mắt ngày 3/3/2026 và lập tức đặt lại mốc chi phí cho open-source reasoning. Trong khi đó, cộng đồng kỹ sư Nhật Bản và Việt Nam đang độc lập đi đến cùng một kết luận kiến trúc về multi-model routing trong hệ thống đa tác nhân.
AI Tuần W01/2026: Khi Cộng Đồng Toàn Cầu Đồng Loạt Nhìn Lại — Và Cuốn Sách 173.000 Từ Mở Ra Năm Mới
Tuần đầu tiên của 2026 không có big release nào — nhưng có thứ còn có giá trị hơn: một bức tranh toàn cảnh. Một CTO Nhật Bản xuất bản cuốn sách kỹ thuật 173.000 từ về LLM miễn phí; Simon Willison tổng kết năm với 940 upvote trên HN; MIT Technology Review vẽ ra 5 quỹ đạo định hình 2026. Cộng đồng Việt Nam thực dụng hơn: họ đang chuẩn bị công cụ để không phụ thuộc vào API đắt đỏ.
9 kỹ năng AI đang tự động hóa — và DS cần đầu tư vào đâu ngay bây giờ
AutoML, Copilot, và ChatGPT đang nuốt dần phần lớn công việc hàng ngày của một Data Scientist cấp junior-mid. Đây không phải bài viết nói 'AI sẽ thay thế DS' — mà là bản audit thẳng thắn: cái gì đã bị commoditize, cái gì đang tăng giá trị, và bạn cần làm gì tùy vào cấp độ hiện tại.
Công việc nào thực sự bị đe dọa? AI Agents và thị trường lao động 2025
Klarna thay thế 700 nhân viên bằng AI trong một tháng. Duolingo sa thải 10% contractor vì lý do tương tự. Đây không còn là dự báo — đây là dữ liệu. Phân tích thẳng thắn về vai trò nào đang bị thay thế, vai trò nào đang tăng giá trị, và bạn cần làm gì ngay bây giờ.