Gemini API vừa nhận được những nâng cấp mang tính đột phá từ Google, mở ra chương mới cho việc phát triển các AI Agents (Tác nhân AI) thông minh và hiệu quả hơn. Các tính năng mới như Context Circulation (lưu chuyển ngữ cảnh), tích hợp Grounding với Google Maps cho dòng mô hình Gemini 3 Flash và cải thiện quy trình gọi hàm (Function Calling) đang thay đổi cách chúng ta xây dựng ứng dụng AI. Những cập nhật này không chỉ giúp giảm độ trễ mà còn mang lại khả năng thực thi tác vụ chính xác hơn bao giờ hết trên hệ sinh thái Google Cloud.
Cùng CloudAZ điểm qua 4 thay đổi quan trọng giúp bạn nâng cấp ứng dụng AI của mình lên một tầm cao mới.
Kết hợp linh hoạt Công cụ Tích hợp và Tùy chỉnh
Trước đây, các nhà phát triển thường phải tự điều phối (orchestration) việc khi nào nên dùng công cụ có sẵn của Google (như Google Search) và khi nào nên gọi các hàm tùy chỉnh (Custom Functions).
Với cập nhật mới từ Gemini API, bạn có thể truyền cả Built-in tools và Custom tools trong cùng một yêu cầu (request):
- Cơ chế: Gemini có thể tự động chuyển đổi giữa việc tra cứu dữ liệu công khai qua Google Search, sau đó gọi trực tiếp đến hệ thống backend của bạn để thực hiện tác vụ.
- Giá trị: Giảm đáng kể độ trễ (latency) và đơn giản hóa kiến trúc agent, giúp quy trình phản hồi trở nên liền mạch.
Lưu chuyển ngữ cảnh giữa các công cụ (Context Circulation)
Trong các quy trình đa bước, đầu ra của công cụ này thường là đầu vào của công cụ khác. Tính năng Context Circulation mới cho phép Gemini bảo toàn mọi phản hồi từ các lần gọi công cụ trước đó trong ngữ cảnh của mô hình.
Ví dụ thực tế: Gemini có thể dùng Google Search để kiểm tra thời tiết thời gian thực, sau đó dùng chính thông tin đó làm tham số cho một Custom Tool để gợi ý lịch trình di chuyển phù hợp cho người dùng.
Khả năng “hiểu và nhớ” kết quả từ các công cụ giúp các bước suy luận sau này trở nên chính xác và nhất quán hơn, hạn chế tối đa việc mô hình bị mất dấu thông tin.
Grounding với Google Maps cho Gemini 3 Flash
Tìm hiểu thêm về Gemini 3 Flash
Grounding (Đối soát thực tế) là kỹ thuật quan trọng giúp AI giảm thiểu hiện tượng “ảo giác” (hallucination). Giờ đây, tính năng Grounding với Google Maps đã chính thức hỗ trợ dòng mô hình Gemini 3 Flash.
Các nhà phát triển có thể xây dựng ứng dụng liên quan đến:
- Xác thực địa điểm kinh doanh thời gian thực.
- Tối ưu hóa chỉ đường và dịch vụ logistics.
- Truy xuất thông tin địa điểm với độ tin cậy cao nhất từ cơ sở dữ liệu khổng lồ của Google.
Định danh Tool Response IDs giúp Debug tối ưu
Để cải thiện khả năng kiểm soát, mỗi lần gọi công cụ hiện nay đều được gán một ID duy nhất (id). Việc này cực kỳ quan trọng khi xử lý Parallel Function Calling (gọi nhiều hàm song song).
Nhà phát triển có thể khớp chính xác phản hồi từ phía client với yêu cầu cụ thể của mô hình, đảm bảo tính minh bạch và dễ dàng gỡ lỗi trong các hệ thống AI quy mô lớn.
Kết luận
Tại CloudAZ, chúng tôi nhận thấy một làn sóng chuyển dịch mạnh mẽ từ các chatbot trả lời thông tin đơn thuần sang thế hệ AI Agents có khả năng thực hiện hành động (Action-oriented AI). Những cập nhật mới nhất từ Gemini API chính là “mảnh ghép” chiến lược giúp doanh nghiệp tối ưu hóa chi phí vận hành thông qua việc giảm thiểu các truy vấn dư thừa, đồng thời nâng cao trải nghiệm khách hàng nhờ sự lưu chuyển ngữ cảnh (Context Circulation) mượt mà. Đặc biệt, việc tích hợp dữ liệu thực từ Google Search và Maps giúp mọi phản hồi của AI đạt độ tin cậy tuyệt đối, hỗ trợ doanh nghiệp đưa ra các quyết định kinh doanh chính xác và nhanh chóng hơn.
Để không bị tụt lại trong cuộc đua công nghệ, việc làm chủ Gemini API và các công cụ trên nền tảng Vertex AI sẽ tạo nên lợi thế cạnh tranh khác biệt cho thương hiệu của bạn. Đội ngũ chuyên gia tại CloudAZ luôn sẵn sàng đồng hành cùng doanh nghiệp trong việc hiện thực hóa các giải pháp AI đột phá, từ tư vấn chiến lược đến triển khai thực tế. Đừng ngần ngại liên hệ với chúng tôi ngay hôm nay để cùng thiết kế một bản demo (PoC) tùy chỉnh, giúp tối ưu hóa quy trình nghiệp vụ của bạn bằng những công nghệ AI tiên tiến nhất từ Google.





