Google nâng cấp Gemini Live: Trợ lý AI vừa nói vừa "chỉ trỏ"

Google công bố loạt nâng cấp cho Gemini Live, biến trợ lý AI này trở nên trực quan hơn và có khả năng tương tác tự nhiên hơn với người dùng.
Gemini có khả năng tương tác với người dùng giống con người hơn

Gemini có khả năng tương tác với người dùng giống con người hơn

Trong một động thái đáng chú ý, Google đã công bố hàng loạt tính năng mới mang tính đột phá cho Gemini Live, đưa trợ lý AI này tiến một bước dài trong việc tương tác với người dùng. Sắp tới, Gemini Live sẽ không chỉ lắng nghe và trả lời, mà còn có thể trực tiếp chỉ dẫn ngay trên màn hình thiết bị hoặc thông qua camera, giúp việc giao tiếp trở nên trực quan và hiệu quả hơn bao giờ hết.

Tính năng này cho phép người dùng hướng camera điện thoại vào một vật thể và yêu cầu trợ lý nhận diện, ví dụ như tìm kiếm một dụng cụ cụ thể trong hộp đồ nghề. Gemini Live sẽ nhanh chóng khoanh vùng và làm nổi bật vật cần tìm trên màn hình, giúp tiết kiệm thời gian và công sức. Theo thông tin từ Google, tính năng mới sẽ được tích hợp trên các thiết bị Pixel 10 ra mắt vào ngày 28 tháng 8, trước khi mở rộng cho các thiết bị Android khác và iOS trong những tuần tiếp theo.

Google nâng cấp Gemini Live: Trợ lý AI vừa nói vừa "chỉ trỏ"- Ảnh 2.

Bên cạnh khả năng tương tác bằng hình ảnh, Google còn cho phép Gemini kết nối sâu hơn với các ứng dụng cốt lõi của điện thoại như Tin nhắn, Điện thoại và Đồng hồ. Điều này đồng nghĩa với việc bạn có thể yêu cầu trợ lý AI thực hiện các tác vụ đa nhiệm một cách liền mạch. Chẳng hạn, khi đang tìm đường, bạn có thể ngắt lời Gemini và ra lệnh: "Đường này ổn rồi. Giờ gửi tin nhắn cho Alex báo tôi đến muộn 10 phút nhé." Ngay lập tức, Gemini sẽ soạn thảo và gửi tin nhắn thay bạn.

Google nâng cấp Gemini Live: Trợ lý AI vừa nói vừa "chỉ trỏ"- Ảnh 3.

Gemini có khả năng gọi điện trực tiếp

Ngoài ra, Google còn giới thiệu một mô hình âm thanh cải tiến cho Gemini Live, giúp trợ lý này có giọng nói tự nhiên và gần gũi với con người hơn, với nhịp điệu, ngữ điệu và cao độ được điều chỉnh linh hoạt. Thậm chí, Gemini còn có thể thay đổi giọng điệu tùy theo chủ đề trò chuyện, hoặc sử dụng một chất giọng đặc biệt khi kể chuyện dưới góc nhìn của một nhân vật hay nhân vật lịch sử. Tất cả những nâng cấp này cho thấy trí tuệ nhân tạo đang ngày càng trở thành một phần không thể thiếu trong cuộc sống, giúp con người giao tiếp với công nghệ một cách tự nhiên hơn.