Chuyên mục: CNTT - Viễn thông

Google mở rộng Gemini thành trợ lý AI đa năng, phục vụ học tập, làm việc và sáng tạo

3 giờ trước

Gemini đang được Google định hướng trở thành một trợ lý AI có thể đồng hành cùng người dùng trong nhiều hoạt động hằng ngày, từ nghiên cứu, học tập, xử lý công việc đến sáng tạo nội dung.

00:00

Theo Google, sự thay đổi này phản ánh nhu cầu ngày càng cao của người dùng khi AI không chỉ cần phản hồi nhanh mà còn phải hỗ trợ xuyên suốt toàn bộ quá trình làm việc, từ tìm kiếm thông tin, phân tích dữ liệu đến hoàn thiện sản phẩm cuối cùng.

Gemini hiện có thể sử dụng trên nền tảng web và ứng dụng di động. Bên cạnh khả năng trò chuyện bằng ngôn ngữ tự nhiên, nền tảng này còn tích hợp nhiều tính năng như Deep Research để nghiên cứu chuyên sâu, Canvas hỗ trợ soạn thảo và biên tập tài liệu dài, Gemini Live cho phép tương tác bằng giọng nói và hình ảnh theo thời gian thực, cùng các công cụ tạo và chỉnh sửa hình ảnh, âm nhạc và video.

Google cho biết lượng người dùng hoạt động hằng tháng của ứng dụng Gemini đã vượt 900 triệu, tăng gấp đôi so với một năm trước. Khối lượng yêu cầu xử lý mỗi ngày cũng tăng gấp 7 lần. Riêng công cụ tạo và chỉnh sửa hình ảnh trong Gemini đã ghi nhận hơn 50 tỷ hình ảnh được tạo trên toàn cầu.

Tại sự kiện Google I/O 2026, hãng cũng giới thiệu Gemini 3.5 Flash, mô hình AI đầu tiên thuộc thế hệ Gemini mới, được thiết kế nhằm cân bằng giữa khả năng suy luận và tốc độ xử lý.

Không chỉ hỗ trợ trả lời câu hỏi, Gemini còn được Google định vị là công cụ đồng hành trong quá trình nghiên cứu và làm việc. Với Deep Research, người dùng có thể xây dựng kế hoạch nghiên cứu, tìm kiếm, phân tích và tổng hợp thông tin từ nhiều nguồn trên web để tạo báo cáo có cấu trúc. Khi được cấp quyền, tính năng này còn có thể khai thác dữ liệu từ Gmail, Google Drive và Google Chat nhằm đưa ra kết quả phù hợp hơn với bối cảnh công việc.

Sau khi hoàn tất quá trình nghiên cứu, người dùng có thể tiếp tục chỉnh sửa nội dung ngay trong Canvas. Không gian làm việc này cho phép biên tập báo cáo, kế hoạch kinh doanh hoặc bài thuyết trình mà không cần chuyển đổi giữa nhiều ứng dụng. Canvas cũng hỗ trợ tạo infographic, bộ câu hỏi và thẻ ghi nhớ phục vụ học tập.

Trong khi đó, Gemini Live giúp việc tương tác với AI trở nên linh hoạt hơn thông qua giọng nói và hình ảnh. Trên thiết bị di động, người dùng có thể chia sẻ hình ảnh trực tiếp từ camera để Gemini phân tích hoặc tạo nội dung mới dựa trên những gì đang hiển thị.

Ngoài các tác vụ phục vụ học tập và công việc, Gemini cũng được Google mở rộng sang lĩnh vực sáng tạo đa phương thức. Người dùng có thể tạo và chỉnh sửa hình ảnh bằng Nano Banana, sáng tác nhạc với mô hình Lyria của Google DeepMind hoặc tạo video bằng Gemini Omni, mô hình mới được giới thiệu tại Google I/O 2026.

Theo Google, Nano Banana đã được sử dụng để tạo hơn 50 tỷ hình ảnh trên toàn cầu. Tại Việt Nam, công cụ này từng xuất hiện trong nhiều xu hướng trên mạng xã hội như tạo ảnh chân dung dưới tuyết, phục chế ảnh cũ hay ảnh mô hình đồ chơi.

Ở mảng âm thanh, Lyria cho phép người dùng tạo nhạc nền, giai điệu hoặc lời bài hát chỉ bằng các mô tả bằng ngôn ngữ tự nhiên. Trong khi đó, Gemini Omni hướng tới khả năng tạo video kết hợp văn bản, hình ảnh, âm thanh và chuyển động trong cùng một quy trình, đồng thời cho phép người dùng chỉnh sửa nội dung thông qua hội thoại.

Google cho biết toàn bộ nội dung do Gemini tạo ra đều được gắn dấu mờ kỹ thuật số bằng công nghệ SynthID của Google DeepMind nhằm tăng tính minh bạch. Hãng cho biết công nghệ này đã được sử dụng để đánh dấu hơn 100 tỷ hình ảnh, video cùng lượng dữ liệu âm thanh tương đương 60.000 năm phát liên tục.

Hiện các tính năng như Deep Research, Canvas, Gemini Live cùng các công cụ tạo hình ảnh, âm nhạc và video đều đã được tích hợp trong ứng dụng Gemini, giúp người dùng có thể thực hiện nhiều tác vụ trên cùng một nền tảng.

Tiểu Minh

Nguồn: https://baomoi.com/google-mo-rong-gemini-thanh-tro-ly-ai-da-nang-phuc-vu-hoc-tap-lam-viec-va-sang-tao-c55476500.epi

TIN LIÊN QUAN