Tạo chữ trong ảnh - thách thức của AI vừa được Google giải quyết Thứ sáu, 21/11/2025, 15:13 (GMT+7) Google ra mắt công cụ Nano Banana Pro nâng cấp khả năng tạo chữ chính xác, hỗ trợ làm đồ họa, sơ đồ, điều mà các mô hình AI khác chưa làm được. Trong thông báo ngày 21/11, Google cho biết Nano Banana Pro được xây dựng trên nền tảng Gemini 3 Pro - mô hình tiên tiến nhất của hãng. Nhờ tận dụng khả năng lập luận tiên tiến và hiểu biết về thế giới thực của Gemini, Nano Banana Pro có thể trực quan hóa thông tin tốt hơn phiên bản Nano Banana cũ và một số mô hình AI phổ biến khác.Một trong những thay đổi lớn là khả năng tạo chữ chính xác. Trong khi nhiều AI chỉ tạo ra hình ảnh "giống chữ" nhưng vô nghĩa hoặc sai nét, Nano Banana Pro được khẳng định có thể "tạo hình ảnh đẹp hơn với phần chữ chính xác và dễ đọc, được hiển thị trực tiếp trong ảnh bằng nhiều ngôn ngữ"."Đây là mô hình tốt nhất để tạo hình ảnh với văn bản được hiển thị chính xác, dù ngắn hay cả đoạn văn dài", Google khẳng định. Minh họa việc chuyển đổi ngôn ngữ trong một bức ảnh do Gemini thực hiện. Ảnh: Google Thử nghiệm thực tế, AI có thể tạo các hình ảnh chứa văn bản tiếng Việt chuẩn. Google giải thích họ sử dụng khả năng lập luận nâng cao của Gemini 3, đồng thời kết nối kho tri thức từ Google Search để giúp người dùng tạo nhanh hình minh họa.Nhờ đó, công cụ có thể được ứng dụng cho những đồ họa như infographic, biển quảng cáo, sơ đồ minh họa, bản ghi chú, công thức nấu ăn... Người dùng nhập câu lệnh và thông tin cần thiết, Nano Banana Pro sẽ kết hợp cùng những dữ liệu mà mô hình tự thu thập để tạo hình, và có thể thay đổi ngôn ngữ trong hình theo nhu cầu người dùng.Một nâng cấp khác với Nano Banana Pro là khả năng kết hợp nhiều dữ liệu đầu vào. Người dùng có thể nhập tối đa 14 hình ảnh tham khảo và yêu cầu AI đưa cùng một thiết kế. Ngoài ra, mô hình cũng đảm bảo giữ được nét giống nhau và sự đồng nhất của tối đa 5 nhân vật trong ảnh, giúp nhận diện liền mạch và nhất quán. Đầu ra hình ảnh có thể đạt độ phân giải 2K, 4K. Hình ảnh Nano Banana Pro tạo ra với câu lệnh: Tưởng tượng bạn là thầy giáo dạy kỹ năng sống, hãy tạo infographic hướng dẫn cách rán trứng, để trẻ 10 tuổi cũng hiểu và thích thú làm theo. Để sử dụng, người dùng vào Gemini trên điện thoại hoặc máy tính, chọn công cụ Tạo hình ảnh (logo quả chuối) và gõ câu lệnh. Tùy yêu cầu, công cụ cần gần một phút để tạo hình. Với yêu cầu khó, AI sẽ hiện lên tiến trình bằng văn bản, hỏi rõ các bước trước khi triển khai. Trong một số trường hợp, công cụ chưa hoạt động ổn định, như nhận câu lệnh nhưng không thực hiện, khiến người dùng phải làm lại.Trước lo ngại về việc AI có thể bị lợi dụng, Google cho biết đã nâng cấp việc xác định hình ảnh được tạo bằng AI trong ứng dụng Gemini. Theo đó, mọi nội dung do công cụ Google tạo ra đều được gắn SynthID - ký hiệu kỹ thuật số ẩn.Để xác minh một bức ảnh có phải được tạo ra bằng AI của Google hay không, người dùng có thể tải lên ứng dụng Gemini và hỏi. "Chúng tôi bắt đầu với hình ảnh trước và sẽ sớm mở rộng sang âm thanh và video", đại diện Google cho biết. Ngoài ra, hãng cũng duy trì ký hiệu mờ (watermark) trên ảnh được tạo bởi người dùng gói miễn phí và gói Google AI Pro. Trong khi đó, gói Google AI Ultra cho người dùng chuyên nghiệp sẽ không có watermark.Lưu Quý Link bài viết: https://vnexpress.net/Tao-chu-trong-anh-thach-thuc-cua-AI-vua-duoc-Google-giai-quyet-4971831.html Facebook Google Tweet Danh mục tin tức Tin tức liên quan Robot hình người Trung Quốc lập kỷ lục thế giới về đi bộ Robot A2 của công ty Agibot lập Kỷ lục Guinness Thế giới với chuyến đi bộ liên thành phố, di chuyển hơn 106 km mà không tắt nguồn. AI có thể dự báo mưa lũ, sạt lở thế nào Nhóm kỹ sư của FPT phát triển mô hình AI có thể phân tích dữ liệu mưa, địa chất để khoanh vùng khu vực có nguy cơ lũ lụt, sạt lở. Blue Origin phát triển tên lửa đẩy hạng siêu nặng Blue Origin hôm 20/11 tiết lộ mẫu tên lửa mới New Glenn 9x4 với kích thước và sức chở lớn, có thể cạnh tranh với Starship của SpaceX. Kỹ sư nói bị sa thải vì cảnh báo sức mạnh của robot hình người Một kỹ sư về an toàn robot đã khởi kiện Figure AI, cho rằng ông bị đuổi việc trái phép sau khi cảnh báo về mức độ an toàn của sản phẩm. Trung Quốc xây đảo nhân tạo nổi chịu được vụ nổ hạt nhân Trung Quốc đang xây cơ sở nghiên cứu khoa học khổng lồ nặng 78.000 tấn, có thiết kế hai thân bán chìm, dự kiến hoạt động năm 2028. Phó chủ tịch Huawei khoe ảnh chụp từ điện thoại chưa ra mắt Phó chủ tịch Huawei đăng loạt ảnh chụp bằng các smartphone thuộc dòng Mate 80 dự kiến ra mắt tuần sau. Mở hộp MacBook Pro 14 inch dùng chip M5 MacBook Pro 14 inch mới giữ nguyên kiểu dáng nhưng nâng cấp chip M5 xử lý AI mạnh hơn, tăng tốc bộ nhớ RAM, SSD cùng thời lượng pin 24 tiếng. Loạt máy lọc nước với công nghệ hydrogen ion kiềm Số bình chọn thứ 9 của Sản phẩm tôi yêu 2025 là cuộc cạnh tranh của 5 mẫu máy lọc nước có công nghệ hydrogen ion kiềm, giá từ 8,6 triệu đến 16,9 triệu đồng. Huawei mở rộng mạng lưới chip AI, giảm phụ thuộc công nghệ Mỹ Dòng chip AI của Huawei và mạng lưới nhà cung cấp nội địa được đánh giá trở thành xương sống trong nỗ lực xây dựng hệ sinh thái bán dẫn tại Trung Quốc. Robot hình người làm việc trong nhà máy ôtô 'nghỉ hưu' Sau 11 tháng làm việc trong nhà máy BMW tại Spartanburg, robot hình người Figure 02 chính thức được thông báo nghỉ việc. Nhà khoa học Việt - Nga thu thập gần 100 mẫu trầm tích Biển Đông Hơn 30 nhà khoa học Việt - Nga làm việc 24/7 suốt một tháng trên Biển Đông, thu gần 100 mẫu trầm tích biển sâu, ghi nhận nhiều dị thường địa hóa phục vụ nghiên cứu khoáng sản và biến động địa chất. Chủ tịch Quốc hội Hàn Quốc đề xuất Việt Nam hợp tác nghiên cứu AI, lượng tử Chủ tịch Quốc hội Hàn Quốc Woo Won Shik cho rằng, hợp tác khoa học công nghệ giữa hai nước cần đi vào các lĩnh vực cụ thể như AI, lượng tử, thúc đẩy nghiên cứu chung. 'Muốn tự chủ công nghệ, phải ưu đãi mạnh cho sản phẩm chiến lược' Đại biểu Trần Anh Tuấn cho rằng sản phẩm công nghệ chiến lược quyết định năng lực tự chủ công nghệ quốc gia nhưng rủi ro lớn, cần ưu đãi đủ mạnh để doanh nghiệp dám đầu tư. Mở cổng bình chọn Sơ loại Tech Awards 2025 Chương trình Bình chọn Công nghệ xuất sắc - Tech Awards 2025 chính thức diễn ra từ ngày 20/11 với 16 hạng mục, trong đó một số hạng mục mới. Hai nền tảng theo dõi mưa lũ, ứng cứu người dân của kỹ sư Việt Hai nhóm kỹ sư trẻ của Việt Nam phát triển các công cụ trực tuyến giúp người dân theo dõi mưa lũ, gửi tín hiệu kêu cứu theo thời gian thực. Xem tất cả