Trí tuệ nhân tạo [ Đăng ngày (24/05/2025) ]
Nâng cấp hàng loạt tính năng mới, Google đang biến Gemini thành một hệ điều hành AI
Với hàng loạt nâng cấp lớn về tính năng, Google đang biến Gemini từ một chatbot AI thành một hệ điều hành AI với nhiều công cụ hữu ích khác nhau.

Tại hội nghị Google I/O 2025 vừa diễn ra vào ngày 20/5/2025, Google đã gây ấn tượng mạnh mẽ khi công bố hàng loạt nâng cấp cho Gemini, biến nó từ một mô hình ngôn ngữ lớn (LLM) thành một hệ điều hành AI toàn diện.

Với những tính năng đột phá, từ tạo video có âm thanh, hỗ trợ nghiên cứu chuyên sâu, đến tích hợp sâu hơn vào hệ sinh thái Google, Gemini đang mở ra một kỷ nguyên mới cho trí tuệ nhân tạo, hứa hẹn thay đổi cách chúng ta làm việc, học tập và sáng tạo. Những công bố này không chỉ khẳng định tham vọng của Google trong cuộc đua AI mà còn đặt nền móng cho một tương lai nơi AI trở thành trợ lý cá nhân không thể thiếu.

Một trong những điểm sáng đầu tiên tại Google I/O 2025 là Gemini Live, giờ đây được cung cấp miễn phí trên cả Android và iOS. Tính năng này cho phép người dùng bật camera, hướng vào bất kỳ vật thể nào và trò chuyện với Gemini theo thời gian thực. Chẳng hạn, bạn có thể chỉ vào một món đồ trong cửa hàng và hỏi về giá cả, hoặc nhờ Gemini hướng dẫn sửa một thiết bị ngay tại chỗ.

Điểm nổi bật là Gemini Live đã được tích hợp sâu với các ứng dụng Google như Maps, Calendar, Tasks và Keep, giúp việc lên kế hoạch, mua sắm hay quản lý công việc trở nên thông minh hơn bao giờ hết. Theo thông tin từ Engadget, tính năng chia sẻ màn hình và camera của Gemini Live đã được triển khai rộng rãi trên mọi thiết bị, không chỉ giới hạn ở dòng Pixel, đánh dấu bước tiến lớn trong việc phổ biến AI đến người dùng toàn cầu.

Tiếp nối thành công của các phiên bản trước, Google đã ra mắt Imagen 4 – mô hình tạo hình ảnh tốt nhất từ trước đến nay của hãng. Imagen 4 mang đến khả năng tạo hình ảnh độ phân giải cao với tốc độ ấn tượng, từ poster quảng cáo đến slide thuyết trình, tất cả đều đạt chất lượng chuyên nghiệp.

Theo bài viết trên blog của Google, Imagen 4 có thể tái hiện chi tiết tinh xảo như kết cấu vải, giọt nước hay lông động vật, đồng thời hỗ trợ cả phong cách ảnh thực tế và trừu tượng với độ phân giải lên đến 2K. Đáng chú ý, Google còn hé lộ một phiên bản nhanh hơn của Imagen 4, dự kiến nhanh gấp 10 lần Imagen 3, hứa hẹn giúp người dùng khám phá ý tưởng sáng tạo một cách nhanh chóng và hiệu quả hơn.

Một điểm nhấn không thể bỏ qua là Veo 3, mô hình tạo video tiên tiến nhất của Google, lần đầu tiên tích hợp âm thanh gốc. Với Veo 3, người dùng chỉ cần viết một câu lệnh để tạo ra video sống động, kèm theo âm thanh nền, hiệu ứng và thậm chí cả hội thoại nhân vật.

Theo Google DeepMind, Veo 3 không chỉ cải thiện chất lượng hình ảnh so với Veo 2 mà còn mang đến khả năng tạo âm thanh tự nhiên, từ tiếng chim hót trong công viên đến tiếng ồn ào của đường phố. Tính năng này hiện đã có mặt trên ứng dụng Gemini cho người dùng gói AI Ultra tại Mỹ, mở ra tiềm năng lớn cho các nhà làm phim và sáng tạo nội dung. Hơn nữa, Veo 3 được tích hợp vào Flow, công cụ làm phim AI mới của Google, cho phép người dùng dễ dàng tạo các đoạn phim điện ảnh với sự hỗ trợ của Imagen và Gemini.

Không dừng lại ở sáng tạo hình ảnh và video, Google còn nâng cấp Deep Research, biến Gemini thành một trợ lý nghiên cứu mạnh mẽ. Người dùng giờ đây có thể tải lên tài liệu PDF, ảnh chụp màn hình hoặc ghi chú, và Gemini sẽ kết hợp dữ liệu này với thông tin công khai để tạo ra báo cáo chi tiết, đầy đủ ngữ cảnh.

Tính năng này đặc biệt hữu ích cho học sinh, nhân viên văn phòng hay nhà phân tích thị trường, giúp tiết kiệm thời gian và nâng cao hiệu quả nghiên cứu. Theo TechCrunch, Deep Research là một phần trong nỗ lực của Google nhằm biến Gemini thành một công cụ đa năng, hỗ trợ người dùng trong mọi khía cạnh của công việc và học tập.

Với Canvas, Google giới thiệu một không gian sáng tạo đa năng, nơi người dùng có thể tạo ra mã lập trình, bài kiểm tra, infographic hay thậm chí podcast chỉ bằng những câu lệnh đơn giản.

Được hỗ trợ bởi Gemini 2.5 Pro, Canvas mang đến tốc độ xử lý nhanh hơn và kết quả thông minh hơn, giúp biến ý tưởng thành hiện thực một cách dễ dàng. Đây là công cụ lý tưởng cho những ai muốn thử sức với sáng tạo mà không cần kỹ năng chuyên môn sâu, từ giáo viên thiết kế bài giảng đến nhà tiếp thị xây dựng nội dung trực quan.

Bắt đầu từ ngày 21/5/2025, Gemini sẽ chính thức được tích hợp vào trình duyệt Chrome, mang đến trải nghiệm duyệt web thông minh hơn. Người dùng có thể yêu cầu Gemini tóm tắt bài viết, trả lời câu hỏi hoặc trong tương lai gần, tự động điều hướng tab và thực hiện các tác vụ duyệt web. Tính năng này không chỉ tiết kiệm thời gian mà còn mở ra tiềm năng tự động hóa các công việc trực tuyến, từ nghiên cứu thông tin đến quản lý công việc hàng ngày.

Google cũng không quên hỗ trợ lĩnh vực giáo dục với tính năng Interactive Quizzes. Người dùng chỉ cần yêu cầu “Tạo bài kiểm tra về nhiệt động lực học”, Gemini sẽ cung cấp câu hỏi, phản hồi tức thì và thậm chí tạo thêm bài kiểm tra cá nhân hóa dựa trên những phần người dùng còn yếu.

Bên cạnh đó, Gemini 2.5 Flash được thiết lập làm phiên bản mặc định, nổi bật với tốc độ nhanh, hiệu suất cao và hoàn toàn miễn phí. Đây là lựa chọn lý tưởng cho các tác vụ hàng ngày, đảm bảo hiệu quả mà không tốn kém.

Để phục vụ nhu cầu đa dạng, Google đã ra mắt hai gói đăng ký mới: AI Pro với giá 19,99 USD/tháng, cung cấp quyền truy cập vào các công cụ như Flow và NotebookLM, cùng gói AI Ultra giá 249,99 USD/tháng, mang đến trải nghiệm cao cấp với các tính năng như Veo 3 và chế độ Deep Think.

Theo thông tin từ Google DeepMind, Deep Think là chế độ suy luận nâng cao, giúp Gemini 2.5 Pro xử lý các vấn đề toán học và lập trình phức tạp một cách hiệu quả hơn, hiện đã được triển khai cho một số người dùng thử nghiệm.

Cuối cùng, Google hé lộ Agent Mode, tính năng sắp ra mắt, cho phép Gemini tự động thực hiện các tác vụ phức tạp. Chẳng hạn, khi bạn yêu cầu “Giúp tôi tìm và đặt thuê một căn hộ”, Gemini sẽ phân tích yêu cầu, tìm kiếm danh sách, chọn lọc lựa chọn phù hợp và thậm chí gửi email cho đại lý. Đây là bước tiến lớn hướng đến AI tự hành, tích hợp chặt chẽ vào hệ sinh thái Google, mở ra viễn cảnh về một trợ lý AI toàn năng.

Với những nâng cấp vượt trội này, Gemini không chỉ dừng lại ở một chatbot mà đang dần trở thành một hệ điều hành AI thực thụ – trực quan, đa năng và chủ động. Google I/O 2025 đã chứng minh rằng Gemini không chỉ là một công cụ, mà là một người bạn đồng hành, sẵn sàng hỗ trợ chúng ta trong mọi khía cạnh của cuộc sống. Khi AI ngày càng tiến gần đến khả năng tương tác giống con người, câu hỏi đặt ra là: chúng ta sẽ tận dụng công nghệ này như thế nào để định hình tương lai?

https://genk.vn/nang-cap-hang-loat-tinh-nang-moi-google-dang-bien-gemini-thanh-mot-he-dieu-hanh-ai-20250521101950964.chn?sid=1375355544354926592 (htquyen)
In bài viết  
Bookmark
Ý kiến của bạn

Xem nhiều

Tiêu điểm

Microsoft cáo buộc nhóm tin tặc đứng sau mạng lưới Deepfake AI
Công nghệ lưu trữ lượng tử vừa đạt đột phá: Chứa 5.000 phim 4K trên một tinh thể bé hơn đầu ngón tay?
Sony tuyên bố hợp tác gây chấn động ngành game, mang tính năng độc quyền trên AMD RX 9000 đến PS5 Pro, vạch ra tương lai cho PS6
Startup xe điện Dat Bike đã không còn "trong tay” người Việt
Trung Quốc tự đẩy mình vào 'thời khắc sinh tử': 300 startup xe điện chỉ còn 7 hãng lớn có thể tồn tại, chiến trường xe điện khốc liệt hơn bất kỳ lúc nào
Chuyên gia Phạm Chi Lan chỉ ra 4 điểm yếu của các nhà sáng lập Việt: Nhiều startup cho rằng xuất khẩu được mới 'oai', trong khi thị trường nội còn khó hơn ngoại
Startup KAMEREO ‘ấm bụng’ trong ‘mùa đông gọi vốn’: Hoàn tất vòng Series B với 7,8 triệu USD từ 5 ‘đồng hương’ Nhật Bản
Founder - CEO Amslink: Kiến tạo tương lai Anh ngữ cho thế hệ trẻ Việt
CASTI Awards 2024 - Tôn vinh sản phẩm khoa học, công nghệ và đổi mới sáng tạo
Thông cáo báo chí Hội thảo “Phát triển hệ sinh thái số về nguồn tin khoa học, công nghệ và đổi mới sáng tạo phục vụ phát triển kinh tế - xã hội thành phố Cần Thơ”
Khai mạc Chợ công nghệ và thiết bị chuyên ngành Nông nghiệp Cần Thơ 2024 – Tech4Agri CanTho 2024
Lãnh đạo thành phố tham quan, trải nghiệm các công nghệ, thiết bị tại Tech4Agri CanTho 2024
Các ứng dụng AI trong nông nghiệp
Hành trình Tech4Agri CanTho 2024 – với chủ đề “Khoa học, công nghệ và đổi mới sáng tạo – Đánh thức nền nông nghiệp đa giá trị”
Gần 300 công nghệ, thiết bị và sản phẩm dự kiến trưng bày, giới thiệu tại Tech4Agri CanTho 2024
Siêu thị số  
 
Google phát hành lỗ hổng zero-day định danh CVE-2025-2783
Google vừa phát hành bản vá khẩn cấp cho trình duyệt Chrome nhằm khắc phục một lỗ hổng zero-day nghiêm trọng đầu tiên được phát hiện trong năm 2025. Lỗ hổng này định danh CVE-2025-2783 đã bị tin tặc khai thác trong thực tế.


 
Công nghệ 4.0  
 
Thúc đẩy ứng dụng AI vào nghiên cứu khoa học xã hội và nhân văn
(VietQ.vn) - Trí tuệ nhân tạo (AI) đang mở ra nhiều cơ hội mới cho nghiên cứu khoa học xã hội và nhân văn tại Việt Nam. Tuy nhiên, việc ứng dụng sâu vẫn còn nhiều rào cản về dữ liệu, nhân lực và đạo đức nghiên cứu.


 
Điện tử  
   
Tin học  
 
Google phát hành lỗ hổng zero-day định danh CVE-2025-2783
Google vừa phát hành bản vá khẩn cấp cho trình duyệt Chrome nhằm khắc phục một lỗ hổng zero-day nghiêm trọng đầu tiên được phát hiện trong năm 2025. Lỗ hổng này định danh CVE-2025-2783 đã bị tin tặc khai thác trong thực tế.


 



© Copyright 2020 Trung tâm Thông tin Khoa học và Công nghệ - Sở Khoa học & Công nghệ TP. Cần Thơ
Địa chỉ: 118/3 Trần Phú - Phường Cái Khế - Quận Ninh Kiều - thành phố Cần Thơ
Giấy phép số: 05/ GP-TTĐT, do Sở Thông tin và Truyền Thông thành phố Cần Thơ cấp ngày 23/5/2017
Trưởng Ban biên tập: Ông Vũ Minh Hải - Giám Đốc Trung tâm Thông tin Khoa học và Công nghệ - Sở Khoa học & Công nghệ TP. Cần Thơ
Ghi rõ nguồn www.trithuckhoahoc.vn khi bạn sử dụng lại thông tin từ website này
-->