Google DeepMind ra mắt AI Gemini Robotics phiên bản ngoại tuyến

Google DeepMind ra mắt AI Gemini Robotics phiên bản ngoại tuyến
Google DeepMind ra mắt AI Gemini Robotics phiên bản ngoại tuyến

Google DeepMind vừa công bố một phiên bản mới đầy mạnh mẽ của AI Gemini Robotics, có thể chạy trực tiếp trên robot mà không cần kết nối internet .

Được thiết kế để thực hiện các tác vụ phức tạp theo thời gian thực, mô hình nhỏ gọn và hiệu quả này mang lại trí tuệ và khả năng thích ứng ấn tượng cho các cỗ máy.

Gemini Robotics AI hoạt động không cần internet

Nếu bạn từng làm việc với robot, hẳn sẽ biết rằng phần lớn các hệ thống AI hiện nay đều phụ thuộc vào kết nối đám mây. Nhưng giờ đây, Google DeepMind đang thay đổi điều đó với phiên bản Gemini Robotics chạy trên thiết bị (on-device). Phiên bản mới này của mô hình thị giác-ngôn ngữ-hành động (VLA) không cần kết nối Wi-Fi hay dữ liệu di động. Chính xác là nó có thể hoạt động hoàn toàn ngoại tuyến .

Điều này đồng nghĩa với việc robot của bạn có thể “nhìn”, “hiểu” và “hành động” một cách độc lập. Nó có thể thực hiện các tác vụ vật lý và thích ứng với những tình huống mới, tương tự như phiên bản Gemini Robotics cao cấp được phát hành vào tháng 3. Nhưng điểm khác biệt cốt lõi là: phiên bản mới đủ nhỏ gọn và hiệu quả để chạy trực tiếp trên robot, không cần xử lý bên ngoài.

Theo bà Carolina Parada, trưởng bộ phận robot tại Google DeepMind, phiên bản Gemini ban đầu sử dụng hệ thống lai, tức là một phần chạy trên đám mây, một phần trên thiết bị. Tuy nhiên, phiên bản mới này phát huy phần lớn sức mạnh khi chạy hoàn toàn ngoại tuyến, phù hợp với môi trường có kết nối yếu hoặc yêu cầu cao về quyền riêng tư.

Tốc độ học nhanh và khả năng thích ứng cao

Video đang HOT

Điều đặc biệt ấn tượng ở phiên bản AI chạy trên thiết bị này là tốc độ học cực nhanh. Robot chỉ cần 50 đến 100 lần thao tác mẫu để học một nhiệm vụ mới. Nếu bạn muốn robot của mình phân loại hàng hóa, dọn bàn ăn, hoặc xử lý vật thể tinh xảo, nó có thể thành thạo sau một vài lần quan sát.

Bài viết liên quan  Liu Grace 'Em Xinh' khiến Trấn Thành 'tốn nước mắt' vì chuyện tình yêu là ai?

Dù mô hình ban đầu được huấn luyện trên robot ALOHA của Google, tính linh hoạt của nó đã được chứng minh khi được tích hợp lên nhiều robot khác nhau: từ robot hình người Apollo của Apptronik đến robot hai tay Franka FR3.

Parada thừa nhận phiên bản lai của Gemini Robotics vẫn vượt trội hơn phiên bản ngoại tuyến ở một số khía cạnh. Tuy nhiên, bà cho biết phiên bản độc lập vẫn cực kỳ mạnh mẽ và có thể là lựa chọn lý tưởng cho những ai mới bắt đầu hoặc các ngành yêu cầu bảo mật dữ liệu cao.

Nhà phát triển có thể truy cập sớm để tinh chỉnh AI

Để hỗ trợ triển khai, Google DeepMind cũng ra mắt bộ công cụ phát triển phần mềm (SDK) cho phiên bản chạy trên thiết bị. Bộ SDK này cho phép các nhà phát triển thử nghiệm AI , tùy chỉnh và tối ưu hóa hiệu suất theo nhu cầu cụ thể của từng robot. Đây là lần đầu tiên DeepMind cung cấp bộ công cụ chính thức cho một hệ thống VLA của họ.

Dù mô hình và SDK này chưa được phát hành rộng rãi, một nhóm người dùng thử nghiệm đáng tin cậy sẽ được tiếp cận sớm. Trong lúc đó, DeepMind sẽ đảm bảo công nghệ đáp ứng các tiêu chuẩn an toàn trước khi phát hành công khai.

Nếu bạn đang phát triển các giải pháp robot và cần một AI hiệu suất cao hoạt động trong môi trường ngoại tuyến hoặc bảo mật, đây có thể chính là đột phá bạn đang chờ đợi từ Google DeepMind.

Google DeepMind công bố AI khoa học ‘đột phá’

Google DeepMind vừa sử dụng các mô hình chatbot để đưa ra giải pháp cho những vấn đề lớn trong toán học và khoa học máy tính.

Trụ sở của Google ở California, Mỹ. Ảnh: Kyodo/TTXVN

Hệ thống có tên AlphaEvolve này kết hợp sự sáng tạo của mô hình ngôn ngữ lớn (LLM) với các thuật toán có thể kiểm tra các đề xuất của mô hình để lọc và cải thiện giải pháp. Nghiên cứu được mô tả trong một báo cáo kỹ thuật được công ty công bố ngày 14/5.

Bài viết liên quan  Hải Sen trước khi bị bắt giàu tới mức hàng xóm ai cũng nể, ước tính thu về gần 200 tỷ đồng

“Bài báo này khá ấn tượng”, Mario Krenn, người đứng đầu Phòng thí nghiệm Nhà khoa học Nhân tạo tại Viện Khoa học Ánh sáng Max Planck ở Erlangen, Đức nhận xét. “Tôi nghĩ AlphaEvolve là minh chứng thành công đầu tiên về những khám phá mới dựa trên các LLM đa năng”.

Theo Pushmeet Kohli, Giám đốc khoa học của DeepMind, bên cạnh việc sử dụng hệ thống để tìm ra giải pháp cho các bài toán mở, DeepMind đã áp dụng kỹ thuật trí tuệ nhân tạo (AI) này vào những thách thức thực tế của chính họ.

AlphaEvolve đã giúp cải thiện thiết kế của thế hệ bộ xử lý tensor tiếp theo – các chip máy tính được phát triển đặc biệt cho AI – và đã tìm ra cách khai thác hiệu quả hơn năng lực điện toán toàn cầu của Google, tiết kiệm 0,7% tổng tài nguyên.

AI đa năng

Theo Krenn, hầu hết các ứng dụng thành công của AI trong khoa học cho đến nay – bao gồm cả công cụ thiết kế protein AlphaFold – đều liên quan đến thuật toán học được thiết kế thủ công cho nhiệm vụ cụ thể. Nhưng AlphaEvolve mang tính đa năng, tận dụng khả năng của LLM để tạo mã giải quyết vấn đề trong nhiều lĩnh vực khác nhau.

DeepMind mô tả AlphaEvolve là một ‘tác nhân’, vì nó liên quan đến việc sử dụng các mô hình AI tương tác. Tuy nhiên, nó nhắm đến một điểm khác trong quy trình khoa học so với nhiều hệ thống khoa học AI ‘tác nhân’ khác, vốn được sử dụng để xem xét tài liệu và đề xuất giả thuyết.

AlphaEvolve được dựa trên dòng LLM Gemini của công ty. Mỗi nhiệm vụ bắt đầu với việc người dùng nhập câu hỏi, tiêu chí đán.h giá và một giải pháp đề xuất, từ đó LLM đề xuất hàng trăm hoặc hàng nghìn sửa đổi. Một thuật toán ‘đán.h giá’ sau đó sẽ đán.h giá các sửa đổi dựa trên các tiêu chí cho một giải pháp tốt.

Bài viết liên quan  Rợn người vụ sản xuất dầu ăn cho người từ thức ăn chăn nuôi: 3 năm thu 8.200 tỷ

Matej Balog, nhà khoa học AI tại DeepMind và là đồng trưởng nhóm nghiên cứu cho biết dựa trên những giải pháp được đán.h giá là tốt nhất, LLM đề xuất ý tưởng mới và theo thời gian hệ thống phát triển một quần thể thuật toán mạnh hơn. Ông nói: “Chúng tôi khám phá tập hợp đa dạng các khả năng giải quyết vấn đề”.

Ứng dụng hẹp

Trong toán học, AlphaEvolve dường như cho phép tăng tốc đáng kể trong việc giải quyết một số vấn đề, theo Simon Frieder, nhà toán học và nghiên cứu AI tại Đại học Oxford, Vương quốc Anh. Nhưng có lẽ nó sẽ chỉ được áp dụng cho “phần hẹp” của các nhiệm vụ có thể được trình bày như các vấn đề cần giải quyết thông qua mã, ông nói.

Các nhà nghiên cứu khác đang dè dặt đán.h giá về tính hữu ích của công cụ này cho đến khi nó được thử nghiệm bên ngoài DeepMind. “Cho đến khi các hệ thống được thử nghiệm bởi cộng đồng rộng lớn hơn, tôi sẽ vẫn hoài nghi và xem xét các kết quả được báo cáo một cách thận trọng”, Huan Sun, nhà nghiên cứu AI tại Đại học Ohio State ở Columbus cho biết.

Theo ông Kohli, mặc dù AlphaEvolve yêu cầu ít sức mạnh tính toán hơn để chạy so với AlphaTensor, nó vẫn quá tốn tài nguyên để được cung cấp miễn phí trên máy chủ của DeepMind. Tuy nhiên, công ty hy vọng việc công bố hệ thống sẽ khuyến khích các nhà nghiên cứu đề xuất các lĩnh vực khoa học để áp dụng AlphaEvolve. Ông Kohli khẳng định: “Chúng tôi chắc chắn cam kết đảm bảo rằng hầu hết mọi người trong cộng đồng khoa học đều có thể tiếp cận nó”.

Nguồn: https://vietgiaitri.com/google-deepmind-ra-mat-ai-gemini-robotics-phien-ban-ngoai-tuyen-20250626i7472959/?campid=cWNfZmFjZWJvb2t8Y3BjfFZHVDAwMS1MaW5rXzIwMjUwNjI2fDA5OjI0OjA4