Chào mừng!!

Bằng cách đăng ký với chúng tôi, bạn sẽ có thể thảo luận, chia sẻ và nhắn tin riêng tư với các thành viên khác trong cộng đồng của chúng tôi.

ĐĂNG KÝ NGAY!

Google DeepMind ra mắt mô hình ngôn ngữ Gemini Robotics On-Device dành cho robot

timingdeptry

Thành viên
Tham gia
13/6/25
Bài viết
19
VNĐ
1,225
Hôm thứ Ba, Google DeepMind đã ra mắt một mô hình ngôn ngữ mới có tên Gemini Robotics On-Device, cho phép robot thực hiện các tác vụ tại chỗ mà không cần kết nối internet.


Dựa trên mô hình Gemini Robotics trước đây được phát hành vào tháng Ba, Gemini Robotics On-Device có thể điều khiển các chuyển động của robot. Các nhà phát triển có thể kiểm soát và tinh chỉnh mô hình này để đáp ứng nhiều nhu cầu khác nhau bằng cách sử dụng các lệnh ngôn ngữ tự nhiên.

Hiệu suất và thử nghiệm

Google cho biết mô hình này có hiệu suất gần với Gemini Robotics dựa trên đám mây trong các bài kiểm tra. Công ty cũng tuyên bố rằng nó vượt trội hơn các mô hình tại chỗ khác trong các bài kiểm tra chung, mặc dù không nêu rõ tên các mô hình đối thủ.

Minh họa thực tế

Trong một bản demo, Google đã trình diễn các robot sử dụng mô hình này để thực hiện các công việc như mở túi và gấp quần áo. Google cho biết mặc dù mô hình này ban đầu được huấn luyện cho các robot ALOHA, nhưng sau đó đã được điều chỉnh để hoạt động với robot hai tay Franka FR3 và robot hình người Apollo của Apptronik.


Theo Google, robot hai tay Franka FR3 đã xử lý thành công các tình huống và đối tượng mà nó chưa từng "gặp" trước đây, chẳng hạn như lắp ráp trên một dây chuyền công nghiệp.
221
Công cụ hỗ trợ phát triển

Google DeepMind cũng phát hành một bộ SDK cho Gemini Robotics. Công ty cho biết các nhà phát triển có thể huấn luyện robot thực hiện các nhiệm vụ mới bằng cách cho chúng xem 50 đến 100 lần minh họa nhiệm vụ, sử dụng các mô hình này trên trình giả lập vật lý MuJoCo.

Đối thủ trong ngành

Các nhà phát triển mô hình AI khác cũng đang thử nghiệm trong lĩnh vực robot:


  • Nvidia đang xây dựng nền tảng để tạo ra các mô hình nền tảng dành cho robot hình người.
  • Hugging Face không chỉ phát triển các mô hình và tập dữ liệu mở cho robot mà còn trực tiếp làm việc với các loại robot.
  • Startup RLWRLD của Hàn Quốc, được Mirae Asset hậu thuẫn, đang xây dựng các mô hình nền tảng cho robot.
 
Top