التخطي إلى المحتوى

النموذج مفتوح المصدر ويتميز بـ 4.7 مليار معلمة مصممة لتوحيد الذكاء المادي. ومن خلال فصل عملية التفكير لدى الروبوت عن التحكم في الحركة، يزيل النظام التأخيرات الشائعة ويسمح بإجراءات سلسة تشبه البشر في الوقت الفعلي.

أعلن الرئيس التنفيذي لشركة شاومي، لي جون، رسمياً عن إطلاق Xiaomi-Robotics-0 وهو أول نموذج كبير للشركة مصمم لمساعدة الروبوتات على فهم العالم المادي والتفاعل معه. وعلى عكس العديد من الشركات الأخرى التي تبقي برامج الروبوت الخاصة بها خاصة وسرية، تطلق شاومي هذا النظام الجديد كمشروع مفتوح المصدر بحيث يمكن للجميع استخدامه لبناء روبوتات أفضل. ويتضمن الإصدار كود الكمبيوتر والنماذج الرياضية، وهي متاحة الآن للباحثين والمطورين لتنزيلها واستخدامها على أنواع مختلفة من أجهزة الروبوت.

يستخدم النموذج تصميماً خاصاً يقسم العمل بين عقلك للتفكير وجزء منفصل للتحكم في الحركة من خلال البناء على نموذج اللغة Qwen3. وقد قام الفريق بتدريب هذا النموذج باستخدام كمية هائلة من البيانات تتضمن حوالي 200 مليون حركة روبوت مميزة وأكثر من 80 مليون صورة عامة وأمثلة نصية. ويسمح هذا التدريب المكثف للروبوت بفهم التعليمات المعقدة والتعرف على الأشياء في العالم الحقيقي مع التخطيط لأفعاله المادية بدقة عالية.

يحل هذا النموذج الجديد مشكلة شائعة حيث تتوقف الروبوتات للتفكير قبل أن تتحرك لأنه يسمح للروبوت بالتخطيط لتحركاته التالية بينما لا يزال ينهي الحركات الحالية. وتستخدم شاومي تقنية تسمى قناع على شكل لامبدا (Lambda-shaped mask)، والتي تضمن أن يتحرك الروبوت بسلاسة بناءً على أفعاله السابقة ولكنه يظل مستعداً للتفاعل مع المعلومات المرئية الجديدة فوراً. وتظهر الاختبارات أن هذا النظام الجديد يعمل بشكل جيد جداً في محاكاة الكمبيوتر، حيث حقق معدل نجاح يقارب 99 بالمائة في معيار LIBERO، وهو أعلى بكثير من العديد من النماذج المنافسة.

كما استعرضت شاومي الروبوت وهو يؤدي مهام صعبة في العالم الحقيقي، مثل تفكيك هياكل ليغو (Lego) المعقدة المكونة من ما يصل إلى 20 مكعباً أو طي المناشف بمهارة تشبه البشر. والروبوت ذكي بما يكفي لنفض منشفة للعثور على زاوية مخفية أو حتى إعادة منشفة إضافية إذا التقط اثنتين عن طريق الخطأ في وقت واحد.

المصدر:


التعليقات

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *