أطلقت شركة مايكروسوفت نموذجاً توليدياً جديداً، أطلق عليه اسم Magma، يمكنه التحكم بشكل مستقل في روبوت كامل أثناء معالجة المعلومات من أجهزة الاستشعار الخاصة به، وهي خطوة نحو عالم يمكن فيه للذكاء الاصطناعي مثل ChatGPT التفاعل مع العالم المادي، باستخدام ذراع آلية أو روبوت بشري أو شيء آخر تماماً.
وحسب موقع “futurism”، قالت مايكروسوفت إن أحدث نماذج الذكاء الاصطناعي لديها يمكنه معالجة البيانات المتعددة الوسائط، بما في ذلك النصوص والصور والفيديو، مع القدرة أيضاً على “التخطيط والعمل في العالم البصري المكاني”. وهذا يعني أنه يمكن استخدامه “لإكمال المهام الوكيلة التي تتراوح من التنقل عبر واجهة المستخدم إلى التلاعب بالروبوت”.
كتبت شركة مايكروسوفت في ورقة بحثية توثق الأداة الجديدة: “Magma قادرة على صياغة الخطط وتنفيذ الإجراءات لتحقيقها”. وأضافت: “من خلال نقل المعرفة بشكل فعال من البيانات المرئية واللغوية المتاحة مجاناً، تربط Magma بين الذكاء اللفظي والمكاني للتنقل في المهام المعقدة”.
Magma هي جزء من انتقال أوسع بكثير من نماذج اللغة الكبيرة البسيطة وروبوتات الدردشة إلى “وكلاء الذكاء الاصطناعي”، الذين يمكنهم تنفيذ المهام نيابة عن البشر.
إشراف بشري
ومع ذلك، لا تزال هذه التقنية تعاني من قيود تقنية مزعجة؛ على سبيل المثال، لا يزال وكيل الذكاء الاصطناعي الذي أصدرته OpenAI مؤخراً، والذي أطلق عليه اسم Operator، والذي تم تصميمه للتنقل عبر الإنترنت “لأداء المهام نيابة عنك”، يتطلب الكثير من الإشراف من قبل البشر لإنجاز أي شيء.
ومن المرجح أن يكون التنقل في العالم المادي، ناهيك عن التلاعب بالأشياء، مهمة ليست سهلة أيضاً.
ومع ذلك، وفقاً لاختبارات مايكروسوفت، يخلق Magma AI “نتائج حديثة جديدة في مهام التنقل عبر واجهة المستخدم والتلاعب الآلي، متفوقاً على النماذج السابقة المصممة خصيصاً لهذه المهام”.
وقد يكون للتحرك نحو الذكاء الاصطناعي الوكيل أيضاً الكثير من العواقب غير المقصودة، مثل إدخال ثغرات الأمن السيبراني من خلال الجهات السيئة التي تستغل عمليات كسر الحماية أو حقن التعليمات البرمجية الخبيثة.