كشفت شركة “أنثروبيك” Anthropic عن ميزة جديدة لنموذجها الذكي Claude 3.5 Sonnet تسمح له بالتحكم الكامل في جميع النوافذ والمحتوى الظاهر على شاشات الحواسيب الشخصية دون أي تدخل من المستخدم سوى بتوجيه أمر نصي يتضمن تفصيلياً كل ما يرغب في إتمامه.
وفي مقطع مصور، أوضحت الشركة أن المستخدم سيكون بإمكانه إنجاز عدد كبير من المهام باستخدام نموذجها الجديد، إذ يمكنه البحث عن المعلومات على حاسوب المستخدم والكتابة والتحكم في مؤشر الماوس، ما يتيح له الضغط على الأزرار والعناصر المختلفة في الواجهات الرسومية الخاصة بمواقع الويب والتطبيقات وكل ما يظهر على شاشة الحاسوب، إلى جانب الكتابة داخل حقول النصوص والمستندات النصية.
وأشارت أنثروبيك إلى أنها ستوفر الميزة الجديدة التي تحمل اسم Computer Use لعموم المطورين من خلال الواجهة البرمجية الخاصة بالنموذج الجديد، لتلقي ردود أفعالهم على أداء الميزة قبل إتاحتها لعموم المستخدمين.
وبحسب الشركة، فإن الإصدار الجديد من نموذج Claude 3.5 Sonnet قد حقق تحسينات كبيرة على العديد من المعايير الصناعية، وهو متاح للعملاء بنفس السعر والسرعة التي تميّز بها النموذج السابق.
وأظهر النموذج المحدَّث تحسينات واسعة النطاق على معايير الأداء، إذ سجل تقدماً ملحوظاً في مهام الترميز واستخدام الأدوات.
وفي مجال الترميز، ارتفعت نسبة الأداء على معيار SWE-bench Verified من 33.4% إلى 49.0%، متفوقاً بذلك على جميع النماذج المتاحة علناً، بما في ذلك نماذج التفكير المتقدمة مثل OpenAI o1-preview والنظم المتخصصة في الترميز.
كما سجل النموذج تحسناً في أداء مهام استخدام الأدوات في معيار TAU-bench، إذ ارتفعت النسبة في قطاع التجزئة من 62.6% إلى 69.2%، وفي قطاع الطيران الأكثر تحدياً من 36.0% إلى 46.0%.
يُذكر أن هذه ليست المرة الأولى التي تحاول فيها شركة تقنية دخول سوق العملاء الرقميين الذين بإمكانهم إنجاز المهام نيابة عن البشر، فقد حاولت شركة “رابيت” Rabbit أداء المهمة نفسها مع جهازها المطور بالذكاء الاصطناعي R1.
وفي أثناء إطلاقه مطلع العام الجاري، أشارت الشركة إلى أن مساعدها الذكي “رابيت” يمكنه إنجاز المهام نيابة عن المستخدم وفقاً للأوامر الصوتية التي يوجهها إليه، إلا أن التجارب الأولية أشارت إلى فشل الجهاز في تقديم هذه الميزة حتى الآن.
جدير بالذكر أن شركات مثل مايكروسوفت وOpenAI قد اتخذت عدة خطوات لتحقيق فكرة الوكلاء الرقميين الذين بإمكانهم إنجاز المهام نيابة عن البشر على الحواسيب والهواتف الذكية.
فعلى سبيل المثال، بدأت مايكروسوفت في تقديم ميزة Recall التي تسجل كل ما يقوم به المستخدم على حاسوب يعمل بنظام ويندوز 11 وتحتفظ به مخزناً محلياً داخل ذاكرة الحاسوب ليتمكن المستخدم من الرجوع إليه في أي وقت.
وهذه الميزة مدعومة بالذكاء الاصطناعي، وبالتالي قد تتمكن مايكروسوفت من فعل هذا عن طريق مساعدها Copilot، أو قد تطور شركة OpenAI ميزة جديدة داخل ChatGPT تسمح بإنجاز المهام تلقائياً على حواسيب المستخدمين في المستقبل القريب.