هزم لاعب بشري بشكل حاسم نظام الذكاء الصناعي الأعلى تصنيفاً في لعبة Go، في مفاجئة جاءت لأول مرة من وقت انتصار الروبوت على أفضل لاعب بشري في العالم في عام 2016, الفوز الذي نُظر إليه كعلامة فارقة في ارتقاء الذكاء الصناعي.
تغلب Kellin Pelrine اللاعب الأمريكي الأقل بمستوى واحد من التصنيف الأعلى للهواة، على النظام اللاعب لـ Go عبر الاستفادة من عيب غير معروف سابقاً تم اكتشافه بواسطة برنامج أخر. بيد أن المواجهة المباشرة التي فاز فيها في 14 من 15 مباراة تمت بدون استخدام مساعدة مباشرة من البرنامج هذا.
سلّط الانتصار هذا الذي يحصل لأول مرة, الضوء على نقطة ضعف في أفضل الأنظمة اللاعبة لـ Go, نقطة الضعف هذه التي تشترك فيها معظم أنظمة الذكاء الصناعي المستخدمة على نطاق واسع اليوم، بما في ذلك ChatGPT روبوت الدردشة الذي أنشأته شركة OpenAI.
تم اقتراح هذه التكتيكات التي أعادت الإنسان إلى رأس قائمة أفضل لاعبي الـ Go بواسطة برنامج قام بفحص الأنظمة اللاعبة لـ Go بحثاً عن نقاط الضعف. ثم تم تسليم الخطة إلى Pelrine الذي قام بتأديتها بلا رحمة.
قال Adam Gleave, الرئيس التنفيذي لشركة الأبحاث في كاليفورنيا التي صممت برنامج كشف نقاط الضعف FAR AI “لقد تفاجئنا بدرجة السهولة التي واجهتنا لاستغلال ضعف هذا النظام”. وأضاف أن البوت لعب أكثر من 1 مليون مباراة ضد KataGo ، أحد أفضل أنظمة لعب Go ، للعثور على “نقطة عمياء” يمكن للاعب البشري الاستفادة منها.
وقال Pelrine إن استراتيجية الفوز التي كشف عنها البرنامج “ليست بسيطة جداً لكنها ليست صعبة للغاية بالنسبة للإنسان أن يتعلمها” ويمكن استخدامها من قبل لاعب متوسط المستوى للتغلب على أنظمة لعب الـ Go. كما استخدم الطريقة نفسها للفوز على نظام لعب Go آخر ، Leela Zero.
ويأتي هذا الانتصار الحاسم، وإن كان بمساعدة تكتيكات اقترحها برنامج آخر, بعد سبع سنوات من ظهور الذكاء الصناعي على الساحة و الذي بدا على أنه تقدم على البشر في اللعبة التي ينظر إليها غالباً على أنها الأكثر تعقيداً من بين جميع ألعاب الطاولة.
هزم AlphaGo، وهو نظام ابتكرته شركة الأبحاث DeepMind التابعة لجوجل، بطل Go في العالم Lee Sedol بأربع مباريات مقابل مباراة واحدة في عام 2016. كما عزا Sedol تقاعده الذي جاء بعد ثلاث سنوات من هزيمته إلى ارتقاء الذكاء الصناعي ، قائلاً إنه “كيان لا يمكن هزيمته”. AlphaGo غير متاح للعوام، لكن الأنظمة التي فاز عليها Pelrine تعتبر على نفس المستوى.
في لعبة Go، يضع لاعبان بالتناوب أحجاراً سوداء وبيضاء على لوحة تحوي 19 ب 19 مربع، سعياً لتطويق أحجار خصمهم وإحاطة أكبر قدر من مساحة اللوحة. العدد الهائل من احتمالات التحرك التي يمكن أن تحصل في لعبة واحدة يعني أنه من المستحيل على الكمبيوتر حساب جميع التحركات المستقبلية المحتملة.
تضمنت التكتيكات التي استخدمها Pelrine تشكيل “حلقة” كبيرة من الحجارة ببطء لتطويق إحدى مجموعات خصمه، أثناء تشتيت انتباه الذكاء الصناعي بحركات في زوايا أخرى من اللوحة غير هامة. قال Pelrine إن الروبوت الذي يلعب ضده في Go لم يلحظ هذه الخطة، حتى عندما كان التطويق قد اكتمل تقريبا.
وأضاف: “لو كان إنسان فسيكون من السهل جداً عليه اكتشاف هذه الخطة”.
و حسب قول Stuart Russell ، أستاذ علوم الكمبيوتر في جامعة كاليفورنيا ، بيركلي: فإن اكتشاف ضعف في أنظمة لعب Go الأكثر تقدما يشير إلى خلل كبير في أنظمة التعلم العميق التي يتعلم عبرها الذكاء الصناعي الأكثر تقدماً في الوقت الحالي وأضاف أن هذه الأنظمة يمكنها “فهم” مواقف محددة فقط تعرضت لها في الماضي وغير قادرة على الارتجال بسهولة مثل البشر
.
كما أضاف: “إن هذا الأمر يبين مرة أخرى أننا كنا متسرعين للغاية في التفكير أن مستويات خارقة من الذكاء قادمة إلى الآلات”.