أنا بطلة شطرنج: لماذا ألعب الشطرنج ضد ChatGPT

— akinbostanci — Getty Images

(SeaPRwire) –   نماذج اللغات الكبيرة (LLMs) سيئة في الشطرنج.

ومع ذلك، وبصفتي بطلة الشطرنج الوطنية ثلاث مرات وبطلة اتحاد الولايات المتحدة للشطرنج للسيدات مرتين، أحب اللعب ضدهم. ليس لأنهم يدفعونني للعب بأفضل ما لدي، بل لأن ما يكشفونه عن الطبيعة البشرية.

لعب الشطرنج مع نماذج اللغات الكبيرة علمني كيف يكون البشر فريدين وخلاقين ومتنوعين، وكيف أن البشر عرضة للمدح والانقياد، وكيف أن الذكاء الاصطناعي يبدأ في تشكيل سلوك البشر.

لم تُصمم نماذج اللغات الكبيرة على الإطلاق للعب الشطرنج بشكل جيد. بعد كل شيء، تم تصميمها للتنبؤ بما هو الأكثر احتمالاً ليأتي بعد ذلك، وللدغدغة مشاعرنا. خوارزميات الشطرنج المدعومة بالذكاء الاصطناعي لا تحاول سحقك؛ إنها تحاول الحفاظ عليك في اللعب. ولكن في لعبهم المثير للاهتمام للشطرنج بشكل سيء، يمكننا تعلم دروساً تتجاوز الطاولة أو الرمز (token).

برامج الشطرنج المدعومة بالذكاء الاصطناعي التي تفوق البشر، من تلك التي هزمت غاري كاسباروف قبل 30 عاماً إلى “AlphaZero” من DeepMind، يمكنها هزيمة أي لاعب بشري بشكل متسق. ولكن معظم البشر لا يلعبون ضد أقوى أجهزة الكمبيوتر في الشطرنج بعد الآن لأن هزيمتك مسألة محسومة. التدمير المتكرر يمكن أن يعلّمك قدراً معيناً فقط. من ناحية أخرى، تجربة نماذج اللغات الكبيرة يمكن أن تكون مبهجة.

عندما تحديت ChatGPT4 لأول مرة إلى لعبة شطرنج، لعب بشكل مقبول، لكنني ما زلت حصلت على موقف ممتاز بعد 15 حركة وفزت بفرسان. وبعد أن ارتفعت ميزتي، حلمت بقطعة وهمية لاستعادة ملكتي. وبعبارة أخرى، إنها غدت تسرق! في البداية، لم يكن هذا يبدو منطقياً. أليست نماذج اللغات الكبيرة الجاهزة (off-the-rack) أكثر شهرة بالانقياد منها بالسرقة؟

لذا بدأت في اللعب بأسوأ حركات يمكنني التفكيرها ضد ChatGPT. انحنى القواعد مرة أخرى، ولكن هذه المرة لصالحي. قطع وهمية استبدلت القطع التي أخطأت فيها. سواء لعبت بشكل أفضل أو أسوأ من ChatGPT، فإنه في النهاية جعلني على نفس مستواه. لم يكن دائماً سرقة، ولكنه كان دائماً “توليد قصص” (confabulating). عندما يفعل البشر ذلك، نحاول ملء الفراغات في ذاكرتنا أو أحلامنا بتسلسل منطقي. كان ChatGPT يفعل الشيء نفسه.

وجدت أن “هلوسات” نماذج اللغات الكبيرة أكثر احتمالاً للحدوث عند محاولة تنفيذ “الحركات الطويلة”، والتي تعبر عن كامل اللوحة. هذا يعكس كيف يواجه نماذج اللغات الكبيرة صعوبة في المحادثات الطويلة.

عندما استضافت Google أفضل نماذج اللغات الكبيرة في بطولة، كانت 42 من أصل 47 لعبة من الدفاع الصقلي، وهو الدفاع الذي يفضله أيضاً بوب فيشر، والشخصية الخيالية بيث هارمون من “ملكة الألعاب” (Queen’s Gambit). لماذا هذا الحب للدفاع الصقلي؟ لأنه هو الأكثر شعبية. أظهرت أبحاث DeepMind الأخيرة نفس التأثير عندما حاولوا إنشاء مواقف شطرنج إبداعية، وجميلة من الناحية الجمالية، وغير متوقعة. وجد الباحثون أن الذكاء الاصطناعي غالباً ما “يتحطم” على نفسه، متكررًا نفس أنواع الموضوعات والأنماط التي اعتبروها “جميلة”.

في حالة برنامج جمال الشطرنج من DeepMind، تمكن الباحثون من تقليل ذلك من خلال برمجة صريحة لمزيد من التنوع. ولكن حتى مع بيانات تدريب واسعة، ومخرجات احتمالية، وفلاتر للتنوع، ليس من السهل محاكاة التباين ونطاق تفكير البشر.

لتأكيد ذلك، نماذج اللغات الكبيرة والذكاء الاصطناعي بشكل أوسع ليست التقنيات الوحيدة التي تتعامل مع صعوبة التقاط تنوع تجربة البشر. خذ ديناميكيات وسائل التواصل الاجتماعي الخوارزمية التي تمنح الفائز كل شيء، والتي فيها الامتثال لما يريده المستخدم المتوسط يحصلك على المزيد من النقرات والانتباه والمال. لتجنب السقوط في جاذبية صوت واحد وثقافة واحدة، يجب أن نبحث عن التنوع في مصادرنا، وطلباتنا (prompts)، والإدخال. كما كتب هاروكي موراكامي: “إذا كنت تقرأ فقط الكتب التي يقرأها الجميع، فستفكر فقط بما يفكر فيه الجميع”.

مثل محركات الشطرنج، ستصبح نماذج اللغات الكبيرة أفضل فقط، ويجب علينا الاستعداد لمستقبل ذلك. وقد عانى الشطرنج لسنوات من محاولة الحفاظ على العدالة في اللعبة على الرغم من الذكاء الاصطناعي الذي يفوق البشر. تم حظر الأجهزة الإلكترونية لفترة طويلة في مسابقات الشطرنج، ولكن ذلك لم يوقف الغش من إزعاج المجال.

في أبرز فضيحة غش في الشطرنج على الإطلاق، خسر البطل رقم 1 في العالم ماغنوس كارلسن أمام برونزية البالغ من العمر 19 عاماً هانس نيومان في عام 2022. انسحب كارلسن من البطولة، وتم الكشف عن أن هانس كان قد غش في ألعابه عبر الإنترنت السابقة. على الرغم من عدم وجود أي دليل يشير إلى أن هانس غش ضد ماغنوس، انتشرت نظريات خرقاء، مثل واحدة اقترحت استخدام حبات شرجية لاعتراض الحركات عبر الذكاء الاصطناعي. منذ ذلك الحين، أضافت بث الأحداث المباشرة تأخيرات زمنية وزادت المراقبة. على الرغم من هذه التدابير، لا تزال الاتهامات بالغش والفضائح شائعة. بعضها صحيح. والبعض الآخر ضعيف الدليل، مدعوماً بخوارزميات وسائل التواصل الاجتماعي الجائعة للمشاهد الدرامية، ويزداد حدة بسبب مخاوف الغش القائم على الذكاء الاصطناعي.

ما يعلمنا إياه هذا هو أن بناء أدوات كشف غش أكثر تقدماً لن يكون كافياً في المستقبل القائم على الذكاء الاصطناعي. بدلاً من ذلك، نحن بحاجة إلى بناء الثقة والنزاهة في مجتمعاتنا. هذا شيء لا يمكن للذكاء الاصطناعي فعله من أجله.

كما علمنا ذلك أننا لا يمكن أن نكون بسيطين بشأن تعقيدات مستقبلنا القائم على الذكاء الاصطناعي. بدلاً من ذلك، نحن بحاجة إلى العثور على طرق إيجابية للاستفادة من الذكاء الاصطناعي.

أصبح لاعبو الشطرنج خبراء في ضبط استخدام الذكاء الاصطناعي للتدريب والاستعداد، حيث نقوم بمراجعة ألعابنا الخاصة وألعاب خصومنا. النقطة المثالية هي توسيع وتحسين قائمة الحركات الممكنة، ولكن ليس إلى درجة أن نتوقف عن التفكير بأنفسنا. أحب طريقة الساندويتش. أبدأ بدماغي (الخبز)، ثم أرى ما يقوله الذكاء الاصطناعي حول الموقف (السمك المعلب)، ثم أعود للتفكير في الاستنتاجات باستخدام دماغي.

تعمل نماذج اللغات الكبيرة في الاتجاهين: يمكن أن تجعلنا أكثر حدة وذكاء، أو تجعلنا أقل حدة وأكثر متوسطية، قادرين على التفكير فقط عندما يكون لدينا جهاز كمبيوتر بجانبنا. عند لعب الشطرنج ضد نماذج اللغات الكبيرة، يمكننا رؤية بوضوح بعض نقاط قوتها وقيودها كمدرب أو صديق مخلص، لذلك نعرف متى نقول “مع السلامة جينيمي” (Goodnight Gemini).

يتم توفير المقال من قبل مزود محتوى خارجي. لا تقدم SeaPRwire (https://www.seaprwire.com/) أي ضمانات أو تصريحات فيما يتعلق بذلك.

القطاعات: العنوان الرئيسي، الأخبار اليومية

يوفر SeaPRwire تداول بيانات صحفية في الوقت الفعلي للشركات والمؤسسات، مع الوصول إلى أكثر من 6500 متجر إعلامي و 86000 محرر وصحفي، و3.5 مليون سطح مكتب احترافي في 90 دولة. يدعم SeaPRwire توزيع البيانات الصحفية باللغات الإنجليزية والكورية واليابانية والعربية والصينية المبسطة والصينية التقليدية والفيتنامية والتايلندية والإندونيسية والملايو والألمانية والروسية والفرنسية والإسبانية والبرتغالية ولغات أخرى.