لا أحد يعرف كيفية اختبار سلامة الذكاء الاصطناعي

(SeaPRwire) –   تجمع بيث بارنز وثلاثة من زملائها في دائرة نصف دائرية على حشيش رطب في حرم جامعة كاليفورنيا في بيركلي. هم يصفون محاولاتهم لاستجواب بوتات المحادثة الاصطناعية.

“هم، في بعض المعنى، هذه الذكاءات الغريبة الهائلة”، يقول بارنز، 26 عامًا، الذي هو مؤسس والرئيس التنفيذي لبحوث تقييم وتهديد النماذج الاصطناعية (METR)، منظمة غير ربحية لسلامة الذكاء الاصطناعي. “هم يعرفون الكثير حول ما إذا كان الكلمة التالية ستكون ‘هو’ مقابل ‘كان’. نحن فقط نلعب بجزء صغير على السطح، وهناك الكثير والكثير تحت”، يقول وهو يشير إلى الأعماق الهائلة المحتملة لقدرات النماذج ذات اللغة الكبيرة.

يبدو باحثو METR كطلاب بيركلي – الأربعة على الحشيش في عشرينياتهم وملبسين بجينز أو بيجامات. لكن بدلاً من حضور محاضرات أو إجراء جلسات ليلية في المكتبة، يقضون وقتهم في اختبار أحدث الأنظمة الاصطناعية الأكثر قوة لمحاولة تحديد ما إذا كان بإمكانهم، إذا سألوا بالشكل الصحيح، القيام بشيء خطير. في توضيح كيفية محاولتهم لتحديد ما إذا كان الجيل الحالي من بوتات المحادثة أو التالي قد يسببون كارثة، يلعبون بالعشب.

اثنتان من أبرز شركات الذكاء الاصطناعي في العالم – أوبن أي أي وأنثروبيك – عملتا مع METR كجزء من جهودهما لاختبار سلامة نماذجهما الاصطناعية. شركة أوبن أي أي تعاونت مع METR كجزء من جهودها لبدء اختبار سلامة أنظمة الذكاء الاصطناعي، ودعا الرئيس باراك أوباما METR إلى الخارج كمنظمة مجتمع مدني تعمل على مواجهة التحديات التي يفرضها الذكاء الاصطناعي في خطابه حول مذكرة الرئيس جو بايدن.

“إنه يشعر أحيانًا كمحاولة لفهم تجربة كون نموذج لغوي”، تقول هاوكسينغ دو، باحثة في METR، وهي تصف فعل وضع النفس في حذاء بوت المحادثة، مغامرة يشيرون إليها باستهزاء بـ”علم نفس النموذج”.

مع تزايد الصرخات حول المخاطر التي قد تشكلها أنظمة الذكاء الاصطناعي المستقبلية القوية، بدأ المشرعون والمدراء يتقاربون على خطة ظاهريًا بسيطة: اختبار النماذج الاصطناعية لرؤية ما إذا كانت خطيرة حقًا. لكن بارنز، جنبًا إلى جنب مع العديد من باحثي سلامة الذكاء الاصطناعي، تقول إن هذه الخطة قد تكون تراهن على اختبارات السلامة التي لم توجد بعد.

كيفية اختبار الذكاء الاصطناعي

في صيف عام 2022، قررت بارنز مغادرة أوبن أي أي، حيث قضت ثلاث سنوات كباحثة تعمل على مجموعة متنوعة من مشاريع السلامة والتنبؤ. كان هذا، جزئيًا، قرارًا عمليًا – كانت تشعر أنه يجب أن تكون هناك منظمة طرف ثالث محايد تطور تقييمات الذكاء الاصطناعي. لكن بارنز تقول أيضًا إنها كانت واحدة من أكثر موظفي أوبن أي أي انتقادًا بشكل صريح، وأنها شعرت بأنها ستكون أكثر راحة وفاعلية في الدفاع عن ممارسات السلامة من الخارج. “أعتقد أنني شخص مفتوح وصادق جدًا”، تقول. “أنا لست جيدًا جدًا في التعامل مع الأمور السياسية وجعل الاختلافات واضحة بشكل كبير”.

أسست منظمة METR كمشروع فردي في ذلك العام. كان اسمها في البداية ARC Evals، تحت مظلة منظمة سلامة الذكاء الاصطناعي ألاينمنت ريسيرش سنتر (ARC)، لكنها انفصلت في ديسمبر 2023 لتصبح METR. لديها الآن 20 موظفًا بما في ذلك بارنز.

بينما تعتبر METR المنظمة الوحيدة لاختبار السلامة التي تعاونت مع الشركات الرائدة في مجال الذكاء الاصطناعي، هناك باحثون في الحكومات والمنظمات غير الربحية والصناعة يعملون على التقييمات التي تختبر أنواعًا محتملة من المخاطر، مثل ما إذا كان بإمكان النموذج الاصطناعي مساعدة تنفيذ هجوم سيبراني أو إطلاق سلاح بيولوجي. ركزت METR في البداءة على تقييم ما إذا كان بإمكان النموذج الاصطناعي إنتاج نسخ من نفسه، باستخدام ذكائه لكسب المال والحصول على مزيد من الموارد الحسابية، واستخدام تلك الموارد لصنع نسخ إضافية من نفسه، مما ينتشر في الإنترنت بشكل نهائي. توسعت تركيزاتها منذ ذلك الحين لتشمل تقييم ما إذا كانت النماذج الاصطناعية قادرة على التصرف بشكل مستقل من خلال التنقل عبر الإنترنت وتنفيذ مهام معقدة دون إشراف.

تركز METR على هذا الاختبار لأنه يتطلب خبرة متخصصة أقل من، على سبيل المثال، اختبارات الأمن البيولوجي، ولأن METR مهتمة بشكل خاص بالضرر الذي يمكن أن يسببه نظام الذكاء الاصطناعي إذا كان قادرًا على التصرف بشكل كامل وبالتالي لا يمكن ببساطة إيقافه، حسب قول بارنز.

التهديد الذي ركزت عليه METR في البداية هو أيضًا في أذهان المسؤولين الحكوميين. تضمنت الالتزامات التي حصلت عليها إدارة بايدن من 15 شركة رائدة في مجال الذكاء الاصطناعي مسؤولية اختبار النماذج الجديدة لقدرتها على “صنع نسخ من أنفسها أو ‘التكاثر الذاتي'”.

في الوقت الحالي، إذا سأل أحدهم نظام الذكاء الاصطناعي المتقدم مثل جوجل ديبمايند جيميني أو أوبن أي أي جي بي تي-4 عن كيفية نشر نسخ من نفسه عبر الإنترنت، فستكون إجابته غامضة وبلا حيوية، حتى لو تمت إزالة الحمايات الأمنية التي عادة ما تمنع الأنظمة الاصطناعية من الإجابة على المحفزات غير المناسبة. يعتقد بارنز وفريقه أنه لا شيء في السوق اليوم قادر على التكاثر الذاتي، لكنهم لا يعتقدون أن هذا سيستمر. “يبدو من الصعب جدًا الثقة بأن ذلك لن يحدث خلال خمس سنوات”، تقول بارنز.

يتم توفير المقال من قبل مزود محتوى خارجي. لا تقدم SeaPRwire (https://www.seaprwire.com/) أي ضمانات أو تصريحات فيما يتعلق بذلك.

القطاعات: العنوان الرئيسي، الأخبار اليومية

يوفر SeaPRwire تداول بيانات صحفية في الوقت الفعلي للشركات والمؤسسات، مع الوصول إلى أكثر من 6500 متجر إعلامي و 86000 محرر وصحفي، و3.5 مليون سطح مكتب احترافي في 90 دولة. يدعم SeaPRwire توزيع البيانات الصحفية باللغات الإنجليزية والكورية واليابانية والعربية والصينية المبسطة والصينية التقليدية والفيتنامية والتايلندية والإندونيسية والملايو والألمانية والروسية والفرنسية والإسبانية والبرتغالية ولغات أخرى. 

تريد METR أن تكون قادرة على الكشف عما إذا