أهم ثلاث ابتكارات في مجال الذكاء الاصطناعي لعام 2023

Chatbot looking out of a smartphone display. Text bubbles floating around. Pink background.

(SeaPRwire) –   في العديد من الطرق ، كان عام 2023 هو العام الذي بدأ فيه الناس في فهم ما هو الذكاء الاصطناعي بالفعل – وما يمكنه فعله. كان هذا العام الذي ذهبت فيه برامج الدردشة حقا فيروسية ، والعام الذي بدأت فيه الحكومات في أخذ مخاطر الذكاء الاصطناعي على محمل الجد. لم تكن هذه التطورات بقدر ما كانت تكنولوجيات وأفكار تأخذ مركز المسرح بعد فترة حمل طويلة.

لكن هناك الكثير من الابتكارات الجديدة أيضًا. هذه هي ثلاثة من أكبرها في العام الماضي:

التعددية

“التعددية” قد تبدو مثل مصطلح فني ، لكنها تستحق فهم ما تعنيه: إنها القدرة على معالجة نظام الذكاء الاصطناعي لأنواع كثيرة مختلفة من البيانات – ليس فقط النصوص ، ولكن أيضًا الصور والفيديو والصوت والمزيد.

كان هذا العام هو المرة الأولى التي يحصل فيها الجمهور على وصول إلى نماذج الذكاء الاصطناعي متعددة الوسائط القوية. كان GPT-4 من أوبن أي أول هذه ، مما يسمح للمستخدمين بتحميل الصور بالإضافة إلى مدخلات النص. يمكن لـ GPT-4 “رؤية” محتويات الصورة ، ما يفتح الكثير من الإمكانيات ، على سبيل المثال سؤاله عما يجب طهيه للعشاء بناءً على صورة لمحتويات الثلاجة. في سبتمبر ، قدمت أوبن أي القدرة للمستخدمين على التفاعل مع تشات جي بي تي بالصوت بالإضافة إلى النص.

أعلنت جوجل ديب مايند عن أحدث نموذج لها جيميني في ديسمبر ، والذي يمكنه أيضًا العمل مع الصور والصوت. أظهر مقطع فيديو تم تقاسمه من قبل جوجل النموذج يحدد بطة بناءً على رسم خطي على ملصق بوست. في نفس الفيديو ، بعد عرض صورة لخيط أرجواني وأزرق وسؤاله عما يمكن استخدامه لصنعه ، أنتج جيميني صورة لدمية أخطبوط وردية وزرقاء. (ظهر الفيديو التسويقي لجوجل عرض جيميني مراقبة الصور المتحركة والاستجابة لأوامر الصوت في الوقت الحقيقي ، لكن في منشور على موقعه ، قالت جوجل إن الفيديو تم تحريره للاختصار – وأن النموذج كان يتم توجيهه باستخدام صور ثابتة ، لا فيديو ، ومدخلات نص ، لا صوت ، على الرغم من أن النموذج لديه القدرة على .)

“أعتقد أن العلامة البارزة التي سيعود الناس إليها ، ويتذكرونها ، هي [أنظمة الذكاء الاصطناعي] تصبح أكثر اكتمالًا متعددة الوسائط بكثير” ، قال شين ليغ ، المؤسس المشارك لجوجل ديب مايند ، في مقابلة في أكتوبر. “هذه المرحلة الأولية في هذا الانتقال ، وعندما تبدأ بالفعل هضم كميات كبيرة من الفيديو وأشياء أخرى مثل ذلك ، فسوف تبدأ هذه الأنظمة بفهم أكثر تأصلاً للعالم”. في مقابلة مع تايم في نوفمبر ، قال سام ألتمان ، الرئيس التنفيذي لأوبن أي ، إن التعددية في نماذجهم الجديدة ستكون واحدة من الأشياء الرئيسية التي يجب مراقبتها العام المقبل.

وعد التعددية ليس فقط أن تصبح النماذج أكثر فائدة. بل إنها أيضًا أن النماذج يمكن تدريبها على مجموعات جديدة غنية من البيانات – الصور والفيديو والصوت – التي تحتوي على مزيد من المعلومات حول العالم من النصوص وحدها. يؤمن العديد من علماء الذكاء الاصطناعي في أفضل شركات الذكاء الاصطناعي أن هذه البيانات التدريبية الجديدة ستترجم إلى هذه النماذج أكثر قدرة أو قوة. هو خطوة على طريق ، يأمل العديد من علماء الذكاء الاصطناعي ، نحو “الذكاء الاصطناعي العام” ، النوع من النظام الذي يمكنه مطابقة الذكاء البشري ، مما يجعل اكتشافات علمية جديدة وأداء عمل قيم اقتصاديًا.

الذكاء الاصطناعي الدستوري

إحدى أكبر الأسئلة دون إجابة في مجال الذكاء الاصطناعي هي كيفية توافقه مع القيم البشرية. إذا أصبحت هذه الأنظمة أذكى وأقوى من البشر ، فقد تسبب أضرارًا لا تُحصى لجنسنا – حتى يقول البعض إنها قد تؤدي إلى انقراضنا الكلي – ما لم يتم تقييدها بقواعد تضع الرفاه البشري في مركزها.

استخدمت أوبن أي العملية التي توافقت من خلالها تشات جي بي تي (لتجنب مخاطر النماذج السابقة) بشكل جيد – لكنها استلزمت كمية كبيرة من العمل البشري ، من خلال تقنية تعرف باسم “تعزيز التعلم بالتغذية الراجعة البشرية” أو RLHF. سيقوم المقيمون البشريون بتقييم استجابات الذكاء الاصطناعي ومنحه ما يعادل المكافأة الحسابية إذا كانت الاستجابة مفيدة وغير ضارة وملتزمة بقائمة القواعد المحتوية لدى أوبن أي. من خلال مكافأة الذكاء الاصطناعي عندما يكون جيدًا ومعاقبته عندما يكون سيئًا ، طورت أوبن أي محادث فعال ونسبياً غير ضار.

لكن لأن عملية RLHF تعتمد بشكل كبير على العمل البشري ، فهناك علامة استفهام كبيرة حول مدى قابليتها للتوسع. إنها مكلفة. تخضع للتحيزات أو الأخطاء التي يرتكبها المقيمون الفرديون. تصبح أكثر عرضة للفشل كلما زادت تعقيد قائمة القواعد. ومن غير المرجح أن تعمل لأنظمة الذكاء الاصطناعي التي تصبح قوية لدرجة أنها تبدأ في القيام بأشياء لا يمكن للبشر فهمها.

يتم توفير المقال من قبل مزود محتوى خارجي. لا تقدم SeaPRwire (https://www.seaprwire.com/) أي ضمانات أو تصريحات فيما يتعلق بذلك.

القطاعات: العنوان الرئيسي، الأخبار اليومية

يوفر SeaPRwire تداول بيانات صحفية في الوقت الفعلي للشركات والمؤسسات، مع الوصول إلى أكثر من 6500 متجر إعلامي و 86000 محرر وصحفي، و3.5 مليون سطح مكتب احترافي في 90 دولة. يدعم SeaPRwire توزيع البيانات الصحفية باللغات الإنجليزية والكورية واليابانية والعربية والصينية المبسطة والصينية التقليدية والفيتنامية والتايلندية والإندونيسية والملايو والألمانية والروسية والفرنسية والإسبانية والبرتغالية ولغات أخرى. 

يحاول الذكاء الاصطناعي الدستوري – الذي وصفه باحثون في مختبر الذكاء الاصطناعي الرائد أنثروبيك في تقرير في ديسمبر 2022 – معالجة هذه المشكلات ، مستفيدًا من الحقيقة أن أنظمة الذكاء الاصطناعي الآن قادرة بما فيه الكفاية على فهم اللغة الطبيعية. الفكرة بسيطة للغاية. أولاً