دراسة حول قدرات OpenAI o1 في التشخيص الطبي تفوق معايير الأطباء

(AsiaGameHub) – قام فريق من كلية الطب بجامعة هارفارد ومركز بيث إسرائيل دياكونيس للطب بإجراء اختبارات على نماذج OpenAI مقابل الأطباء في تشخيص الحالات الطبية باستخدام حالات طوارئ حقيقية ومهام سريرية أخرى.

معلومة مفيدة

حقق OpenAI o1 تشخيصًا دقيقًا أو قريبًا من الدقة في 67% من حالات التriage الأولية في قسم الطوارئ.
حقق طبيبان رئيسيان درجة 55% و50% في نفس اختبار التriage.
قال الباحثون إن المستشفيات لا تزال بحاجة إلى دراسات تجريبية على المرضى الحقيقيين قبل استخدام الذكاء الاصطناعي في التشخيصات عالية المخاطر.

يقول الباحثون إن الاستخدام الفعلي في قسم الطوارئ لا يزال بحاجة إلى اختبارات

كان أقوى النتائج في اللحظة التي يكون فيها لدى الأطباء أقل معلومات. في التriage الأولي لقسم الطوارئ، حقق OpenAI o1 تشخيصًا دقيقًا أو قريبًا من الدقة في 67% من الحالات. أما أحد الأطباء الرئيسيين فقد بلغ 55%، بينما بلغ الآخر 50%.

لم يصور الباحثون النتيجة على أنها إشارة خضراء للذكاء الاصطناعي لإدارة أقسام الطوارئ. بل أشار البحث الذي نشرته مجلة Science إلى “الحاجة الملحة إلى دراسات تجريبية مستقبلية لتقييم هذه التقنيات في بيئات الرعاية الصحية الفعلية.”

ويعتبر هذا التحذير مهمًا لأن الاختبار ظل داخل السجلات النصية. أشار الفريق إلى أن “الدراسات الحالية تشير إلى أن النماذج الأساسية الموجودة محدودة أكثر في التفكير عبر المدخلات غير النصية.” بعبارات بسيطة، فإن الرسوم البيانية والتصوير والفحوصات المجسمة والفحوصات الجسدية والحكم بجانب السرير لا تزال تخلق مشكلات أصعب لأدوات التشخيص الذكية.

استخدم البحث 76 مريضًا من قسم الطوارئ بمستشفى بيث إسرائيل. تلقت OpenAI o1 و4o نفس التفاصيل من السجلات الطبية الإلكترونية المتاحة في كل نقطة تشخيص. قالت كلية الطب بجامعة هارفارد إن الباحثين لم يقوموا “بمعالجة البيانات مسبقًا على الإطلاق”، لذلك لم تحصل النماذج على ملخصات منظمة أو مساعدة إضافية.

ثم قام طبيبان رئيسيان آخران بتقييم الإجابات دون معرفة أي تشخيص جاء من طبيب بشري وأي من الذكاء الاصطناعي.

قال البحث:

“في كل نقطة تشخيص، أدى o1 أداءً أفضل قليلاً أو على قدم المساواة مع الطبيبين الرئيسيين و4o.”

أضاف أن الفجوة كانت واضحة جدًا في بداية الرعاية، حيث تكون الضغوط عالية والمعلومات قليلة:

“كانت واضحة بشكل خاص في أول نقطة تشخيص (التriage الأولي لقسم الطوارئ)، حيث تكون المعلومات المتوفرة عن المريض هي الأقل وأكثر اللحظات توترًا لاتخاذ القرار الصحيح.”

قال أرجون مانراي، الذي يرأس مختبر الذكاء الاصطناعي في كلية الطب بجامعة هارفارد وساعد في قيادة الدراسة:

“اختبرنا النموذج الذكي ضد كل المعايير التقريبًا، وقد تفوق على كل النماذج السابقة وأساسيات أطبائنا.”

لكن الإشراف والمساءلة ما زالت مشكلة صعبة. قال آدم رودمان، طبيب في مستشفى بيث إسرائيل وأحد المؤلفين الرئيسيين للدراسة، لصحيفة الجارديان إنه “لا يوجد إطار رسمي حاليًا للمساءلة” حول التشخيصات الذكية. كما أنه ذكر أن المرضى لا يزالون “يرغبون في أن يقودهم البشر في اتخاذ قرارات حياة أو موت [و] في اتخاذ قرارات علاج صعبة.”

تم تقديم هذه المقالة من قبل مزود محتوى طرف ثالث. AsiaGameHub (https://asiagamehub.com/) لا تقدم أي ضمانات أو تعهدات بشأن محتواها.

التصنيف: أخبار عاجلة، تحديثات عامة

توفر AsiaGameHub خدمات توزيع موجهة لقطاع الألعاب الإلكترونية (iGaming) للشركات والمؤسسات، مع الوصول إلى أكثر من 3,000 وسيلة إعلام آسيوية متميزة وأكثر من 80,000 من المؤثرين المتخصصين. وتُعد الجسر الأمثل لتوزيع محتوى iGaming والكازينو والرياضات الإلكترونية عبر منطقة الآسيان.

يقول الباحثون إن الاستخدام الفعلي في قسم الطوارئ لا يزال بحاجة إلى اختبارات

Related News