رئيس حزب الوفد ورئيس مجلس الإدارة
د.عبد السند يمامة
رئيس مجلس التحرير
سامي أبو العز
رئيس التحرير
ياسر شورى
رئيس حزب الوفد ورئيس مجلس الإدارة
د.عبد السند يمامة
رئيس مجلس التحرير
سامي أبو العز
رئيس التحرير
ياسر شورى

Gemini أم GPT-4.. من يتفوق في معركة الذكاء الاصطناعي

Gemini أم  GPT-4
Gemini أم GPT-4

كشفت Google هذا الأسبوع عن برنامج Gemini، الذي يبدو بالفعل منافسًا ذكيًا بشكل مخيف لـ GPT-4 من OpenAI.

يتكون Gemini من ثلاثة نماذج مختلفة تختلف في الحجم والقدرة. نموذجها الأكثر تقدمًا، Gemini Ultra - والذي ليس متاحًا للعامة بعد، لكن جوجل تقول إنه مصمم لـ "مهام معقدة للغاية" - يتفوق على GPT-4 في العديد من المجالات، بدءًا من معرفة موضوعات مثل التاريخ والقانون وحتى إنشاء التعليمات البرمجية في لغة بايثون. وقالت جوجل في إعلانها إن المهام التي تتطلب تفكيرًا متعدد الخطوات.

قالت Google إن Gemini تفوقت على GPT-4 في اختبار فهم اللغة متعدد المهام الضخم، أو MMLU، والذي يعد أحد أكثر الطرق شيوعًا لقياس المعرفة ومهارات حل المشكلات لنماذج الذكاء الاصطناعي.

يمكنك مقارنتها بـ "SATs لنماذج الذكاء الاصطناعي"، كما قال كيفن روز في البودكاست التكنولوجي لصحيفة نيويورك تايمز هارد فورك. ومع ذلك، فإن اختبار MMLU أكثر تقدمًا قليلاً من اختبار الإعدادية الكلية النموذجي. وهو يغطي 57 موضوعًا، بما في ذلك الرياضيات والفيزياء والتاريخ والقانون والطب والأخلاق، لاختبار المعرفة العالمية وقدرات حل المشكلات، وفقًا لإعلان جوجل.

حصل Gemini Ultra على 90% في MMLU، بينما حصل GPT-4 على 86.4%، وفقًا لجوجل.

لكن قد يكون الإنجاز الأكثر إثارة للإعجاب لـ Gemini Ultra هو أنه أيضًا النموذج الأول الذي يتفوق على الخبراء البشريين في MMLU. وقالت جوجل في تقرير فني عن برج الجوزاء إن خبراء البشر سجلوا نحو 89.8%.

"أعتقد أنك لو عدت إلى الوراء حتى عامين أو ثلاثة أعوام وأخبرت باحثي الذكاء الاصطناعي أن Google سيكون لديها نموذج يحصل على 90 بالمائة في MMLU، فهذا أفضل من نوع العتبة المعيارية للخبراء البشريين، لكانوا سيقولون، حسنًا قال روز: "هذا هو الذكاء الاصطناعي العام". AGI، أو الذكاء العام الاصطناعي، هو شكل افتراضي من الذكاء الاصطناعي يمكنه معالجة القدرات البشرية المعقدة مثل الحس السليم والوعي.

لقد تغلب GPT-4 على Gemini Ultra بعدة نقاط مئوية في تقييم قدرات التفكير المنطقي في المهام اليومية، وفقًا لـ Google.

لكن إحدى الميزات التي تقول Google إن Gemini يتمتع بها مقارنة بالنماذج الأخرى هي أنها متعددة الوسائط في الأصل، مما يعني أنها مصممة من الألف إلى الياء لمعالجة عدة أنواع من البيانات، من النص إلى الصوت إلى التعليمات البرمجية إلى الصور والفيديو. وقال أوريول فينيالز، نائب رئيس الأبحاث في DeepMind من Google، في مقطع فيديو يعلن عن Gemini، إن النماذج الأخرى متعددة الوسائط تم إنشاؤها من خلال "الدمج معًا" للنماذج النصية فقط، والرؤية فقط، والصوت فقط "بطريقة دون المستوى الأمثل".

ونتيجة لذلك، تقول جوجل إن تصميم جيميني يسمح لها بفهم المدخلات بشكل أفضل من النماذج متعددة الوسائط الحالية. ويقول الباحثون الذين يعملون في مدونة SemiAnalogy أيضًا إن جيميني من المرجح أن يسحق GPT-4 خارج نطاق القدرة الحاسوبية المطلقة.

في حين أن Gemini Ultra قد وضعت بالتأكيد توقعات عالية لوصولها، إلا أن هيئة المحلفين لا تزال غير متأكدة من كيفية أداء نماذج Gemini الثلاثية ضد OpenAI، التي تتمتع بالفعل بميزة في وعي المستهلك.

كانت ردود الفعل المبكرة على برنامج Gemini Pro الأقل تقدمًا، والذي يمكن الوصول إليه من خلال برنامج الدردشة الآلي Bard من Google، إيجابية. ومع ذلك، واجه النموذج أيضًا مشكلات تتعلق بالدقة والهلوسة. حتى أنها طلبت من الناس اللجوء إلى Google للحصول على إجابات لأسئلة مثيرة للجدل.