هل سيتمكن Google Gemini من القضاء علىChatGPT ؟
قم بتسجيل الدخول للقيام بالتعليق
تسجيل الدخولأعلنت Google Deepmind مؤخرًا عن إطلاق Gemini، وهو نموذج الذكاء الاصطناعي الجديد الخاص بها للتنافس مع ChatGPT الخاص بـ OpenAI.
فهو على ما يبدو يمكنه أن يفهم ويتحدث بذكاء عن أي نوع من المطالبات تقريبًا، سواء الصور أو النصوص أو الكلام أو الموسيقى وغير ذلك.
و لكن لماذا يعتبر علامة فارقة مهمة، وماذا سيجلب لمستخدمي خدمات جوجل؟
وبشكل عام، ماذا يعني ذلك في سياق التطورات الحالية فائقة السرعة في مجال الذكاء الاصطناعي؟
الذكاء التوليدي
أولا، من الجدير بالذكر أن كلا النموذجين سواء جيميني أو ChatGPT هما عبارة عن أمثلة على "الذكاء الاصطناعي التوليدي"، التي تتعلم كيفية العثور على أنماط الإدخال من معلومات التدريب لإنشاء بيانات جديدة سواء صور أو كلمات أو وسائط أخرى.
اقرأ ايضا
لكن ChatGPT هو نموذج لغة كبير (LLM) يركز على إنتاج النص.
و بنفس الطريقة التي يعتبر بها ChatGPT تطبيق ويب للمحادثات يعتمد بالأساس على الشبكة العصبية المعروفة باسم GPT، و التي يتم تدريبها على كميات هائلة من النصوص، لدى Google تطبيق ويب للمحادثة أيضا يسمى Bard و الذي يعتمد على نموذج يسمى LaMDA يتم تدريبه على الحوار.
فما الذي يميز Gemini عن LaMDA؟
ما يميز Gemini عن نماذج الذكاء الاصطناعي التوليدية السابقة مثل LaMDA هو أنه "نموذج متعدد الوسائط" (multi-modal model ).
وهذا يعني أنه يعمل مباشرة مع أوضاع متعددة للإدخال والإخراج. بالإضافة إلى ذلك، فإنه يدعم الصور والصوت والفيديو أيضا.
بعبارة أخرى، إنه قادر على فهم المحتوى في الوقت الفعلي مثل الفيديو المباشر والكلام البشري.
وبفضل البيانات وأجهزة الاستشعار الجديدة، سيكون قادرًا على مراقبة الأحداث في العالم الحقيقي ومناقشتها والتصرف بناءً عليها.
المثال الأكثر وضوحًا على ذلك هو السيارات ذاتية القيادة، التي تجمع بالفعل كميات هائلة من البيانات أثناء قيادتها على طرقاتنا. و علاوة على ذلك، يمكنها دعم حركة المرور، أو حتى مساعدة السلطات في تحديد السلوك المشبوه أو الإجرامي.
ما الذي يميز Geminiعن ChatGPT-4 إذن؟
حاليا، لدى شركة OpenAI نموذج يسمى GPT-4Vision يمكنه العمل مع الصور والصوت والنص أيضًا.
ومع ذلك، فهو ليس نموذجًا متعدد الوسائط تمامًا بالطريقة التي وعد بها جيميني.
ففي حين أن ChatGPT-4 المدعوم بواسطة GPT-4V، يمكنه العمل مع المدخلات الصوتية وإنشاء مخرجات الكلام.
فقد أكدت OpenAI أن ذلك يتم عن طريق تحويل الكلام إلى نص عند الإدخال باستخدام نموذج تعلم عميق آخر يسمى Whisper.
وبالمثل، يمكن لـ ChatGPT-4 إنتاج صور، ولكنه يفعل ذلك عن طريق إنشاء مطالبات نصية يتم تمريرها إلى نموذج منفصل للتعلم العميق يسمى Dall-E 2، والذي يحول أوصاف النص إلى صور.
مما يعني أن GPT-4V يعمل فقط مع النص.
هل هناك مميزات أخرى ل Gemini؟
من المرجح أن تتمتع أنظمة الذكاء الاصطناعي، مثل جيميني، والتي يمكن تدريبها بشكل مباشر على كل هذه البيانات، بقدرات أكبر بكثير في المستقبل.
فعلى سبيل المثال لا الحصر، فإن النماذج التي يتم تدريبها على الفيديو سوف تطور تمثيلات داخلية معقدة لما يسمى "الفيزياء الساذجة"(Native Physics )
والتي تعني الفهم الأساسي غير مدرب لدى البشر حول السببية والحركة والجاذبية والظواهر الفيزيائية الأخرى.
إضافة إلى ذلك، و مع تحقيق نتيجة مذهلة بلغت 90.0 بالمائة، أصبح Gemini Ultra النموذج الأول الذي يتفوق على الخبراء البشريين في معيار" فهم اللغات المتعدد المهام" (MMLU)،
الذي يحتوي على 57 موضوعًا، بما في ذلك الرياضيات والفيزياء والتاريخ والقانون والطب.
مما يؤهله إلى الإنضمام إلى نماذج الذكاء الاصطناعية العامة الأقوى (AGI)( artificial general intelligence )،
والتي لها القدرة على فهم أو تعلم أي مهمة فكرية يمكن للإنسان القيام بها بل وحتى التفوق عليهم.
الاصدارات المتوفرة
هناك ثلاث إصدارات محتملة للبرنامج .
الإصدار الحالي المتاح للجمهور يسمى Gemini 1.0 Pro، وهو ليس جيدًا بشكل عام مثل GPT-4، وهو أكثر تشابهًا في قدراته مع GPT 3.5 حسب تقرير Google.
أعلنت Google أيضًا عن إصدار أخر يسمى Gemini 1.0 Ultra، وقدمت بعض النتائج التي توضح أنه سيكون مستقبلا أقوى من GPT-4.
كما أعلنت عن إصدار يسمى Gemini Nano، وهو أخف وزنًا بكثير و قادر على التشغيل مباشرة على الهواتف المحمولة.
هل Google تراهن عليه في إعادة مكانتها كلاعب رئيسي في مجال الذكاء الاصطناعي ؟
نعم، بكل تأكيد تراهن Google على Gemini لترقية معظم منتجاتها من خلال تعزيز الوظائف الحالية وإنشاء وظائف جديدة لخدمات مثل البحث وGmail وYouTube ومجموعة إنتاجية المكاتب.
مما من شأنه أن يسمح أيضا بإدخال تحسينات على أعمالهم الإعلانية عبر الإنترنت - مصدر إيراداتهم الرئيسي - وكذلك لبرامج الهاتف أندرويد، مع إصدارات تعمل على أجهزة ذات سعة محدودة.
بالنسبة للمستخدمين، يعني Gemini ميزات وقدرات متطورة من شأنها أن تجعل من الصعب تجنب خدمات Google.
ويمكنه توفير أدوات للمتسوقين تقوم بتحليل الصور ومقاطع الفيديو للتوصية بالمشتريات وإنشاء مسارات سفر مفصلة بناءً على تفضيلات المستخدم.
كما يمثل تكامل Gemini مع Google Cloud نموذجًا للتحول الرقمي في العمليات التجارية.
فببساطة شديدة، سيساعد Gemini شركة Google في إعادة مكانتها كلاعب رئيسي في مجال الذكاء الاصطناعي.
خاصة بعد النجاح الهائل وغير المتوقع الذي حققه ChatGPT و الذي جذب الكثير من الاهتمام وعزز مصداقية OpenAI.
هل يعني ذلك أنه تم القضاء على GPT؟
في العام الماضي، على الرغم من ظهور العديد من نماذج الذكاء الاصطناعي التوليدية، كانت نماذج GPT من OpenAI هي المهيمنة، مما يدل على مستوى من الأداء لم تتمكن النماذج الأخرى من الاقتراب منه حتى.
يشير Gemini من Google إلى ظهور منافس رئيسي سيسحب البساط من المولود الحديث العهدGPT-4.
وبطبيعة الحال، يكاد يكون من المؤكد أن OpenAI تعمل على GPT-5، ويمكننا أن نتوقع أنه سيكون أيضًا متعدد الوسائط و قطعا سيظهر قدرات جديدة سيفاجىء بها غنيمه و من يدري بماذا يفاجئنا نحن أيضا.
المراجع:
https://theconversation.com/googles-gemini-is-the-new-ai-model-really-better-than-chatgpt-219526
منة ادريس
مترجمة من الإنجليزية إلى العربية/ كاتبة محتوى علمياعتمادا على المصادر العلمية الموثوقة أكتب في مختلف المجالات و ذلك من أجل جعل العلم يصل إلى بيتنا العربي بطريقة بسيطة جدا يفهما عامة الناس.
تصفح صفحة الكاتب