recent
آخر الاخبار

أهم الأمور التي يمكن لنموذج الذكاء الاصطناعي الجديد GPT-4o القيام بها.

الصفحة الرئيسية

أهم الأمور التي يمكن لنموذج الذكاء الاصطناعي الجديد GPT-4o القيام بها.
أهم الأمور التي يمكن لنموذج الذكاء الاصطناعي الجديد GPT-4o القيام بها.

أهم الأمور التي يمكن لنموذج الذكاء الاصطناعي الجديد GPT-4o القيام بها.

أهم الأمور التي يمكن لنموذج الذكاء الاصطناعي الجديد GPT-4o القيام بها: بعد مرور ما يقارب العام والنصف على إعلان شركة OpenAI الرائدة في مجال الذكاء الاصطناعي وتقنياته عن بوت الدردشة الخاص بها ChatGPT الذي لاقى نجاح باهر وانتشار واسع في مختلف أنحاء الكوكب عادت الشركة لتستحوذ على أنظار العالم من جديد بعد أن أعلنت عن نموذج الذكاء الاصطناعي الأكثر تطوراً "GPT-4o" الذي جاء لتحسين أداء ChatGPT وتعزيز قدراته.

يأتي نموذج "GPT-4o" الجديد مدعوم بالذكاء الاصطناعي متعدد الوسائط وهذا يعني أن النموذج الجديد قادر على فهم مختلف أنواع وأشكال المدخلات بما في ذلك المدخلات الصوتية والمرئية وفهم الكلام بالإضافة إلى المدخلات النصية الاعتيادية التي كانت مدعومة في النموذج السابق، كما يمكن استخدام المميزات الجديدة للاستفادة من البوت كمساعد صوتي، كل هذا يجعل من نموذج "GPT-4o" أكثر كفاءة وسرعة في الاستجابة من النموذج السابق "GPT-4".

فيما يلي سنقدم لكم نظرة شاملة عن كل المميزات والإمكانات الرئيسية التي يمكن لنموذج "GPT-4o" الجديد القيام بها وقبل ذلك سنحاول إيجاز أبرز الاختلافات بين النموذج الجديد GPT-4o والنموذج السابق GPT-4.

أبرز الفروقات بين نموذجي الذكاء الاصطناعي GPT-4o و GPT-4.

عند إطلاق البوت الشهير ChatGPT للمرة الأولى كان يعتمد على نموذج الذكاء الاصطناعي "GPT-3.5" والذي كان يقدم قدرات أقل بكثير من النموذج الحالي GPT-4، إلا أن المدخلات التي يمكن للبوت تلقيها في هذه المرحلة اقتصرت على المدخلات النصية، لكن مع إعلان OpenAI عن النموذج الجديد "GPT-4o" تغير كل شيء!

الآن مع اعتماد ChatGPT على النموذج الجديد GPT-4o أصبح من الممكن إدخال مختلف أشكال البيانات سواء النصية أو الصوتية أو المرئية حيث يعتمد هذا النموذج على الذكاء الاصطناعي متعدد الوسائط وبالتالي يمكننا القول أن الاختلاف الجوهري بين نموذجي الذكاء الاصطناعي GPT-4o و GPT-4 هي قدرة الأول على التعامل مع مختلف أنواع المدخلات فهمها والاستجابة لها بينما يقتصر الثاني على فهم المدخلات النصية والتعامل معها والاستجابة لها.

يمتاز النموذج الجديد GPT-4o أيضاً بسرعة استجابة أعلى وكفاءة أكبر من GPT-4 في معالجة الأوامر والمدخلات ما يجعله قادر على القيام بالكثير من الوظائف والمهام كالترجمة وتحليل الصور في الزمن الحقيقي.

تبلغ مدة الاستجابة التي يقدمها GPT-4o للمدخلات الصوتية 232 ميللي ثانية وهذا الرقم قريب من المدة اللازمة للاستجابة البشرية ما يجعله أقرب لمحاكاة البشر في المحادثات والاستجابة.

الآن بعد أن حددنا أبرز الفروقات بين نموذجي الذكاء الاصطناعي GPT-4o و GPT-4 سنتحدث عن أهم الأمور التي يمكن لنموذج الذكاء الاصطناعي الجديد GPT-4o القيام بها.

1 | إضافة النص إلى الصور.

حالياً يعتمد بوت الدردشة ChatGPT على نموذج توليد الصور Dall-E 3 المطور من قبل OpenAI والذي تم دمجه مع البوت في أيلول / سبتمبر الماضي (2023)، مهمة هذا النموذج تكمن في الاستجابة لمطالبات مستخدمي ChatGPT Plus بإنشاء الصور بالاعتماد على الذكاء الاصطناعي.

هذا النموذج (Dall-E 3) وغيره من النماذج الأخرى المبنية على نموذج Diffusion لا تزال قاصرة على إنشاء الصور التي تحوي على نصوص.

أما مع النموذج الجديد GPT-4o أصبح بإمكان ChatGPT توليد وإنشاء صور تحوي على نصوص بالاعتماد على الذكاء الاصطناعي بشكل دقيق للغاية في حال طُلب منه القيام بذلك.

جاءت النتائج الأولية التي عرضتها OpenAI لتثبت قوة النموذج في دمج النصوص مع الصور حيث بدت النصوص الموجودة داخل الصور متسقة بشكل رائع معها ولم تبدو مضافة أو معدلة.

وعلى اعتبار أن GPT-4o نموذج متعدد الوسائط وقادر على التعامل مع مختلف المدخلات المرئية والمسموعة فيمكن للمستخدم ادخال صورة جاهزة إلى ChatGPT ومطالبته بكتابة نص معين داخلها مع قدرات هائلة على التحكم بحجم النص وشكله وموضعه وزواياه بالإضافة إلى إمكانية جعله يبدو بشكل ثلاثي الأبعاد 3D.

2 | معالجة الفيديوهات في الزمن الحقيقي.

بفضل الإمكانيات المميزة التي يقدمها الذكاء الاصطناعي متعدد الوسائط في النموذج الجديد GPT-4o أصبح من الممكن التعامل مع الفيديوهات ومعالجتها في الوقت الفعلي وبالتالي يمكن لمستخدمي ChatGPT إدخال الفيديوهات إلى البوت ومطالبته بتلخيص هذه الفيديوهات أو تحديد النقاط الرئيسية التي يدور حولها موضوع الفيديو.

هذه الوظيفة تشبه إلى حد كبير تلك التي يقدمها نموذج Gemini 1.5 Pro الموجود في تطبيق Gemini Advanced الخاص بجوجل.

3 | الاستخدام في الأغراض والنشاطات التعليمية.

أليس من الرائع أن يصبح الذكاء الاصطناعي بمثابة مدرّس خاص لك يساعدك على المذاكرة وحل الفروض الدراسية من خلال محاكاة المعلمين البشر في الأداء؟

هذا ما يقدمه نموذج GPT-4o متعدد الوسائط الجديد، حيث يمكنك أن تشارك شاشة جهازك سواء كان جهاز تابلت أو جهاز كمبيوتر مع بوت الدردشة ChatGPT ومن ثم تطلب من البوت أن يقوم بشرح المسائل المستعصية أو صعبة الحل سواء الرياضية أو الهندسية أو العلوم أو الجغرافيا والخرائط أو الرسوم البيانية والشروح التوضيحية أو غيرها من الجوانب العلمية المختلفة.

4 | المساعدة على فهم واستيعاب الرموز المميزة في اللغات الأخرى.

الترميز اللغوي في التعلم الآلي واللغات الطبيعية هو مفهوم يشير إلى عملية اختزال النصوص من خلال تحويل سلسلة من الكلمات أو العبارات الطويلة في لغة معينة إلى مجموعة أصغر من الحروف والكلمات والتي تعرف بـ "الرموز المميزة".

على سبيل المثال لفظ "GPT-4o" في اللغة الانكليزية تتم ترجمته في اللغة العربية إلى "جي بي تي 4 أو" وهكذا.

تتميز كل واحدة من اللغات المعروفة بعدد معين من الرموز المميزة والتي تتفاوت من لغة إلى أخرى وقد أحرز نموذج GPT-4o تقدم كبير في مجال فهم واستيعاب الرموز المميزة للعديد من اللغات.

وقد تم اختبار GPT-4o في فهم الرموز المميزة بحوالي 20 لغة مختلفة غير الانكليزية وحقق نتائج لافتة حسب الموقع الرسمي لـ Open AI.

هذا الفهم للرموز المميزة الذي يبديه نموذج GPT-4o يدل على تحسن كبير في أداءه في فهم اللغات والتعامل معها ويجعله قادر بشكل مميز على إجراء عمليات الترجمة الفورية بالزمن الحقيقي نظراً لسرعة الاستجابة الهائلة الذي يبديها النموءج.

5 | المشاركة في الاجتماعات.

كما أشرنا يستطيع نموذج GPT-4o فهم الكلام البشري بشكل مميز وقريب لفهم البشر ويمكنه التفاعل معه والاستجابة له بشكل لافت، هذا الأمر يجعله قادر على المشاركة في اجتماعات العمل من خلال مشاركة جلسة الاجتماع مع البوت بشكل مرئي ومسموع ومن ثم يمكن الاستفادة منه في طرح الأفكار ومعالجة المشكلات التي تظهر أثناء الاجتماع وطرح الحلول لها، كما يمكن الاعتماد عليه في تقديم ملخص للأفكار والنقاط الرئيسية التي تمت مناقشتها أثناء جلسة الاجتماع.

ختاماً: أصبح GPT-4o حالياً متاح لبعض المستخدمين وقد أعلنت OpenAI أنه سيتوفر بشكل مجاني لمستخدمي ChatGPT في أقرب وقت ممكن، كما سيتمكن المشتركين بالخدمة المدفوعة ChatGPT Plus من الاستفادة من 5 أضعاف عدد المطالبات التي يتيحها النموذج في الساعة الواحدة للمشتركين في الخدمة المجانية.

GPT-4o متاح كتطبيق لمستخدمي أجهزة الماك من شركة أبل وقد أتاحت OpenAI للمطورين القدرة على الوصول إلى النموذج وإجراء التعديلات عليه من خلال واجهات برمجة التطبيقات (API) الأسرع والأفضل من واجهة GPT-4 Turbo.

مواضيع قد تهمك:

مواصفات وسعر هاتف Poco F6 بوكو اف 6.

أفضل التطبيقات الجديدة للأندرويد والآيفون لهذا الأسبوع (2-6-24).

google-playkhamsatmostaqltradent