تقنيات عربية وعالمية

شركة OpenAI تطلق نموذجين جديدين للذكاء الاصطناعي..وهذه اهم المميزات

أعلنت شركة OpenAI إطلاق نموذجان جديدان للذكاء الاصطناعي ( gpt-oss-120b وgpt-oss-20b) بتكلفة منخفضة.

وإوضحت الشركة عبر بيان لها  على موقعها الإلكتروني ،اطلع عليه”اتصالات اليوم” أن النموذجان لغويان ومتطوران و يُقدمان أداءً قويًا في العالم الحقيقي

وأشارت الشركة إلى أن النموذجان يتوفران بموجب ترخيص Apache 2.0 المرن، ويتفوقان على النماذج المفتوحة المماثلة في الحجم في مهام الاستدلال، ويُظهران قدرات استخدام أدوات قوية، ومُحسّنين للنشر الفعال على الأجهزة الاستهلاكية،و تم تدريبهما باستخدام مزيج من التعلم التعزيزي وتقنيات مُستندة إلى أحدث نماذج OpenAI الداخلية، بما في ذلك o3 وأنظمة رائدة أخرى.

وأضافت الشركة أن النموذج gpt-oss-120b يحقق تكافؤًا شبه كامل مع OpenAI o4-mini في معايير الاستدلال الأساسية، ويعمل بكفاءة على وحدة معالجة رسومية واحدة بسعة 80 جيجابايت. أما نموذج gpt-oss-20b فيقدم نتائج مماثلة لنتائج OpenAI o3-mini في معايير الاستدلال الشائعة، ويمكن تشغيله على أجهزة طرفية بذاكرة 16 جيجابايت فقط، مما يجعله مثاليًا للاستخدام على الجهاز، والاستدلال المحلي، والتكرار السريع دون الحاجة إلى بنية تحتية مكلفة..ويستعرض معكم موقعكم المفضل “اتصالات اليوم“مزايا النموذجان وفقا لبيان الشركة ،كالتالي:

مزايا نماذج الذكاء الاصطناعي الجديدة لشركة OpenAI

وأوضحت الشركة أن النموذجين يتميزان بالأتي

-أداء قوي في استخدام الأدوات، واستدعاء الدوال قليلة اللقطات، واستدلال CoT (كما يتضح من نتائج مجموعة تقييم الوكلاء Tau-Bench) وHealthBench (حتى أنه يتفوق على النماذج المملوكة مثل OpenAI o1 وGPT-4o).

– النماذج متوافقة مع واجهة برمجة التطبيقات الخاصة بنا Responses API(يفتح في نافذة جديدة)وهي مصممة للاستخدام ضمن سير عمل الوكالة مع متابعة استثنائية للتعليمات، واستخدام أدوات مثل البحث على الويب أو تنفيذ أكواد بايثون، وقدرات استدلالية – بما في ذلك القدرة على تعديل جهد الاستدلال للمهام التي لا تتطلب استدلالًا معقدًا و/أو تستهدف مخرجات نهائية منخفضة جدًا في زمن الوصول.

– قابلة للتخصيص بالكامل، وتوفر سلسلة كاملة من الأفكار (CoT)، وتدعم المخرجات المنظمة .(يفتح في نافذة جديدة).

-تستخدم النماذج أنماط انتباه كثيفة ومتفرقة محلية النطاق بالتناوب، على غرار GPT-3 [3] . من أجل الاستدلال وكفاءة الذاكرة، تستخدم النماذج أيضًا انتباهًا متعدد الاستعلامات المجمع، بحجم مجموعة يبلغ 8.

-تستخدم النماذج الجديدة .التضمين الموضعي الدوار (RoPE [4] ) للترميز الموضعي، وندعم بشكل أصلي أطوال سياق تصل إلى 128 كيلو بايت.

– تقييمات شاملة للسلامة، حيث تم اضافة مستوى تقييم إضافيًا من خلال اختبار نسخة مُعدّلة بدقة من gpt-oss-120b ضمن إطار عملنا للاستعداد .(يفتح في نافذة جديدة)تُقدم نماذج gpt-oss أداءً يُضاهي نماذجنا الرائدة في معايير السلامة الداخلية، مما يُوفر للمطورين نفس معايير السلامة المُستخدمة في نماذجنا الملكية الحديثة. نُشارك نتائج هذا العمل والمزيد من التفاصيل في ورقة بحثية .(يفتح في نافذة جديدة)وفي بطاقة النموذج(يفتح في نافذة جديدة)لقد تمت مراجعة منهجيتنا من قبل خبراء خارجيين، وهي تمثل خطوة إلى الأمام في وضع معايير السلامة الجديدة للنماذج ذات الوزن المفتوح.

-عملت الشركة مع شركاء مبكرين مثل AI Sweden(يفتح في نافذة جديدة), برتقالي(يفتح في نافذة جديدة)، و ندفة الثلج(يفتح في نافذة جديدة)للتعرف على التطبيقات العملية لنماذجنا المفتوحة، بدءًا من استضافة هذه النماذج محليًا لضمان أمن البيانات وصولًا إلى ضبطها بدقة على مجموعات بيانات متخصصة. يسعدنا توفير هذه النماذج المفتوحة الرائدة لتمكين الجميع – من المطورين الأفراد إلى الشركات الكبرى والحكومات – من تشغيل وتخصيص الذكاء الاصطناعي على بنيتهم التحتية الخاصة. وبفضل النماذج المتاحة في واجهة برمجة التطبيقات (API)، يمكن للمطورين اختيار الأداء والتكلفة وزمن الوصول اللازمين لتشغيل سير عمل الذكاء الاصطناعي.

التدريب المسبق وهندسة النموذج

أشارت الشركة إلى أنه تم تدريب نماذج gpt-oss باستخدام أحدث تقنياتنا للتدريب المسبق واللاحق، مع التركيز بشكل خاص على التفكير المنطقي والكفاءة وسهولة الاستخدام في بيئات النشر المتنوعة. في حين أننا أتاحت نماذج أخرى، بما في ذلك Whisper و CLIP ، بشكل مفتوح، فإن نماذج gpt – oss هي أول نماذج لغات مفتوحة .

وأضحت الشركة أن كل نموذج هو محول يستفيد من مزيج الخبراء (MoE [2] ) لتقليل عدد المعلمات النشطة اللازمة لمعالجة المدخلات. ينشط gpt-oss-120b 5.1 مليار معلمة لكل رمز، بينما ينشط gpt-oss-20b 3.6 مليار. تحتوي النماذج على 117b و 21b إجمالي المعلمات على التوالي.

مقالات ذات صلة

زر الذهاب إلى الأعلى