أخر الاخبار

وحدة المعالجة المركزية الفردية تتفوق على الفائزين بالميداليات الذهبية في المنظمة الدولية للرياضيات (IMO)، وشركتي OpenAI وAdobe تستخدمان بيانات YouTube وبيانات Midjourney

  وحدة المعالجة المركزية الفردية  تتفوق على الفائزين بالميداليات الذهبية في المنظمة الدولية للرياضيات (IMO)، وشركتي OpenAI وAdobe تستخدمان بيانات YouTube وبيانات Midjourney

أخبار الذكاء الاصطناعي الأخيرة

شهدت هذا الأسبوع جولة جديدة من التطورات الملحوظة في عالم الذكاء الاصطناعي، حيث أصبحت OpenAI وAdobe غامضتين فيما يتعلق ببيانات التدريب، وتفوقت النماذج على بعضها البعض وعلى الفائزين بميداليات المنظمة الدولية للرياضيات (IMO). أعلنت الشركات التكنولوجية العملاقة Google وMeta استثماراتها في رقاقات الذكاء الاصطناعي، بينما قامت Mistral وX.ai بإطلاق نماذج كبيرة جديدة، وتتقدم النماذج اللغوية الصغيرة مرة أخرى.


أبرز المستجدات لهذا الأسبوع تشمل:

  • قدمت Google وMeta رقاقات ذكاء اصطناعي جديدة قوية، بينما قدمت Intel مسرع ذكاء اصطناعي جديد، الذي يقدم تحسينات كبيرة على نماذج Nvidia.
  • قد يواجه OpenAI دعوى قانونية من Google بسبب ادعاء استخدامه أكثر من مليون ساعة من مقاطع فيديو YouTube لتدريب GPT-4، مما قد ينتهك شروط خدمة YouTube، بينما استخدمت Adobe Midjourney لتدريب Firefly.
  • قامت X.ai بتقديم نموذجها المتعدد الوسائط Grok-1.5V، الذي قدم تقدمًا كبيرًا في فهم ومعالجة المعلومات البصرية.
  • أطلقت Mistral LLM الجديدة الخاصة بهم، Mistral8x22B، التي تفوقت على GPT-3.5 ولكنها لا تزال تتأخر وراء GPT-4 عبر مختلف المقاييس.
  • أجرت Anthropic دراسة تقيس إقناعية النماذج اللغوية الطويلة (LLMs)، وتشير إلى أن النماذج الحديثة قد تنافس إقناعية البشر.

قدمت Google وMeta رقاقات ذكاء اصطناعي جديدة قوية، بينما قدمت Intel مسرع ذكاء اصطناعي جديد، الذي يقدم تحسينات كبيرة على نماذج Nvidia.

سوق رقائق الذكاء الاصطناعي يشهد نموًا سريعًا مع إطلاق شركتي التكنولوجيا العملاقتين Google وMeta لأحدث رقائقهما.

في مؤتمر Google Cloud Next، أعلنت Google عن إطلاق Cloud TPU v5p، أحدث رقاقة ذكاء اصطناعي لديها، والتي يمكنها تدريب النماذج اللغوية الطويلة (LLMs) بسرعة تقريبًا ثلاث مرات أسرع من الجيل السابق، TPU v4.

كما قامت Meta بتقديم رقاقتها الأحدث التي تحمل اسم Meta Training and Inference Accelerator (MTIA)، وهي رقاقة مخصصة تم تصميمها لتعزيز كفاءة التدريب والاستنتاج لنماذج التصنيف والتوصيات في Meta.

علاوة على ذلك، تهدف الرقاقة الجديدة MTIA إلى تحسين الأداء بشكل كبير، مع دعم خوارزميات التصنيف ونماذج الذكاء الاصطناعي الإنتاجية مثل نماذج اللغة LLaMa.

كما كشفت إنتل عن مسرعها الذكاء الاصطناعي الجديد الذي يحمل اسم Gaudi 3، الذي يوفر أداءً في الاستنتاج يصل إلى 50% أفضل وكفاءة طاقة تصل إلى 40% أفضل من رقاقة Nvidia H100 بتكلفة أقل.

قام الرئيس التنفيذي لشركة إنتل، بات جيلسينجر، بتقديم Gaudi 3 في حدث Intel Vision. (المصدر)

قد يواجه OpenAI دعوى قانونية من Google بسبب ادعاء استخدامه أكثر من مليون ساعة من مقاطع فيديو YouTube لتدريب GPT-4، مما قد ينتهك شروط خدمة YouTube، بينما استخدمت Adobe Midjourney لتدريب Firefly.

OpenAI تستخدم مقاطع فيديو من YouTube لتدريب مُنشئ الفيديو Sora

كنا نتساءل ما إذا كانت OpenAI تستخدم مقاطع فيديو من YouTube لتدريب مُنشئ الفيديو Sora، حيث أشار الرئيس التنفيذي لـ YouTube، Neal Mohan، إلى أن ذلك سيكون "انتهاكًا لشروط وخدمات المنصة".

يُزعم أن OpenAI قامت بتحويل أكثر من مليون ساعة من مقاطع فيديو YouTube إلى نصوص مكتوبة لتدريب نموذجها الرئيسي للغة الطويلة، GPT-4. وهذا يتعارض مع سياسة YouTube المعلنة ضد مثل هذه الممارسات.

ذكر Mohan الآن أن "شروط الخدمة لا تسمح بأشياء مثل تحويل النصوص ومقاطع الفيديو ليتم تنزيلها". كما يُفيد التقرير أن الرئيس التنفيذي Greg Brockman شارك مباشرة في جمع بيانات YouTube لأغراض التدريب.

قد نشهد عواقب قانونية خطيرة لـ OpenAI حيث يمكن لشركة Google رفع دعوى قانونية. ولم ترد OpenAI وGoogle بعد على الادعاءات، لذلك سنضطر إلى الانتظار ومتابعة التطورات.

 5%  من مجموعة بيانات تدريب Firefly من Adobe كانت من منصة Midjourney

على نفس النحو، تم تدريب مولد الصور الذكي Firefly من Adobe باستخدام صور مولدة بواسطة الذكاء الاصطناعي، بما في ذلك تلك التي تم إنتاجها من قبل منافسين مثل Midjourney. ومع وجود 5% من صور تدريب Firefly تمثلها صور مولدة بواسطة الذكاء الاصطناعي من منصات أخرى، هناك مخاوف حول الآثار الأخلاقية (في حين أن الجوانب القانونية للصور المولدة بواسطة الذكاء الاصطناعي لم تحدد بعد).

ومن أجل الحصول على المزيد من البيانات التدريبية، قامت Adobe أيضًا بتحفيز المساهمين عن طريق دفع مبالغ مالية مقابل الصور المقدمة إلى Firefly - حتى لو كانت تلك الصور مولدة بواسطة الذكاء الاصطناعي.

قامت X.ai بتقديم نموذجها المتعدد الوسائط Grok-1.5V، الذي قدم تقدمًا كبيرًا في فهم ومعالجة المعلومات البصرية.

تم تقديم Grok 1.5 Vision من X.ai

Grok 1.5V هو نموذج متعدد الوسائط من الجيل الأول من Grok قادر على معالجة مجموعة متنوعة من المعلومات البصرية، مثل:

- لقطات الشاشة
- الصور
- الوثائق
- الرسوم التوضيحية
- الرسوم البيانية

جدول مقارنة الأداء لنموذج Grok-1.5V. (المصدر)




يمكن لـ Grok 1.5V مواكبة أو حتى تجاوز نماذج متعددة الوسائط رائدة أخرى مثل GPT-4V عبر مجموعة متنوعة من المقاييس الحالية ويقدم مقياسًا جديدًا لفهم الفضاء في العالم الحقيقي يُسمى RealWorldQA.

يقيم RealWorldQA قدرة النموذج على فهم سيناريوهات الفضاء الحقيقية من خلال أكثر من 700 صورة مع أسئلة مرتبطة بها. تم إطلاقه للاستخدام المجتمعي.

قدمت X.ai عرضًا لـ Grok-1.5V يترجم مخطط لعبة تخمين إلى رمز Python قابل للتنفيذ، مما يظهر تطبيقه العملي في البرمجة من المدخلات البصرية.

أطلقت Mistral LLM الجديدة الخاصة بهم، Mistral8x22B، التي تفوقت على GPT-3.5 ولكنها لا تزال تتأخر وراء GPT-4 عبر مختلف المقاييس.

طرحت شركة Mistral نموذجها الجديد، Mixtral8x22B

إنه نموذج للغة طويل الأمد جديد يحتوي على 176 مليار معلمة ونافذة سياقية تصل إلى 65,000 رمز، بهدف تجاوز سابقته والمنافسين مثل GPT-3.5 من OpenAI.

يتفوق Mixtral 8x22B على GPT-3.5 ولكنه يبقى دون GPT-4 في مقارنة الأداء. (المصدر)

يعتبر Mixtral مفتوح المصدر، مما يساعد على تمكين الوصول إلى نماذج LLM ذات آخر تقنية لأن أي شخص يمكنه الوصول إليها وتعديلها. يتزامن هذا الإصدار الجديد مع إصدارات أخرى كبيرة من نماذج LLM، بما في ذلك Google Gemini Pro 1.5 في Google Cloud Next و GPT-4 Turbo من OpenAI.


أجرت Anthropic دراسة تقيس إقناعية النماذج اللغوية الطويلة (LLMs)، وتشير إلى أن النماذج الحديثة قد تنافس إقناعية البشر.


مشروع قانون الشفافية في تدريب الذكاء الاصطناعي من شيف

مشروع القانون الجديد الذي قدمه النائب آدم شيف يتطلب من شركات الذكاء الاصطناعي الكشف عن المواد المحمية بحقوق الطبع والنشر المستخدمة في مجموعات بيانات التدريب إلى مكتب حقوق الطبع والنشر قبل إطلاق أنظمة الذكاء الاصطناعي.

التقدم في أبحاث الذكاء الاصطناعي

أطلقت Anthropic وجهة نظر مثيرة حول كيفية اقتراب قدرة نماذج اللغة الطويلة على الإقناع من قدرة البشر في هذا الجانب. وشملت التطورات الأخرى حلاً جديدًا لتحسين سلامة نماذج اللغة الطويلة الذاتية التشغيل، بالإضافة إلى استخدام نماذج أصغر وأرخص في التدريب كبديل للنماذج الأكبر.

LLMs مقنعة كبشر؟

مقارنة إقناع النماذج. (المصدر)

كان قياس إقناع محتوى الذكاء الاصطناعي بدقة أمرًا صعبًا. لقد واجهت صعوبات في تعميم النتائج المختبرية إلى سيناريوهات العالم الحقيقي حيث تؤثر العوامل الديناميكية على الإقناع.

تقوم الورقة الجديدة من Anthropic بتقييم إقناع نماذج اللغة عبر أجيال مختلفة من نماذجها وتقارنها بالحجج المكتوبة من قبل البشر. كما أبرزت أن النماذج الأحدث والأكبر حجمًا أكثر إقناعًا.

كان ذلك واضحًا مع النموذج الأحدث، Claude 3 Opus، الذي كان قريبًا من إقناع البشر في التجارب المُجراة بشكل مُحكم.


الحد من مخاطر مخرجات LLM المستقلة

السلامة والثقة في نماذج اللغة الطويلة الذاتية التشغيل التي تقوم بأعمال في العالم الحقيقي دون إشراف مستمر من البشر هي مصدر قلق كبير.

تطور نماذج اللغة الطويلة من الروبوتات الدردشة إلى التطبيقات والخدمات المصغرة. (المصدر)

تهدف هذه الورقة إلى معالجة هذه المسألة من خلال تقديم مفهوم "التحقق بعد الحقيقة" لتطبيقات نماذج اللغة الطويلة الذاتية التشغيل. وهو يركز على التحقق من الإجراءات بعد التنفيذ بدلاً من قبله، مما يساعد في التعامل مع عدم التنبؤ والمخاطر في إخراج هذه النماذج.

كما تقترح آليات مثل "التراجع" و"حصر الأضرار" للتخفيف من المخاطر الناتجة عن الإجراءات غير المقصودة.

يتم تقديم محرك التنفيذ جوريلا (GoEX) كحل تشغيلي يستخدم هذه المفاهيم لجعل نماذج اللغة الطويلة الذاتية التشغيل أكثر أمانًا وموثوقية في النشر.


المصدر 

اتمنى ان ينال المقال اعجابكم و حرصناً منا على تزويدكم ب مصدر المعلومة وضعنا لكم العديم من الروابط للمصادر, اذا اعجبك المقال اتمنى منك ترك تعليق لكي تشجعنا على نشر المزيد

310TECH
بواسطة : 310TECH
"310Tech" هي مدونة في عالم التكنولوجيا، حيث نسعى جاهدين لتقديم أحدث الأدوات والحلول التقنية التي تسهل حياة القراء وتجعلها أكثر سلاسة وفاعلية. نحن نتفهم تمامًا تحديات الحياة اليومية ونسعى جاهدين لتقديم حلول مبتكرة تلبي احتياجاتهم بدقة وفعالية. من التطبيقات الذكية إلى الأجهزة الذكية وكل ما بينهما، يقدم 310Tech باستمرار أدوات تقنية متطورة تجمع بين الأداء المتميز والسهولة في الاستخدام. هدفنا هو تمكين القراء وجعل حياته اليومية أكثر يسرًا وفعالية من خلال الابتكار التكنولوجي المتقدم.
تعليقات



    حجم الخط
    +
    16
    -
    تباعد السطور
    +
    2
    -