مقدمة
تُعتبر نماذج اللغة الكبيرة (LLMs) من أبرز التطورات في مجال أبحاث الذكاء الاصطناعي. لقد أحدثت هذه النماذج العامة تأثيرًا كبيرًا، حيث يمكنها التعامل مع مجموعة متنوعة من المهام اللغوية بناءً على تعليمات المستخدمين. ومع ذلك، تواجه الجامعات والمنظمات غير الربحية ومختبرات الأبحاث في الشركات الصغيرة صعوبة في إنشاء أو دراسة أو حتى استخدام LLMs، حيث أن القليل من المختبرات الصناعية التي تمتلك الموارد اللازمة والحقوق الحصرية يمكنها الوصول إليها بالكامل.
اليوم، نُقدم لكم BLOOM، أول نموذج لغة متعدد اللغات تم تدريبه بشفافية كاملة، لتغيير هذا الوضع. يُعتبر BLOOM نتيجة أكبر تعاون بين باحثي الذكاء الاصطناعي في مشروع بحثي واحد. بفضل 176 مليار معلمة، يمكن لـ BLOOM إنتاج نصوص بـ 46 لغة طبيعية و13 لغة برمجة. بالنسبة لمعظم هذه اللغات، مثل الإسبانية والفرنسية والعربية، سيكون BLOOM أول نموذج لغوي يتجاوز 100 مليار معلمة تم إنشاؤه على الإطلاق.
الميزات الرئيسية
استغرق تطوير BLOOM عامًا من العمل، بمشاركة أكثر من 1000 باحث من أكثر من 70 دولة و250 مؤسسة. تم تدريب النموذج على حاسوب Jean Zay الفائق في جنوب باريس، فرنسا، بفضل منحة حوسبة تقدر قيمتها بحوالي 3 ملايين يورو من الوكالات البحثية الفرنسية CNRS وGENCI. يمكن للباحثين الآن تنزيل BLOOM وتشغيله ودراسته لاستكشاف أداء وسلوك نماذج اللغة الكبيرة التي تم تطويرها مؤخرًا.
الاستخدامات
يمكن لأي فرد أو مؤسسة توافق على شروط ترخيص الذكاء الاصطناعي المسؤول للنموذج استخدامه والبناء عليه على جهاز محلي أو على مزود سحابي. نظرًا لأنه مدمج في نظام Hugging Face، فإن استخدامه سهل مثل استيراده باستخدام transformers وتشغيله باستخدام accelerate. في إطار التعاون والتحسين المستمر، نُصدر أيضًا، للمرة الأولى، نقاط التحقق الوسيطة وحالات المحسن للتدريب.
التسعير
إذا كنت لا تمتلك 8 وحدات A100 لتجربتها، فنحن بصدد إنهاء واجهة برمجة التطبيقات للاستدلال للاستخدام على نطاق واسع حتى بدون أجهزة أو هندسة مخصصة. في غضون ذلك، يمكنك بالفعل تجربة نسخة مبكرة على مركز HF للاختبارات السريعة والنماذج الأولية والاستخدامات ذات النطاق الأقل.
المستقبل
هذه هي البداية فقط. ستستمر قدرات BLOOM في التحسن مع استمرار ورشة العمل في التجربة والتعديل على النموذج. لقد بدأنا العمل لجعله أكثر قابلية للتوجيه مثل جهودنا السابقة T0++، ونتطلع إلى إضافة المزيد من اللغات، وضغط النموذج إلى نسخة أكثر قابلية للاستخدام بنفس مستوى الأداء، واستخدامه كنقطة انطلاق لهياكل أكثر تعقيدًا.
جميع التجارب التي أرادها الباحثون والممارسون دائمًا، بدءًا من قوة نموذج يتجاوز 100 مليار معلمة، أصبحت الآن ممكنة. BLOOM هو بذور عائلة حية من النماذج التي نعتزم تنميتها، وليس مجرد نموذج لمرة واحدة، ونحن مستعدون لدعم جهود المجتمع لتوسيعها.