أفضل 5 LLMs مجانية مفتوحة المصدر في عام 2024
LLMs موجودة في كل مكان في الوقت الحاضر ، ولا تحتاج إلى مقدمة. سواء كنت تعمل في مجال التكنولوجيا أم لا ، فمن المحتمل أنك واجهت أو تستخدم حاليا شكلا من أشكال LLM على أساس يومي. تشمل أبرز LLMs في الوقت الحالي GPT من OpenAI و Claude من Anthropic و Gemini من Google.
ومع ذلك ، غالبا ما تعمل هذه LLMs الشائعة كأنظمة مجردة أو صندوق أسود ، مما يثير مخاوف بشأن خصوصية البيانات والشفافية. لمعالجة مثل هذه المشكلات ، تتوفر العديد من LLMs مفتوحة المصدر ، مما يسمح للمستخدمين بنشرها على الأجهزة أو الخوادم الخاصة براحة البال.
يشير المصدر المفتوح إلى البرامج أو المنتجات الموزعة مع شفرة المصدر الخاصة بها المتاحة مجانا للفحص والتعديل والتوزيع. تمكن إمكانية الوصول هذه المستخدمين من فهم البرنامج وتحسينه والمساهمة في تطويره.
فيما يلي بعض من أفضل LLMs مفتوحة المصدر المتاحة حاليا:
اللاما 2
Llama 2 هو ماجستير في القانون مفتوح المصدر تم تطويره بواسطة Meta ، ويتم تقديمه مجانا للأغراض التجارية والبحثية. يتم تدريب نماذج اللاما 2 على تريليوني رمز وتفتخر بضعف طول سياق اللاما 1.
تؤثر معلمات النموذج بشكل مباشر على قدرته على فهم النص ، حيث تقدم النماذج الأكبر أداء أفضل على حساب زيادة الحجم ومتطلبات الموارد.
المتغيرات المتاحة: معلمات 7B و 13B و 70B
نافذة السياق: 4096 الرموز
اللغات المدعومة: أفضل أداء في اللغة الإنجليزية
ميكسترال 8x7B
Mixtral 8x7B ، الذي طورته Mistral الذكاء الاصطناعي ، هو LLM يحتوي على 46.7B إجمالي المعلمات. على الرغم من حجمه ، فإنه يحافظ على سرعة الاستدلال والتكلفة المماثلة للنماذج ثلث حجمه. يتفوق نموذج خليط الخبراء (MoE) للمحولات (MoE) الذي يعمل بوحدة فك التشفير فقط بشكل كبير على LLama 2 و GPT-3.5 في بعض المعايير.
المتغيرات المتاحة: صغيرة وصغيرة ومتوسطة وكبيرة (مرتبة من فعالة من حيث التكلفة إلى عالية الأداء)
نافذة السياق: 32000 رمز (على ميسترال كبير)
اللغات المدعومة: الإنجليزية، الفرنسية، الإسبانية، الألمانية، الإيطالية (على ميسترال لارج)
صقر
فالكون، الذي طوره معهد الابتكار التكنولوجي (TII) في أبوظبي، هو برنامج ماجستير آخر مفتوح المصدر ومفتوح المصدر. بعد إطلاقه ، احتل Falcon 40B المركز #1 في لوحة المتصدرين في Hugging Face لنماذج اللغات الكبيرة مفتوحة المصدر (LLMs) لمدة شهرين. ومع متغير 180B، يعزز معهد دراسات الترجمة معرفة النموذج وقدراته على فهم البيانات. Falcon 180B هو نموذج لغوي فائق القوة تم تدريبه على 3.5 تريليون رمز.
المتغيرات المتاحة: فالكون 40B و فالكون 180B
نافذة السياق: 4096 الرموز
اللغات المدعومة: الإنجليزية والألمانية والإسبانية والفرنسية ، مع دعم محدود للإيطالية والبرتغالية والبولندية والهولندية والرومانية والتشيكية والسويدية.
وردة
BLOOM هو نموذج لغة كبيرة الانحدار الذاتي (LLM) تم تطويره بواسطة Big Science. تم تدريب BLOOM على معلمات 176B ، وهو يتفوق في توليد استمرار النص من المطالبات باستخدام كميات هائلة من البيانات النصية والموارد الحسابية على نطاق صناعي.
المتغيرات المتاحة: بلوم-560 م ، بلوم-1ب1 ، بلوم-1ب7 ، بلوم-3ب ، بلوم-7ب1 ، بلوم 176 ب
نافذة السياق: 2048 الرموز
اللغات المدعومة: 46 لغة طبيعية (بكميات متفاوتة من البيانات ، من 30٪ للغة الإنجليزية إلى 0.00002٪ ل Chi Tumbuka)
جيما
جيما ، أحدث ماجستير مفتوح من Google ، يتبع نجاح الجوزاء. جيما هي عائلة من نماذج اللغات الكبيرة ذات الأوزان المفتوحة (LLM) من Google DeepMind ، المبنية على أبحاث وتكنولوجيا Gemini. في حين أن أوزان النموذج يمكن الوصول إليها بحرية ، فقد تختلف شروط الاستخدام المحددة وإعادة التوزيع والملكية المتغيرة وقد لا تستند إلى ترخيص مفتوح المصدر.
المتغيرات المتاحة: جيما 2 ب وجيما 7 ب
نافذة السياق: 8192 توكنز
اللغات المدعومة: الإنكليزية
استنتاج
نحن في Cody نعطي الأولوية لنهج محايد للنموذج عندما يتعلق الأمر ب LLMs ، حيث نقدم نظاما أساسيا يمكنك من إنشاء روبوتات مخصصة مصممة خصيصا لحالة الاستخدام الفريدة الخاصة بك. مع مجموعة متنوعة من خيارات LLM المتاحة ، فأنت لست مقيدا بمزود واحد ، مما يمنحك حرية اختيار الأنسب لمتطلباتك.
من خلال كودي ، يمكن للشركات الاستفادة من الذكاء الاصطناعي لتطوير مساعدين أذكياء مخصصين لاحتياجاتهم الدقيقة. هذه المرونة تجعل كودي إضافة واعدة إلى عالم حلول الأعمال التي تعتمد على الذكاء الاصطناعي.