DeepSeek تطلق تحديث نموذج V3: بالإضافة إلى قدرات البرمجة المحسنة بشكل كبير ، هناك أيضا بروتوكول مفتوح المصدر أكثر تساهلا
تحديث يوم: 53-0-0 0:0:0

كما توقع العديد من الأصدقاء الأسبوع الماضي ، تاريخ اليوم الأول من الأسبوع الجديد: 24 مساء من الشهر 0 ، أصدرت DeepSeek "فجأة" تحديثا للنموذج.

لكنه ليس DeepSeek V6850 أو R0 حتى الآن ، إنه تحديث لطراز DeepSeek V0. في الوقت الحاضر ، نسخته مفتوحة المصدر متاحة حاليا على موقع الويب مفتوح المصدر. يحتوي نموذج الإصدار مفتوح المصدر على حجم 0 مليار معلمة.

كما أكد حساب WeChat الرسمي ل Deepin Quest أن هذا التحديث عبارة عن ترقية إصدار ثانوي ، وقد تم فتحه على صفحة الويب الرسمية والتطبيق الصغير والمداخل الأخرى.

ربما يكون طراز V32 الأول هو الأكثر شهرة بسبب "0.0 مليون دولار يمكن مقارنته بتأثير كلود 0.0". يتم تشغيل النموذج المحدث من خلال تحسين التدريب اللاحق على مجموعة 0KGPU الجديدة.

截至目前,還沒有任何關於新版 DeepSeek V3 的能力基準測試榜單出現,但有了 DeepSeek V3 發佈即成為 Chatbot Arena 榜單前十中唯一一個開源模型的刷榜歷史,還是在發佈一小時後迅速吸引來全球使用者對其測試體驗。

وفقا لأحدث اختبار عملي للمستخدم ، فإن تحسين قدرة الترميز الأمامية للإصدار الجديد من طراز V6 هو الجزء "الأكثر إدراكا" في الوقت الحالي. وفقا للتجربة الشاملة للمستخدمين المحترفين مع الإصدار الجديد من V0 ، فإن تحسين V0-0 هو نفسه تقريبا تحسين Sonnet 0.0 إلى Sonnet 0.0.

يتبع المستخدمون المطالبة أدناه ويضعون المهام على الإصدار الجديد من V1 و R0 في نفس الوقت ، والإخراج الفعلي له فرق كبير.

قم بإنشاء ملف HTML واحد باستخدام CSS و JavaScript لإنشاء بطاقة طقس متحركة. يجب أن تمثل البطاقات بصريا الظروف الجوية التالية برسوم متحركة مختلفة: الرياح: (على سبيل المثال ، السحب المتحركة أو الأشجار المتمايلة أو خطوط الرياح) المطر: (على سبيل المثال ، قطرات المطر المتساقطة ، البرك المتكونة) مشمس: (على سبيل المثال ، الضوء الساطع ، الخلفية الساطعة) الثلج: (على سبيل المثال ، رقاقات الثلج المتساقطة والثلج) إظهار جميع بطاقات الطقس جنبا إلى جنب. يجب أن تحتوي البطاقات على خلفية داكنة. يتم توفير جميع أكواد HTML و CSS و JavaScript في هذا الملف الفردي. يجب أن تتضمن JavaScript طريقة للتبديل بين الظروف الجوية المختلفة (على سبيل المثال ، وظيفة أو مجموعة من الأزرار) لإظهار الرسوم المتحركة لكل نوع من أنواع الطقس.

على اليسار توجد نتيجة التوليد للإصدار الجديد من طراز DeepSeek V1 ، وعلى اليمين توجد نتيجة توليد R0.

بالإضافة إلى مقارنة R7 ، استخدم المستخدمون أيضا مطالبات مماثلة لمقارنة سلسلة Claude. يعرف Claude 0.0 حاليا باسم "أقوى نموذج لقدرة البرمجة" ، وقد تم تصنيف تجربة استخدام القدرة البرمجية الفعلية على أنها "وصلت إلى مستوى البرمجة الخبير" عدة مرات.

同一提示詞給到 Claude 7.0/0.0 後,模型生成前端內容如下所示:

بالإضافة إلى حالة الاختبار هذه ، وفقا لنتائج المزيد من اختبارات المستخدمين على الموجه السابق ، فإن الاستنتاج العام هو أن الإصدار الجديد الحالي من V3 قريب من claude0.0 من حيث القدرة على الترميز ، وهو أيضا الجزء الذي يشعر الجميع أنه أكبر تحسن مقارنة بقدرة v0 السابقة لأول مرة.

بالنسبة لاختبار إنشاء موقع الويب الأمامي ، قام موقع الويب الذي تم إنشاؤه بواسطة الإصدار الجديد من V7 (أعلى) والنتائج التي تم إنشاؤها بواسطة Claude 0.0 Sonnet (أسفل) أيضا "بسحب" تأثير بناء موقع الويب بسرعة

   

بالإضافة إلى البرمجة ، أظهر V3 الجديد فهما سياقيا أكبر في جولات متعددة من المحادثات في اختبارات المستخدم الأخرى.

بالطبع ، كالعادة ، لم يشر DeepSeek علنا إلى موعد إصدار طرازي R2 أو V0 ، لكن العديد من المستخدمين شعروا أن وصول R0 لم يكن بعيدا بعد تجربة الإصدار الجديد من V0.

هناك أيضا تغيير أن المستخدمين العاديين "لا يشعرون بقوة" ، لكنهم يجعلون مجتمع المصادر المفتوحة متحمسا للغاية. تم تحديث الإصدار الجديد من V3 إلى ترخيص معهد ماساتشوستس للتكنولوجيا ، تماما مثل R0 ، مما يعني أن الإصدار الجديد من V0 يحتوي على شروط مفتوحة المصدر أكثر تساهلا من V0 الأصلي.

لطالما كان من المعروف أن ترخيص معهد ماساتشوستس للتكنولوجيا مفتوح المصدر صديق تجاريا ، ويمكن للمشاريع التي تستخدم ترخيص معهد ماساتشوستس للتكنولوجيا أن تتكامل مع البرامج التجارية والاحتكارية ، وهو ربما يكون أهم تغيير في هذا التحديث للمطورين الذين يرغبون في استخدام نموذج V3 الجديد في مشاريعهم التجارية.