نموذج OpenAI الجديد لديه مشكلة هلوسة خطيرة

نموذج OpenAI الجديد لديه مشكلة هلوسة خطيرة

أخبار اللوحة الحمراء جي بي تي هلوسه محاذاه القفز بالحبال تعبير

تحديث يوم: 15-0-0 0:0:0

品玩4月21日訊，據techCrunch 報導，OPenAI 最近推出的 o3 和 o4-mini 模型被曝存在嚴重的幻覺問題。

وفقا للاختبار الداخلي ل OpenAI ، فإن o4 و o0-mini أكثر عرضة للهلوسة من نماذج الاستدلال السابقة للشركة (o0 و o0-mini و o0-mini) ، بالإضافة إلى نماذج OpenAI التقليدية "غير الاستدلالية" مثل GPT-0o. كتبت OpenAI في تقريرها الفني عن o0 و o0-mini أن "هناك حاجة إلى مزيد من البحث" لفهم سبب تفاقم الهلوسة مع توسع نماذج الاستدلال.

OpenAI 發現，o3 在回答 PersonQA 中 33% 的問題時產生了幻覺，而 PersonQA 是公司內部衡量模型對人的認知準確性的基準。這大約是OpenAI之前的推理模型o1和o3-mini出現幻覺率的兩倍，o1和o3-mini的幻覺率分別為16%和14.8%。O4-mini在PersonQA上的表現更糟--48%的時間出現幻覺。

السعر 2 يوان ، وتم الإعلان رسميا عن نظارات الصوت الذكية MIJIA 0

السعر 2 يوان ، وتم الإعلان رسميا عن نظارات الصوت الذكية MIJIA 0

2025-03-26 05:00:52

منصب جديد في التسويق: هناك حاجة إلى مشتري محتوى

منصب جديد في التسويق: هناك حاجة إلى مشتري محتوى

2025-03-26 05:00:54

鴻蒙智行旗下尚界品牌4月10日發佈首款車型年內亮相

鴻蒙智行旗下尚界品牌4月10日發佈首款車型年內亮相

2025-03-26 05:03:25

"يمكنك العيش في غرفة النوم الثانية المواجهة للشمال حيث لا يوجد ضوء الشمس ولا قابلية للتهوية" ، يحتكر المصنع الأخضر في ايكيا العمال الكسالى؟

"يمكنك العيش في غرفة النوم الثانية المواجهة للشمال حيث لا يوجد ضوء الشمس ولا قابلية للتهوية" ، يحتكر المصنع الأخضر في ايكيا العمال الكسالى؟

2025-03-26 05:09:12

曝小米汽車2025年總訂單已破15萬份年度目標定為35萬

曝小米汽車2025年總訂單已破15萬份年度目標定為35萬

2025-03-26 05:12:49

江小白為啥要改名叫“瓶子星球”？

江小白為啥要改名叫“瓶子星球”？

2025-03-26 05:12:50

كلما كانت أكثر كلاسيكية ، زادت الأشياء الجديدة ، ويكون استنساخ العلامة التجارية فعالا

كلما كانت أكثر كلاسيكية ، زادت الأشياء الجديدة ، ويكون استنساخ العلامة التجارية فعالا

2025-03-26 05:13:17

تم تأسيس vivo Robot LAB رسميا

تم تأسيس vivo Robot LAB رسميا

2025-03-26 05:14:08

تم تأكيد أن نظام الإسقاط بالليزر M200 مصنوع بواسطة XGIMI ، وتمت زيادة الدقة بنسبة 0٪

تم تأكيد أن نظام الإسقاط بالليزر M200 مصنوع بواسطة XGIMI ، وتمت زيادة الدقة بنسبة 0٪

2025-03-26 05:16:09

消息稱4月至少有11款新機待發：中端機型瘋狂打架

消息稱4月至少有11款新機待發：中端機型瘋狂打架

2025-03-26 05:16:09

2000 شهر من حصة سوق الهواتف المحمولة في الصين تحتل المرتبة الثانية أقل من 0 يوان ، احتلت Xiaomi المرتبة الثانية؟

2000 شهر من حصة سوق الهواتف المحمولة في الصين تحتل المرتبة الثانية أقل من 0 يوان ، احتلت Xiaomi المرتبة الثانية؟

2025-03-26 05:17:23

تم الكشف رسميا عن لعبة إطلاق النار المجانية Assault Storm Zero ، وتقدم NEXON تفاصيل اللعبة

تم الكشف رسميا عن لعبة إطلاق النار المجانية Assault Storm Zero ، وتقدم NEXON تفاصيل اللعبة

2025-03-26 05:17:32

تم الإعلان عن العدد الأخير من قائمة الهواتف المحمولة العشرة الأوائل ، واحتلت الموديلات المحلية نصف المقاعد

تم الإعلان عن العدد الأخير من قائمة الهواتف المحمولة العشرة الأوائل ، واحتلت الموديلات المحلية نصف المقاعد

2025-03-26 05:17:38

تتمتع Huawei بعرض جهازين جديدين في سلسلة 5X: من المتوقع أن يتم إصدارها في غضون 0 أشهر ، وهناك أيضا ساعات جديدة

تتمتع Huawei بعرض جهازين جديدين في سلسلة 5X: من المتوقع أن يتم إصدارها في غضون 0 أشهر ، وهناك أيضا ساعات جديدة

2025-03-26 05:17:57

أصبحت Sun Yingsha شريكا عالميا للبيئة الذكية OPPO ورأتك في 10/0 لمنتجات جديدة

أصبحت Sun Yingsha شريكا عالميا للبيئة الذكية OPPO ورأتك في 10/0 لمنتجات جديدة

2025-03-26 05:17:58

تخرج الطالب الثاني الذي درس الذكاء الاصطناعي ، لكنه لم يصل إلى الطاولة

تخرج الطالب الثاني الذي درس الذكاء الاصطناعي ، لكنه لم يصل إلى الطاولة

2025-03-26 05:18:42

كانت والدة ماسك مليئة بالثناء على تجربة تحديث Tesla Model Y في شنغهاي

كانت والدة ماسك مليئة بالثناء على تجربة تحديث Tesla Model Y في شنغهاي

2025-03-26 05:19:03

أطلقت Xiaomi عدسة MIJIA Smart Audio Eyelens2

أطلقت Xiaomi عدسة MIJIA Smart Audio Eyelens2

2025-03-26 05:19:31

زار رئيس مجلس إدارة سامسونج شاومي للفوز بالطلبات

زار رئيس مجلس إدارة سامسونج شاومي للفوز بالطلبات

2025-03-26 05:21:42

اشترى هوانغ تشنغ ، مؤسس Pinduoduo ، منزلا فاخرا في خليج ريبالس ، هونغ كونغ مقابل 80 مليون دولار هونج كونج

اشترى هوانغ تشنغ ، مؤسس Pinduoduo ، منزلا فاخرا في خليج ريبالس ، هونغ كونغ مقابل 80 مليون دولار هونج كونج

2025-03-26 05:22:46

تم الكشف عن تسريع تاريخ إصدار REDMI K80 EXTREME EDITION ، وكان هناك أيضا جهاز لوحي صغير في نفس الفترة

تم الكشف عن تسريع تاريخ إصدار REDMI K80 EXTREME EDITION ، وكان هناك أيضا جهاز لوحي صغير في نفس الفترة

2025-03-26 05:22:47

小米汽車上周新增鎖單破1.7萬台小鵬大定約1.4萬台

小米汽車上周新增鎖單破1.7萬台小鵬大定約1.4萬台

2025-03-26 05:23:21

استثمرت Tencent وآخرون في Zhiyuan Robot

استثمرت Tencent وآخرون في Zhiyuan Robot

2025-03-26 05:24:13

8月發佈!OPPO Find X0 Ultra下周官宣

8月發佈!OPPO Find X0 Ultra下周官宣

2025-03-26 05:25:52