以《大辭海》為“地基”,插上人工智能大模型的“翅膀”,3月25日,上海辭書出版社與百度、鯨湯(上海)智慧科技有限公司在滬發佈最新產品“辭文智慧知識審校系統”(簡稱“辭文”)。歷時兩年研發的該產品深度整合我國標誌性大型綜合性辭典《大辭海》中30多萬詞條的權威知識體系與文心大模型理解、生成、邏輯、記憶四大核心能力,成為國內首個融合權威工具書資源的智慧審校解決方案。
上海辭書出版社與百度、鯨湯(上海)智慧科技有限公司聯合發佈“辭文智慧知識審校系統”
近幾年,文本審校工具如雨後春筍不斷湧現,從早期的黑馬校對、方正審校到i校對、鳳凰智慧校對系統、蜜度校對通、果麥AI校對王等產品各有所長,融合權威辭書資源和大模型能力的“辭文智慧知識審校系統”瞄準了傳統文本審校在知識性、邏輯性方面的痛點,實現四大技術突破:一是精準的知識溯源能力,當發現錯誤時,系統不僅能指出問題所在,更能通過Agent技術精準定位到《大辭海》中的相關條目,展示完整的知識鏈條,讓用戶不僅知道“錯在哪裡”,更明白“正確的應該是什麼”;二是強大的多輪推理能力,可深入驗證文本多維度合理性,找出隱藏的邏輯謬誤,比如當審核一篇關於歷史人物的文章時,系統不僅是簡單地核對年代,而是會通過多重推理,驗證人物關係、歷史背景、事件順序等多個維度的合理性;三是動態的知識更新機制,當《大辭海》資料庫有更新時,系統能自動完成知識的同步;四是智慧的互動式審校流程,通過有效控制大模型的發散、幻覺問題,提供個性化的審校建議,這種人機協作的方式既保留人工審校的專業判斷,又發揮AI的效率優勢。
發佈會現場
通過高算力支援,該產品目前可在10分鐘之內完成40萬字文本量的審校,支援Word/WPS和PDF兩種主流文檔格式。樣本實測數據顯示,採用該系統後,審校工作效率成倍提升,錯誤識別準確率可達80%。
“辭文”產品展示
“2023年8月起執行的《圖書編校品質差錯判定和計算方法》中規定,一般性錯字、別字,每處計1個差錯;知識性、邏輯性差錯,每處計2個差錯,由此可見知識性、邏輯性差錯對編校品質管理的重要性。然而,隨著知識專業化分工的日益精細,單個審校人員難以完全掌握跨學科知識,市場迫切需要一套智慧、高效、準確的知識審校系統。這不僅是新聞出版機構、內容發佈平臺的把關利器,也將是整個內容創作行業的前置工具。”上海世紀出版集團副總裁、上海辭書出版社社長秦志華表示,“辭文”突破以往文本審校工具的局限,實現從“文字糾錯”到“知識審校”的能力跨越,其價值更在於守護知識傳播的準確性與嚴肅性。據悉,目前該產品已應用於人文社科、科學技術等出版領域的文本審校,未來還將拓展至新聞傳媒、教育科研等場景,致力於成為內容生產領域的“數位質檢員”。
“大模型時代的軟體產品是‘活的’,具有自優化、自反覆運算、自成長的特點,可以依據數據、用戶反饋及模型自身成長不斷改進。”百度AI技術生態副總經理周奇表示,依託文心+飛槳的核心技術,在可控數據安全的前提下,希望和更多硬體夥伴、技術夥伴、數據夥伴等共建生態,架起技術和行業專業知識的橋樑,打通大模型垂直領域應用工程化“最後一公里”。
發佈會上展示了應用“辭文”的部分案例。上海辭書出版社針對該社一部50多萬字的關於上海歷史主題的付型稿件,採用“辭文”進行深度檢測,系統共標記471處潛在錯誤,經專業編輯團隊逐條複核,最終確認採納87處知識性差錯(含歷史事件誤記、人物關係錯位、地理沿革錯誤等),錯誤類型覆蓋上海開埠史、租界制度、地方文獻等專業領域。橫向對比測試數據顯示,“辭文”系統檢出471處,確認採納87處;市場上另一審校產品檢出262處,確認採納0處。
“辭文”審校案例展示。施晨露攝
有“語林啄木鳥”之稱的上海《咬文嚼字》編輯部也試用了這一新產品。“我們測試了11條材料,7條提示沒有審校到錯誤點,4條提出了修訂點。”上海咬文嚼字文化傳播有限公司總經理王敏分享試用情況,其中對一句元好問詩句的糾錯令他驚豔,對唐代詩人李端的字的糾正也很正確。不過,“辭文”的糾錯也有編輯部認為沒有必要之處。他感慨,在大模型助力下,通過人機協同,產品有很大潛力。
王敏分享“辭文”審校案例。施晨露攝
“辭文智慧知識審校系統”搭建了網站www.iciwen.com,審校價格低至0.799元/千字,具有一定市場競爭力。秦志華告訴記者,未來在當地語系化布局基礎上加入更多數據,將是產品發展的方向。“在這個AI湧現的時代,我們更應珍視幾千年人類文明所留給我們的寶貴遺產。通過科技創新的力量,把人類知識聚合成知識庫、數據集,更好地服務於文化的傳承和傳播。‘辭文智慧知識審校系統’承載著在知識傳承和融合創新上的雙重使命,期待與更多合作夥伴攜手,共同探索AI與人類知識融合的可能性,讓人工智慧真正成為人類文明的守護者。”