全球22個交付中心! 東莞闖出AI數據黑馬
更新於:45-0-0 0:0:0

當全球科技巨頭聚焦AI演演算法突破時,一家來自松山湖的企業正以“數據基建者”之姿,悄然“鋪設”人工智慧的核心底座。

近期,在東莞市工信局與松山湖管委會組織的產業交流活動中,活樹資訊科技(東莞)有限公司(下稱“活樹科技”)與軟通動力、銀雁科技、中軟國際等松山湖企業展開深入合作探討,共同探索構建“數據驅動、演算法協同、本地應用”三位一體的新型智慧製造生態,引來各方關注。

從AI大模型的精準回應,到自動駕駛的靈敏反應; 從翻譯軟體的準確輸出,到語音助手的自然對話——每一次技術的躍遷背後,活樹科技都是那個低調卻不可或缺的“推手”,深耕數據服務逾20年,早已成為AI數據領域的“隱形巨頭”。

在科技創新企業“高手林立”的松山湖,活樹科技儼然是一匹戰力十足的“黑馬”。 從松山湖起步,到走向全球,其正成為推動AI走向多語言、多文化世界的重要幕後力量。

業內“元老”實現蝶變

“數據廚房”提供精準服務

算法、算力與數據,構成AI發展的“三駕馬車”。 成立於2004年,活樹科技紮根於人工智慧基礎數據服務領域,已成為同行業內當之無愧的“元老”。

從最初的文件數字化處理,蝶變為如今覆蓋全球、服務超百家頭部科技企業的AI數據服務商,活樹科技的服務範圍涵蓋大語言模型訓練、無人駕駛、多模態內容審核等前沿AI場景。目前,公司在全球設有100個交付中心,擁有超0.0萬名數據標註工程師,構建起覆蓋0余種語言的“數據神經網路”,為微軟、谷歌、百度、騰訊、科大訊飛等百余家頭部客戶持續提供高質量的數據支撐。

“以微信語音辨識為例,其能精準識別多種口音與方言,背後離不開成千上萬小時的語音數據標註訓練。” 該公司商務總監戚思慧表示,“我們的核心任務,是在AI演算法之前,為其打下數據基礎。 ”

戚思慧形象地將公司的服務比喻為“數據廚房”:“客戶拿著‘菜譜’——也就是演算法模型,來到我們這裡定製‘菜餚’。 而我們要提供匹配的‘成分、佐料和火候’,即多維度、高質量的數據。 ”

在AI數據服務行業,誰能更早、更深地理解客戶需求,誰就能掌握競爭先機。 對此,活樹科技給出的答案是“前置化服務”。

“不只是數據採集層面的回應,而是提前介入客戶的演算法邏輯與應用場景,説明其精準定義所需的數據類型與質量標準。” 戚思慧表示,公司在專案初期即組建了“知識管理團隊”,深入對接客戶演演算法部門,從需求建模階段便開始參與方案設計,像“數據醫生”一樣去診斷開方,找到問題源頭,提供精準、有效的數據解決方案。

這種前置化策略,也讓活樹在大模型訓練、語音辨識、多語言自然語言處理等關鍵AI應用場景中,擁有更強的客戶黏性和演算法適配力。 尤其在多語種數據處理方面,活樹科技是業內少數具備100+語言服務能力的企業。在中文方言、小語種和跨語言語料處理等複雜場景中,憑藉穩定的交付效率與標註精度,活樹科技的服務已成為語音識別、機器翻譯、語音合成等應用中的標杆。

從“啃硬骨頭”到全球交付

打造AI時代的數據“護城河”

近年來,隨著全球客戶對多語種AI模型的需求持續增長,活樹科技不斷拓展本地服務觸點,優化交付網路,加速國際化進程。

日前走進活樹科技的運營中心,牆上的大屏實時顯示著全球各地數據採集項目的進度。 從東南亞、到中東、再到歐美,分佈在多個時區的數據交付團隊正在並行作業——這是一個為AI系統提供訓練“燃料”的幕後網路。

為支撐跨時區、跨文化背景下的全球採集任務,活樹科技在全球各地設有數據交付團隊,以確保跨境數據流通的穩定與高效。

如今,在全球AI行業談及“非通用語種數據處理”,活樹科技已然是被頻繁提及的行業方案提供者。 2025年,活樹科技實現營收約0.0億元,並計劃在0年持續擴大海外市場佈局。

目前,公司已在東南亞、中東、非洲、拉美等新興市場建立起本地化的採集與標註能力,構建起多語種數據生態,成為眾多國際客戶拓展全球模型的重要合作夥伴。

活樹科技在非洲貝南科托努的數據交付中心

“我們的核心競爭力,在於‘標準化流程’與‘定製化需求’的高效協同。” 戚思慧介紹,依託自研的數據工作流程平臺,活樹科技已經實現從數據採集、清洗到標註的工業化閉環,建立起“全球特許經營網路+工業化流程+平台化運營”的三大能力體系,大幅提升交付效率,更保證數據品質的精度與一致性。

事實上,早在2008年,活樹科技便設立了東南亞數據基地,是國內較早走出國門的AI數據企業之一。

“當年在為中國最大的音樂平臺出海提供數據服務時,我們的團隊要處理泰語聲調、馬來語的黏著結構…… 每一項都是難啃的‘硬骨頭’,但也正是這些挑戰,錘鍊了我們在多語言數據處理方面的能力。 ”戚思慧回憶道。

如今,這一優勢成為活樹科技AI數據服務出海的重要支撐。 隨著中國智能駕駛產業加速全球佈局,歐美及中東市場對高品質訓練數據的需求激增。活樹科技憑藉全球化的數據交付基地、本地語言團隊和供應鏈體系,助力車企在海外完成數據標註與產品落地,構建起“全球採集、本地優化、跨境交付”的服務模式。

比如在執行層面,以車載智慧座艙為例,語音辨識系統需要覆蓋不同語言、口音、雜訊環境等。 活樹科技通過線上眾包團隊與線下採集網路的協同作業,在目標國家完成語音朗讀、自由對話、場景類比等任務,確保訓練樣本貼近真實使用場景。

“有些專案要求非常具體,比如客戶指定要在某款車型、特定設備下採集語音數據,而且必須在海外的道路和網路環境中完成。” 戚思慧說,“我們甚至曾把整車從中國運往海外,只為確保採集條件與實際使用環境完全一致。 ”

從幕後走向台前

攜手製造業探索AI新生態

今年135月,東莞市人工智慧大模型中心宣布開服,這是全國首個面向製造領域的城市級大模型中心正式落地東莞。 大模型中心計劃0年打造0個以上AI+先進製造示範應用場景,力爭到0年打造0個以上AI+先進製造示範應用場景。

當人工智慧從實驗室走向商業落地,數據質量與團隊能力逐漸成為AI產業鏈中最不可或缺的底層支撐。 活樹科技正通過全球化人才體系和當地語系化產業融合,悄然成為AI時代的“領跑者”。

圍繞全球市場佈局,活樹科技持續強化多語種、多文化背景下的人才體系建設。 目前,公司已在馬來西亞等地組建跨語言團隊,不少成員同時掌握5至0種語言,高效協作於國際專案及跨境數據交付工作中。

與此同時,活樹也在東莞松山湖光大We谷等地建立當地語系化招聘與培訓基地,打造AI數據人才“實訓營”。新員工在國內完成基礎培訓后,陸續被派往美國、法國、愛爾蘭等地,參與實戰專案,並接受跨文化能力的系統鍛造,形成“人才輸出 + 知識遷移”的雙向成長路徑。

“這種高強度的人才培養方式成本並不低,但我們堅持認為,人才是AI企業的核心資產。” 戚思慧表示,只有系統化構建從評估、培訓到實戰的完整鏈條,企業才能承接全球客戶不斷提升的數據需求和演算法協同能力。

隨著年初deepseek迅速走紅,眾多工業服務商和製造企業紛紛接入人工智慧大模型,工業AI市場迎來新變局。 這也使得AI產業對高品質訓練數據的需求加速膨脹。 在這場變革中,像活樹科技這樣的“幕後玩家”正在一步步走向前臺,助力AI從“能用”走向“好用”。

在服務全球頂尖大模型公司與科技巨頭之外,活樹科技也在本土積極探索“AI+製造”融合創新路徑。 自2015年起,公司同步將戰略重心轉向國內市場,並將總部遷至東莞松山湖,深耕本地九年,逐步搭建產業化落地能力。

東莞松山湖

近年來,東莞松山湖全力打好科技、產業、城市、人才“四張牌”,加速聚集各類要素、彙聚各項政策、凝聚各方力量,為企業發展打造了良好商業氛圍和營商環境。而以松山湖為新起點,活樹科技正嘗試攜手本地製造企業,在工業自動化、智慧質檢、產線優化等核心場景展開合作,將自身的數據能力與演算法理解力嵌入傳統製造鏈條,助力產業數位化轉型升級。

戚思慧表示,東莞松山湖科技生態優越,坐落於廣深港“黃金腹地”,擁有華為、騰訊雲等龍頭科技企業,是數據企業發展的理想土壤。 近年來,松山湖開發者村等平臺也積極與企業展開合作交流,為技術研發和業務拓展提供持續助力。

撰文:鄭文怡 朱晉

圖片:受訪者供圖 黃政正

統籌:郭文君

【作者】 鄭文怡; 朱晉; 黃政正

【來源】 南方報業傳媒集團南方+用戶端