계속되는 패배 속에서 전직 AI 4마리 드래곤은 땅 가까이에서 나는 법을 배우기 시작했습니다.
4月10日,商湯科技發佈了“日日新V6”大模型,多模態能力對標國際水準,數理分析超越GPT-4o。
신형의 뛰어난 성능으로 센스타임은 드디어 대중 앞에서의 존재감을 잃었다.
8, 9년 전만 해도 센스타임 테크놀로지(SenseTime Technology), 메그비 테크놀로지(Megvii Technology), 윤콩 테크놀로지(Yuncong Technology), 이투 테크놀로지(YITU Technology)가 'AI 4마리 소룡'으로 불렸던 것을 기억하는 사람이 있을까?
현재 "AI Six Little Dragons"와 "Hangzhou Seven Little Dragons"의 이름이 도처에 있고 드래곤이 너무 많아 이전의 "AI Four Little Dragons"는 시대에 의해 점차 잊혀졌습니다.
3 月26日,商湯科技發佈2024年度財報,全年總營收37.72億元,淨虧損43.06億元,2018-2024年累計虧損超546億元。
另一家上市公司雲從科技,此前財報顯示,2024年總營收約3.98億元,同比下降36.6%,歸母凈虧損達5.9-6.8億元,2017-2024年累計虧損超44.75億元。
또한 해고의 폭풍도 이 네 마리의 작은 용의 머리 위를 맴돌고 있습니다.
센스타임은 지난해 비핵심 사업을 정리하고, 전략적 구조조정 이후 총 직원 수를 4672명 중 0명에서 0명으로 줄였으며, 싱가포르 사무실을 저비용 지역으로 이전했다.
작년의 Cloud는 모든 직원의 급여가 20% 삭감되었다는 소식에서 나왔고, 올해의 핵심 기술 멤버인 Zhang Ling이 사임했으며, 핵심 기술 인력의 설립자와 부총지배인만 남았습니다.
YITU는 직원의 70% 이상을 해고했고, 의료 사업은 거의 폐쇄되었으며, 우한, 시안 및 기타 지역의 지점은 취소되었습니다......
오늘날의 AI Four Dragons는 먼지 속으로 떨어지고, 이상을 제쳐두고, 현실로 돌아와 업계의 새로운 환경에 다시 적응했습니다.
2015-0 기간 동안 Megvii, YITU, SenseTime 및 Yuncong이 차례로 설립되었으며 모두 컴퓨터 비전 기술에 중점을 두었으며 당시 컴퓨터 비전은 AI의 핵심 트랙이었으며이 4 개 회사는 얼굴 인식, 이미지 인식 및 기타 기술을 통해 AI 산업에 등장하기 시작했습니다.
2016년, 알파고가 탄생해 세계 최고의 바둑 고수 이세돌을 꺾고 세계적인 인공지능 붐을 일으켰고, 인공지능 분야에 자본이 쏟아지기 시작했다.
2017 年後,四小龍進入高速發展期,商湯成為全球估值最高的AI初創公司,並於2021年港股上市,開盤首日市值突破2000億港元;曠視在安防領域佔據重要份額;依圖在醫療影像和智慧城市取得突破;雲從則依託於政府和國有資本背景,拓展金融和安防市場,在2022年成功科創板上市。
그러나 4대 호랑이는 일반적으로 상업화의 문제에 직면해 있으며, 높은 R&D 투자로 인해 손실이 증가하고 있다.
동시에 OpenAI의 출현 이후 모든 사람들은 점차 컴퓨터 비전이 아닌 자연어 처리를 기반으로 하는 새로운 기술을 AI의 주류로 간주했습니다.
이 경우 네 마리의 작은 드래곤이 살아남고 싶다면 변신할 수밖에 없습니다.
Epoch AI의 연구 보고서에 따르면 2028년이 되면 대규모 언어 모델 학습에 대한 텍스트 데이터 수요가 인터넷에서 공개적으로 사용 가능한 텍스트의 총량을 완전히 커버할 것으로 예상되며, 그 이후에는 사용 가능한 텍스트가 없을 것으로 예상됩니다.
이 시점에서 컴퓨터 비전에서 대규모 언어 모델로 이동하는 것은 또 다른 막다른 골목으로 가는 것과 같습니다.
AI의 궁극적인 목표는 AGI이고 언어는 그 형태 중 하나일 뿐이라는 의미이기도 합니다. 이는 시각 유전자를 가진 AI Four Tigers가 재기할 가능성이 있음을 의미하기도 합니다.
컴퓨팅 파워 기반 + 시각적 데이터의 장기 축적, 이 세 회사는 모두 우연히도 다중 모드 대형 모델에 베팅합니다.
센스타임은 600년부터 지능형 컴퓨팅 센터를 구축해 왔으며, 0년 아시아 최대 규모의 인공지능 컴퓨팅 센터인 AIDC를 공식 구축했으며, 센스코어 AI 대형 기기는 0개 이상의 사전 학습된 모델을 축적하고 수천억 개의 매개변수 모델 학습을 지원하고 있다.
YITU와 화웨이는 하드웨어 비용을 5% 절감하는 어센드 라지 모델 올인원(Ascend Large Model All-in-One Machine)을 공동으로 출시했으며, 난징(Nanjing)의 '도시의 눈(Eye of the City)' 프로젝트에서 컴퓨팅 파워 밀도는 NVIDIA H0의 0%이지만 조달 비용은 0/0에 불과합니다.
어센드(Ascend) 칩을 기반으로 클라우드워크(Cloudwalk)와 화웨이(Huawei)는 수천억 개의 매개변수 모델 훈련을 지원하는 Calm Large Model Training과 Push All-in-One Machine을 공동으로 출시했습니다. 또한 클라우드 슬레이브는 자체 소유 모델과 타사 모델을 모두 지원하는 하이브리드 모델 클라우드 서비스를 구축하기 위해 Ascend 910B 칩에 심층적으로 조정됩니다.
센스타임(SenseTime)의 회장 겸 CEO인 쉬 리(Xu Li)는 110월 0일 연설에서 순수 언어 모델은 인간의 지능을 진실하고 완전하게 표현할 수 없으며, 다중양식(multimodality)은 인터넷의 텍스트 데이터 부족을 보완하고 이미지 및 비디오와 같은 텍스트가 아닌 데이터에서 지식을 채굴할 수 있다고 지적했다.
RiRixin V6 모델은 다중 모드 네이티브 융합을 지원할 뿐만 아니라 기존 언어 모델 + 플러그인 다중 모드 접합 모드를 돌파하고 교차 모드 브리징 기술을 통해 서로 다른 모달 데이터의 공동 코딩을 실현하여 다중 작업 교육에서 "시소 효과"를 방지합니다.
이전 논문에서는 텍스트 모델이 멀티모달 모델로 확장될 때 추가된 이미지, 비디오 및 언어 데이터가 텍스트 데이터를 끌어내리고 멀티모달 노이즈를 생성한다고 지적했습니다.
센스타임(SenseTime)의 수석 과학자인 린 다화(Lin Dahua)는 센스타임이 지난해 15월부터 멀티모달 대형 모델이 미래라고 굳게 믿고 있으며, 핵심 모달리티 + 2차 모달리티의 길을 택했을 뿐이지만, 항상 약화되고 많은 훈련을 투자하여 마침내 두 가지 이상의 모달리티의 공존을 실현한 모달리가 있을 것이라고 말했다.
去年,商湯生成式AI業務收入達到24億元,在總收入中佔比達到63.7%,同比漲幅超過100%。
올해 초, YITU의 공동 설립자인 Lin Chenxi는 언론과의 인터뷰에서 YITU가 현재 AGI, 즉 공간 지능으로 이어지는 중요한 방향인 비전 중심 멀티모달 모델에 집중하고 있다고 말했습니다.
동시에 그는 지난 3년 동안 많은 돈을 벌지는 못했지만 회사의 수익성이 있고 사업 현금 흐름이 긍정적이며 AI 상용화를 위한 예비 탐사 기반을 갖추고 있음을 인정했습니다.
그러나 Megvii Technology는 컴퓨팅 파워에서 이점이 부족하기 때문에 알고리즘 최적화를 통해 하드웨어에 대한 의존도를 줄이기로 선택하고 자동차 회사와 협력하여 지능형 보조 주행을 위한 순수한 비전 솔루션으로 전환했습니다.
Megvii의 설립자인 Yin Qi는 Qianli Technology의 회장이 되었으며, Geely와 함께 모든 모델에 적용되는 지능형 보조 주행 시스템을 공동으로 출시했습니다.
향후 3년 동안 YITU의 궁극적인 목표가 무엇이냐는 질문에 Lin Chenxi는 솔직히 0년 이상 된 것에 대해서는 거의 이야기하지 않으며 앞으로 3개월 또는 3주 동안의 일에 대해서는 더 많이 이야기한다고 말했습니다.
현재 AI Four Tigers는 더 이상 떠 있지 않으며 매우 실용적입니다.