27/0,2025 Mesyuarat Tahunan Forum ZhongguancunDibuka di Beijing, forum itu akan berlangsung sehingga 31/0. Tema mesyuarat tahunan Forum tahun ini ialah "Produktiviti Kualiti Baharu dan Kerjasama Sains dan Teknologi Global".
29/0 petang,Wang Zhongyuan, Presiden Akademi Kecerdasan Buatan Beijing (selepas ini dirujuk sebagai "KLCII").Di Forum Perintis Kecerdasan Buatan Masa Depan, beliau memberi ucapan mengenai "Evolusi Teknologi Kecerdasan Terkandung dan Pembinaan Bersama Ekologi".
Di forum itu, KLCII mengeluarkan RoboOS, rangka kerja kerjasama otak yang terkandung dalam silang ontologi pertama, dan RoboBrain, otak terkandung sumber terbuka, yang boleh merealisasikan rentas senario, berbilang tugas, ringan, penggunaan pantas dan kerjasama silang ontologi, dan mempromosikan kecerdasan mesin tunggal untuk mengerumuni kecerdasan.
Sebelum permulaan forum,Wang ZhongyuanDitemu bual oleh wartawan "Berita Ekonomi Harian" (selepas ini dirujuk sebagai NBD).
智源研究院是在科技部和北京市支援下,聯合北京人工智慧領域優勢單位共建的人工智慧領域的新型研發機構。王仲遠是第二任院長,他在2018年榮獲“Kajian Teknologi MIT35 orang di bawah umur 0 inovasi saintifik dan teknologi"; Beliau juga mempunyai pengalaman kerja di Microsoft, Facebook (kini Meta), Meituan dan Kuaishou.
NBD: Dengan kejayaan DeepSeek, adakah ini bermakna kuasa pengkomputeran tidak lagi menjadi masalah untuk model besar?
Wang Zhongyuan:Saya tidak begitu bersetuju dengan itu. DeepSeek benar-benar telah mencapai keputusan yang cemerlang, memastikan kami boleh melatih model sebesar ChatGPT-4 dengan kuasa pengkomputeran yang terhad. Walau bagaimanapun, kita perlu sedar bahawa teknologi sedemikian juga boleh digunakan oleh institusi dan negara lain di peringkat antarabangsa, sekali gus memacu pembangunan model besar ke arah skala yang lebih besar.
Pada masa kini, terima kasih kepada pengoptimuman kejuruteraan, adalah mungkin untuk melatih model dengan parameter yang lebih besar. Dalam kes ini, jika Undang-undang Penskalaan (semakin besar model, semakin tinggi kecerdasannya) masih berkuat kuasa, prestasi model boleh dipertingkatkan lagi.
Oleh itu, model semasa, terutamanya model asas, nampaknya telah menghadapi kesesakan tertentu, atau peningkatan prestasinya agak perlahan, faktor yang sangat penting ialah data (tidak mencukupi), dan had kuasa pengkomputeran juga merupakan kesesakan, jadi saya tidak fikir kuasa pengkomputeran semasa cukup untuk digunakan, saya fikir teknologi keseluruhan model besar masih jauh dari akhir, dan kuasa pengkomputeran masih diperlukan.
NBD: Industri mengatakan bahawa tahun ini adalah titik perubahan dalam pembangunan kecerdasan buatan, apa pendapat anda? Adakah anda bersetuju dengan pandangan ini?
Wang Zhongyuan:Ya, pertama sekali, saya fikir akan ada letupan besar dalam penerapan kecerdasan buatan tahun ini. Oleh kerana model domestik boleh mencapai prestasi yang setanding dengan kuasa pengkomputeran yang kecil, ia pasti akan memasuki peringkat pendaratan aplikasi.
China mempunyai sejumlah besar senario aplikasi dan keperluan aplikasi, yang merupakan kelebihan kami. Apabila keupayaan model asas dipertingkatkan, sebenarnya, kami mempunyai banyak pengurus produk dan usahawan, yang boleh menggunakan model tersebut, terutamanya penggunaan model bahasa yang besar, yang mempunyai potensi besar untuk letupan industri.
Sudah tentu, saya telah berulang kali menekankan bahawa model bahasa yang besar tidak mencukupi. Walaupun tanpa bercakap tentang robot, kita dapat melihat bahawa terdapat sejumlah besar data berbilang mod dalam industri sebenar, seperti carta alir, data sinar-X dalam bidang perubatan, data CT dan data penderia dalam pelbagai industri, yang bukan data teks mudah. Oleh itu, model besar multimodal adalah keupayaan yang tidak dapat dielakkan.
Model besar multimodal semasa, terutamanya model pemahaman multimodal, harus dikatakan masih dalam peringkat awal, walaupun terdapat beberapa penyelesaian, seperti yang mempunyai model bahasa besar sebagai teras. Walau bagaimanapun, selepas banyak model bahasa besar menambah keupayaan berbilang modal, keupayaan bahasa asal mereka akan terdegradasi. Ini juga merupakan sebab penting mengapa KLCII memberi tumpuan kepada membuat kejayaan ke arah multimodaliti asli bersatu tahun lepas.
Tahun lepas, KLCII secara rasmi melancarkan Emu3, model berbilang mod asli bersatu yang menyatukan teks, imej dan video secara asli dari awal, dan menyatukan pemahaman dan penjanaan. Kami percaya bahawa model berbilang mod bersatu ini dijangka membantu model besar dilaksanakan dalam pelbagai industri dan mencapai hasil yang lebih baik.
NBD: Sejauh manakah anda fikir kami dari AGI (Kecerdasan Am Buatan)? Apa lagi yang perlu ditangani?
Wang Zhongyuan:Terus terang, tiada definisi yang sangat jelas dan konsensus luas mengenai AGI pada masa ini. Jika kita hanya melihat AGI keupayaan menulis, ia sebenarnya telah mencapai AGI sedikit sebanyak. Jika ujian Turing digunakan sebagai piawaian untuk menilai sama ada kecerdasan buatan telah mencapai AGI pada masa lalu, sekurang-kurangnya pada tahap literal, kecerdasan buatan berkemungkinan telah mencapai AGI.
Sebagai tambahan kepada fleksibiliti mereka, model bahasa besar hari ini hampir dengan peringkat sarjana atau kedoktoran dalam banyak bidang tertentu, seperti matematik dan pengaturcaraan. Daripada aspek ini, kita boleh mengatakan bahawa kecerdasan buatan telah mencapai sebahagiannya tahap AGI.
Tetapi jika anda melihatnya dalam erti kata yang lebih luas, seperti membenarkan AI memahami bahasa manusia dan menyelesaikan masalah tertentu dalam kehidupan sebenar, seperti melakukan kerja rumah, memasak, mencuci pinggan mangkuk, dsb., Saya fikir masih ada jalan yang panjang sebelum mencapai tahap AGI ini, dan mungkin bertahun-tahun, sekurang-kurangnya 10 hingga 0 tahun atau lebih lama. Kerana dalam proses ini, ia bergantung kepada keupayaan ontologi, kemajuan pembinaan model dunia, dan pengumpulan data dalam senario pendaratan yang berbeza, jadi ia masih perlu melalui kitaran yang panjang.
NBD: Adakah interaksi fizikal kecerdasan yang terkandung akan menjadi keupayaan teras AGI?
Wang Zhongyuan:Ia sememangnya keupayaan teras AGI dalam erti kata yang luas seperti yang kita fahami, dan pada akhirnya, jika kecerdasan buatan ingin beralih dari dunia digital ke dunia fizikal, ia mesti berinteraksi dengan dunia nyata dan belajar melalui interaksi.
Harian Perniagaan Kebangsaan