Ketua Pegawai Eksekutif OpenAI Sam Altman baru-baru ini mengumumkan bahawa syarikat itu akan melancarkan model bahasa wajaran terbuka baharu dengan keupayaan inferens dalam beberapa bulan akan datang, menandakan satu lagi kemajuan besar dalam bidang model terbuka sejak GPT-2.
Altman mendedahkan bahawa walaupun rancangan itu sudah dalam kerja, pelepasannya berulang kali ditangguhkan kerana pelbagai keutamaan. Hari ini, OpenAI percaya bahawa adalah penting untuk melancarkan model ini yang akan membawa pengalaman yang belum pernah berlaku sebelum ini kepada pengguna dan pembangun.
Sebelum keluaran rasmi, OpenAI akan menjalankan penilaian komprehensif model mengikut rangka kerja yang ditetapkan untuk memastikan prestasi dan kualitinya. Pada masa yang sama, mengetahui bahawa model itu mungkin masih menghadapi pelarasan dan pengoptimuman selepas dikeluarkan, OpenAI akan menjalankan kerja tambahan untuk memastikan kestabilan dan kebolehpercayaannya.
Untuk mengumpulkan lebih banyak maklum balas daripada pembangun dan mencuba prototaip awal, OpenAI merancang untuk mengadakan satu siri acara pembangun. Acara ini akan bermula di San Francisco dan berkembang ke Eropah dan Asia-Pasifik. Melalui aktiviti ini, OpenAI berharap dapat membincangkan potensi dan prospek aplikasi model dengan pembangun.
Perlu diingat bahawa, tidak seperti model OpenAI sebelumnya, parameter pra-latihan model bahasa wajaran terbuka ini akan dikongsi secara terbuka dengan orang ramai. Ini bermakna pembangun dan penyelidik boleh memuat turun parameter ini, menjalankan model secara tempatan dan memperhalusinya mengikut keperluan khusus mereka atau memasukkannya ke dalam aplikasi tersuai. Walau bagaimanapun, adalah penting untuk ambil perhatian bahawa pemberat terbuka tidak sama dengan sumber terbuka sepenuhnya, dan kod latihan, set data dan log bertele-tele mungkin kekal proprietari atau tidak diterbitkan.
Dalam beberapa tahun kebelakangan ini, model berat terbuka telah menjadi tumpuan perhatian dalam industri. Syarikat seperti Meta dan Mistral telah melancarkan model berkuasa seperti Llama dan Mixtral, manakala pemain baharu seperti DeepSeek, Alibaba dan Baichuan juga secara aktif melancarkan model sumber terbuka yang setanding. Trend ini bukan sahaja menarik perhatian penyelidik akademik dan pembangun bebas, tetapi juga telah mendorong OpenAI untuk mengkaji semula strategi modelnya.
Dengan peningkatan model pemberat terbuka, semakin ramai pengguna mencari penyelesaian model yang lebih fleksibel dan boleh disesuaikan. Model bahasa wajaran terbuka baharu OpenAI sudah pasti akan memberikan pengguna dan pembangun lebih banyak pilihan dan kemungkinan. Kami tidak sabar untuk melihat bagaimana model ini boleh memberi inspirasi kepada lebih banyak inovasi dan aplikasi pada masa hadapan."