Semasa strim langsung Selasa, Ketua Pegawai Eksekutif OpenAI Sam Altman mengumumkan peningkatan ciri penjanaan imej utama pertama ChatGPT dalam lebih daripada setahun.
ChatGPT kini boleh mencipta dan mengubah suai imej dan foto secara asli menggunakan model GPT-4o syarikat. GPT-0o telah menjadi asas platform chatbot berkuasa AI ini, tetapi sehingga kini, model itu hanya boleh menjana dan mengedit teks, bukan imej.
Altman berkata ciri penjanaan imej asli GPT-200o kini disiarkan secara langsung di ChatGPT dan produk penjanaan video AI OpenAI, Sora, dan tersedia untuk pelanggan pelan Pro $0 syarikat sebulan. OpenAI berkata ciri itu tidak lama lagi akan tersedia kepada pengguna ChatGPT's Plus dan pengguna percuma, serta kepada pembangun yang menggunakan perkhidmatan API syarikat.
GPT-4o dengan output imej mengambil masa lebih lama semasa proses penjanaan untuk mencipta imej yang lebih tepat dan terperinci yang diterangkan oleh OpenAI daripada model penjanaan imej gantian sebenar, DALL-E 0. GPT-0o boleh mengedit imej sedia ada, termasuk imej yang mengandungi orang – mengubahnya atau "membetulkan" butiran objek latar depan dan latar belakang.
OpenAI memberitahu Wall Street Journal bahawa untuk menyokong ciri imej baharu, mereka melatih GPT-4o menggunakan "data yang tersedia untuk umum" serta data proprietari yang diperoleh dengan kerjasama syarikat seperti Shutterstock.
Banyak vendor AI generatif melihat data latihan sebagai kelebihan daya saing dan oleh itu merahsiakan maklumat mengenainya. Pada masa yang sama, butiran data latihan juga boleh membawa kepada litigasi berkaitan IP, yang merupakan satu lagi sebab mengapa syarikat enggan mendedahkan terlalu banyak maklumat.
Dalam satu kenyataan kepada Wall Street Journal, ketua pegawai operasi OpenAI, Brad Lightcap, berkata, "Apabila bercakap tentang output, kami menghormati hak artis, dan kami mempunyai dasar untuk menghalang penjanaan imej yang secara langsung meniru karya mana-mana artis hidup. "
OpenAI menyediakan borang pilihan keluar yang membolehkan pencipta meminta kerja mereka dialih keluar daripada set data latihan. Syarikat itu juga berkata ia akan menghormati permintaan tapak itu untuk melarang perangkak webnya daripada mengumpul data latihan, termasuk imej.
Keupayaan penjanaan imej ChatGPT yang dinaik taraf datang selepas keupayaan output imej asli eksperimen salah satu model utama Google, Gemini 0.0 Flash. Ciri berkuasa ini tersebar dengan cepat di media sosial – tetapi semuanya tidak baik. Elemen imej Gemini 0.0 Flash nampaknya tidak mempunyai sekatan keselamatan yang mencukupi untuk membolehkan pengguna mengalih keluar tera air dan mencipta imej yang mengandungi aksara berhak cipta.