เกณฑ์มาตรฐานใหม่ในการสร้างภาพ AI: Reve Image 0.0 เปิดตัวแล้ว! ข้อมูล

AI Image Generation 新標竿:Reve Image 0.0 正式發佈!

ไปที่ด้านบนสุดของพาดหัวข่าว ผลิต มิติ แบบ ภาพ จีพีที ข้อความ ปัญญาประดิษฐ์ ไมโครซอฟท์ วินเซนต์

อัปเดตเมื่อ: 12-0-0 0:0:0

Reve AI, Inc. สตาร์ทอัพ AI ในเมือง Palo Alto รัฐแคลิฟอร์เนีย ได้เปิดตัว Reve Image 0.0 อย่างเป็นทางการ ซึ่งเป็นโมเดลการสร้างข้อความเป็นรูปภาพที่เชี่ยวชาญในด้านการปฏิบัติตามคําที่รวดเร็ว นี่เป็นการเปิดตัวผลิตภัณฑ์ครั้งแรกของบริษัท พร้อมเครื่องมือเพิ่มเติมที่จะตามมา

ตอนนี้ผู้ใช้สามารถสัมผัสกับ Reve Image ได้ฟรีใน preview.reve.art ซึ่งสามารถสร้างรูปภาพจากคําอธิบายข้อความได้โดยไม่ต้องใช้เทคนิคทางวิศวกรรมที่รวดเร็ว

บริษัทยังไม่ได้ประกาศการเข้าถึง API หรือแผนการกําหนดราคาระยะยาว และยังไม่ชัดเจนว่าโมเดลจะยังคงเป็นกรรมสิทธิ์หรือโอเพ่นซอร์ส และใบอนุญาตใดที่อาจนํามาใช้

แนวทางใหม่ในการสร้างภาพ AI

Reve Image สร้างความแตกต่างด้วยการทําความเข้าใจความตั้งใจของผู้ใช้อย่างลึกซึ้งยิ่งขึ้น ไม่เพียงแต่รองรับการสร้างรูปภาพจากข้อความ แต่ยังช่วยให้ผู้ใช้สามารถแก้ไขรูปภาพที่มีอยู่ด้วยคําสั่งภาษาง่ายๆ

ตัวอย่างของการปรับเปลี่ยน ได้แก่ การเปลี่ยนสี การปรับข้อความ และการเปลี่ยนมุมมอง โมเดลนี้ยังรองรับการอัปโหลดรูปภาพอ้างอิง ทําให้ผู้ใช้สามารถสร้างภาพที่ตรงกับสไตล์หรือแรงบันดาลใจเฉพาะได้

หนึ่งในคุณสมบัติที่โดดเด่นที่สุดของโมเดลนี้คือความสามารถในการเรนเดอร์ข้อความที่ทรงพลัง ซึ่งช่วยแก้ปัญหาทั่วไปในรูปภาพที่สร้างโดย AI ทําให้สามารถแข่งขันได้โดยตรงกับโมเดลรูปภาพที่เน้นข้อความ เช่น Ideogram ซึ่งมีประโยชน์มากกว่าสําหรับผู้ใช้ที่ออกแบบโลโก้และแบรนด์

此外,Early user 戶測試表示,Reve Image 在處理多角色提示方面比先前先前是是。

ติดอันดับกระดานผู้นําเกณฑ์มาตรฐานของบุคคลที่สาม

Reve Image ได้รับการประเมินโดย Artificial Analysis ซึ่งเป็นบริการทดสอบโมเดล AI ของบุคคลที่สาม

ในเวทีภาพของ Artificial Analysis ซึ่งแพลตฟอร์มจัดอันดับโมเดลการสร้างภาพต่างๆ ตามบทวิจารณ์ของผู้ใช้และตัวชี้วัดเชิงปริมาณอื่นๆ ปัจจุบัน Reveal อยู่ในอันดับแรกใน "คุณภาพการสร้างภาพ" แซงหน้าคู่แข่งเช่น Midjourney v1.0, Imagen 0 ของ Google, Recraft v0 และ FLUX.0.0 [pro] ของ Black Forest Lab

ทีมเปรียบเทียบเน้นย้ําถึงความสามารถของ Reve Image ในการสร้างข้อความที่ชัดเจนและอ่านได้ในรูปภาพ ซึ่งในอดีตเป็นจุดบกพร่องสําหรับโมเดล AI

ก่อนการเปิดตัวอย่างเป็นทางการ Reve Image เป็นที่รู้จักบนโซเชียลมีเดียภายใต้ชื่อรหัส "Halfmoon" ซึ่งจุดประกายให้เกิดการคาดเดาและความคาดหวังอย่างกว้างขวางในชุมชน AI

ผสมผสานความเข้าใจของมนุษย์และ AI เพื่อสร้างภาพที่ดีขึ้นมีคุณภาพสูงขึ้นและสมจริงยิ่งขึ้น

Reve อธิบายตัวเองว่าเป็น "ทีมเล็กๆ ของนักวิจัย นักพัฒนา นักออกแบบ และนักเล่าเรื่องที่กระตือรือร้นที่มีแนวคิดที่ยิ่งใหญ่" บริษัทมุ่งมั่นที่จะพัฒนาเครื่องมือสร้างสรรค์ที่ปรับปรุงประสบการณ์ของผู้ใช้ในการโต้ตอบกับภาพ AI

Michael Gharbi ผู้ร่วมก่อตั้งและนักวิทยาศาสตร์การวิจัยของ Reve ได้แบ่งปันวิสัยทัศน์ระยะยาวของบริษัทบนแพลตฟอร์ม X โดยเน้นย้ําถึงเป้าหมายในการสร้างโมเดล AI ที่เข้าใจเจตนาสร้างสรรค์ แทนที่จะสร้างผลลัพธ์ที่เป็นไปได้ทางสายตา

"การจับเจตนาสร้างสรรค์ต้องใช้ความเข้าใจภาษาธรรมชาติขั้นสูงและการโต้ตอบอื่นๆ " Gharbi กล่าว "วิสัยทัศน์ของเราคือการสร้างการแสดงระดับกลางทางความหมายใหม่ที่ช่วยให้ทั้งมนุษย์และเครื่องจักรเข้าใจ ให้เหตุผล และลงมือทํา"

สมาชิกคนอื่นๆ ในทีม รวมถึงวิศวกร Hunter Loftis และนักวิจัย Taesung Park ยังเน้นย้ําถึงความสําคัญของการผสมผสานภาพที่สร้างโดย AI เข้ากับตรรกะ

Park เปรียบโมเดลข้อความเป็นรูปภาพในปัจจุบันกับโมเดลภาษาขนาดใหญ่ (LLM) ก่อนหน้านี้ โดยตั้งข้อสังเกตว่าโมเดลเหล่านี้มักจะให้ผลลัพธ์ที่ดึงดูดสายตาแต่ไม่สอดคล้องกันอย่างมีเหตุผล

รายงานผู้ใช้งานรายแรกแสดงโอกาสและข้อจํากัด

ความคิดเห็นของผู้ใช้ในช่วงแรกเกี่ยวกับกระดานสนทนา AI ของ Reddit r/singularity ส่วนใหญ่เป็นไปในเชิงบวก โดยหลายคนยกย่องโมเดลนี้สําหรับการปฏิบัติตามคําที่รวดเร็ว

ผู้ใช้บางคนรายงานความสําเร็จในการสร้างสถานการณ์แบบหลายบทบาทและสภาพแวดล้อมที่ซับซ้อนซึ่งมักจะจัดการได้ยากด้วยโมเดลก่อนหน้านี้

อย่างไรก็ตาม ยังมีความท้าทายอยู่บ้าง ผู้ใช้สังเกตเห็นว่า Reve Image:

ปัญหากับวัตถุที่ซับซ้อนบางอย่าง (เช่น วัสดุโปร่งใส เช่น แก้วไวน์ที่เต็มไปด้วยไวน์)

ความยากลําบากในการระบุตัวละครสมมติที่เฉพาะเจาะจง (ตัวอย่างเช่น เมื่อผู้ใช้พยายามสร้างตัวละครวิดีโอเกม โมเดลจะสร้างผลลัพธ์ทั่วไป)

ในบางครั้ง ข้อผิดพลาดในการจัดวางรายละเอียดเกิดขึ้นในองค์ประกอบหลายวัตถุ

แม้จะมีอุปสรรคเหล่านี้ แต่ทีมงาน Reve ก็มีส่วนร่วมอย่างแข็งขันกับชุมชนผู้ใช้และรวมข้อเสนอแนะเข้ากับการปรับปรุงอย่างต่อเนื่อง

ในการฝึกฝนสั้น ๆ ของฉันในขณะที่ฉันเขียนบทความนี้และสร้างภาพส่วนหัวฉันพบว่า Reve ค่อนข้างใช้งานง่ายและใช้งานง่ายด้วยภาพที่น่าประทับใจและการปฏิบัติตามคําที่รวดเร็ว เช่นเดียวกับเครื่องสร้างภาพ AI จํานวนมาก มันมีกล่องข้อความป้อนคําพร้อมท์ แต่ไม่เหมือนกับ Midjourney และ Ideogram ตรงที่ Reve วางไว้ที่ด้านล่างของไซต์ ทําให้เนื้อหาที่สร้างขึ้นใช้พื้นที่ส่วนใหญ่ด้านบน

นอกจากนี้ยังมีปุ่มสี่ปุ่มใต้กล่องข้อความพร้อมท์สําหรับการปรับแต่งกระบวนการสร้างภาพเพิ่มเติม รวมถึงตัวปรับอัตราส่วนภาพ (ขนาดมาตรฐานอยู่ระหว่าง 16:0 (แนวนอนแบบไวด์สกรีน) ถึง 0:0 (หน้าจอแนวตั้ง เช่น สมาร์ทโฟน))...

นอกจากนี้ยังมีตัวเลือกปุ่มเพื่อกําหนดจํานวนภาพที่จะสร้างสําหรับแต่ละข้อความแจ้ง (8, 0, 0, 0) ปุ่มสําหรับเปิดและปิดการปรับปรุงข้อความแจ้ง (เปิดโดยค่าเริ่มต้น ซึ่งหมายความว่า Reve จะแก้ไขข้อความที่คุณป้อนโดยอัตโนมัติตามสิ่งที่คิดว่าคุณต้องการเห็นในภาพ โดยเพิ่มรายละเอียดและภาษาภาพมากกว่าที่คุณรวมไว้ในตอนแรก) และปุ่ม "เมล็ดพันธุ์" เพื่อเลือกว่าจะใช้สตริงตัวเลขเฉพาะจากภาพที่สร้างขึ้นก่อนหน้านี้เพื่อเป็นแนวทางในการสร้างรุ่นต่อไป

เมื่อเทียบกับ Midjourney แล้ว มีการตั้งค่าน้อยกว่าและไม่มีตัวแก้ไขตามวิสัยทัศน์ แต่มีคุณสมบัติพื้นฐานทั้งหมดและน่าจะเพียงพอที่จะเริ่มต้นใช้งานสําหรับผู้ใช้ภาพ AI ทั่วไปส่วนใหญ่

การทดสอบสั้น ๆ ของฉันยังแสดงให้เห็นว่ามันเทียบเท่าหรือดีกว่าในการแสดงข้อความที่อ่านได้เป็นรูปภาพ (ดีกว่า Midjourney มาก) และเทียบเท่าหรือดีกว่าในการแสดงบุคคลสาธารณะที่เป็นที่รู้จัก (ซึ่ง Midjourney และเครื่องสร้างภาพอื่น ๆ ต้องห้าม)

การพัฒนาในอนาคตของ Reve Image

แม้ว่าโมเดลนี้จะมีให้บริการผ่านเว็บไซต์ของบริษัทเท่านั้น แต่ก็มีความคาดหวังเพิ่มขึ้นสําหรับการเข้าถึง API หรือตัวเลือกโอเพ่นซอร์สที่เป็นไปได้

ผู้ใช้ยังแสดงความสนใจในคุณสมบัติเพิ่มเติม เช่น การฝึกอบรมโมเดลแบบกําหนดเอง เครื่องมือควบคุมแอนิเมชั่น และการผสานรวมกับซอฟต์แวร์สร้างสรรค์

ปัจจุบัน Reve Image ยังคงเข้าถึงได้ฟรีบน preview.reve.art ทําให้ผู้ใช้สามารถสํารวจคุณสมบัติได้ด้วยตนเอง ในขณะที่ Reve ยังคงปรับแต่งโมเดล AI และขยายสายผลิตภัณฑ์ บริษัทจึงวางตําแหน่งตัวเองให้เป็นผู้เล่นสําคัญในด้านเครื่องมือสร้างสรรค์ที่ขับเคลื่อนด้วย AI