news

OpenAI Rilis Fitur Image Generator Baru Memakai ChatGPT-4o, Paham Instruksi yang Lebih Kompleks

Senin, 31 Maret 2025 | 19:21 WIB
Komik strip empat panel yang dihasilkan oleh image generator baru yang memakai ChatGPT-4o. (OpenAI)

PejuangKantoran.com - OpenAI baru aja ngerilis fitur images baru untuk ChatGPT, yaitu "Images in ChatGPT". Jika dulu kita cuma bisa ngobrol sama chatbot ini, sekarang kita bisa bikin gambar langsung dari dalam ChatGPT-4o.

Fitur ini berbeda dari DALL-E yang sebelumnya dipakai untuk membuat gambar, dan kelihatannya sih DALL-E memang mulai ditinggalkan.

Menurut Gabriel Goh, salah satu peneliti utama di OpenAI, GPT-4o ini disebut sebagai model "omnimodal". Artinya, dia bisa menerima dan menanggapi berbagai jenis data dalam satu sistem, termasuk teks, gambar, audio, dan video.

Baca Juga: Pulau dengan Pantai Pasir Pink di Indonesia Ini Tempati Peringkat Teratas Tempat Terindah di Dunia

Kalau biasanya AI dipisah-pisah antara yang bisa bikin teks dan yang bisa bikin gambar, sekarang semuanya ada di satu tempat.

"Ini adalah jenis teknologi baru yang benar-benar berbeda di dalamnya. Kami tidak memisahkan pembuatan gambar dan teks. Kami ingin semuanya dilakukan bersama," ujar Goh.

Tren seperti ini tidak hanya terjadi di OpenAI. Google juga sedang mengembangkan sistem serupa lewat "Project Astra" yang bisa melihat dunia lewat kamera HP, sekaligus menjawab pertanyaan secara real-time.

Terlihat, AI memang makin canggih dan makin bisa memahami berbagai jenis input dari pengguna.

Seberapa canggih fitur images generator ini?

Sebelumnya, image generator AI kesulitan membuat gambar yang sangat berbeda dari gambar yang sudah ada. Misalnya, jika kamu meminta generator gambar untuk membuat gambar sepeda dengan roda segitiga, generator tersebut akan kesulitan.

Baca Juga: Begini Cara Mencairkan Dana JHT BPJS Ketenagakerjaan, Bisa Cair Hingga Rp10 Juta

Dalam blog post resminya, OpenAI menunjukkan beberapa contoh gambar yang dihasilkan dengan memakai "Images in ChatGPT".

Salah satu yang menarik adalah foto seorang peneliti OpenAI yang sedang bekerja di depan whiteboard, dengan latar belakang pemandangan Bay Bridge. Uniknya, AI ini bisa menambahkan pantulan fotografer di dalam gambar, detail yang biasanya sulit dilakukan untuk AI lain.

Fitur yang baru ini juga bisa membuat gambar-gambar realistis yang kualitasnya luar biasa. Dibandingkan dengan DALL-E yang dulu, teknologi baru ini bisa menciptakan gambar dari instruksi yang lebih kompleks dan beragam.

Misalnya, jika kamu menggambarkan komik strip empat panel, termasuk karakter yang muncul di setiap panel dan apa yang mereka katakan satu sama lain, teknologi tersebut dapat langsung mengerjakannya dengan cepat.

Halaman:

Tags

Terkini