OpenAI, GPT-4o modelinin yeni görsel oluşturma özelliklerini duyurdu. Bu yeni model, önceki versiyonlara göre çok daha hassas, ayrıntılı ve gerçekçi görseller üretme yeteneğine sahip. Kullanıcılar, basit komutlarla istedikleri görselleri oluşturabilecek, düzenleyebilecek veya mevcut görseller üzerinden yeni tasarımlar geliştirebilecek.
OpenAI, görsel oluşturma yeteneğinin dil modelleri için temel bir beceri olması gerektiğini uzun süredir savunuyor. GPT-4o, bu düşünce doğrultusunda geliştirilen en gelişmiş ve kullanışlı görsel oluşturma sistemi olarak öne çıkıyor. Yaratılan görseller, estetik açıdan olduğu kadar bilgi aktarımı açısından da oldukça kullanışlı hale geldi.

Yeni model, kullanıcıların verdiği komutları daha doğru şekilde anlayıp görsellere daha hassas biçimde uyguluyor. Özellikle karmaşık ve çok nesneli görsellerde GPT-4o, rakiplerine göre daha iyi performans gösteriyor. Model, 10 ila 20 farklı objeyi tek bir görsel içerisinde tutarlı şekilde bir araya getirebiliyor. Ayrıca, görsellerdeki metinleri ve sembolleri doğru şekilde işleyebilme özelliği sayesinde logolar, diyagramlar ve infografikler gibi bilgilendirici görselleri üretmek çok daha kolay hale geliyor.

OpenAI’nin paylaştığı örnekler arasında, beyaz tahtada yapılan toplantı notları, çizgi romanlar, bilimsel deneylerin ayrıntılı infografikleri ve anlamlı metinlerle desteklenen görseller bulunuyor. Şirket, görsel oluşturmanın sadece dekoratif amaçlı değil, bilgi paylaşımı ve iletişimde de güçlü bir araç olarak kullanılması gerektiğini vurguluyor.
Yeni GPT-4o modeli, çok adımlı görsel üretimi özelliğine de sahip. Kullanıcılar, oluşturdukları görselleri doğal bir sohbet üzerinden modelle birlikte geliştirebiliyor. Örneğin, bir oyun karakterinin tasarımı adım adım şekillendirilebilir ve her adımda karakterin tutarlılığı korunabilir.
GPT-4o, kullanıcının yüklediği görselleri analiz ederek bu görsellerden yeni görseller türetebilme yeteneğine de sahip.

Bu özellik, modeli kullanıcılar için daha sezgisel ve kişiselleştirilmiş bir araç haline getiriyor. OpenAI’ye göre, modelde kullanılan görüntülerin çeşitliliği ve stili, modelin foto-gerçekçi görseller oluşturabilmesine ve görsel dönüşümleri ikna edici biçimde gerçekleştirebilmesine imkân sağlıyor.
OpenAI, yeni modelin henüz bazı sınırlamalara sahip olduğunu kabul ediyor. Özellikle küçük boyutlu yazılar içeren çok yoğun bilgi barındıran grafikler veya çoklu diller içeren görsellerde bazı sınırlamalar bulunuyor. Ayrıca, istenmeyen görsel kırpmaları ve tutarsızlıklar gibi problemlerin yaşanabileceği ifade ediliyor. Şirket, gelecekte bu konularda iyileştirmeler yapılacağını belirtiyor.

OpenAI, görsel oluşturma özelliğini güvenli hale getirmek için çeşitli önlemler aldığını da duyurdu. GPT-4o tarafından üretilen tüm görsellere, içeriğin kaynağının OpenAI olduğunu belirten C2PA meta verileri ekleniyor. Bu sayede oluşturulan içeriklerin orijinalliği daha kolay bir şekilde doğrulanabiliyor. Ayrıca, zararlı içerik taleplerinin otomatik olarak engellendiği vurgulanıyor.
Bugünden itibaren GPT-4o’nun görsel oluşturma özellikleri ChatGPT’de Plus, Pro, Team ve ücretsiz kullanıcılar için varsayılan seçenek olarak sunulmaya başlandı. Enterprise ve Edu kullanıcıları da kısa süre içinde bu özellikten yararlanabilecek. DALL·E severler için ise bu model hala özel bir DALL·E GPT üzerinden kullanılabilecek. Ayrıca, geliştiriciler önümüzdeki haftalarda API aracılığıyla GPT-4o’nun görsel oluşturma özelliğini kullanabilecek.
