Pinterest, ürün çekim arka planlarını geliştirmek için 'Canvas' adlı yeni bir yapay zeka (AI) metin-görüntü oluşturma sürecini tanıttı. Bu sistem, ürün maskeleri oluşturmak için bir segmentasyon modeli kullanarak arka planı ve ön planı izole ediyor. Canvas, belirli görsel stillerle uyumlu hale getirmek için küratörlü görüntüler üzerinde eğitiliyor ve markaların çeşitli ürün görselleri oluşturmasına olanak sağlıyor. Pinterest, bu sistemi kendi içinde geliştirdiği gizli bir yayılma modeli ile eğitiyor.
Pinterest Canvas'ın Özellikleri
Pinterest Canvas, ürün maskeleri ve stilistik rehberlik için koşullandırma görüntüleri şeklinde keyfi koşullandırma bilgilerini destekleyen bir metinden görüntüye modeldir. Model, sadece Pinterest'te şirket içinde eğitilen gizli bir yayılma modeli olarak oluşturulmuştur. Varyasyonel bir otokoder (VAE) tarafından öğrenilen gizli alanda çalışır. Metin başlıkları hem CLIP-ViT/L hem de OpenCLIP-ViT/G kullanılarak kodlanır ve oluşturma sürecinde metin koşullandırma bilgilerini dahil etmek için çapraz dikkat yoluyla bir evrişimsel UNet'e beslenir.
Eğitim Süreci
Eğitim sırasında, rastgele başlık-görüntü çiftleri bir veri kümesinden örneklenir, VAE kullanılarak gizli gösterimlere kodlanır ve CLIP kullanılarak gömülür. Her görüntü gizlisine gürültü eklenir ve UNet, metin yerleştirme ve zaman adımı endeksi verildiğinde gizliyi gürültüden arındırmakla görevlendirilir. Eğitim verileri, yüksek kalite, güven ve emniyet standartlarını sağlamak için filtrelenir ve 1,5 milyardan fazla yüksek kaliteli metin-görüntü çifti elde edilir.
Bu habere henüz yorum yazılmamış, haydi ilk yorumu siz bırakın!...