OpenAI paleido ChatGPT Images 2.0: vaizdų generavimas pagaliau turi protą
·

1024 pikseliai. Tiek pakako, kad internetas prarastų galvą. OpenAI pirmadienį paleido ChatGPT Images 2.0 su nauju gpt-image-2 modeliu, ir šį kartą tai ne šiaip gražių paveikslėlių generatorius.
Skirtumas nuo ankstesnių versijų? Modelis pagaliau supranta, ką piešia. Jei paprašai „parduotuvės iškabos su tekstu SALE 50%” – jis tikrai parašys tuos žodžius be klaidų. Skamba banaliai, bet dar prieš pusmetį DI modeliai tekste ant paveikslėlio sukurdavo tokią košę, kad geriau nerodyti.
Kas pasikeitė techniškai
gpt-image-2 dirba su 2K rezoliucija ir palaiko kelių vaizdų nuoseklumą vienoje sesijoje. Tai reiškia, kad gali sukurti produkto nuotraukų seriją, kur visur tas pats stilius, tie patys šešėliai, ta pati apšvietimo kryptis. Anksčiau reikėjo Photoshop ir 3 valandų rankinio darbo.
Tekstas ant paveikslėlių veikia lotynų ir CJK (kinų, japonų, korėjiečių) rašmenyse. UI maketus, produktų etiketes, ranka rašytus užrašus – viską atvaizduoja skaitomai. Na, bent jau OpenAI taip tvirtina.
Kam tai naudinga praktiškai
Jei turi el. parduotuvę ir kas savaitę reikia 20 produkto nuotraukų su kainomis – šitas įrankis tau sutaupys ne valandas, o dienas. Jei kuri socialinių tinklų turinį ir reikia vizualų su tekstu – DI socialiniams tinklams jau rašėme, bet dabar galimybės šoko į kitą lygį.
Dizaineriai turėtų būti truputį neramūs. Ne todėl, kad DI juos pakeis rytoj. Bet todėl, kad 80% rutininio vizualinio darbo ką tik tapo 10 kartų pigesni.
Kontekstas
OpenAI šį mėnesį pila naujoves viena po kitos. Prieš tai buvo Codex darbalaukio agentas, dar anksčiau GPT-5.4 Cyber kibernetiniam saugumui. Atrodo, kad Sam Altman ruošiasi IPO ir nori parodyti investuotojams kuo daugiau produktų.
Google su Gemini 3.1 Ultra irgi nelaukia. Vaizdų generavimo karas tik prasideda.
Bet štai klausimas: ar tau tikrai reikia 2K rezoliucijos DI paveikslėlio, jei jį vis tiek suspaus Instagram iki 1080px?


