Kaip dirbtinis intelektas keičia fotografiją: nuo paprastų filtrų iki generatyvinio vaizdavimo

·


Fotografija niekada nebuvo tokia paplitusi kaip šiandien. Kiekvienas turi fotoaparatą kišenėje, milijardai nuotraukų daromos kasdien. Bet per pastaruosius kelerius metus įvyko kažkas esminio: dirbtinis intelektas pradėjo ne tik pagerinti nuotraukas, bet ir jas kurti iš naujo. Tai nėra filtrai. Tai yra kažkas daug fundamentaliau.

Šiame straipsnyje aiškiname, kaip DI keičia fotografiją, kokios technologijos tai lemia, ir ką tai reiškia tau kaip fotografui ar paprastam vartotojui.

Nuo filtrų iki turinio supratimo: kaip DI „mato” nuotrauką

Pirmieji DI patobulinimų etapai buvo paprasti: automatinis ryškumo reguliavimas, spalvų balanso koregavimas, „gražesnio” vaizdo kūrimas. Tai darė tokie įrankiai kaip Google Photos „Magic Eraser” arba iPhone „Enhance”.

Tačiau šiuolaikinis DI fotografijoje veikia kitaip. Jis supranta turinį. Ne tik pikselių reikšmes, bet ir kas yra nuotraukoje: žmogus, fonas, šviesa, erdvė, perspektyva, emocija. Tokį supratimą suteikia konvoliuciniai neuroniniai tinklai (CNN) ir vizualinio transformatoriaus architektūros.

Kai DI „žino”, kas yra nuotraukoje, jis gali daryti daug daugiau. Gali atskirti žmogų nuo fono ir keisti tik foną. Gali pašalinti nepageidaujamą objektą ir natūraliai užpildyti jo vietą. Gali pakeisti apšvietimą taip, lyg nuotrauka būtų daryta visai kitoje vietoje.

Generatyvinis DI: kai nuotrauka tampa kuriama, o ne tik padaroma

Didžiausias šuolis įvyko su generatyviniu DI. Skirtumas esminis: anksčiau DI taisė tai, kas jau buvo nuotraukoje. Dabar jis gali kurti tai, ko nebuvo.

Kelios konkrečios galimybės:

  • Inpainting: pašalini objektą ir DI generuoja tikrovišką foną jo vietoje.
  • Outpainting: praplečia nuotrauka už originalių ribų, generuodamas naują aplinką.
  • Spatial Reframing: kaip demonstravo Apple iOS 27, DI „performinėja” kamerą ir generuoja nuotrauką iš kito rakurso.
  • Relighting: pakeičia šviesos šaltinį nuotraukoje, kaip kad Adobe Firefly siūlo.

Šios galimybės remiasi tais pačiais modeliais, kurie generuoja vaizdo įrašus. Jei domina, kaip DI generuoja vaizdo įrašus, ten rasite gerą tos pačios technologijos paaiškinimą.

Kokie DI įrankiai keičia fotografiją dabar?

Šiuo metu labiausiai paplitę įrankiai:

Adobe Firefly integruotas tiesiai į Photoshop ir Lightroom. Generatyvus užpildymas, fonas, tekstūros. Profesionalų standartas redagavimui.

Google Photos su „Magic Editor”: automatinis fono keitimas, objektų šalinimas, kompozicijos taisymas. Prieinama milijardams vartotojų nemokamai.

Apple Intelligence iOS 27 su Spatial Reframing ir „Extend” įrankiu: perspektyvos keitimas, papildomo fono generavimas. Daugiau apie iOS 27 DI galimybes.

Ideogram, Midjourney, DALL-E: visiška nuotraukos kūrimas iš teksto prompt’o, nebe tik redagavimas.

Kur yra riba tarp „originalios” ir „DI sukurtos” nuotraukos?

Tai filosofinis klausimas, kuris tampa vis aktualesnis. Kai DI gali pakeisti foną, personą, apšvietimą, perspektyvą ir kompoziciją, kiek liko „originalo”?

Profesionalios fotografijos pasaulyje šis klausimas jau sprendžiamas praktiškai. Didžiausi foto leidiniai, kaip Reuters ir Associated Press, draudžia generatyvų DI redagavimą žurnalistinėse nuotraukose. Meno fotografijoje ribos nėra.

Kasdieniam vartotojui ši dilema mažiau aktuali. Jei nori, kad šeimos nuotrauka atrodytų geriau, DI yra paprasčiausias būdas tai pasiekti.

Ką tai reiškia pradedančiajam fotografui?

Geriausia žinia: DI nepakeičia kūrybinės vizijos. Jis tik eliminuoja technines kliūtis.

Anksčiau tobula fotografija reikalavo tinkamos įrangos, perfekto apšvietimo ir daug techninio mokymosi. Dabar DI gali ištaisyti daugelį techninių klaidų. Tai reiškia, kad daugiau laiko gali skirti kompozicijai, momentui ir istorijai, o ne techniniams nustatymams.

Jei esi smalsus apie DI kūrybiniams procesams plačiau, perskaityk mūsų apžvalgą apie Ideogram 4, laisvai prieinamą DI vaizdo generatorių, kuris pirmą kartą lenkia mokamus įrankius.

Kur fotografija eina toliau?

Per artimiausius metus DI ir fotografija susilies dar labiau. Vaizdo modeliai taps tikslesniais. Mobilieji įrenginiai gaus galingesnę aparatinę įrangą DI apdorojimui. Realaus laiko DI per vaizdo kamerą taps standartu.

Ir galbūt svarbiausia: riba tarp „foto” ir „video” išnyks. Jau dabar Apple Spatial Reframing veikia su nuotraukomis taip pat, kaip DI vaizdo modeliai veikia su kadrais. Netrukus tų ribų nebeliks.

Fotografija visada buvo technologijos ir kūrybiškumo sankirta. DI tiesiog padaro tą sankirtą stipresnę nei bet kada anksčiau.