21. 9.Minut čtení: 7

Kouzla Aladinovy lampy: AI v životě fotografa a jak ji ochočit

Programy, založené na umělé inteligenci, které momentálně mění způsob naší interakce se světem, již nevratně vstoupily do našich životů. Můžete v nich tvořit texty, hudbu, fotografie, a dokonce i videa. Jelikož se náš časopis věnuje fotografii, zaměříme se zde právě na vizuální oblast. Mezi hlavní hráče na trhu umělé inteligence patří Midjourney, Dall-E a nový program od Adobe. Jsou jich již stovky, trh je velmi pružný a dynamický, a proto není ani tak důležitá samotná značka programu, ale jeho mechanismus. A tyto mechanismy, i když mají určité rozdíly, jsou si přesto podobné...

Text a vygenerované obrázky: Oleg Yakovlev | Přeložila: Galina Gordeeva

OLEG JAKOVLEV je 38letý rusko-izraelský umělec. Má vzdělání v psychologii, urbanistice, výtvarném umění a designu. Hlavními tématy jeho zájmu jsou identita, autenticita, jazyk a realita.

Hlavním způsobem komunikace s umělou inteligencí je text (prompt). Ve světě fotografie to může zpočátku trochu mást, ale když se nad tím zamyslíme hlouběji, zjistíme, že pokaždé když fotíme, jsme nuceni odpovědět si na otázku: CO fotografuji? A v tomto okamžiku prázdný řádek promptu představuje jednoduchou pravdu – co tedy chceš?

AI dokáže všechno, bez jasného požadavku nic. Tento jednoduchý moment může být jak inspirující, tak i frustrující. Fotografové dvacátého století byli zvyklí schovávat se za techniku: „podívejte se na zrno tohoto filmu“, „tento fotograf čísluje všechny své otisky“, „tento fotí jen na prošlý film“... Silný zásah přinesla digitální fotografie, a mimo- chodem, tehdy také mnozí říkali, že to není skutečná fotografie, že snímač není totéž, co film, že úprava v editoru je fejk a podobně. Oheň na střeše vyvolal i samotný zrod fotografie: tehdy byli poníženi a uraženi malíři, kteří právě dosáhli fotografické přesnosti zobrazení reality. Zato po vynálezu fotografie se malířství konečně osvobodilo a prakticky už nemělo potřebu se zabývat dokumentární fixací reality.

Svoboda a zodpovědnost (ani jedna nemá meze) je to, co nám nabízí umělá inteligence. Nyní je možné vymyslet jakýkoli obraz a zrealizovat jej během pár vteřin – bez tun vybavení, asistentů, modelů, smluv. Realita už není potřeba. Tento fakt je stejně inspirující jako znepokojující. Vysvětlím to na příkladu z vlastní praxe.

Mnoho let fotím mužské akty. Z kulturních a jiných důvodů je vždy a všude těžké najít vhodné modely. Ještě složitější je získat svolení k publikaci. A najednou mám před sebou prázdný řádek promptu: během několika minut mohu vizualizovat to, co jsem léta toužil nafotit. Jakási inflace vizuality, ve které je nyní možné vše... no, vlastně ne, protože umělou inteligenci stvořili lidé a lidé mají rádi hranice.

Kulturní fenomén

Jsme zvyklí věřit fotografii. A této důvěry se všichni budeme muset vzdát, a čím dříve, tím lépe. Je zajímavé, že fotografie vždy byla jakousi černou skříňkou: ačkoliv se mechanický proces zachycení světla může zdát naivní a nevinný, je náchylný k subjektivitě.

Obyvatelé Evropy od třicátých let minulého století dobře vědí, čeho je cenzura diktatury schopná a jak elegantně lze odstranit nepohodlné osoby z fotografií – jako by nikdy neexistovaly.

Možná právě tento moment, fenomén fotografie jako kolektivní paměti, musíme prožít: už nikdy to nebude takové jako dřív. Můžete požádat umělou inteligenci, aby vytvořila fotografii křídových jeskyní, prérií, mrakodrapů, šťastné rodiny, vojáka z první světové války, koťátka, Fordovy továrny, a nikdy nebudete moci s jistotou říci, že tento kousek reality na planetě neexistuje nebo neexistoval – natolik realistický bude výsledek. Hranice mezi reálným a metareálným se zde začíná znatelně chvět a téměř rozplývat: možná se stejnou posvátnou hrůzou a úžasem naši předkové před téměř dvěma stoletími pozorovali zjevování obrázku na světlocitlivém materiálu...

Psychologický aspekt

Po ponoření se do světa AI jsem svůj foťák odložil, přestože jsem předtím fotil bez přestávky více než 20 let. Ležel, zaprášený a nepotřebný, v rohu a používal jsem ho pouze jako činku při cvičení.

Umělá inteligence vtahuje: kolik nocí jsem věnoval upřesňujícím dialogům, nudným detailům: chci tohle, takto, tady. Třel jsem tuto kouzelnou Aladinovu lampu až do mozolů a opotřebovaných kláves: „Ó, zroď mi můj sen, obraz, který se léta mihotal někde za hranicemi vědomí!“ A jednou jsem se přesytil: „ano, AI umí všechno. A co umíš ty?

Politický a právní aspekt

Sociální sítě již zavedly označení „Vytvořeno umělou inteligencí“. Samozřejmě to často nefunguje správně a moji přátelé, umělečtí fotografové jsou naštvaní, když jsou jejich pracně vyfocené „reálné“ snímky označovány jako vytvořené v AI. Jak mají zpravodajské agentury ověřovat vizuální obsah? Stále jednoduše věříme klamům a vygenerovaná fotografie mrtvého dítěte může vést k masakru ve skutečnosti.

Umělou inteligenci vytvářejí lidé. A lidé mají rádi hranice. Proto jsou cerbeři cenzury v programech umělé inteligence ještě přísnější než v běžných sociálních sítích. Násilí, erotika, sex – to všechno vám program nedovolí vytvořit, pokud nezačne vyloženě bláznit (ale výsledek bude spíše nechutný a děsivý). Mocná technologie je uměle omezována puritánskými metodami – ale jsem si jistý, že se za chvilku objeví specializované programy pro tvorbu (například) porna na požádání: lidské potřeby se dají omezit, ale zničit je nelze.

Vliv na průmysl

Trh profesionální fotografie se brzy změní. Zatímco dokumentární žánry (svatby, děti, reportáže, zpravodajství) pravděpodobně přežijí, oblast „představivosti“ zcela přebere AI generace. Proč utrácet desítky tisíc dolarů za snové surrealistické focení, když můžete napsat pár promptů a dostat hodně muziky za málo peněz?

Již existují desítky soutěží zaměřených na AI-vytvořené obrázky, a těch za pár let vzniklo více, než vzniklo fotografií během poloviny dvacátého století. I když pracujete s „reálným“ světem, například se zabýváte rodinným focením, stojí za to se naučit pracovat s umělou inteligenci, abyste mohli vygenerovat referenční obrázky. Ať chcete, nebo ne, AI programy se brzy stanou každodenním nástrojem, a to nejen ve fotografickém průmyslu.

META ZÁVĚR

Fotografie je vizuální jazyk, to je to nejdůležitější, co AI odhaluje. My, lidé, myslíme slovy, pojmy, obrazy a pomocí umělé inteligence můžeme tyto myšlenky přímo extrahovat z naší hlavy bez pomoci komplikovaných a drahých přístrojů. Hlavním nástrojem fotografa je jeho mozek, a proto AI pouze usnadňuje úkol předání nápadu. Zbývá jen soustředit se a vybrat z nekonečného množství možností ten obraz, který odráží váš vnitřní impuls. Totální svoboda – lákavá a děsivá zároveň.

TVOŘÍME SPOLU S MIDJOURNEY

V posledních verzích AI programů je kromě textového promptu možné použít i referenční obrázky – což značně rozšiřuje a zjednodušuje způsoby práce. Základní myšlenka je taková: dobrý prompt je jako poezie – musí být přesný, stručný a upřímný. Někteří se snaží AI ovládat dotazy, které připomínají podrobnou právní stížnost, výsledek bývá obvykle zklamáním. AI program není otrok ani fotoaparát, ale spoluautor, i když ne vždy úplně střízlivý. Proto je lepší mu nabídnout téma, náznak, náčrt – a hned se ukáže v tom nejlepším světle. Až poté můžete pečlivě dopracovávat výsledek: přibližovat nebo zobecňovat, měnit detaily, vybírat verze příběhu. Je to fascinující cesta, která vede k vytouženým nádherným výsledkům.

Práci s AI vysvětlím na příkladu Midjourney. V tuto chvíli je to nejdynamičtější a nejšikovnější AI program na vizuální tvorbu. Bohužel, nemůžete pracovat hned na webu (až po vytvoření 1000 obrázků). Práci je třeba začít přes server Discord. Jak to udělat?

1.dRegistrace na Midjourney

Zaregistrujte se na webu Midjourney a zaplaťte si předplatné (nejjednodušší zkušební stojí 12 dolarů měsíčně).

2. Registrace na Discord

Zaregistrujte se na Discordu, připojte tam server Midjourney a pozvěte na svůj server Midjourney Bot, který bude generovat obrázky podle vašeho zadání.

3. Můžete začít

Hlavní příkaz pro bota je /imagine a po něm můžete napsat prompt: teoreticky v jakémkoli jazyce, ale nejlepší je angličtina.

4. Specifikace výběru

Po obdržení prvních výsledku můžeme: buď zvětšit (Upscale) některou ze 4 variant, nebo vytvořit variace (Variations) každého náhledu. Už zde nás to tlačí k iterativní práci.

5. Jakmile jsme vybrali variantu, můžeme:

Vytvořit hi-res (Upscale (Subtle))
Vytvořit hi-res s kreativními změnami (Upscale (Creative))
Vytvořit variace: v podstatě je to návrat k předchozímu kroku se 4 obrázky, ale již na základě vybraného (Vary (Subtle))
Vytvořit velmi odlišné variace vzdálené od originálu (Vary (Strong))
Změnit fragment obrázku (Vary (Region)) – k tomu je třeba vybrat pomocí lasa nebo obdélníkového ořezu požadovaný fragment a napsat, co je třeba v něm změnit.
Zoom Out 2x – „odjezd“ 2x (dokončení obrázku na okrajích)
Zoom Out 1,5x – totéž
Custom Zoom – možnost zoomu do 2x (zoom out 5x není možný za jeden krok)
Make Square – vytvořit čtvercový obrázek, tedy doplnit ho shora-dolů nebo zprava-doleva.

6. Použití zoomu

Provedl jsem zoom-out 1,5x – a dále musím znovu vybrat ze 4 variant – a hned je vidět, kde AI pokulhává (rukávy). Proto vybírám třetí obrázek.

7. Opravení chyb

Zaznamenal jsem chybu na hrudi a využil funkci Vary (Region) – prompt jsem neměnil – v tom případě program jednoduše nabídne několik možností nahrazení „blízkých kontextu“.

8. Nabídka nových variant

Po opravě mi AI nabídla 4 varianty – abych je lépe prohlédl, stačí kliknout na náhled. Mezi nimi není zásadní rozdíl, chyba na hrudníku zmizela, takže vybírám libovolnou variantu a znovu provádím Zoom Out 1,5x.

9. Výběr obrázku

První obrázek mi přijde realističtější, znovu provádím Zoom Out 1,5x.

10. Vygenerování nového Zoom-out

Zde vidíme, že se AI zamotala v rukou a nohách. Zatím je to typické, ale během několika měsíců tyto chyby zmizí. Můžeme udělat tři věci:

Zastavit se u předchozí iterace, kde je obrázek realistický.
„Léčit“ obrázek pomocí funkce Vary (Region) – ale někdy je to velmi zdlouhavý a pečlivý proces.
Požádat Midjourney, aby znovu vygeneroval Zoom Out – tedy kliknout na modrou ikonu se šipkami (Obnovit). Zkusím to udělat právě takto.

11. Opravené končetiny

Jak vidíme, nová iterace je mnohem realističtější. Vybírám 4. variantu a hned provádím Zoom Out 1,5x.

12. Pozor na ruce

Na této velikosti bych se asi zastavil (vybral jsem 3. variantu). Pomocí Vary (Region) opravím některé drobnosti, ale je důležité neuhlazovat obrázek: právě některé detaily běžného prostředí činí umělé vygenerované obrázky fotorealistickými.

13. Opravení pozice rukou

Protože se pravá ruka pořád nepřiblížila realitě, rozhodl jsem se jednat radikálně: vrátit se o krok zpět a použít funkci Vary (Subtle) na celý obrázek: tím „ztratíme“ naši postavu, ale zachováme příběh, kompozici, dokonce i barvu kalhot, a zároveň osvěžíme pohled na obrázek.

14. Úprava pozadí

Vezmu druhou variantu, ale s ní je také potřeba pracovat (nelíbí se mi lampa z hlavy, trochu divná hruď a staromódní košile) – budu to opravovat pomocí Vary (Region).

15. Výsledná oprava hrudníku

Už je to mnohem lepší. Hrudník se mi líbí na druhém obrázku, zbývá tam opravit světla (Vary (Region)).

16. Konečný výběr

Pak trochu doladím rukávy, aby nebyly tak přilnavé a máme hotovo! Vybírám verzi č. 2.

ZÁVĚR

Tím bych to asi uzavřel. V zaměření na detaily, snaze neotupit pohled, vědomém ořezávání, osvětlování, práci s barvami – ve všech těchto ohledech je práce s AI podobná fotografování, jenže nyní zdroj surového materiálu není realita, ale nekonečný archiv otisků této reality, ze kterého umělá inteligence generuje nové obrazy. Samozřejmě s vaší pomocí!

AKTUÁLNÍ

ČÍSLO MAGAZÍNU

Kouzla Aladinovy lampy: AI v životě fotografa a jak ji ochočit

Nejnovější příspěvky

Comments

PŘIHLAŠTE SE K ODBĚRU NOVINEK