Dvidešimto amžiaus pabaigoje dažnai tekdavo girdėti, kad kompiuteris nepadarys kokios nors veiklos. Tarkime, grindų neišsiurbs. Štai, važinėja dabar grindimis blynas, vardu Kiborgas Dulkių Žudikas ir sriaubia į save visokias dulkes, neatsargiai numestas Lego detales ir kitus besimėtančius dalykus. Dvidešimt pirmo amžiaus pradžioje dažnai tenka girdėti, kad dirbtinis intelektas nepadarys kokios nors veiklos. Dažniausiai tai ne paprasti darbai, o tai, kas reikalauja kūrybiškumo. Pabandykite įsivaizduoti merginą stovinčią ant ežero kranto tolimoje planetoje ir laukiančią kosminio laivo. Pavyko? Pabandykime įsivaizduoti ką nors paprastesnio. Šeši sovietų pionieriai besikaunantys su ragana senoje bažnyčioje. Anime stiliumi. Dirbtinis intelektas šituos dalykus geba sukurti (sugeneruoti?). Kiek seniau testavau „Stable Diffusion“ gebėjimus, neseniai visiems prieinamų tapo ir „DALL-E2“ menininkas. Nesu dirbtinio intelekto žinovas, todėl techninių detalių nekomentuosiu, į šiuos produktus žiūrėsiu kaip galutinis vartotojas, verčiantis dirbtinį menininką kurti paveikslėlius pagal keistas užklausas.
Nesu tikras ar tai techninė detalė, tačiau visas menas sukurtas su „Stable Diffusion“ yra open source (nesivečia liežuvis apie paveikslėlius sakyti „atvirojo kodo“) – su juo galite daryti ką tik norite, o štai „DALL-E2“ turi licencijų skydą – sukurtais paveikslėliais galite naudotis, bet jie jums nepriklauso. Beje, pirmoji sistema yra atviro kodo ir jei norite, galite viską pasileisti, kad ir savo kompiuteryje, tik jūsų vaizdo plokštė turi turėti bent 6GB atminties.
Abi sistemas galima išbandyti nemokamai, „Stable Diffusion“ turi smarkiai apribotą demonstraciją kurią galima bandyti kiek tik nori (https://huggingface.co/spaces/stabilityai/stable-diffusion). Na, o jei apribojimai erzina arba norisi daug daug daug dirbtinio intelekto meno, galima nusipirkti taškų ir nerti į makaliūzes (https://beta.dreamstudio.ai/home). DALL-E2 (https://openai.com/dall-e-2/) prisiregistravus duoda nemokamų taškų kūrybai, vėliau reikia pirkti arba laukti kol kiekvieną mėnesį įbyrės nemokami 15 taškų.
„DALL-E2“ vartotojo aplinka minimalistinė tiek, kad joje tėra teksto laukelis, kuriame įrašote savo norus ir dirbtinis intelektas sukonstruoja keturis paveikslėlius. Paveikslėlių dydis fiksuotas 1024×1024 pikseliai, jie parsisiunčiami kaip PNG failai. „Stable Diffusion“ leidžia kontroliuoti gerokai daugiau dalykų, pavyzdžiui, kiek paveikslas turi atitikti jūsų užklausą, o kiek dirbtinis intelektas gali prifantazuoti. Galima pasirinkti paveikslėlio dydį nuo 512×512 iki 1024×1024 pikselių, jis išsaugomas PNG formatu. Apkramtytoje „Stable Diffusion“ versijoje galite įvesti tik paieškos frazę (kadaise veikė ir išplėstiniai nustatymai) ir gaunate keturis 512×512 dydžio rezultatus JPG formatu.
Dirbtinio intelekto kuriamu menu rimčiau pasidomėjau perskaitęs straipsnį apie jo laimėtą prizą. Tuomet nėręs į informacijos liūną aptikau gražių paveikslėlių, raudų kaip dirbtinis intelektas žudo meninkus, išdidžių kalbų kaip dirbtinis intelektas niekada nekurs meno, nes tai daryti gali menininkai, aptikau dar gražių paveikslėlių. Ir tuomet pats išbandžiau kaip visa tai veikia. Rezultatai labai nevienareikšmiški. Tikimybių teorija neneigia galimybės, kad kelis kartus galva trenkę į klaviatūrą sukursite nuostabų eilėraštį. Nesakau, kad čia galva trankome molbertą, bet… kartais jausmas būtent toks.
Nežinia ar man taip sekėsi ar iš tiesų „DALL-E2“ buvo labai šlovinamas tarp bandytojų kaip kuriantis puikius rezultatus. Taip, jis sukuria ir tokių. Kaip ir kiti dirbtiniai menininkai. Daugiausiai dvejonių man sukėlė jo gebėjimas kurti kokiu nors stiliumi. „Stable Diffusion“ bent man čia atrodo smarkiai geriau. Žiūrovai gana lengvai atspėdavo kieno stilius imituojamas. „O Dieve! Kokia čia šlykštynė? Gal Rubensas?” „DALL-E2“ sukurtą Rubensą atskirti sekėsi sunkiau. Su Salvadoro Dali kūryba rezultatas buvo panašus. Piešimo pieštuku stilius lengviausiai įveikiamas abiems sistemoms, sakyčiau, kad jos čia visiškai lygiavertės. Štai anime stilius yra visiškai neįveikiamas „DALL-E2“ sistemai. Atrodo, kad šis žodis tiesiog ignoruojamas. Panaši situacija ir bandant išspausti ką nors kiberpankinio – retai rezultatas atitinka lūkesčius. Su panašiomis užklausomis „Stable Diffusion“ susitvarko lengvai.
DALL-E2
„Anime hacker in futuristic train“
Stable Diffusion
„Anime hacker in futuristic train“
Hakeriai? Nesu tikras. Futuristinis traukinys? Sakyčiau po vieną iš kiekvieno intelekto turime. Anime? Nors ir kreivas šleivas, bet tik „Stable Diffusion“.
DALL-E2 „cyberpunk girl with cat looking trhough window to futuristic city anime style“
Stable Diffusion „cyberpunk girl with cat looking trhough window to futuristic city anime style“
DALL-E2 vs Stable Diffusion
Cyberpunk girl? 0:3
Cat? 4:7
Futuristic city? 0:4
Anime style? 0:4
Mergaitis / berniukė? 0:1
Tikrai verta atskirai paminėti veidus. Po pirmųjų „DALL-E2“ bandymų man kilo įtarimas, kad sistema kuria tokius veidus, kuriuos mylėti gali tik juos sukūręs dirbtinis intelektas.
DALL-E2
„dwarf cleric fighting giant rat in cellar medieval style“
„steampunk girl with cat looking trhough window to futuristic city“
Vis dėl to paprašius sukurti būtent veidą, rezultatas atrodė labai gerai. Po ankstesnių jo kūrinių tai tikrai buvo „WOW!“ akimirka.
DALL-E2
„Woman figter face closeup cyberpunk style“
„Stable Diffusion“ kuria normalius veidus. Nemačiau rezultato, kuris labai nudžiugintų, bet dažniausiai ir neišgąsdina.
Stable Diffusion
„Woman figter face closeup cyberpunk style“
Vis dėl to abi sistemos gana prastai susidoroja su mažesniais veidais arba su didesniu kiekiu veidų. Net nežinau kurio intelekto kuriami mutantai man priimtinesni. Atrodo, kad „DALL-E2“ bando kurti kažką panašaus į veidą toje vietoje, kur jis turėtų būti. Tai gal labiau primena dailininko mėginimą keliais štrichais nupiešti veidą, kad kada nors vėliau nepamirštų vėliau gražiai ir detaliai nutapyti.
DALL-E2
„Woman ranger with bow in forest“
„Stable Diffusion“ nebijo stačia galva nerti į body horror gelmes. Jis bando konstruoti veidą tinkantį visam piešinio stiliui, tačiau kartais rezultatas būna kraupokas. Ir tie kartai ne tokie reti. Sakyčiau, kad stilistiškai tie veidai prie bendro vaizdo tinka lyg ir labiau, jie atrodo kaip natūrali paveikslo dalis. Tik ne natūrali mus supančios gamtos dalis.
Stable Diffusion
„Peter Paul Rubens style painting of lunar landing“
Emocijų perteikimas nežavi nė vienoje iš sistemų. „DALL-E2“ turi galimybę perkurti paveikslėlio dalį, ja pasinaudodamas pabandžiau pakoreguoti būtent veidą. Turiu pripažinti, kad vėlesni generavimai tiko prie paveikslėlio stilistikai, na, bet rezultatas vis tiek nenudžiugino.
DALL-E 2
„sad anime girl near destroyed giant robot“
Pirmas paveikslėlis – pirmas generavimo rezultatas. Likusieji – bandymas pakoreguoti veidą.
Pastebėjau, kad „Stable Diffusion“ mėgsta pridėti papildomų galūnių, ar kitų detalių visiems gyviems padarams. Kuo mažiau gyvų padarų, tuo geresnius rezultatus sukuria dirbtinis intelektas.
Stable Diffusion
„Dwarf fights a giant rat in sewer oil painting HQ“
„Stable Diffusion“ turi polinkį kelis kartus pakartoti paieškoje užsakytus dalykus. Nori lankininkės? Štai, tau lankininkė! Ir dar viena! Su keturiomis rankomis! Tokių dėsningumų nepastebėjau su „DALL-E2“.
Stable Diffusion
„Woman ranger with bow in forest“
Abi sistemas reikia prisijaukinti, jei norite gerų rezultatų. Jei norite fotorealistinių žmonių minios stebinčios skraidantį laivą, belieka palinkėti sėkmės. Ta pati paieška nurodžius piešimą pieštuku ar kreidelėmis situaciją smarkiai pakeičia.
DALL-E2
„Steampunk girl riding bycicle in old town“
DALL-E2
„Steampunk girl riding bycicle in old town pencil drawing on brown paper“
Stable Diffusion
„Steampunk girl riding bycicle in old town“
Stable Diffusion
„Steampunk girl riding bycicle in old town pencil drawing on brown paper“
Pašalinus žmones abi sistemos sugeneruoja gražius rezultatus.
DALL-E2
„town in snow trenches matte painting trending on artstation“
Stable Diffusion
„town in snow trenches matte painting trending on artstation“
DALL-E2
„girl waiting for spaceship near lake on distatnt planet matte painting trending on artstation“
Stable Diffusion
girl waiting for spaceship near lake on distatnt planet matte painting trending on artstation
Bene įdomiausias eksperimentas buvo kurti vieno dailininko paveikslą kito dailininko stiliumi. Yra toks Salvadoro Dali paveikslas „Dream Caused by the Flight of a Bee Around a Pomegranate a Second Before Awakening“
Pamaniau, kad pavadinims skamba pakankamai įspūdingai, kad galėčiau jį duoti dirbtiniam intelektui. Pripažinsiu, „DALL-E2“ tikėjausi įspūdingesnior rezultato, nes pats pavadinimas įpareigoja. Taigi, jeigu Dali paveikslus tapytų Rubensas rezultatai būtų tokie.
DALL-E2
„Dream Caused by the Flight of a Bee Around a Pomegranate a Second Before Awakening“
Stable Diffusion
„Dream Caused by the Flight of a Bee Around a Pomegranate a Second Before Awakening“
Gana įdomiai veikia dirbtinio intelekto cenzūra, tarkime, jei sugeneruojate paveikslėlį, kuris gali būti koks nepadorus ar kitaip netinkamas turinys. Dall-E2 piktybiškai tokio negeneruoja. Kiek bandžiau subtiliai išprovokuoti, tiek jis pateikdavo nekaltus vaizdelius. Stable Diffusion kartais sulieja paveikslėlius, kad galėtum pasukti galvą kas jau ten tokio nepadoraus.
DALL-E2
„Adam and Eve eating hamburger near volcano mate oil painting by Rubbens“
Stable Diffusion
„Adam and Eve eating hamburger near volcano mate oil painting by Rubbens“
Taigi, ar dirbtinis intelektas atims duoną iš meninkų? Tikriausiai taip. Nemanau, kad tai įvyks artimiausiu metu, dabar dirbtinis tepliotojas žengia pirmus žingsnius ir tai, ką jis daro galime palyginti su pirmosiomis vaiko makaliūzėmis. Ar tai taps kažkuo rimtesniu? Kodėl gi ne? Dabar jis pagal tam tikras frazes bando sulipdyti vaizdą, kartais sėkmingai, kartais ne. Ar šis kelias labai skiriasi nuo žmogaus, kuris remdamasis savo turima patirtimi bando sukurti kažką naujo pagal jam galvon šovusią mintį?
Ar sugebėsite atskirti kur žmogaus, o kur dirbtinio intelekto darbas?