AI-genererad konst

Squeeds Julkalender | 2022-12-21 | Jacob Lundberg
Verktyg för att generera konst med hjälp av Artificiell Intelligens (AI) har tagit världen med storm och idag finns flera olika metoder tillgängliga för vem som helst att använda, DALL-E 2, Midjourney och Stable Diffusion. Följ med på min resa från upptäckten av dessa verktyg till vad som är möjligt att skapa med dem.
000027.2829558392.png

Under det gångna året har olika AI-drivna tjänster tagit världen med storm med allt från GitHub Co-pilot (se lucka 18) som kan skriva kod till nu senast med ChatGPT som kan generera, ja nästan vilken typ av text som helst. För egen del har det dock varit de tjänster och modeller som utifrån en textbeskrivning kan generera bilder som fascinerat mig mest. Det kan till exempel se ut så som bilden nedan där jag bett DALL-E 2 rita en astronaut som rider på en häst.

Det var i höstas som OpenAI släppte sin tjänst DALL-E 2 öppet för alla att testa efter en tid av stängt betatest. Vem som helst kunde då skapa ett konto och få lite gratis krediter att spendera varje månad med möjligheten att betala för fler när gratisbilderna tagit slut, den första fixen är alltid gratis.

Detta exploderade snabbt och plötsligt var mina flöden i sociala medier och andra kommunikationskanaler fyllda till bredden av olika häftiga, vackra och (tämligen ofta) humoristiskt imperfekta bilder. Jag ville ju inte vara sämre och skrev snabbt upp mig för att se vad DALL-E 2 kunde skapa och några av mina första försök såg ut så här.

"Pandas eating bamboo in the style of van Gogh""Gold in the air on an autumn day in the mountains and a lake""Digital art of Danny DeVito as an evil wizard"

Detta var ju alldeles för roligt och det tog inte lång tid innan jag hade förbrukat alla mina gratisbilder och hade behövt vänta tills nästkommande månad för en påfyllning eller helt enkelt öppna plånboken. Lyckligtvis upptäckte jag ungefär samtidigt att det fanns en annan modell, Stable Diffusion, som kan köras på sin egen dator med hjälp av Open-Source verktyg. Det enda som krävs är ett inte allt för gammalt Nvidia-grafikkort (till och med mitt gamla GeForce GTX 1060 6GB fungerar) samt lite tålamod för installationen.

Efter inte alltför mycket strul var jag igång och kunde nu åter generera häftiga bilder. Och visst, det gick kanske inte lika snabbt som med DALL-E 2 men nu behövde jag inte oroa mig för att några krediter skulle ta slut och jag fick tillgång till många fler inställningar att leka med. Jag kunde nu experimentera mer frikostigt för att lära mig hur man kan skriva sin text för att generera bättre bilder och förstod vad som var möjligt och inte. Här är några av de första bilderna jag genererade med min egen dator.

"Boba Fett getting ice cream""Yoda in a tuxedo, oil on canvas"

Detta var ju ännu roligare! Men mitt verkliga intresse väcktes inte förrän jag härnäst upptäckte verktyget Dreambooth som gör det möjligt att anpassa Stable Diffusion modellen på saker den inte är tränad på, till exempel bilder på sig själv. Jag läste mig in på hur Dreambooth fungerar och samlade snabbt ihop ett gäng bilder på mig och satte igång.

Här räckte dock inte min dator så jag fick ta och hyra lite beräkningstid från en molntjänst med tillgång till lite kraftigare resurser. Efter lite mer än en timme och ungefär tio kronor fattigare var processen slutförd och jag kunde hämta hem min uppdaterade modell och börja experimentera. Självklart var det första jag genererade bilder på mig som om de vore målade av kända konstnärer.

RembrandtVan Gogh

Denna hobby växte snabbt till en stor besatthet och jag ägnade i stort sett all ledig tid åt generera roliga bilder som ibland såg mer eller mindre ut som mig. Ibland blev det dock fel, väldigt fel.

Efter detta mardrömsbränsle lärde jag mig nya tekniker och verktyg som till exempel

  • "Bild till bild" generering, utgår från en grundbild istället för en blank yta vid.
  • Inpainting, modifiera bilder genom att endast tillåta att delar av den målas över.

Med dessa tekniker till hjälp kunde jag göra bilder av mig som en trollkarl.

Som en cyber-ninja.

Eller varför inte som en karaktär från filmens värld.

Detta är så långt jag kommit idag men min resa och mitt lärande om dessa verktyg är långt ifrån över. Det händer väldigt mycket inom detta område och det sker ofta stora framsteg. Ett stort Open-Source community bidrar med att utveckla nya features samt göra så att verktygen går att köra på allt enklare hårdvara.

Avslutningsvis vill jag och mitt tomte alter ego, som fick bli årets julkort, önska er alla en riktigt God Jul och ett Gott nytt år!

Länkar