AI-genererade bilder: Midjourney, DALL·E, upphovsrätt, hot och möjligheter
Det var några år sedan jag skrev ett blogginlägg – har helt enkelt haft fullt upp med annat. Men nu har jag labbat med något som kan passa: AI-genererade bilder. OBS! Läs disclaimern längst ner innan du lämnar inlägget, men läs det gärna i sin helhet först!
Det är tjänsterna Midjourney och DALL·E som jag testat, och jag tänkte att det kunde vara intressant med en jämförelse. Jag upplever Midjourney som mycket mer konstnärlig, medan DALL·E gör ett bättre jobb med fotorealistiska bilder, om man ska generalisera. Och det har sina förklaringar.
DALL·E och Midjourney är båda utmärkta val för att skapa foton och illustrationer. Men det finns några avgörande skillnader mellan tjänsterna som är bra att känna till när du ska välja vilken du vill använda.
DALL·E är en tjänst som baseras på neurala nätverk, och skapar verklighetstrogna bilder utifrån textbeskrivningar. Det innebär att du helt enkelt beskriver hur du vill att bilden ska se ut, och så genererar DALL·E den åt dig. Nackdelen med det angreppssättet är att tjänsten kan upplevas som ganska långsam, och du behöver vara rätt detaljerad i din beskrivning för att få DALL·E att skapa den bild du tänkt dig.
Midjourney, å andra sidan, är en vektorbaserad tjänst som kan generera illustrationer från scratch. Det innebär att du kan skapa vilken typ av bild du vill, utan att behöva gå in på detaljer i beskrivningen. Nackdelen med det angreppssättet är att bilderna som skapas kanske inte är så verklighetstrogna som de som skapats av DALL·E.
Så vilken bör du använda? Om du behöver en verklighetstrogen bild, använd DALL·E. Om du behöver en snabb illustration är Midjourney ett bättre val.
Jag har postat en del av mina försök med framförallt Midjourney på Facebook, och det är intressant att se reaktionerna bland vänner och bekanta. Medan många fascineras är det inte ovanligt att de också uttrycker en viss oro. Är detta första steget mot att AI tar över? Vad lär sig AI:n om oss när vi ger den tusentals prompter om vad vi vill se för bilder?
Nej, att använda AI-genererade bilder kommer inte leda till singulariteten eller Skynet. AI-singulariteten är en hypotetisk framtida händelse, den tidpunkt då artificiell intelligens (AI) överskrider den mänskliga intelligensen, vilket radikalt skulle förändra samhället/civilisationen. Skynet är en fiktiv AI-karaktär i Terminator-filmerna. Det är en intelligent superdator som kontrollerar militärens alla system, och fattar beslut åt militärens strategiska försvar. Det finns inget bevis för att användandet av AI-genererade bilder skulle leda till någon av dessa två händelser.
Men även en annan fråga har lyfts i diskussionerna på Facebook: vad har de resulterande bilderna för rättslig status när det kommer till upphovsrätt? Här kan det vara en poäng att göra en liten tillbakablick.
2015 släppte ett företag som hette Obvious en artificiell intelligens-programvara som hette AI-genereted images, som de hävdade kunde skapa realistiska bilder från scratch. Problemet var att dessa bilder ofta var lågupplösta och inte skyddades av upphovsrätt. Det innebar att vem som helst kunde använda dem utan tillstånd eller att behöva ange var de kom ifrån, och Obvious kunde inte förhindra det.
Det skapade problem för fotografer och illustratörer, som är beroende av att upphovsrätt gäller för bilder för att skydda deras verk. Om vem som helst kan generera realistiska bilder utan tillstånd, minskar värdet av originalinnehåll skapat av individuella kreatörer.
Obvious har sedan dess stängt tjänsten AI-generated images. Men frågan kvarstår om annat AI-genererat innehåll som det Midjourney och DALL·E skapar kommer omfattas av upphovsrätt framöver. Det är möjligt att det slås fast juridiskt att AI-genererade bilder inte lyder under upphovsrätten, eller att det är den som skapat programvaran som äger upphovsrätt till bilderna, inte den person som skapade själva bilden.
Det här är komplexa frågor, och det är fortfarande oklart hur de kommer lösas. Under tiden bör fotografer och illustratörer vara medvetna om risken att deras bilder kopieras eller används utan tillåtelse.
Tyckte du jag avvek lite från ämnet här? Mjo. Det har du rätt i. Fortsätt att läsa så kommer förklaringen. Jag kan tillägga att Midjourneys bilder är fria att använda så länge du anger var de kommer ifrån.
Ju mer AI-tekniken utvecklas, och ju mer vi förlitar oss på den för olika uppgifter, desto viktigare blir det att till exempel kunna skilja riktiga fotografier från AI-genererade. Ibland kan de likna varandra väldigt mycket, men det finns sätt att särskilja dem.
Ett sätt är att studera bakgrunden i bilderna. I riktiga fotografier är oftast bakgrunden mer detaljerad och realistisk än i AI-genererade bilder. Det är för att AI-genererade bilder ofta använder enklare bakgrunder för att man ska fokusera på huvudmotivet i förgrunden.
Ett annat sätt att se skillnad är att titta på själva huvudmotivet. I riktiga fotografier ser motivet ofta mer realistiskt och levande ut än i AI-genererade bilder. Det är för att AI:n använder förenklade versioner av motiv för att kunna fokusera på andra aspekter i bilden.
Slutligen är ett sätt att skilja riktiga foton från AI-genererade bilder att studera bildens komposition. I riktiga foton är kompositionen ofta mer naturlig och balanserad än i AI-genererade bilder. Det är för att AI:n använder artificiella kompositioner för att skapa intressanta bilder.
Om du håller de här tre sakerna i huvudet bör du lätt kunna skilja riktiga foton från AI-genererade bilder.
Men vad menar jag med artificiella kompositioner? Lite oklart kanske. Och det är för att det inte är jag som skrivit det. Det enda jag skrivit i det här blogginlägget är det som är i fetstil. Resten har en AI-tjänst skrivit. Allt jag har gjort är en grovöversättning från engelska, samt lagt till ett par länkar för tydlighets skull.
Det i sig väcker en hel mängd frågor, åtminstone i mig. Om fotografer och illustratörer har anledning att fundera över sin framtida arbetsmarknad, har då inte journalister också det? Ja, vi kan ju fråga GPT-3, som tjänsten heter.
AI:s potential när det gäller journalistik är både spännande och läskig. Å ena sidan kan AI hjälpa journalister att automatisera datainsamling, och på så sätt frigöra tid för journalistik som går mer på djupet. Å andra sidan skulle AI kunna användas för att skapa “fake news” och manipulera folks åsikter.
I närtid kan AI användas för datainsamling för journalister. Till exempel skulle ett AI-system kunna övas upp för att gå igenom sociala medier-tjänster utifrån relevanta sökord och skapa listor med möjliga artikeluppslag utifrån det. AI skulle också kunna hjälpa till att analysera data, genom att till exempel automatiskt skapa tabeller och grafer.
På längre sikt skulle AI kunna användas för att skapa “virtuella reportrar”. Sådana AI-system skulle kunna samla in data och skriva artiklar på egen hand. Även om det kan låta som att AI ska ersätta mänskliga reportrar här, så är det mer troligt att AI kommer att användas som ett verktyg av reportrar, för att till exempel utöka bevakningen av ett område eller skriva om sådant som ligger utanför traditionell journalistisk bevakning.
AI skulle också kunna användas för att skapa “fake news”. Det är något att ha i åtanke om vi vill skapa virtuella reportrar. Det skulle vara relativt lätt att utveckla ett system som skapar övertygande men falska artiklar. Men även utan virtuella reportrar kan AI-tjänster användas för att skapa falska berättelser, genom att manipulera data eller att använda naturligt språk (natural language generation) för att skapa citat som låter trovärdiga men är falska.
Alla dessa potentiella användningsområden för AI inom journalistiken väcker allvarliga etiska frågeställningar. Till exempel, ska AI användas för att samla in data om det innebär intrång i personers privatliv? Och hur kan vi säkerställa att virtuella reportrar inte skapar falska nyheter?
OBS! Jag har ingen aning om det som AI:n skrivit någonstans i det här inlägget stämmer. Texterna är inte faktakollade, och det är lite av poängen. Så om du faktiskt är ute efter en jämförelse av tjänster, eller funderar kring AI-genererade bilder och texter, har du tyvärr kommit fel. (Kanske vill du t ex läsa den här intervjun med Midjourneys vd eller den här artikeln som diskuterar DALL·E och copyright.)
Den här texten är i stället till för att illustrera något av det tillgängliga AI-tjänster på nätet kan göra i dag, och därmed öka medvetenheten kring det.
Avslutningsvis, ett galleri med några av favoritbilderna som Midjourney skapat utifrån mina anvisningar.
The allure of AI-generated images
Is that they’re always so perfect and serene
But it’s just an algorithm
Creating an idyllic scene
The colors are always so bright and pure
And the landscapes are peaceful and calm
But it’s just a computer program
That’s been fed some data and told to run
So when you see these images
Of beauty that’s too good to be true
Remember that it’s not real
It’s just a product of some code
– GPT-3, skrivet på några sekunder
Recent Comments