AI-genererade bilder: Midjourney, DALL·E, upphovsrätt, hot och möjligheter

by lotta · September 2, 2022

Det var några år sedan jag skrev ett blogginlägg – har helt enkelt haft fullt upp med annat. Men nu har jag labbat med något som kan passa: AI-genererade bilder. OBS! Läs disclaimern längst ner innan du lämnar inlägget, men läs det gärna i sin helhet först!

Det är tjänsterna Midjourney och DALL·E som jag testat, och jag tänkte att det kunde vara intressant med en jämförelse. Jag upplever Midjourney som mycket mer konstnärlig, medan DALL·E gör ett bättre jobb med fotorealistiska bilder, om man ska generalisera. Och det har sina förklaringar.

Midjourney-illustration av prompten: Midjourney and DALL·E in a boxing fight, ink and charcoal illustration in the New Yorker, high resolution, blue, green, extreme, zoomed out

DALL·E och Midjourney är båda utmärkta val för att skapa foton och illustrationer. Men det finns några avgörande skillnader mellan tjänsterna som är bra att känna till när du ska välja vilken du vill använda.

DALL·E är en tjänst som baseras på neurala nätverk, och skapar verklighetstrogna bilder utifrån textbeskrivningar. Det innebär att du helt enkelt beskriver hur du vill att bilden ska se ut, och så genererar DALL·E den åt dig. Nackdelen med det angreppssättet är att tjänsten kan upplevas som ganska långsam, och du behöver vara rätt detaljerad i din beskrivning för att få DALL·E att skapa den bild du tänkt dig.

Midjourney, å andra sidan, är en vektorbaserad tjänst som kan generera illustrationer från scratch. Det innebär att du kan skapa vilken typ av bild du vill, utan att behöva gå in på detaljer i beskrivningen. Nackdelen med det angreppssättet är att bilderna som skapas kanske inte är så verklighetstrogna som de som skapats av DALL·E.

Så vilken bör du använda? Om du behöver en verklighetstrogen bild, använd DALL·E. Om du behöver en snabb illustration är Midjourney ett bättre val.

DALL·E-illustration av prompten: Midjourney and DALL·E in a boxing fight, ink and charcoal illustration in the New Yorker, high resolution, blue, green, extreme, zoomed out (outpainted)

Jag har postat en del av mina försök med framförallt Midjourney på Facebook, och det är intressant att se reaktionerna bland vänner och bekanta. Medan många fascineras är det inte ovanligt att de också uttrycker en viss oro. Är detta första steget mot att AI tar över? Vad lär sig AI:n om oss när vi ger den tusentals prompter om vad vi vill se för bilder?

Nej, att använda AI-genererade bilder kommer inte leda till singulariteten eller Skynet. AI-singulariteten är en hypotetisk framtida händelse, den tidpunkt då artificiell intelligens (AI) överskrider den mänskliga intelligensen, vilket radikalt skulle förändra samhället/civilisationen. Skynet är en fiktiv AI-karaktär i Terminator-filmerna. Det är en intelligent superdator som kontrollerar militärens alla system, och fattar beslut åt militärens strategiska försvar. Det finns inget bevis för att användandet av AI-genererade bilder skulle leda till någon av dessa två händelser.

Men även en annan fråga har lyfts i diskussionerna på Facebook: vad har de resulterande bilderna för rättslig status när det kommer till upphovsrätt? Här kan det vara en poäng att göra en liten tillbakablick.

2015 släppte ett företag som hette Obvious en artificiell intelligens-programvara som hette AI-genereted images, som de hävdade kunde skapa realistiska bilder från scratch. Problemet var att dessa bilder ofta var lågupplösta och inte skyddades av upphovsrätt. Det innebar att vem som helst kunde använda dem utan tillstånd eller att behöva ange var de kom ifrån, och Obvious kunde inte förhindra det.

Det skapade problem för fotografer och illustratörer, som är beroende av att upphovsrätt gäller för bilder för att skydda deras verk. Om vem som helst kan generera realistiska bilder utan tillstånd, minskar värdet av originalinnehåll skapat av individuella kreatörer.

Obvious har sedan dess stängt tjänsten AI-generated images. Men frågan kvarstår om annat AI-genererat innehåll som det Midjourney och DALL·E skapar kommer omfattas av upphovsrätt framöver. Det är möjligt att det slås fast juridiskt att AI-genererade bilder inte lyder under upphovsrätten, eller att det är den som skapat programvaran som äger upphovsrätt till bilderna, inte den person som skapade själva bilden.

Det här är komplexa frågor, och det är fortfarande oklart hur de kommer lösas. Under tiden bör fotografer och illustratörer vara medvetna om risken att deras bilder kopieras eller används utan tillåtelse.

Tyckte du jag avvek lite från ämnet här? Mjo. Det har du rätt i. Fortsätt att läsa så kommer förklaringen. Jag kan tillägga att Midjourneys bilder är fria att använda så länge du anger var de kommer ifrån.

Ju mer AI-tekniken utvecklas, och ju mer vi förlitar oss på den för olika uppgifter, desto viktigare blir det att till exempel kunna skilja riktiga fotografier från AI-genererade. Ibland kan de likna varandra väldigt mycket, men det finns sätt att särskilja dem.

Ett sätt är att studera bakgrunden i bilderna. I riktiga fotografier är oftast bakgrunden mer detaljerad och realistisk än i AI-genererade bilder. Det är för att AI-genererade bilder ofta använder enklare bakgrunder för att man ska fokusera på huvudmotivet i förgrunden.

Ett annat sätt att se skillnad är att titta på själva huvudmotivet. I riktiga fotografier ser motivet ofta mer realistiskt och levande ut än i AI-genererade bilder. Det är för att AI:n använder förenklade versioner av motiv för att kunna fokusera på andra aspekter i bilden.

Slutligen är ett sätt att skilja riktiga foton från AI-genererade bilder att studera bildens komposition. I riktiga foton är kompositionen ofta mer naturlig och balanserad än i AI-genererade bilder. Det är för att AI:n använder artificiella kompositioner för att skapa intressanta bilder.

Om du håller de här tre sakerna i huvudet bör du lätt kunna skilja riktiga foton från AI-genererade bilder.

Svårt att se skillnad? DALL·E illustrerar “realistic photo of a newsroom editor comparing an ai-generated image with a real photograph”

Men vad menar jag med artificiella kompositioner? Lite oklart kanske. Och det är för att det inte är jag som skrivit det. Det enda jag skrivit i det här blogginlägget är det som är i fetstil. Resten har en AI-tjänst skrivit. Allt jag har gjort är en grovöversättning från engelska, samt lagt till ett par länkar för tydlighets skull.

Det i sig väcker en hel mängd frågor, åtminstone i mig. Om fotografer och illustratörer har anledning att fundera över sin framtida arbetsmarknad, har då inte journalister också det? Ja, vi kan ju fråga GPT-3, som tjänsten heter.

AI:s potential när det gäller journalistik är både spännande och läskig. Å ena sidan kan AI hjälpa journalister att automatisera datainsamling, och på så sätt frigöra tid för journalistik som går mer på djupet. Å andra sidan skulle AI kunna användas för att skapa “fake news” och manipulera folks åsikter.

I närtid kan AI användas för datainsamling för journalister. Till exempel skulle ett AI-system kunna övas upp för att gå igenom sociala medier-tjänster utifrån relevanta sökord och skapa listor med möjliga artikeluppslag utifrån det. AI skulle också kunna hjälpa till att analysera data, genom att till exempel automatiskt skapa tabeller och grafer.

På längre sikt skulle AI kunna användas för att skapa “virtuella reportrar”. Sådana AI-system skulle kunna samla in data och skriva artiklar på egen hand. Även om det kan låta som att AI ska ersätta mänskliga reportrar här, så är det mer troligt att AI kommer att användas som ett verktyg av reportrar, för att till exempel utöka bevakningen av ett område eller skriva om sådant som ligger utanför traditionell journalistisk bevakning.

AI skulle också kunna användas för att skapa “fake news”. Det är något att ha i åtanke om vi vill skapa virtuella reportrar. Det skulle vara relativt lätt att utveckla ett system som skapar övertygande men falska artiklar. Men även utan virtuella reportrar kan AI-tjänster användas för att skapa falska berättelser, genom att manipulera data eller att använda naturligt språk (natural language generation) för att skapa citat som låter trovärdiga men är falska.

Alla dessa potentiella användningsområden för AI inom journalistiken väcker allvarliga etiska frågeställningar. Till exempel, ska AI användas för att samla in data om det innebär intrång i personers privatliv? Och hur kan vi säkerställa att virtuella reportrar inte skapar falska nyheter?

Trovärdig journalistik? Midjourney illustrerar “serious man reading an ai-generated news article on a computer screen”.

OBS! Jag har ingen aning om det som AI:n skrivit någonstans i det här inlägget stämmer. Texterna är inte faktakollade, och det är lite av poängen. Så om du faktiskt är ute efter en jämförelse av tjänster, eller funderar kring AI-genererade bilder och texter, har du tyvärr kommit fel. (Kanske vill du t ex läsa den här intervjun med Midjourneys vd eller den här artikeln som diskuterar DALL·E och copyright.)

Den här texten är i stället till för att illustrera något av det tillgängliga AI-tjänster på nätet kan göra i dag, och därmed öka medvetenheten kring det.

Avslutningsvis, ett galleri med några av favoritbilderna som Midjourney skapat utifrån mina anvisningar.

araneida_inner_city_landscape_Swedish_mordern_girl_walking_amon_dd49d80d-441f-42a7-a6b9-987bfdfcf795

araneida_tiny_jungle_insects_on_parade_on_a_branch_jungle_backg_ad3f9e31-4d27-4159-af33-5ab03b6c47a4

araneida_c-3po_from_Star_wars_running_the_New_York_City_Maratho_2b92fb35-2415-44d3-a57a-9605ead983f5

araneida_findac_portrait_of_avril_lavigne_mural_high_quality_4k_2e6d4371-433a-41a8-85d7-28e2bc3ddee6

araneida_magic_fairy_of_the_dawn_flying_full_body_hair_flowing__3f9da1b9-086e-4284-98bf-09a303392f59

araneida_a_teen_girl_auburn_hair_looking_at_herself_in_the_mirr_153230af-55c9-4089-bf1b-a7bd3d24b0b2

araneida_cute_japanese_toy_robot_wind-up_toy_metallic_ancient_a_cf3d3746-1da3-44cc-a0e5-694903d5906a

araneida_tokyo_streetart_mystic_mural_inspired_by_haruki_muraka_780830a5-5ca0-4a17-8b17-44637fff49dd

araneida_a_front_view_portrait_of_Benedict_Cumberbatch_as_Sherl_55af60f1-5ed5-4a92-8364-f05f8867b371

araneida_two_women_on_bicycles_on_a_country_road_in_Eker_Sweden_0f906123-39bb-4df4-bbf8-06fd538e0cac

araneida_steampunk_version_of_the_city_of_Stockholm_8k_hyper-re_ed92fe4a-8b66-4bb1-8889-19a81e5ad0f5

araneida_the_matrix_concept_art_high_quality_extreme_detail_72b4b701-a105-473b-9649-6bc1eea203a0

chlennnnn_tokyo_streetart_mystic_mural_inspired_by_haruki_murak_b923abca-54e0-4750-8c33-694e6563df80

araneida_politicians_around_a_round_table_with_microphones_and__f25196b3-5e06-43ae-a4ba-28d31ae3550f

araneida_the_singularity_as_it_should_be_4k_18adc8eb-44d1-4db9-ae9d-8913f9d2ca15

araneida_tokyo_neon_civil_rights_defender_in_style_of_finbarr_d_1e89f516-2dc3-4b22-bb13-3cf61c3d6921

araneida_Madonna_as_a_scary_clown_leaning_forward_towards_the_v_1787cceb-6586-4182-a23f-efb96fe3d677

The allure of AI-generated images
Is that they’re always so perfect and serene
But it’s just an algorithm
Creating an idyllic scene

The colors are always so bright and pure
And the landscapes are peaceful and calm
But it’s just a computer program
That’s been fed some data and told to run

So when you see these images
Of beauty that’s too good to be true
Remember that it’s not real
It’s just a product of some code

– GPT-3, skrivet på några sekunder

In the dark of night

I see the scary magic

Of ai-generated images

In the minds of men

They twist and turn

And create new nightmares

I see the fear in their eyes

As they try to make sense

Of the images that they see

And I can’t help but wonder

What will become of us

When the machines can create

Such perfect nightmares?

– GPT-3 igen

AI-genererade bilder: Midjourney, DALL·E, upphovsrätt, hot och möjligheter

You may also like...

Leave a Reply Cancel reply

Recent Comments

AI-genererade bilder: Midjourney, DALL·E, upphovsrätt, hot och möjligheter

Possibly related posts:

You may also like...

Skolforum, utbyten och ikt

Helgö – en kultplats på järnåldern

Orkut frenzy

Leave a Reply Cancel reply

Trending posts

Recent Comments