Naturligtvis, när en AI-generator gör en bild i stil med en sedan länge död artist, är det osannolikt att han kommer att göra anspråk på tjänstens ägare.
Men för levande konstnärer (liksom för människor som vet hur man ritar), som ställer ut sina verk ArtStation, DeviantArt, Behance, på sina egna webbplatser, etc., är sådan amatöraktivitet av datauppsättningssamlare nu ett mycket allvarligt problem. Minst sagt.
Online måste du nu lära dig att skydda dina originalteckningar, såväl som texter, videor och allt originalinnehåll i allmänhet, från andras uppmärksamhet. När allt kommer omkring, om en digital målning, ritning eller bara ett foto faller in i datasetet, kommer vilken AI som helst att generera sin “analog” på bokstavligen en halv sekund.
Låt oss genast säga att det redan idag är väldigt svårt. Nästan omöjligt. Men det finns fortfarande något som kan göras. Nämligen…
I teorin kan du liksom förhindra LAION-400M och LAION-5B bots från att skanna bilden. Detta görs på webbplatsen, men det är väldigt långsamt och misstänkt.
LAION-400M och LAION-5B är, låt oss minnas, idag de två största öppna datauppsättningarna på Internet, på vilka de mest populära generatorerna för neurala nätverk, och i synnerhet, är utbildade. Men eftersom båda datauppsättningarna är öppna använder alla som vet hur man använder dem dem.
I allmänhet, om vi vill lägga till en bild i listan över undantag för dessa två datamängder, går vi till den angivna platsen, registrerar och aktiverar kontot, varefter:
- vi letar efter liknande bilder genom söksystemet eller laddar omedelbart upp vår bild till webbplatsen (!);
- Efter det högerklickar du på bilden i webbläsaren
- klicka på knappen “” och lägg till den i listan över bilder som du inte tillåter att skannas (på samma sätt kan förresten en bild läggas till i databasen över de som är tillåtna för skanning – knappen “”) .
Något sånt här. Men tricket är att du måste “förbjuda” på detta sätt på just den här webbplatsen var och en av dina bilder separat. Så om det redan finns många av dem i databasen (eller det finns många av dem på din webbplats och sociala nätverk), måste du arbeta (om du anser att denna aktivitet är lämplig).
Återigen, vi pratar bara om två, om än den största, men absolut inte den enda grafiska datamängden i världen. Det finns många andra vars bots aktivt utforskar nätverket och samlar in ny data. Dessutom pratar vissa utvecklingsföretag, inklusive den berömda OpenAI, inte alls om vilka datauppsättningar de använder för att träna sina bots.
Detta är naturligtvis inte heller något skydd (som Googles support officiellt och upprepade gånger har rapporterat), men man tror att webbplatsinnehåll fortfarande kan döljas från bots (sökrobotar eller spindlar) i vissa system som använder detta verktyg.
Till exempel skapades från boten för Common Crawl-systemet, vars data används för att skapa LAION-datauppsättningar (LAION-400M, i synnerhet enligt den officiella beskrivningen “”).
Common Crawl-ägare noterar regelbundet att systemboten följer robots.txt-regler och inte skannar (eller skannar efter en viss tid) innehåll som stängs av webbplatsadministratörer.
Detaljerade instruktioner om hur du hanterar robots.txt-filen finns på webbplatsen “” – [ССЫЛКА]. Du kan också snabbt skapa Robots.txt för en webbplats med gratis onlineverktyg som .
I allmänhet inget komplicerat. Till exempel, för att förhindra CCBot från att skanna bilder på en webbplats, måste du skriva följande i robots.txt-filen:
User-agent: CCbot Disallow: /images/ User-agent: * Allow: / Sitemap: https://www.example.com/sitemap.xml
Men återigen, bara de “spindlar” som stöder robots.txt-reglerna reagerar korrekt på ett sådant förbud, för det första.
Och för det andra kan innehållet som de redan har skannat inte längre tas ifrån dem.
Om det finns något att skydda, och i framtiden kommer det att finnas inspiration och möjlighet att försvara dina rättigheter i internationella domstolar, varför inte? Du kan till exempel registrera ditt arbete på statens webbplats. Systemet accepterar upp till 10 tidigare opublicerade verk i en uppsättning, men registreringsproceduren är inte omedelbar och kan pågå i upp till 1 år.
För inte så länge sedan lämnade förresten flera konstnärer vars verk var registrerade i databasen in en grupptalan mot företagen Stability AI (utvecklare av tjänsterna Stable Diffusion och DreamStudio och sponsor av LAION-datasetet) och.
Enligt amerikanska advokater är kompetent och snabb registrering av verk på den här webbplatsen, såväl som med US Copyright Office, till stor hjälp i framtida juridiska strider.
Bots vet inte hur man raderar dem än. Därför, om du publicerar en förhandsvisning av en ritning på en webbplats eller ett socialt nätverk, helt täckt med personliga taggar, kommer den i det här formuläret att hamna i datasetet (om det gör det).
Därför måste du tänka noga innan du publicerar en teckning på nätet. Om det inte är för pengar, utan rent för skojs skull, behöver du inte bry dig om vattenstämplar.
Tja, om det här är en förhandsvisning av en verklig (eller digital) målning som visas på Internet i syfte att säljas, måste du ta reda på hur du lägger skydd på den så att den inte stör potentiella köpare korrekt utvärdera arbetet.
Det är det, ja. När allt kommer omkring, om en bild (foto, teckning, målning, etc.) lagras på en dator och inte online, och ännu mer när den bara finns på papper (på duk och på något annat icke-digitalt medium), då kommer inte att hamna i datamängderna.
En annan sak är att det praktiskt taget inte finns något sätt för en modern konstnär att tjäna pengar på sitt arbete utan internet. Dessutom, var är garantin att någon inte tar ett foto av en ny vacker målning och sedan skryter om den på sin Instagram?
De säger att idag är allt som återstår inte att fråga “kan de”, utan att se likgiltigt på när de redan lär sig? Och ändå är det bättre att vänja sig vid tanken att när en bild väl finns på Internet, så finns den definitivt redan i olika datamängder, både öppna och stängda. Och det spelar ingen roll om den är skyddad av upphovsrätt eller inte ännu.
För att lugna din själ kan du söka efter bilden i öppna dataset, till exempel på samma sida. Om bilden finns i webbplatsens databas betyder det att hon redan använder tjänsten och andra också.
som vi redan har noterat, avslöjar inte information om sina datauppsättningar. Men som ett experiment kan du prova att be DALL-E skapa en bild i din stil. Det vill säga, vi skriver en begäran som “+ ditt efternamn (förnamn, smeknamn, etc.)” på engelska och ser resultatet. Om vi ser välbekanta motiv drar vi slutsatser…
Låt oss säga direkt: vid tidpunkten för publiceringen av det här inlägget hade ingen ännu erbjudit sådana verktyg, det vill säga tillräckligt effektiva mjukvaruverktyg för att skydda digitalt innehåll från obehörig inkludering i datauppsättningar, antingen betalda eller gratis.
Men arbetet pågår. Till exempel utvecklar specialister vid University of Chicago, som en del av Glaze-projektet, ett program som “gör mycket små förändringar” i en bild.
Utvecklarna kallar tekniken “stilmaskering”. Bilden som behandlas av Glaze-applikationen skiljer sig inte från originalet för det mänskliga ögat, men AI:n uppfattar den som en helt annan bild. Nu testas programmet fortfarande, men de lovar att släppa det väldigt snart (i form av en ansökan om och) och det verkar vara gratis.
En alternativ mjukvarulösning utvecklas vid University of Melbourne. Programmet, enligt beskrivningen, lägger helt enkelt till lite så kallat “” till bilden, ändrar “” och gör kopian helt olämplig för AI-träning. Projektet är dock fortfarande experimentellt, och utvecklarna anger inte när de kan förvänta sig release.
Nåväl, för nu är det något sånt här…