Under helgen, Google uppdaterade sin integritetspolicy för att låta användarna veta att de kommer att använda någon av deras allmänt tillgängliga data för att träna sina stora språkmodeller, som Bard.
Företaget uppgav också att uppgifterna skulle användas för att träna Google Translate och dess Cloud AI för att prestera bättre. Detta drag utlöste samhället när experter varnar för att sådan skrapning så småningom skulle skada användarna, eftersom företagen ofta anser stulen privata data också när de tränar sina produkter.
Utbildning om offentliga data
I takt med att Generativ AI börjar bli vana, ändrar big tech sin policy för att anpassa sig därefter. Efter att ha rusat för att göra sina stora språkmodeller, justerar teknikföretagen nu sina datasugande regler för att gynna deras produkter bättre, på bekostnad av samhällets integritet.
Det senaste i denna jakt är Google, som ändrade sin integritetspolicy under helgen för att använda allmänt tillgänglig data för att träna sina produkter, nämligen Bard, Cloud AI och Google Translate. Företaget har ändrat formuleringen från “AI-modeller” till “språkmodeller” i sina policyer, som du kan se här.
Detta är ett formellt sätt att informera allmänheten (som inte söker tillstånd) att de kan använda sina offentliga uppgifter för sin produktutbildning. Experter varnade för att en sådan trend skulle kunna skada allmänhetens integritet i framtiden, med vissa redan stämma OpenAI för att massivt skrapa personlig data från internet, inklusive “,” för att träna sina GPT-modeller utan föregående medgivande.
På samma sätt kommer vi att se många sådana rättegångar i framtiden när fler företag utvecklar sina egna generativa AI-produkter. Detta ledde till att vissa offentliga webbplatsägare tog specifika åtgärder för att förhindra eller dra nytta av den generativa AI-boomen.
Och företag som Reddit och Twitter har skapat nya regler för att begränsa användningen av deras gratisresurser. Reddit har till exempel förnyat sin API-prispolicy för att ta ut rejäla summor, medan Twitter begränsar möjligheten att titta på tweets för alla sina användare för att undvika överdriven dataskrapning.