Tehisintellekt

Fotod, videod, heli: tehisintellekt õpib reaalsust kopeerima

Kõik sai alguse Open AI GPT-3 tekstigeneraatorist: tänapäeval suudab AI luua ka liikumatuid ja liikuvaid pilte ja helisid. Kuid riskidest ei puudu, alates autoriõigusest kunivõltsuudised

Ajavahemik septembrist oktoobrini on periood Moenädalal, eriti Milanos ja Pariisis. Sel aastal, vahetult pärast hooaja kahte oodatuimat sündmust, on alanud teistmoodi moenädal, täiesti digitaalne. Tegemist on AI-moenädalaga, mida reklaamib Instagrami konto nimega @ dailydall.ee, mis töötab koostöös Open AI-ga, tehisintellekti ettevõte, mida otsisid Sam Altaman ja Elon Musk. Iga päev avaldatakse neljast fotost koosnev seeria, millel on sama palju rõivaid kuulsaimatelt disaineritelt Paco Rabanne'ist Givenchyni.

Asi on selles, et keegi ei disaininud neid riideid. Tehisintellekt lõi need tekstist. Antud juhul kasutati seda Dall-E 2, avatud AI süsteem suudab sõnu kujutisteks muuta, kuid Google'ilt on olemas ka Stable Diffusion, Midjourney või Imagen. Ja uuteks piirideks on video ja heli loomine. Paar sõna, lihtne kirjeldus, et alustada animatsioonide nägemist või helide kuulamist.

Investeeringud juhivad tehisintellekti arengut

Kokkuvõtteks võib öelda, et veidi enam kui kahe aastaga oleme jõudnud lihtsate tekstiridade loomiselt videote loomiseni. Ja see pole veel kõik: 30. septembril Felix Krause, Meta uurija, teatas heligeneraatori väljatöötamisest. Süsteem, mis nagu teisedki, suudab luua heli alates tekstilisest päringust.

Kiire, võib-olla ootamatu kasv, mis on tingitud riistvara arengust ja Big Techi koletutest investeeringutest. Vastavalt Wall Street Journali artiklile, teadus- ja arendusosakond ainuüksi Meta ja Alphabet kulutasid ainuüksi 60. aastal sellele valdkonnale üle 2021 miljardi dollari. Investeeringud, mis on kindlustanud evolutsiooni, mis võimaldab nüüd masinatel õppida kiiremini ja vähem andmeid ja eelkõige sõnu ja pilte või helisid tõhusamalt seostada.

Tehnoloogilised edusammud, mis on avanud uusi teid. Mõelge vaid difusioonile, tehnikale, mida kasutatakse staatiliste või liikuvate kujutiste loomiseks. Tehisintellekt võtab sisenditena vastu miljoneid pilte kogu Internetist, millel on kirjeldus. Sel hetkel jagab see need tuhandeteks piksliteks, mis alates kasutaja taotlustest ühendatakse uuesti, et luua uus pilt. Olemasolevatel fotodel ja illustratsioonidel pole lihtsat ülekatet: see on generatiivne protsess. See algab pikslite komplektiga ja täiustab neid, et luua midagi uut.

Riskid ja eelised: mis juhtub?

Koos tehniliste arengutega on ka ärilisi ja poliitilisi valikuid. Kui Open AI valis sel suvel Dall-E 2 jaoks aeglase väljalaske, mille ootenimekiri on väga pikk Stabiilsuse AI on laual olevaid kaarte vahetanud stabiilse difusiooniga. See piltide genereerimise mudel on tegelikult tehtud kõigile kättesaadavaks, kaasa arvatud kood. See on üks põhjusi, mis tõukab nende süsteemide demokratiseerimist.

Demokratiseerimine, mis kahtlemata tekitab rida küsimusi, mis tuleb lahendada. Seal on näiteks poleemika piltide omamise üle mis tekivad. Hetkel oleneb kõik teenusest: näiteks Midjourney'l genereeritud on kasutajale täielikult kättesaadavad; need, millel on Dall-E 2, jäävad Open AI omandisse.

Teine punkt puudutab autoriõigus piltidest, mida nende süsteemide toitmiseks kasutati. Teisisõnu võinuks nende tehisintellektide koolitamise aluseks võtta mis tahes viimastel aastatel Internetti üles laaditud kunstiteoseid. Ja seetõttu avastaksid need inimkunstnikud tänapäeval end konkureerimas masinatega, mis suudavad nende stiili jäljendada.

Ja see pole veel kõik: hirmutavad on ka ohud piltide või videote genereerimisel, mis kujutavad näiteks inimesi realistlikes olukordades. Risk on olemas võlts uudised: piltide saadavus, nt samuti esile tõstnud Penn State'i ülikooli teadlased, mõjutab suuresti võltsuudiste usaldusväärsust. Kuigi paljudel süsteemidel on loomisfiltrid, mis kujutavad nägusid või olukordi, mida peetakse sobimatuks, Stabiilne difusioon stabiilsuse.AI abil, nagu osutati ka The Verge'i artiklis, võimaldaks kogenumatel kasutajatel luua mis tahes tüüpi pilte. Kaasa arvatud pornograafia.

Koostamine BlogInnovazione.it