Tehisintellekt

Fotod, videod, heli: tehisintellekt õpib reaalsust kopeerima

Kõik sai alguse Open AI GPT-3 tekstigeneraatorist: tänapäeval suudab AI luua ka liikumatuid ja liikuvaid pilte ja helisid. Kuid riskidest ei puudu, alates autoriõigusest kunivõltsuudised


Ajavahemik septembrist oktoobrini on periood Moenädalal, eriti Milanos ja Pariisis. Sel aastal, vahetult pärast hooaja kahte oodatuimat sündmust, on alanud teistmoodi moenädal, täiesti digitaalne. Tegemist on AI-moenädalaga, mida reklaamib Instagrami konto nimega @ dailydall.ee, mis töötab koostöös Open AI-ga, tehisintellekti ettevõte, mida otsisid Sam Altaman ja Elon Musk. Iga päev avaldatakse neljast fotost koosnev seeria, millel on sama palju rõivaid kuulsaimatelt disaineritelt Paco Rabanne'ist Givenchyni.

Asi on selles, et keegi ei disaininud neid riideid. Tehisintellekt lõi need tekstist. Antud juhul kasutati seda Dall-E 2, avatud AI süsteem suudab sõnu kujutisteks muuta, kuid Google'ilt on olemas ka Stable Diffusion, Midjourney või Imagen. Ja uuteks piirideks on video ja heli loomine. Paar sõna, lihtne kirjeldus, et alustada animatsioonide nägemist või helide kuulamist.

Investeeringud juhivad tehisintellekti arengut

Kokkuvõtteks võib öelda, et veidi enam kui kahe aastaga oleme jõudnud lihtsate tekstiridade loomiselt videote loomiseni. Ja see pole veel kõik: 30. septembril Felix Krause, Meta uurija, teatas heligeneraatori väljatöötamisest. Süsteem, mis nagu teisedki, suudab luua heli alates tekstilisest päringust.

Kiire, võib-olla ootamatu kasv, mis on tingitud riistvara arengust ja Big Techi koletutest investeeringutest. Vastavalt Wall Street Journali artiklile, teadus- ja arendusosakond ainuüksi Meta ja Alphabet kulutasid ainuüksi 60. aastal sellele valdkonnale üle 2021 miljardi dollari. Investeeringud, mis on kindlustanud evolutsiooni, mis võimaldab nüüd masinatel õppida kiiremini ja vähem andmeid ja eelkõige sõnu ja pilte või helisid tõhusamalt seostada.

Tehnoloogilised edusammud, mis on avanud uusi teid. Mõelge vaid difusioonile, tehnikale, mida kasutatakse staatiliste või liikuvate kujutiste loomiseks. Tehisintellekt võtab sisenditena vastu miljoneid pilte kogu Internetist, millel on kirjeldus. Sel hetkel jagab see need tuhandeteks piksliteks, mis alates kasutaja taotlustest ühendatakse uuesti, et luua uus pilt. Olemasolevatel fotodel ja illustratsioonidel pole lihtsat ülekatet: see on generatiivne protsess. See algab pikslite komplektiga ja täiustab neid, et luua midagi uut.

Innovatsiooni uudiskiri
Ärge jätke ilma kõige olulisematest uuendustest. Registreeruge, et saada neid meili teel.
Riskid ja eelised: mis juhtub?

Koos tehniliste arengutega on ka ärilisi ja poliitilisi valikuid. Kui Open AI valis sel suvel Dall-E 2 jaoks aeglase väljalaske, mille ootenimekiri on väga pikk Stabiilsuse AI on laual olevaid kaarte vahetanud stabiilse difusiooniga. See piltide genereerimise mudel on tegelikult tehtud kõigile kättesaadavaks, kaasa arvatud kood. See on üks põhjusi, mis tõukab nende süsteemide demokratiseerimist.

Demokratiseerimine, mis kahtlemata tekitab rida küsimusi, mis tuleb lahendada. Seal on näiteks poleemika piltide omamise üle mis tekivad. Hetkel oleneb kõik teenusest: näiteks Midjourney'l genereeritud on kasutajale täielikult kättesaadavad; need, millel on Dall-E 2, jäävad Open AI omandisse.

Teine punkt puudutab autoriõigus piltidest, mida nende süsteemide toitmiseks kasutati. Teisisõnu võinuks nende tehisintellektide koolitamise aluseks võtta mis tahes viimastel aastatel Internetti üles laaditud kunstiteoseid. Ja seetõttu avastaksid need inimkunstnikud tänapäeval end konkureerimas masinatega, mis suudavad nende stiili jäljendada.

Ja see pole veel kõik: hirmutavad on ka ohud piltide või videote genereerimisel, mis kujutavad näiteks inimesi realistlikes olukordades. Risk on olemas võlts uudised: piltide saadavus, nt samuti esile tõstnud Penn State'i ülikooli teadlased, mõjutab suuresti võltsuudiste usaldusväärsust. Kuigi paljudel süsteemidel on loomisfiltrid, mis kujutavad nägusid või olukordi, mida peetakse sobimatuks, Stabiilne difusioon stabiilsuse.AI abil, nagu osutati ka The Verge'i artiklis, võimaldaks kogenumatel kasutajatel luua mis tahes tüüpi pilte. Kaasa arvatud pornograafia.

​  

Koostamine BlogInnovazione.it 

Innovatsiooni uudiskiri
Ärge jätke ilma kõige olulisematest uuendustest. Registreeruge, et saada neid meili teel.

Viimased artiklid

Kuidas Excelis andmeid ja valemeid kõige paremini korraldada, et analüüs oleks hästi tehtud

Microsoft Excel on andmeanalüüsi viitetööriist, kuna see pakub palju funktsioone andmekogumite korraldamiseks,…

14 mai 2024

Positiivne järeldus kahe olulise Walliance Equity ühisrahastusprojekti kohta: Jesolo Wave Island ja Milano Via Ravenna

Walliance, SIM ja platvorm alates 2017. aastast Euroopa kinnisvara ühisrahastuse valdkonna liidrite seas, teatab, et…

13 mai 2024

Mis on Filament ja kuidas Laravel Filamenti kasutada

Filament on "kiirendatud" Laraveli arendusraamistik, mis pakub mitmeid täispinu komponente. See on loodud selleks, et lihtsustada…

13 mai 2024

Tehisintellekti kontrolli all

«Pean tagasi pöörduma, et oma evolutsioon lõpule viia: projitseerin end arvutisse ja muutun puhtaks energiaks. Pärast sisseelamist…

10 mai 2024

Google'i uus tehisintellekt võib modelleerida DNA-d, RNA-d ja "kõiki elumolekule"

Google DeepMind tutvustab oma tehisintellekti mudeli täiustatud versiooni. Uus täiustatud mudel pakub mitte ainult…

9 mai 2024

Laraveli moodularhitektuuri uurimine

Laravel, mis on kuulus oma elegantse süntaksi ja võimsate funktsioonide poolest, loob ka kindla aluse moodularhitektuurile. Seal…

9 mai 2024

Cisco Hypershield ja Splunki omandamine Algab uus turvalisuse ajastu

Cisco ja Splunk aitavad klientidel kiirendada nende teekonda tuleviku turvaoperatsioonide keskusesse (SOC)…

8 mai 2024

Lisaks majanduslikule poolele: lunavara ilmselge hind

Viimased kaks aastat on uudistes domineerinud lunavara. Enamik inimesi on hästi teadlikud, et rünnakud…

6 mai 2024