Artikkelit

Robotit voivat oppia ihmisiltä ahkerasti ja järjestelmällisesti

Viimeaikaiset Googlen synergiassa tutkimuskeskusten ja yritysten kanssa tekemät tutkimukset ovat tuottaneet tärkeitä tuloksia koneoppimisesta (ML), kuten tekonäön ja luonnollisen kielen käsittelystä.

Voittava, yhteinen ja jaettu lähestymistapa hyödyntää suuria ja erilaisia ​​tietojoukkoja ja ilmeikkäitä malleja, jotka voivat absorboida tehokkaasti kaiken tiedon. Vaikka tätä lähestymistapaa on yritetty soveltaa robotiikkaan useaan otteeseen, robotit eivät olleet vielä hyödyntäneet erittäin suorituskykyisiä malleja samoin kuin muilla osa-alueilla.

Vuosien varrella olemme usein luottaneet teknologiaan täydentämään ja parantamaan inhimillisiä kykyjämme. Kehitimme tulostimia tietojen jakamiseen, matematiikan laskimia ja lentokoneita, jotka auttavat meitä liikkumaan nopeasti. Viime vuosina ja erityisesti koneoppimisen alalla olemme kehittäneet uusia tapoja käsitellä tietoa hyödyllisten teknologioiden, kuten Searchin, Assistanttien, Mapsin ja monien muiden tehostamiseksi.

Muuntaja

Ennen vuotta 2017 järjestelmät koneoppiminen he kamppailivat selvittääkseen, mikä osa heidän panoksestaan ​​oli olennaista oikean vastauksen saavuttamiseksi. Transformer esitteli huomion käsitteen: kiinnittämällä huomiota syötteensä tärkeään osaan malli voi dynaamisesti valita, millä tiedoilla on merkitystä ja mikä ei. Muuntajat ovat osoittautuneet niin merkityksellisiksi, että niistä on tullut nykyaikaisten kielimallien äiti, joka ruokkii suurta osaa tekoälystä. Nykyään jopa tekoälyn alalla, joka tuottaa kuvia, kuten Imagen ja Parti.

Vuosien mittaan Transformers on saanut koulutusta valtavan määrän tekstidataa verkosta. Ne auttavat tunnistamaan kielen trendejä ja malleja käännöspalvelujen tarjoamiseksi, ihmisten keskustelun muokkaamiseksi ja korkealaatuisten hakutulosten edistämiseksi. Viime aikoina Transformers on otettu laajemmin käyttöön auttaakseen ymmärtämään muun tyyppistä tietoa kielen lisäksi, mukaan lukien kuvat, videot ja puhe. Transformers ovat todellakin loistavia puhe- ja visuaalisissa tehtävissä, joten pystyimme käyttämään tätä tekniikkaa ymmärtääksemme, mitä robotit näkevät ja miten ne toimivat.

Muuntajien soveltaminen robotteihin

Yhteistyössä Everyday Robotsin kanssa google on osoittanut, että tehokkaan kielimallin, kuten PaLM, integroiminen robottioppimismalliin ei vain mahdollistaisi ihmisten kommunikointia robotin kanssa, vaan myös parantaa robotin yleistä suorituskykyä. Tämä kielimalli antoi auttaville roboteille mahdollisuuden ymmärtää erilaisia ​​pyyntöjä – kuten "olen nälkäinen, tuo minulle välipala" tai "auta minua siivoamaan tämä vuoto" - ja toteuttamaan ne.

Google käyttää samaa arkkitehtuuria kuin PaLM, Transformer, auttaakseen robotteja oppimaan yleisemmin jo näkemästään. Joten sen sijaan, että hän ymmärtäisi pyynnön, kuten "Olen nälkäinen, tuo minulle välipalaa" takana olevaa kieltä, hän voi oppia – aivan kuten me – kaikista kollektiivisista kokemuksistaan ​​esimerkiksi katsomalla ja hakemalla välipaloja.

Innovaatio-uutiskirje
Älä missaa tärkeimpiä innovaatioita koskevia uutisia. Rekisteröidy saadaksesi ne sähköpostitse.
Tutkimus

Transformerin koulutus tehtiin käyttämällä dataa, joka on kerätty 130.000 700 demonstraatiosta – kun henkilö käyttää robottia jonkin tehtävän suorittamiseksi – yli 13 eri tehtävästä, jotka suoritettiin 1 Everyday Robots -apurobotilla. Harjoituksia ovat esimerkiksi esineiden poimiminen ja asettaminen, laatikoiden avaaminen ja sulkeminen, esineiden laittaminen laatikoihin ja niistä pois, pitkänomaisten esineiden sijoittaminen oikeaan yläkulmaan, esineiden kaataminen, lautasliinojen vetäminen ja tölkkien avaaminen. Tuloksena on huippuluokan Robotics Transformer -malli eli RT-700, joka pystyy suorittamaan yli 97 tehtävää. Onnistumisprosentti on XNUMX%, yleistäen hänen oppinsa uusiin aktiviteetteihin, esineisiin ja ympäristöihin.
Kuinka Transformer-pohjainen kielimalli ennustaa seuraavan sanan tekstissä näkemiensä trendien ja kuvioiden perusteella. RT-1 koulutettiin robotin havaintodataan ja vastaaviin toimiin, jotta se voisi tunnistaa seuraavan todennäköisimmän käytöksen, johon robotin pitäisi osallistua. Tämän lähestymistavan avulla robotti voi yleistää oppimansa uusiin tehtäviin. Se tekee tämän hallitsemalla uusia objekteja ja ympäristöjä koulutustietojensa kokemusten perusteella – harvinainen saavutus roboteille, jotka on tyypillisesti tiukasti koodattu kapeita tehtäviä varten.

Opi toisiltaan

Ihmisinä opimme omista kokemuksistamme ja toisiltamme. Jaamme usein oppimamme ja muokkaamme järjestelmiä havaittujen virheiden perusteella. Vaikka robotit eivät kommunikoi keskenään, tutkimukset osoittavat, kuinka erityyppisten robottien tietojoukkoja voidaan yhdistää ja käyttäytymismalleja siirtää niiden yli. Google on osoittanut, että yhdistämällä useiden robottien tietoja ne pystyvät lähes kaksinkertaistamaan mallin kapasiteetin ja yleistämään uuden tilanteen. Tämä tarkoittaa, että jatkamalla erilaisten robottien ja uusien tehtävien kokeilua, voidaan ehkä lisätä RT-1:n harjoitustietoja, mikä parantaa robotin käyttäytymistä ja tekee siitä joustavan ja skaalautuvan lähestymistavan robotin oppimiseen.

Kohti hyödyllisempää robotiikkaa

Aivan kuten Google on tehnyt avoimen lähdekoodin Transformer-tutkimuksen, myös RT-1 tulee olemaan avoimen lähdekoodin edistämään robotiikka-alan lisätutkimusta. Tämä on ensimmäinen askel kohti robottioppimisjärjestelmiä, jotka saattavat pystyä käsittelemään ihmiskeskeisten ympäristöjen lähes ääretöntä vaihtelua.

Ercole Palmeri

----  

Innovaatio-uutiskirje
Älä missaa tärkeimpiä innovaatioita koskevia uutisia. Rekisteröidy saadaksesi ne sähköpostitse.

Viimeaikaiset artikkelit

Googlen uusi tekoäly voi mallintaa DNA:ta, RNA:ta ja "kaikkia elämän molekyylejä"

Google DeepMind esittelee parannetun version tekoälymallistaan. Uusi parannettu malli tarjoaa paitsi…

9 Toukokuu 2024

Laravelin modulaariseen arkkitehtuuriin tutustuminen

Laravel, joka on kuuluisa elegantista syntaksistaan ​​ja tehokkaista ominaisuuksistaan, tarjoaa myös vankan perustan modulaariselle arkkitehtuurille. Siellä…

9 Toukokuu 2024

Cisco Hypershield ja Splunkin hankinta Uusi tietoturvan aikakausi alkaa

Cisco ja Splunk auttavat asiakkaita nopeuttamaan matkaansa tulevaisuuden Security Operations Centeriin (SOC)…

8 Toukokuu 2024

Taloudellisen puolen lisäksi: kiristysohjelmien ilmeiset kustannukset

Ransomware on hallinnut uutisia viimeisen kahden vuoden ajan. Useimmat ihmiset tietävät hyvin, että hyökkäykset…

6 Toukokuu 2024

Innovatiivinen interventio lisättyyn todellisuuteen Applen katsojan kanssa Catanian poliklinikalla

Catanian poliklinikalla tehtiin silmäleikkaus Apple Vision Pro -kaupallisella katseluohjelmalla…

3 Toukokuu 2024

Värityssivujen edut lapsille - taikuuden maailma kaikenikäisille

Hienomotoristen taitojen kehittäminen värittämisen avulla valmistaa lapsia monimutkaisempiin taitoihin, kuten kirjoittamiseen. Värittää…

2 Toukokuu 2024

Tulevaisuus on täällä: kuinka merenkulkuala mullistaa maailmantalouden

Laivastosektori on todellinen maailmanlaajuinen talousmahti, joka on navigoinut kohti 150 miljardin markkinaa...

1 Toukokuu 2024

Julkaisijat ja OpenAI allekirjoittavat sopimuksia, joilla säännellään tekoälyn käsittelemää tiedonkulkua

Viime maanantaina Financial Times julkisti sopimuksen OpenAI:n kanssa. FT lisensoi maailmanluokan journalismiaan…

Huhtikuu 30 2024