Badakigu Google-k testua ulertzen duela, baina zenbait mugen barruan. Garrantzitsuena da Google-k bilaketa-barran erabiltzaileak modu egokian lotzen dituela, bilaketa-emaitzarik onenarekin. Horretarako, Google-k ezin du erabiltzaileak eskuragarri jartzen duen informazioan soilik fidatu, hots, meta datuak.
Gainera, badakigu testuan erabiltzen ez den esaldi bat sailkatzea posible dela (nahiz eta oraindik praktika ona izan gako esaldi zehatz bat edo gehiago identifikatzea eta erabiltzea). Beraz, Google-k zerbait egiten du zure webguneko orrialde batean dagoen testua irakurtzeko eta ebaluatzeko.
Testuak ulertzeko Google-k erabiltzen duen metodoa ez da ezagutzen. Hau da, informazioa ez dago modu errazean eta dohainik eskuragarri. Jakin badakigu ere, ikerketaren emaitzen arabera, oraindik lan asko egin behar dela emaitza ezin hobea lortzeko. Baina badira ondorio batzuk interesgarriak atera ditzakegunak han eta hemen.
Adibidez, badakigu Googlek aurrerapauso handiak eman dituela testuingurua ulertzeko. Jakin badakigu Google-k hitzak eta kontzeptuak elkarri lotuta daudela zehazten saiatzen dela.
Google-k patenteak aurkeztu eta landu duen teknika interesgarria deritzo Hitza txertatzea, "Hitz batzarrak" edo "Hitz erlazionatuak". Xehetasunen gainetik hegan eginez, beste hitz batzuekin lotura duten hitzak aurkitzea da helburua. Praktikoki: software batek testu kopuru bat hartzen du, aztertzen ditu eta hitzak zein maiztasunarekin egon ohi diren zehazten du eta hitz bakoitza zenbaki sorta bihurtzen du. Horrela, hitzak diagrama bateko espazioaren puntu gisa irudikatzea posible da, sakabanaketaren trama bezala.
Lortutako diagrama honetan hitzak erlazionatuta daude eta nola. Zehatzago esanda, hitzen arteko distantzia erakusten du, hitzek osatutako galaxia moduko bat irudikatuz.
Adibidez, "gako-hitzak" bezalako hitzak askoz ere gertuago egongo lirateke "idazkera" baino "sukaldeko tresneria" baino.
Prozedura hau hitzak eta esaldiak eta / edo paragrafoetan aplika daiteke. Zenbat eta handiagoa izan programa programa elikatzen duen datu multzoa, orduan eta hobea izango da algoritmoa hitzak sailkatzeko eta ulertzeko, ulertzeko nola erabiltzen diren. eta zer esan nahi dute.
Praktikoki, Google-k sare osoa biltzen duen datu base bat du. Horrela, tamaina horretako informazio multzo batekin, testuaren eta testuinguruaren balioa ebaluatu dezaketen eredu fidagarriak sortu daitezke.
Hitzen korrelazioan urrats txiki bat ematen dugu erlazionatutako entitateen kontzepturantz. Bilaketa bat egiten saiatzen bagara, erlazionatutako erakundeak zein diren ikus dezakegu. "Pasta motak" idatzita, SERParen goialdean "I Formati della Pasta" ikusi beharko zenuke. Pasta barietate horiek ere azpikategorizatu behar dira. Hitz eta kontzeptuak elkarri lotzeko modua islatzen duten SERP antzeko asko daude.
Google-k aurkeztu dituen entitateei buruzko patenteak entitateei buruzko indizeen datu-basea aipatzen du. Datu base bat da, non kontzeptuak edo entitateak, esaterako, pasta gordetzen diren. Erakunde horiek ere ezaugarriak dituzte. Lasagna, adibidez, pasta da. Pasta ere egina dago. Eta janaria da. Orain, entitateen ezaugarriak aztertuta, era guztietako moduetan taldekatu eta sailka daitezke. Horri esker, Google-k hitzak nola erlazionatzen diren hobeto ulertzeko eta, beraz, testuingurua hobeto ulertzeko aukera ematen du.
Google-k orriaren testuingurua ulertzen badu, zalantzarik gabe ebaluatuko du eta bere edukia epaituko du. Zenbat eta korrespondentzia hobea izan Google-ren testuinguruarekin, orduan eta hobeak izango dira probetan egoteko aukerak. Beharrezkoa izango da kontzeptuak modu zabalean adieraztea. Modu zabalagoan, erlazionatutako kontzeptuak ere adieraziz.
Testu sinpleek, kontzeptu desberdinen arteko erlazioak argi eta garbi adierazten dituztenez, irakurleek hobeto ulertzen laguntzen dute eta Google-ri ere laguntzen diote.
Idazkera zaila, inkoherentea eta gaizki egituratua ulertzeko zailagoa da gizakientzat eta Google-rentzat. Bilatzailea zure testuak ulertzen lagundu behar duzu:
Emaitza onak zure irakurleek eta Google-k zure testua ulertzen lagunduko dute eta, beraz, zuk ezarritako helburu guztiak.
Batez ere, badirudi Google-k gizakiak hizkuntza eta informazioa prozesatzeko duen modua imitatzen duen eredua sortzen saiatzen ari direlako.
Eta horrek pentsarazten digu Google-k oraindik ere gako-hitzak erabiltzen dituela, zure orria kontsulta batekin lotzeko.
Veeam-ek Coveware-k ziber estortsioaren gorabeherak erantzuteko zerbitzuak eskaintzen jarraituko du. Coveware-k auzitegiko eta konpontzeko gaitasunak eskainiko ditu...
Mantentze-lan prediktiboak petrolioaren eta gasaren sektorea iraultzen ari da, lantegien kudeaketaren ikuspegi berritzaile eta proaktibo batekin.…
Erresuma Batuko CMAk adimen artifizialeko merkatuan Big Tech-en jokabideari buruzko abisua eman du. Han…
Eraikinen energia-eraginkortasuna hobetzeko Europar Batasunak egin duen "Case Green" Dekretuak legegintza-prozesua amaitu du...