Articles

Lùb Dìomhaireachd: tuigse fuadain ann an labyrinth Prìobhaideachd is Còraichean

Is e seo a’ chiad de dhà artaigil anns a bheil mi a’ dèiligeadh ris a’ chàirdeas fìnealta eadar Dìomhaireachd agus Còraichean air an aon làimh, agus Artificial Intelligence air an taobh eile.

Càirdeas trioblaideach far a bheil mean-fhàs teicneòlach a’ dearbhadh a bhith cho luath is gun tèid atharrachadh riaghlaidh sam bith a chur an gnìomh bhon chiad iarrtas aige.

Tha feum air aire, comas agus deasbad riatanach eadar daoine inntleachdail agus eòlaichean ar n-ùine gus dèiligeadh ri cùisean duilich co-cheangailte ri còraichean dhaoine agus dàta pearsanta. Tha sinn a’ faighinn a-mach nach eil sinn luath gu leòr ann a bhith ag atharrachadh riaghailtean sòisealta ris na dùbhlain a tha romhainn le innleachdan teicneòlach. Bidh teicneòlasan a tha a’ tighinn am bàrr a’ faighinn barrachd is barrachd ag obair anns an raon fhosgailte, às aonais riaghailtean iomlan a tha a’ cuingealachadh an cleachdadh, saor bho mhilleadh a dhèanamh agus mar sin a’ dèanamh sin gun chead iomlan.

A bheil e comasach smaoineachadh air smachd a tha a’ dol air ais suas an t-sreath de leasachadh teicneòlach gu rannsachadh saidheansail agus na h-amasan ro-innleachdail aige?

A bheil e comasach a bhith a’ riaghladh mean-fhàs ar gnè fhad ‘s a chumas sinn spèis làidir do shaorsa fa-leth?

Prìobhaideachd?

“Mar as motha a dh’ fheuchas tu ri falach, is ann as motha a tharraingeas tu aire. Carson a tha e cho cudromach nach eil fios aig duine mu do dheidhinn?" - bhon fhilm "Anon" air a sgrìobhadh agus air a stiùireadh le Anndra Niccol - 2018

Anns an fhilm "Anon" de 2018, tha comann-sòisealta na h-ama ri teachd na àite dorcha, fo smachd dìreach siostam coimpiutair mòr ris an canar Ether, comasach air sùil a chumail air a h-uile ceàrnaidh den dùthaich le bhith ga fhaicinn tro shùilean nan aon daoine a bhios ga shluagh. Tha a h-uile duine na neach-stiùiridh às leth Ether agus is e a ’chiad uallach aca, gu dearbh, sùil a chumail orra fhèin agus air an giùlan.

Is e Ether an caidreachas as fheàrr de na feachdan poileis: tro Ether, faodaidh riochdairean eòlas neach sam bith a lorg le bhith ga thoirt beò leis na sùilean aca fhèin agus fuasgladh fhaighinn air seòrsa sam bith de eucoir.

Tha an t-oifigear poileis Sal a’ cnuasachadh carson a bu chòir dhut sabaid gus do phrìobhaideachd a dhìon: dè an rud a th’ ann nuair nach eil adhbhar agad a dhol am falach? Às deidh na h-uile, ann an àm far a bheil na teicneòlasan a bhios sinn a’ togail gus sàbhailteachd ar dachaighean agus ar sràidean a mheudachadh ag iarraidh clàradh, sgrùdadh agus dearbhadh an fhiosrachaidh sin airson math nan daoine fhèin a dh’ iarras dìon, ciamar as urrainn dhuinn a bhith an dùil gealltainn an dìomhaireachd aca?

Gus sealltainn cho cunnartach sa tha e cothrom fhaighinn air beatha chàich, gabhaidh neach-tarraing smachd air Ether agus thig trom-laighe uamhasach sìos air beatha milleanan de dhaoine: an cunnart a bhith a’ coimhead mar luchd-amhairc gun chuideachadh na h-ìomhaighean den fheadhainn as motha. amannan cràdh nam beatha, air an craoladh gu dìreach a-steach do na retinas aca.

An Lùb

Le lìonraidhean neural fuadain a tha mar bhunait air gnìomhachd inntleachd fuadain an latha an-diugh, a’ tionndadh timcheall air trì prìomh eileamaidean: fiosrachadh bunaiteach ris an canar a chaochladh corpas, un algorithm airson co-chur fiosrachaidh agus aon cuimhne airson an cuimhneachadh.

Chan eil an algairim air a chuingealachadh ri luchdachadh fiosrachaidh casgach a-steach don chuimhne, bidh e ga sganadh a’ lorg eileamaidean a tha gan ceangal ri chèile. Thèid measgachadh de dhàta agus dàimhean a ghluasad chun chuimhne a bhios mar a teamplaid.

Taobh a-staigh modail, tha dàta agus dàimhean gu tur eadar-dhealaichte, agus is e sin as coireach gu bheil e cha mhòr do-dhèanta an corpas de fhiosrachadh trèanaidh tùsail ath-chruthachadh bho lìonra neural trèanaidh.

Tha seo gu sònraichte fìor nuair a tha tòrr dàta ann an cuirp. Tha seo fìor mu na siostaman mòra cànain ris an canar Large Language Models (LLM airson goirid) a’ toirt a-steach an ChatGpt mì-chliùiteach. Tha iad mar thoradh air an èifeachdas aca leis an ìre mhòr de dh'fhiosrachadh a thathar a 'cleachdadh ann an trèanadh: an-dràsta feumaidh trèanadh math co-dhiù beagan terabytes de dhàta agus leis gu bheil aon terabyte a' freagairt ri 90 billean caractar, timcheall air 75 millean duilleag de theacsa, tha e furasta a thuigsinn gu bheil uiread de dh'fhiosrachadh a dhìth.

Ach mura h-urrainnear modalan a dhì-innleachadh, carson a bu chòir dhuinn faighneachd dhuinn fhìn an duilgheadas a thaobh brisidhean prìobhaideachd?

Ceannas dàta

“Faodaidh an neach a tha craicte iarraidh air a bhith saor bho mhiseanan itealaich, ach ge bith cò a dh’ iarras a bhith saor bho mhiseanan itealaich chan eil e às mo chiall. ” - stèidhichte air an nobhail "Catch 22" le Joseph Heller.

Leabhar-latha ùr-ghnàthachaidh
Na caill na naidheachdan as cudromaiche mu ùr-ghnàthachadh. Clàraich gus am faighinn air post-d.

Tha cruinneachadh dàta de leithid de mheud a leigeas le pròiseactan leithid ChatGpt no feadhainn eile den aon seòrsa a chruthachadh an-diugh na roghainn aig companaidhean mòra ioma-nàiseanta a tha, leis na gnìomhan didseatach aca, air a bhith comasach air an làmhan fhaighinn air an stòr fiosrachaidh as motha. air an t-saoghal: the Web.

Is e Google agus Microsoft, a tha airson bliadhnaichean air a bhith a’ stiùireadh innealan sgrùdaidh a bhios a’ sganadh an Lìon agus a’ cuir a-mach tòrr mòr fiosrachaidh, a’ chiad thagraichean airson LLM a chruthachadh, na h-aon mhodalan AI a tha comasach air meud fiosrachaidh a chuairteachadh mar an fheadhainn a chaidh a mhìneachadh gu h-àrd.

Tha e duilich a chreidsinn gum biodh e comasach dha Google no Microsoft fiosrachadh pearsanta fhalach san dàta aca mus cleachd iad e mar chorpas ann a bhith a’ trèanadh lìonra neural. Tha a bhith a’ cur fiosrachadh gun urra a thaobh siostaman cànain a’ ciallachadh gu bheilear a’ comharrachadh dàta pearsanta taobh a-staigh corpas agus a’ cur dàta meallta na àite. Smaoinich sinn air corpas meud beagan terabytes leis a bheil sinn airson modal a thrèanadh agus feuchaidh sinn ri smaoineachadh dè an ìre de dh’ obair a bhiodh riatanach gus an dàta a th’ ann a bhith gun urra le làimh: bhiodh e cha mhòr do-dhèanta. Ach nam biodh sinn airson a bhith an urra ri algairim airson a dhèanamh gu fèin-ghluasadach, bhiodh an aon shiostam comasach air an obair seo a dhèanamh na mhodail eile a tha a cheart cho mòr agus cho adhartach.

Tha sinn an làthair duilgheadas clasaigeach Catch-22: “gus LLM a thrèanadh le dàta gun urra feumaidh sinn LLM a tha comasach air gun urra, ach ma tha LLM againn a tha comasach air an dàta gun urra, cha deach an trèanadh aige a dhèanamh le dàta gun urra. .”

Tha an GDPR air a dhol à bith

Tha an GDPR a tha ag òrdachadh (cha mhòr) air feadh na cruinne na riaghailtean airson a bhith a’ toirt urram do dhìomhaireachd dhaoine, mar thoradh air na cuspairean sin mar-thà na sheann naidheachd agus chan eilear a’ beachdachadh air dìon dàta pearsanta a tha an sàs ann an seata trèanaidh.

Anns an GDPR, chan eil giullachd dàta pearsanta airson adhbhar ionnsachadh co-dhàimhean agus ceanglaichean coitcheann air a riaghladh ach gu ìre le Artaigil 22 a tha ag ràdh: “Tha còir aig cuspair an dàta gun a bhith fo cho-dhùnadh stèidhichte air giollachd fèin-ghluasadach a-mhàin, a’ toirt a-steach pròifil, a tha ag ràdh. a bheir buaidh laghail air no a bheir buaidh air ann an dòigh cho-ionann agus chudromach".

Tha an artaigil seo a’ toirt a-steach casg air luchd-riaghlaidh dàta dàta pearsanta cuspair a chleachdadh mar phàirt de phròiseas co-dhùnaidh làn fèin-ghluasadach aig a bheil buaidh laghail dìreach air a’ chuspair. Ach bidh lìonraidhean neural, a tha furasta an gabhail a-steach do phròiseasan co-dhùnaidh fèin-ghluasadach, aon uair ‘s gu bheil iad air an trèanadh a’ faighinn an comas co-dhùnaidhean fèin-ghluasadach a dhèanamh a bheir buaidh air beatha dhaoine. Ach chan eil na co-dhùnaidhean sin an-còmhnaidh “loidsigeach”. Rè an trèanaidh, gu dearbh, bidh gach lìonra neural ag ionnsachadh fiosrachadh a cheangal ri chèile, gu tric gan ceangal ri chèile ann an dòigh gu tur neo-shreathach. Agus chan eil dìth “loidsig” a’ dèanamh an obair nas fhasa don neach-reachdais a tha airson sgiath a thogail a dhìonas prìobhaideachd dhaoine.

Ma roghnaich neach cuideachd poileasaidh air leth cuibhrichte a chuir an sàs, mar eisimpleir a’ toirmeasg cleachdadh dàta mothachail sam bith mura h-eil e air a cheadachadh gu soilleir leis an t-sealbhadair, bhiodh cleachdadh laghail lìonraidhean neural do-dhèanta. Agus bhiodh e na chall mòr a bhith a’ toirt seachad theicneòlasan lìonra neòil, dìreach smaoinich air na modalan sgrùdaidh a tha air an trèanadh le dàta clionaigeach de chuspairean sluaigh air an tug galair sònraichte buaidh gu ìre. Bidh na modailean sin a’ cuideachadh le bhith a’ leasachadh phoileasaidhean casg le bhith a’ comharrachadh co-dhàimhean eadar na h-eileamaidean a tha an làthair anns an dàta agus an galar fhèin, co-dhàimhean ris nach robh dùil a dh’ fhaodadh nochdadh gu tur aineolach ann an sùilean luchd-clionaigeach.

A’ riaghladh feumalachdan

Tha a bhith a’ cur an duilgheadas a thaobh a bhith a’ toirt urram do dhìomhaireachd dhaoine às deidh dha a chruinneachadh a cheadachadh airson bhliadhnaichean gu neo-chinnteach meallta a ràdh co-dhiù. Tha an GDPR fhèin le cho iom-fhillteachd an urra ri iomadach làimhseachadh a leigeas le cead fhaighinn airson dàta pearsanta a phròiseasadh le bhith a’ gabhail brath air mì-chinnt nan clàsan agus an duilgheadas tuigse.

Gu cinnteach feumaidh sinn an lagh a dhèanamh nas sìmplidhe a leigeas le bhith iomchaidh agus fìor fhoghlam ann a bhith a’ cleachdadh fiosrachadh pearsanta gu mothachail.

Chan e mo mholadh leigeil le companaidhean eòlas fhaighinn air dàta pearsanta luchd-cleachdaidh a bhios a’ clàradh airson an cuid sheirbheisean, eadhon ged a tha iad nan seirbheisean pàighte. Bu chòir cleachdadh dàta pearsanta meallta le daoine prìobhaideach tachairt gu fèin-ghluasadach nuair a bhios iad a’ cleachdadh siostaman air-loidhne. Bu chòir cleachdadh dàta fìor a bhith cuingealaichte ris a 'phròiseas ceannach a-mhàin, a' dèanamh cinnteach gu bheil e an-còmhnaidh gu tur air leth bho stòr-dàta na seirbheis.

Bhiodh eòlas air blasan is roghainnean a’ chuspair gun a bhith a’ leigeil le ainm no aghaidh a bhith co-cheangailte ris a’ phròifil seo ag obair mar sheòrsa de dh’ ainm gun urra a dhèanamh suas an abhainn a leigeadh leotha dàta a chruinneachadh agus an cleachdadh ann an siostaman fèin-ghluasaid leithid tuigse fhuadain.

Artaigil de Gianfranco Fedele

Leabhar-latha ùr-ghnàthachaidh
Na caill na naidheachdan as cudromaiche mu ùr-ghnàthachadh. Clàraich gus am faighinn air post-d.

Altan o chionn ghoirid

Ionnsachadh inneal: Coimeas eadar Random Forest agus craobh cho-dhùnaidhean

Ann an saoghal ionnsachadh innealan, tha pàirt deatamach aig gach cuid algorithm coille air thuaiream agus craobh co-dhùnaidh ann an seòrsachadh agus…

17 Cèitean 2024

Mar a leasaicheas tu taisbeanaidhean Power Point, molaidhean feumail

Tha mòran mholaidhean is chleasan ann airson taisbeanaidhean math a dhèanamh. Is e amas nan riaghailtean sin èifeachdas, rèidh…

16 Cèitean 2024

Tha astar fhathast na luamhan ann an leasachadh toraidh, a rèir aithisg Protolabs

Aithisg “Protolabs Product Development Outlook” air fhoillseachadh. Dèan sgrùdadh air mar a thèid toraidhean ùra a thoirt chun mhargaidh an-diugh.…

16 Cèitean 2024

Na ceithir colbhan de Seasmhachd

Tha an teirm seasmhachd a-nis air a chleachdadh gu farsaing gus prògraman, iomairtean agus gnìomhan a tha ag amas air goireas sònraichte a ghleidheadh.…

15 Cèitean 2024

Mar a chruinnicheas tu dàta ann an Excel

Bidh gnìomhachd gnìomhachais sam bith a’ toirt a-mach tòrr dàta, eadhon ann an diofar chruthan. Cuir a-steach an dàta seo le làimh bho dhuilleag Excel gu…

14 Cèitean 2024

Mion-sgrùdadh ràitheil Cisco Talos: is e puist-d corporra air an cuimseachadh le eucoirich Dèanamh, Foghlam agus Cùram Slàinte na roinnean as motha a tha a’ toirt buaidh

Mheudaich co-rèiteachadh puist-d companaidh còrr is a dhà uiread anns a’ chiad trì mìosan de 2024 an taca ris a’ chairteal mu dheireadh de…

14 Cèitean 2024

Prionnsabal sgaradh eadar-aghaidh (ISP), an ceathramh prionnsapal SOLID

Tha am prionnsapal dealachadh eadar-aghaidh mar aon de na còig prionnsapalan SOLID ann an dealbhadh a tha ag amas air nithean. Bu chòir gum biodh clas…

14 Cèitean 2024

An dòigh as fheàrr air dàta agus foirmlean a chuir air dòigh ann an Excel, airson mion-sgrùdadh air a dheagh dhèanamh

Is e Microsoft Excel an inneal iomraidh airson mion-sgrùdadh dàta, leis gu bheil e a’ tabhann mòran fheartan airson seataichean dàta a chuir air dòigh,…

14 Cèitean 2024

Leugh Ùr-ghnàthachadh sa chànan agad

Leabhar-latha ùr-ghnàthachaidh
Na caill na naidheachdan as cudromaiche mu ùr-ghnàthachadh. Clàraich gus am faighinn air post-d.

Lean dhuinn