Հոդվածներ

Գաղտնիության հանգույց. արհեստական ինտելեկտը գաղտնիության և հեղինակային իրավունքի լաբիրինթոսում

Սա երկու հոդվածներից առաջինն է, որտեղ ես անդրադառնում եմ մի կողմից Գաղտնիության և հեղինակային իրավունքի, իսկ մյուս կողմից՝ Արհեստական ինտելեկտի միջև նուրբ հարաբերություններին:

Խնդրահարույց հարաբերություն, որտեղ տեխնոլոգիական էվոլյուցիան այնքան արագ է, որ կարգավորող ցանկացած ճշգրտում հնացած է դառնում իր առաջին կիրառման պահից:

Մարդկանց իրավունքներին և անձնական տվյալներին առնչվող փշոտ հարցերին անդրադառնալը պահանջում է ուշադրություն, իրավասություն և անփոխարինելի քննարկում մեր ժամանակների մտավորականների և մասնագետների միջև: Մենք բացահայտում ենք, որ բավականաչափ արագ չենք հարմարեցնում սոցիալական կանոնները այն մարտահրավերներին, որոնք տեխնոլոգիական նորարարությունները մեզ են ներկայացնում: Զարգացող տեխնոլոգիաներն ավելի ու ավելի են հայտնվում բաց դաշտում գործող կանոնակարգերի իսպառ բացակայության պայմաններում, որոնք սահմանափակում են դրանց կիրառումը, որոնք ազատ են վնաս պատճառելու և, հետևաբար, դա անելու բացարձակ անպատժելիության պայմաններում:

Հնարավո՞ր է արդյոք պատկերացնել այնպիսի վերահսկողություն, որը տեխնոլոգիական զարգացման շղթայով կվերադառնա գիտական հետազոտություններին և դրա ռազմավարական նպատակներին:

Արդյո՞ք կարելի է կառավարել մեր տեսակի էվոլյուցիան՝ պահպանելով անհատական ազատությունների նկատմամբ ամուր հարգանքը:

Գաղտնիություն?

«Որքան շատ ես փորձում թաքնվել, այնքան ուշադրություն ես գրավում: Ինչո՞ւ է այդքան կարևոր, որ ոչ ոք չգիտի քո մասին»։ – Էնդրյու Նիքոլի «Անոն» ֆիլմից, սցենարի հեղինակ և ռեժիսոր – 2018 թ

Ֆիլմում «Շուտով2018 թվականին ապագայի հասարակությունը մութ վայր է՝ Էթեր կոչվող հսկա համակարգչային համակարգի անմիջական հսկողության ներքո, որն ունակ է վերահսկել ազգի յուրաքանչյուր անկյուն՝ դիտարկելով այն նույն մարդկանց աչքերով, ովքեր բնակեցնում են այն: Յուրաքանչյուր մարդ հսկիչ է Եթերի անունից, և նրանց առաջին պարտականությունն, իհարկե, իրենց և իրենց վարքագծին վերահսկելն է:

Եթերը ոստիկանական ուժերի լավագույն դաշնակիցն է. Եթերի միջոցով գործակալները կարող են հետևել ցանկացած մարդու փորձին՝ վերապրելով այն սեփական աչքերով և բացահայտել ցանկացած տեսակի հանցագործություն:

Ոստիկան Սալը զարմանում է, թե ինչու պետք է պայքարեք ձեր գաղտնիությունը պաշտպանելու համար. ո՞րն է իմաստը, երբ թաքնվելու պատճառ չունեք: Ի վերջո, մի դարաշրջանում, երբ տեխնոլոգիաները, որոնք մենք կառուցում ենք մեր տների և մեր փողոցների անվտանգությունը բարձրացնելու համար, պահանջում են նման տեղեկատվության գրանցում, մոնիտորինգ և ստուգում՝ ի շահ այն մարդկանց, ովքեր պաշտպանություն են խնդրում, ինչպե՞ս կարող ենք երաշխավորել: նրանց գաղտնիությունը?

Ցույց տալու համար, թե որքան վտանգավոր է ուրիշների կյանք մուտք գործելը, հաքերը կստանձնի Եթերը, և մի սարսափելի մղձավանջ կհայտնվի միլիոնավոր մարդկանց կյանքում. նրանց կյանքի տանջված պահերը՝ ուղիղ հեռարձակվող նրանց ցանցաթաղանթում:

The Loop

Le արհեստական նյարդային ցանցեր որոնք ընկած են ժամանակակից արհեստական ինտելեկտի գործունեության հիմքում, պտտվում են երեք հիմնական տարրերի շուրջ կորպուսը, ՄԵԿ ալգորիթմ տեղեկատվության յուրացման համար եւ մեկ հիշողություն նրանց անգիր անելու համար։

Ալգորիթմը չի սահմանափակվում հիշողության մեջ տեղեկատվության սովորական բեռնմամբ, այն սկանավորում է դրանք միմյանց հետ կապող տարրեր փնտրելու համար: Տվյալների և հարաբերությունների խառնուրդը կփոխանցվի հիշողությանը, որը կձևավորի ա մոդել.

Մոդելի ներսում տվյալները և հարաբերությունները լիովին չեն տարբերվում, այդ իսկ պատճառով վերապատրաստված նեյրոնային ցանցից ստացված նախնական ուսումնական տեղեկատվության կորպուսը վերակառուցելը գրեթե անհնար է:

Սա հատկապես ճիշտ է, երբ կորպուսները պարունակում են մեծ քանակությամբ տվյալներ: Սա խոշոր լեզվական համակարգերի դեպքն է, որը հայտնի է որպես Large Language Models (LLM կարճ) ներառյալ տխրահռչակ ChatGpt-ը: Նրանք իրենց արդյունավետությունը պարտական են թրեյնինգում օգտագործվող տեղեկատվության մեծ քանակին. ներկայումս լավ մարզումը պահանջում է առնվազն մի քանի տերաբայթ տվյալներ և հաշվի առնելով, որ մեկ տերաբայթը համապատասխանում է 90 միլիարդ նիշի, մոտավորապես 75 միլիոն էջ տեքստի, հեշտ է հասկանալ, որ կա: այնքան շատ տեղեկատվություն է անհրաժեշտ:

Բայց եթե մոդելները չեն կարող ճարտարագիտությունից հանվել, ինչո՞ւ պետք է ինքներս մեզ հարց տանք գաղտնիության խախտման խնդիրը:

Տվյալների գերակայություն

«Ով խելագար է, կարող է խնդրել, որ իրեն ազատեն թռիչքային առաքելություններից, բայց ով խնդրում է ազատվել թռիչքային առաքելություններից, նա խենթ չէ»: – հիմնված է Ջոզեֆ Հելլերի «Catch 22» վեպի վրա։

Նորարարության տեղեկագիր
Բաց մի թողեք նորարարության մասին ամենակարևոր նորությունները: Գրանցվեք դրանք էլփոստով ստանալու համար:

Այն չափի տվյալների հավաքումը, որը թույլ է տալիս ստեղծել այնպիսի նախագծեր, ինչպիսիք են ChatGpt-ը կամ այլ նմանատիպ նախագծեր, այսօր մեծ բազմազգ ընկերությունների իրավասությունն է, որոնք իրենց թվային գործունեությամբ կարողացել են ձեռք բերել տեղեկատվության ամենամեծ շտեմարանը: աշխարհում՝ վեբ.

Google-ը և Microsoft-ը, որոնք տարիներ շարունակ կառավարել են որոնողական համակարգերը, որոնք սկանավորում են համացանցը և էքստրապոլացնում հսկայական քանակությամբ տեղեկատվություն, LLM-ի ստեղծման առաջին թեկնածուներն են՝ միակ արհեստական ինտելեկտի մոդելները, որոնք կարող են մարսել այնպիսի տեղեկատվություն, ինչպիսին վերը նկարագրվածն է:

Դժվար է հավատալ, որ Google-ը կամ Microsoft-ը կկարողանան թաքցնել անձնական տեղեկությունները իրենց տվյալների մեջ, նախքան դրանք որպես կորպուս օգտագործելը նեյրոնային ցանցի վերապատրաստման համար: Լեզվական համակարգերի դեպքում տեղեկատվության անանունացումը վերածվում է կորպուսի ներսում անձնական տվյալների նույնականացման և կեղծ տվյալների փոխարինման: Եկեք պատկերացնենք մի քանի տերաբայթի չափի մի կորպուս, որով մենք ցանկանում ենք վարժեցնել մոդելը և փորձենք պատկերացնել, թե որքան աշխատանք կպահանջվի դրա պարունակած տվյալները ձեռքով անանուն դարձնելու համար. դա գործնականում անհնար կլինի: Բայց եթե մենք ցանկանայինք հենվել ալգորիթմի վրա՝ դա ինքնաբերաբար կատարելու համար, միակ համակարգը, որն ի վիճակի է կատարել այս աշխատանքը, կլիներ մեկ այլ նույնքան մեծ և բարդ մոդել:

Մենք դասական Catch-22 խնդրի առկայության մեջ ենք. «Անանունացված տվյալների հետ LLM պատրաստելու համար մեզ անհրաժեշտ է LLM, որը կարող է անանունացնել դրանք, բայց եթե մենք ունենք LLM, որը կարող է անանունացնել տվյալները, ապա դրա ուսուցումը չի արվել անանուն տվյալների հետ: .»

GDPR-ը հնացած է

GDPR-ը, որը թելադրում է (գրեթե) գլոբալ մակարդակով մարդկանց գաղտնիությունը հարգելու կանոնները՝ հաշվի առնելով այս թեմաները, արդեն հին նորություն է, և ուսուցման հավաքածուում ներառված անձնական տվյալների պաշտպանությունը չի նախատեսվում:

GDPR-ում անձնական տվյալների մշակումը ընդհանուր հարաբերակցություններն ու կապերը սովորելու նպատակով միայն մասամբ կարգավորվում է 22-րդ հոդվածով, որտեղ ասվում է. օրինական ազդեցություն է թողնում նրա վրա կամ որը ազդում է նրա վրա նմանատիպ և էական ձևով»:

Այս հոդվածը ներկայացնում է տվյալների վերահսկիչների կողմից սուբյեկտի անձնական տվյալները օգտագործելու արգելքը՝ որպես որոշումների կայացման լիովին ավտոմատացված գործընթացի մաս, որն անմիջական իրավական ազդեցություն ունի տվյալ սուբյեկտի վրա: Բայց նեյրոնային ցանցերը, որոնք հեշտությամբ յուրացվում են որոշումների կայացման ավտոմատացված գործընթացներին, վերապատրաստվելուց հետո ձեռք են բերում ավտոմատ որոշումներ կայացնելու ունակություն, որոնք կարող են ազդել մարդկանց կյանքի վրա: Բայց միշտ չէ, որ այդ որոշումները «տրամաբանական» են։ Թրեյնինգի ընթացքում, ըստ էության, յուրաքանչյուր նեյրոնային ցանց սովորում է տեղեկատվություն կապել միմյանց հետ՝ հաճախ դրանք միմյանց հետ կապելով բացարձակապես ոչ գծային ձևով: Իսկ «տրամաբանության» բացակայությունը չի հեշտացնում գործն այն օրենսդիրի համար, ով ցանկանում է վահան բարձրացնել՝ ի պաշտպանություն մարդկանց անձնական կյանքի։

Եթե որևէ մեկը նաև որոշի կիրառել չափազանց սահմանափակող քաղաքականություն, օրինակ՝ արգելելով որևէ զգայուն տվյալների օգտագործումը, եթե ուղղակիորեն թույլտվություն չունենա սեփականատիրոջ կողմից, նեյրոնային ցանցերի օրինական օգտագործումն անիրագործելի կլիներ: Եվ նեյրոնային ցանցերի տեխնոլոգիաներից հրաժարվելը մեծ կորուստ կլինի, պարզապես մտածեք վերլուծության մոդելների մասին, որոնք պատրաստված են որոշակի հիվանդությամբ մասամբ տուժած բնակչության կլինիկական տվյալների վրա: Այս մոդելներն օգնում են բարելավել կանխարգելման քաղաքականությունը՝ բացահայտելով տվյալների մեջ առկա տարրերի և հենց հիվանդության միջև փոխկապակցվածությունը, անսպասելի հարաբերակցություններ, որոնք բժիշկների աչքում կարող են լիովին անտրամաբանական թվալ:

Կարիքների կառավարում

Տարիներ շարունակ դրա հավաքածուն անխտիր թույլատրելուց հետո մարդկանց գաղտնիությունը հարգելու խնդիր դնելն առնվազն կեղծավորություն է: GDPR-ն ինքն իր բարդությամբ պատասխանատու է բազմաթիվ մանիպուլյացիաների համար, որոնք թույլ են տալիս ստանալ անձնական տվյալների մշակման թույլտվություն՝ օգտվելով կետերի անորոշությունից և հասկանալու դժվարությունից:

Մեզ, անշուշտ, անհրաժեշտ է օրենքի պարզեցում, որը թույլ կտա դրա կիրառելիությունը և իրական կրթություն անձնական տեղեկատվության գիտակցված օգտագործման հարցում:

Իմ առաջարկն է թույլ չտալ ընկերություններին իմանալ իրենց ծառայությունների համար գրանցված օգտատերերի անձնական տվյալները, նույնիսկ եթե դրանք վճարովի ծառայություններ են: Անհատների կողմից կեղծ անձնական տվյալների օգտագործումը պետք է տեղի ունենա ավտոմատ կերպով, երբ նրանք օգտագործում են առցանց համակարգեր: Իրական տվյալների օգտագործումը պետք է սահմանափակվի միայն գնումների գործընթացով, ապահովելով, որ դրանք միշտ լիովին անջատված լինեն ծառայության տվյալների բազայից:

Թեմայի ճաշակն ու նախասիրությունները իմանալը, առանց թույլ տալու, որ անունը կամ դեմքը կապված լինի այս պրոֆիլի հետ, կգործի որպես անանունացման ձև, որն իրականացվում է հոսանքին հակառակ, որն ավտոմատ կերպով թույլ կտա տվյալների հավաքագրումը և դրանց օգտագործումը ավտոմատացման համակարգերում, ինչպիսիք են արհեստական ինտելեկտը:

Արտիկոլո դի Gianfranco Fedele

Tags: chat gptհեղինակային իրավունքGDPRgianfranco fedeleGoogleարհեստական բանականությունlarge language modelsLLMMicrosoft-ըՄարդ չկաԳաղտնիությանարհեստական նյարդային ցանցեր

Սեպտեմբերի 26, 2023 12:56

հաջորդ Neuralink-ը սկսում է հավաքագրվել ուղեղի իմպլանտի առաջին մարդկային կլինիկական փորձարկման համար »

Նախկինում « Փայլուն գաղափար. HUDWAY DRIVE, նորարարություն, որը ձեզ կենտրոնացնում է ճանապարհի վրա

Վերջին հոդվածները

Comunicati Stampa

Veeam-ն ունի ամենաընդգրկուն աջակցություն փրկագինին՝ պաշտպանությունից մինչև պատասխան և վերականգնում

Veeam-ի Coveware-ը կշարունակի տրամադրել կիբեր շորթման միջադեպերի արձագանքման ծառայություններ: Coveware-ը կառաջարկի դատաբժշկական և վերականգնման հնարավորություններ…

23 Ապրիլ 2024

Հոդվածներ

Կանաչ և թվային հեղափոխություն. Ինչպես է կանխատեսելի սպասարկումը փոխակերպում նավթի և գազի արդյունաբերությունը

Կանխատեսելի սպասարկումը հեղափոխություն է անում նավթի և գազի ոլորտում՝ կայանի կառավարման նորարարական և ակտիվ մոտեցմամբ:…

22 Ապրիլ 2024

Հոդվածներ

Մեծ Բրիտանիայի հակամենաշնորհային կարգավորիչը բարձրացնում է BigTech-ի ահազանգը GenAI-ի վերաբերյալ

Մեծ Բրիտանիայի CMA-ն նախազգուշացում է տարածել արհեստական ինտելեկտի շուկայում Big Tech-ի վարքագծի վերաբերյալ: Այնտեղ…

18 Ապրիլ 2024

Comunicati Stampa

Casa Green. էներգետիկ հեղափոխություն կայուն ապագայի համար Իտալիայում

Շենքերի էներգաարդյունավետության բարձրացման նպատակով Եվրոպական միության կողմից ձևակերպված «Քեյս Գրին» հրամանագիրը իր օրենսդրական գործընթացն ավարտել է…

18 Ապրիլ 2024

Գաղտնիության հանգույց. արհեստական ​​ինտելեկտը գաղտնիության և հեղինակային իրավունքի լաբիրինթոսում

Խնդրահարույց հարաբերություն, որտեղ տեխնոլոգիական էվոլյուցիան այնքան արագ է, որ կարգավորող ցանկացած ճշգրտում հնացած է դառնում իր առաջին կիրառման պահից:

Գաղտնիություն?

The Loop

Տվյալների գերակայություն

GDPR-ը հնացած է

Կարիքների կառավարում

Վերջին հոդվածները

Veeam-ն ունի ամենաընդգրկուն աջակցություն փրկագինին՝ պաշտպանությունից մինչև պատասխան և վերականգնում

Կանաչ և թվային հեղափոխություն. Ինչպես է կանխատեսելի սպասարկումը փոխակերպում նավթի և գազի արդյունաբերությունը

Մեծ Բրիտանիայի հակամենաշնորհային կարգավորիչը բարձրացնում է BigTech-ի ահազանգը GenAI-ի վերաբերյալ

Casa Green. էներգետիկ հեղափոխություն կայուն ապագայի համար Իտալիայում

Վերջին հոդվածները

Տվյալների տեսակը որոշող հայտանիշ

Գաղտնիության հանգույց. արհեստական ինտելեկտը գաղտնիության և հեղինակային իրավունքի լաբիրինթոսում