Məqalələr

Məxfilik Döngəsi: Məxfilik və Müəllif Hüququ labirintində süni intellekt

Bu, bir tərəfdən Məxfilik və Müəllif Hüququ, digər tərəfdən isə Süni İntellekt arasındakı incə münasibətə toxunduğum iki məqalədən birincisidir.

Texnoloji təkamülün hər hansı tənzimləyici düzəlişi ilk tətbiqindən köhnələcək qədər sürətli olduğu problemli əlaqə.

İnsanların hüquqları və şəxsi məlumatları ilə bağlı mürəkkəb məsələlərin həlli diqqət, bacarıq və dövrümüzün ziyalıları və mütəxəssisləri arasında əvəzolunmaz müzakirə tələb edir. Biz sosial qaydaları texnoloji yeniliklərin qarşımıza qoyduğu problemlərə uyğunlaşdırmaqda kifayət qədər tez olmadığımızı aşkar edirik. İnkişaf etməkdə olan texnologiyalar getdikcə daha çox açıq sahədə fəaliyyət göstərir, onların tətbiqini məhdudlaşdıran qaydaların tam olmaması, zərər vurmaqda sərbəstdir və buna görə də bunu tamamilə cəzasızlıqla edir.

Texnoloji inkişaf zəncirindən elmi tədqiqatlara və onun strateji məqsədlərinə qədər uzanan nəzarəti təsəvvür etmək mümkündürmü?

Fərdi azadlıqlara möhkəm hörmət göstərərək növümüzün təkamülünü idarə etmək mümkündürmü?

Məxfilik?

“Nə qədər gizlətməyə çalışsan, bir o qədər diqqəti cəlb edirsən. Sənin haqqında heç kimin bilməməsi niyə bu qədər vacibdir?” – Endryu Nikkolun ssenari müəllifi və rejissoru olduğu “Anon” filmindən – 2018

Filmdə "Anon” 2018-ci ildə, gələcəyin cəmiyyəti qaranlıq bir yerdir, Eter adlı nəhəng kompüter sisteminin birbaşa nəzarəti altındadır və millətin hər bir guşəsini onu məskunlaşdıran eyni insanların gözü ilə müşahidə etmək iqtidarındadır. Hər bir insan Eter adından nəzarətçidir və onların birinci vəzifəsi, əlbəttə ki, özünə və davranışlarına nəzarət etməkdir.

Eter polis qüvvələrinin ən yaxşı müttəfiqidir: Eter vasitəsilə agentlər hər hansı bir insanın təcrübəsini öz gözləri ilə yenidən yaşayaraq izləyə və istənilən növ cinayəti həll edə bilər.

Polis məmuru Sal təəccüblənir ki, siz nə üçün şəxsi həyatınız üçün mübarizə aparmalısınız: gizlənməyə heç bir səbəbiniz olmadığı halda nə mənası var? Axı, evlərimizin və küçələrimizin təhlükəsizliyini artırmaq üçün qurduğumuz texnologiyaların qorunmaq istəyən insanların maraqları naminə bu cür məlumatların qeydə alınmasını, monitorinqini və yoxlanılmasını tələb etdiyi bir dövrdə biz necə təminat verə bilərik? onların məxfiliyi?

Başqalarının həyatına girişin nə qədər təhlükəli olduğunu nümayiş etdirmək üçün bir haker Ether üzərində nəzarəti ələ keçirəcək və milyonlarla insanın həyatına dəhşətli kabus düşəcək: ən çox köməksiz tamaşaçılar kimi baxmaq təhlükəsi. həyatlarının əzablı anlarını birbaşa retinalarına yayımlayırlar.

Döngə

Le süni neyron şəbəkələri Müasir süni intellektlərin fəaliyyətinin əsasını təşkil edən üç əsas element ətrafında fırlanır: əsas məlumatlar başqa cür adlandırılır. corpusbir alqoritm məlumatların mənimsənilməsi üçün və a yaddaş əzbərlədikləri üçün.

Alqoritm məlumatın yaddaşa qeyri-adi yüklənməsi ilə məhdudlaşmır, onları bir-biri ilə əlaqələndirən elementləri axtarmaq üçün onu skan edir. Məlumatların və əlaqələrin qarışığı yaddaşa ötürüləcək ki, bu da a təşkil edəcək növü.

Model daxilində verilənlər və əlaqələr tamamilə fərqlənmir, buna görə də təlim keçmiş neyron şəbəkəsindən orijinal təlim məlumatının korpusunu yenidən qurmaq demək olar ki, mümkün deyil.

Bu, xüsusilə korpuslarda böyük miqdarda məlumat olduqda doğrudur. Bu, adı ilə tanınan böyük dil sistemlərinə aiddir Large Language Models (qısaca LLM), o cümlədən məhşur ChatGpt. Onlar öz effektivliyini təlimdə istifadə olunan böyük miqdarda məlumatlara borcludurlar: hazırda yaxşı təlim ən azı bir neçə terabayt məlumat tələb edir və bir terabaytın 90 milyard simvola, təxminən 75 milyon səhifə mətnə ​​uyğun olduğunu nəzərə alsaq, asan başa düşmək olar ki, bu qədər məlumat lazımdır.

Bəs modelləri dizayndan çıxarmaq mümkün deyilsə, niyə özümüzə məxfiliyin pozulması problemini soruşmalıyıq?

Məlumatların üstünlüyü

"Kim dəlidirsə, uçuş missiyalarından azad olunmağı xahiş edə bilər, amma kim uçuş missiyalarından azad olunmaq istəsə, dəli deyil." – Cozef Hellerin “Catch 22” romanı əsasında.

İnnovasiya bülleteni
Yeniliklərlə bağlı ən vacib xəbərləri qaçırmayın. Onları e-poçtla almaq üçün qeydiyyatdan keçin.

ChatGpt və ya digər oxşar layihələrin yaradılmasına imkan verəcək ölçüdə məlumatların toplanması bu gün rəqəmsal fəaliyyətləri ilə ən böyük məlumat deposunda əllərini əldə edə bilən böyük transmilli şirkətlərin səlahiyyətindədir. dünyada: İnternet.

İllərdir İnterneti skan edən və böyük miqdarda məlumatı ekstrapolyasiya edən axtarış sistemlərini idarə edən Google və Microsoft, yuxarıda təsvir edilənlər kimi böyük miqdarda məlumatı həzm edə bilən yeganə AI modelləri olan LLM-nin yaradılması üçün ilk namizədlərdir.

İnanmaq çətindir ki, Google və ya Microsoft neyron şəbəkəsinin təlimində korpus kimi istifadə etməzdən əvvəl öz məlumatlarında şəxsi məlumatları gizlədə biləcəklər. Linqvistik sistemlər vəziyyətində məlumatın anonimləşdirilməsi korpus daxilində fərdi məlumatların identifikasiyasına və onların saxta məlumatlarla əvəzlənməsinə çevrilir. Modeli hazırlamaq istədiyimiz bir neçə terabayt ölçüsündə korpusu təsəvvür edək və onun tərkibində olan məlumatları əl ilə anonimləşdirmək üçün nə qədər işin lazım olduğunu təsəvvür etməyə çalışaq: bu, praktiki olaraq qeyri-mümkün olardı. Ancaq bunu avtomatik etmək üçün bir alqoritmə etibar etmək istəsək, bu işi görə bilən yeganə sistem eyni dərəcədə böyük və mürəkkəb bir model olardı.

Klassik Catch-22 problemi ilə qarşılaşırıq: “anonimləşdirilmiş məlumatlarla bir LLM hazırlamaq üçün bizə onu anonimləşdirməyə qadir olan LLM lazımdır, lakin bizdə məlumatları anonimləşdirməyə qadir bir LLM varsa, onun təlimi anonim məlumatlarla aparılmayıb. ”

GDPR köhnəlib

Qlobal miqyasda insanların məxfiliyinə hörmət qaydalarını diktə edən (demək olar ki,) GDPR, bu mövzular fonunda artıq köhnə xəbərdir və təlim toplusunda iştirak edən şəxsi məlumatların qorunması nəzərdə tutulmur.

GDPR-də ümumi korrelyasiya və əlaqələri öyrənmək məqsədilə şəxsi məlumatların işlənməsi yalnız qismən 22-ci maddə ilə tənzimlənir: “Məlumat subyekti yalnız avtomatlaşdırılmış emal, o cümlədən profilləşdirmə əsasında qərara məruz qalmamaq hüququna malikdir. ona hüquqi təsirlər yaradır və ya ona oxşar və əhəmiyyətli şəkildə təsir edir”.

Bu maddə məlumat nəzarətçiləri üçün subyektin şəxsi məlumatlarından subyektə birbaşa hüquqi təsir göstərən tam avtomatlaşdırılmış qərar qəbuletmə prosesinin bir hissəsi kimi istifadəsinə qadağa təqdim edir. Lakin avtomatlaşdırılmış qərar qəbuletmə proseslərinə asanlıqla mənimsənilən neyron şəbəkələri təlim keçdikdən sonra insanların həyatına təsir edə biləcək avtomatik qərarlar qəbul etmək bacarığına yiyələnir. Lakin bu qərarlar heç də həmişə “məntiqli” olmur. Təlim zamanı, əslində, hər bir neyron şəbəkəsi məlumatları bir-biri ilə əlaqələndirməyi öyrənir, çox vaxt onları bir-biri ilə tamamilə qeyri-xətti şəkildə əlaqələndirir. “Məntiqin” olmaması isə insanların şəxsi həyatının müdafiəsinə qalxan qaldırmaq istəyən qanunvericinin işini asanlaşdırmır.

Əgər biri də son dərəcə məhdudlaşdırıcı siyasət tətbiq etməyi seçərsə, məsələn, sahibi tərəfindən açıq şəkildə icazə verilmədiyi təqdirdə hər hansı həssas məlumatın istifadəsini qadağan edərsə, neyron şəbəkələrin qanuni istifadəsi qeyri-mümkün olardı. Neyron şəbəkə texnologiyalarından imtina etmək böyük itki olardı, sadəcə olaraq müəyyən bir xəstəlikdən qismən təsirlənmiş bir əhalinin subyektlərinin klinik məlumatları ilə hazırlanmış analiz modellərini düşünün. Bu modellər məlumatlarda mövcud olan elementlər və xəstəliyin özü arasında korrelyasiya, klinisyenlərin nəzərində tamamilə məntiqsiz görünə bilən gözlənilməz korrelyasiyaları müəyyən etməklə profilaktika siyasətini təkmilləşdirməyə kömək edir.

Ehtiyacların idarə edilməsi

İllər boyu onun toplanmasına ayrı-seçkilik etmədən icazə verdikdən sonra insanların şəxsi həyatına hörmət probleminin qoyulması ən azı ikiüzlülükdür. GDPR özü mürəkkəbliyi ilə bəndlərin qeyri-müəyyənliyindən və başa düşülmə çətinliyindən istifadə edərək şəxsi məlumatların emal edilməsi üçün icazə əldə etməyə imkan verən çoxsaylı manipulyasiyalara görə məsuliyyət daşıyır.

Bizə, şübhəsiz ki, qanunun onun tətbiqinə imkan verən sadələşdirilməsinə və şəxsi məlumatların şüurlu istifadəsi üzrə real təhsilə ehtiyacı var.

Təklifim odur ki, şirkətlərə xidmətlərindən qeydiyyatdan keçən istifadəçilərin, hətta pullu xidmətlər olsa belə, onların şəxsi məlumatlarını bilməsinə icazə verilməsin. Fərdi şəxslər tərəfindən saxta şəxsi məlumatların istifadəsi onlayn sistemlərdən istifadə etdikdə avtomatik olaraq baş verməlidir. Həqiqi məlumatların istifadəsi yalnız satınalma prosesi ilə məhdudlaşdırılmalı və onun həmişə xidmət verilənlər bazasından tamamilə ayrı olmasını təmin etməlidir.

Adın və ya sifətin bu profillə əlaqələndirilməsinə icazə vermədən mövzunun zövqlərini və üstünlüklərini bilmək, avtomatik olaraq məlumatların toplanmasına və onların süni intellekt kimi avtomatlaşdırma sistemlərində istifadəsinə imkan verən yuxarıda həyata keçirilən anonimləşdirmə forması kimi fəaliyyət göstərəcək.

məqaləsi Gianfranco Fedele

İnnovasiya bülleteni
Yeniliklərlə bağlı ən vacib xəbərləri qaçırmayın. Onları e-poçtla almaq üçün qeydiyyatdan keçin.

Articoli recenti

Veeam müdafiədən tutmuş cavab və bərpaya qədər ransomware üçün ən əhatəli dəstəyi təqdim edir

Coveware by Veeam kiber qəsb hallarına cavab xidmətləri göstərməyə davam edəcək. Coveware məhkəmə və remediasiya imkanları təklif edəcək...

23 Aprel 2024

Yaşıl və Rəqəmsal İnqilab: Proqnozlaşdırılan Baxım Neft və Qaz Sənayesini necə çevirir?

Proqnozlaşdırılan texniki xidmət zavodun idarə edilməsinə innovativ və proaktiv yanaşma ilə neft və qaz sektorunda inqilab edir.…

22 Aprel 2024

Böyük Britaniyanın antiinhisar tənzimləyicisi GenAI üzərində BigTech həyəcanını qaldırır

Böyük Britaniyanın CMA süni intellekt bazarında Big Tech-in davranışı ilə bağlı xəbərdarlıq edib. Orada…

18 Aprel 2024

Casa Green: İtaliyada davamlı gələcək üçün enerji inqilabı

Avropa İttifaqı tərəfindən binaların enerji səmərəliliyini artırmaq üçün tərtib edilən "Yaşıl Evlər" Fərmanı qanunvericilik prosesini yekunlaşdırdı ...

18 Aprel 2024