Артиколи

Құпиялық циклі: Құпиялылық пен авторлық құқық лабиринтіндегі жасанды интеллект

Бұл бір жағынан Құпиялылық пен Авторлық құқық, екінші жағынан Жасанды интеллект арасындағы нәзік қатынасты қарастыратын екі мақаланың біріншісі.

Технологиялық эволюция кез келген реттеуші түзетуді алғашқы қолданудан бастап ескіретіндей жылдам болатын проблемалық қатынас.

Адамдардың құқықтары мен жеке деректеріне қатысты күрделі мәселелерді шешу қазіргі заманның зиялылары мен мамандарының назарын, біліктілігін және таптырмас талқылауын талап етеді. Біз әлеуметтік ережелерді технологиялық инновациялар бізге тудыратын қиындықтарға бейімдеуде жылдам емес екенімізді анықтап жатырмыз. Дамып келе жатқан технологиялар барған сайын ашық өрісте, олардың қолданылуын шектейтін, зиян келтіруге еркін, сондықтан оны толық жазасыз қалдыратын ережелердің мүлдем жоқтығында жұмыс істейді.

Технологиялық даму тізбегінен ғылыми зерттеулер мен оның стратегиялық мақсаттарына дейін көтерілетін бақылауды елестету мүмкін бе?

Жеке бас бостандықтарын қатаң құрметтей отырып, түріміздің эволюциясын басқару мүмкін бе?

Құпиялылық?

«Сіз неғұрлым жасыруға тырыссаңыз, соғұрлым назар аударасыз. Сіз туралы ешкім білмейтіні неге сонша маңызды?» – Эндрю Никкол сценарийін жазып, түсірген «Анон» фильмінен – 2018 ж

фильмінде»Анон” 2018 жылы болашақ қоғамы – бұл Эфир деп аталатын алып компьютерлік жүйенің тікелей басқаруындағы қараңғы жер, ол елдің әр түкпірін сол халықтың көзімен бақылай алады. Әрбір адам Этер атынан бақылаушы және олардың бірінші міндеті, әрине, өзін және мінез-құлқын бақылау.

Эфир полиция күштерінің ең жақсы одақтасы болып табылады: Этер арқылы агенттер кез келген адамның тәжірибесін өз көздерімен қайталау арқылы бақылап, кез келген қылмыс түрін шеше алады.

Полиция қызметкері Сал жеке өміріңізді қорғау үшін неге күресу керек деп таң қалдырады: жасыруға ешқандай себеп болмаған кезде не керек? Өйткені, біздің үйлеріміз бен көшелеріміздің қауіпсіздігін арттыру үшін жасап жатқан технологиялар осындай ақпаратты тіркеуді, бақылауды және тексеруді талап ететін дәуірде қорғауды сұрайтын адамдардың мүдделері үшін біз қалай кепілдік бере аламыз? олардың құпиялылығы?

Басқалардың өміріне қол жеткізудің қаншалықты қауіпті екенін көрсету үшін хакер Эфирді өз қолына алады және миллиондаған адамдардың өміріне қорқынышты қорқыныш түседі: ең дәрменсіз көрермен ретінде ең көп бейнелерді көру қаупі. олардың өмірінің азапты сәттері тікелей олардың торына таратылады.

Цикл

Le жасанды нейрондық желілер Қазіргі жасанды интеллект жұмысының негізінде жатқан үш негізгі элементтің айналасында айналады: негізгі ақпарат басқаша аталады корпусБҰҰ-ның алгоритм ақпаратты игеру үшін және а жады есте сақтауы үшін.

Алгоритм ақпаратты жадқа банальды жүктеумен шектелмейді, ол оларды бір-бірімен байланыстыратын элементтерді іздеу үшін сканерлейді. Деректер мен қатынастардың қоспасы а құрайтын жадқа тасымалданады Modello.

Модельде деректер мен қарым-қатынастар мүлдем ажыратылмайды, сондықтан оқытылған нейрондық желіден бастапқы оқу ақпаратының корпусын қайта құру мүмкін емес дерлік.

Бұл әсіресе корпустарда деректердің үлкен көлемі болған кезде дұрыс. Бұл деп аталатын үлкен тілдік жүйелердің жағдайы Large Language Models (қысқа LLM), соның ішінде атышулы ChatGpt. Олар өздерінің тиімділігін оқытуда қолданылатын ақпараттың үлкен көлеміне байланысты: қазіргі уақытта жақсы дайындық үшін кем дегенде бірнеше терабайт деректер қажет және бір терабайт 90 миллиард таңбаға, шамамен 75 миллион бет мәтінге сәйкес келетінін ескерсек, бұл бар екенін түсіну оңай. соншама ақпарат керек.

Бірақ егер модельдерді де-инженеризациялау мүмкін болмаса, неге біз өзімізге құпиялылықты бұзу мәселесін қоюымыз керек?

Деректер үстемдігі

«Кім ақылсыз болса, ұшу миссияларынан босатылуды сұрай алады, бірақ ұшу миссияларынан босатылуды сұраған адам ақылсыз емес». – Джозеф Хеллердің «22-ні ұстау» романы бойынша.

Инновациялық ақпараттық бюллетень
Инновация туралы ең маңызды жаңалықтарды жіберіп алмаңыз. Оларды электрондық пошта арқылы алу үшін тіркеліңіз.

ChatGpt немесе басқа соған ұқсас жобаларды жасауға мүмкіндік беретін көлемдегі деректерді жинау бүгінгі күні өздерінің цифрлық қызметі арқылы ақпараттың ең үлкен репозиторийіне қол жеткізе алған ірі трансұлттық компаниялардың құқығы болып табылады. әлемде: Интернет.

Жылдар бойы Интернетті сканерлейтін және үлкен көлемдегі ақпаратты экстраполяциялайтын іздеу жүйелерін басқарған Google және Microsoft жоғарыда сипатталған ақпараттың көлемін қорыта алатын жалғыз AI үлгілері LLM құруға алғашқы үміткерлер болып табылады.

Google немесе Microsoft корпорациялары өз деректеріндегі жеке ақпаратты нейрондық желіні оқытуда корпус ретінде пайдаланбас бұрын жасыра алады дегенге сену қиын. Лингвистикалық жүйелер жағдайында ақпаратты анонимдеу корпус ішіндегі жеке деректерді сәйкестендіруге және оны жалған деректермен ауыстыруға айналады. Модельді жаттықтырғымыз келетін бірнеше терабайттық корпусты елестетіп көрейік және оның құрамындағы деректерді қолмен анонимдеу үшін қанша жұмыс қажет болатынын елестетіп көрейік: бұл іс жүзінде мүмкін емес еді. Бірақ егер біз оны автоматты түрде орындау үшін алгоритмге сенгіміз келсе, бұл тапсырманы орындауға қабілетті жалғыз жүйе басқа бірдей үлкен және күрделі модель болар еді.

Бізде классикалық Catch-22 мәселесі бар: «ЖОО-ны анонимді деректермен оқыту үшін бізге оны анонимизациялауға қабілетті LLM қажет, бірақ егер бізде деректерді анонимизациялауға қабілетті LLM болса, оны оқыту анонимді деректермен жасалмаған. .»

GDPR ескірген

Жаһандық деңгейде адамдардың жеке өміріне қол сұғылмаушылықты сақтау ережелерін (дерлік) белгілейтін GDPR осы тақырыптар аясында бұрыннан ескі жаңалық болып табылады және оқу жинағына қатысты жеке деректерді қорғау қарастырылмаған.

GDPR-де жалпы корреляциялар мен байланыстарды үйрену мақсатында жеке деректерді өңдеу тек ішінара 22-баппен реттеледі, онда былай делінген: «Деректердің субъектісі тек автоматтандырылған өңдеуге, оның ішінде профильге негізделген шешімге ұшырамауға құқылы. оған заңды әсер етеді немесе оған ұқсас және маңызды түрде әсер етеді».

Бұл бап деректерді бақылаушыларға субъектінің жеке деректерін субъектіге тікелей құқықтық әсер ететін толық автоматтандырылған шешім қабылдау процесінің бөлігі ретінде пайдалануға тыйым салады. Бірақ автоматтандырылған шешім қабылдау процестеріне оңай игерілетін нейрондық желілер оқытылғаннан кейін адамдардың өміріне әсер ететін автоматты шешімдер қабылдау мүмкіндігіне ие болады. Бірақ бұл шешімдер әрқашан «қисынды» бола бермейді. Жаттығу кезінде, шын мәнінде, әрбір нейрондық желі ақпаратты бір-бірімен байланыстыруды үйренеді, көбінесе оларды абсолютті сызықты емес түрде бір-бірімен байланыстырады. Ал «логиканың» жоқтығы адамдардың жеке өмірін қорғап қалқан көтергісі келетін заң шығарушының жұмысын жеңілдетпейді.

Егер біреу сондай-ақ өте шектеуші саясатты қолдануды таңдаса, мысалы, иесінің рұқсатынсыз кез келген құпия деректерді пайдалануға тыйым салу, нейрондық желілерді заңды түрде пайдалану мүмкін болмайды. Ал нейрондық желі технологияларынан бас тарту үлкен шығын болар еді, белгілі бір аурудан ішінара зардап шеккен популяцияның субъектілерінің клиникалық деректерімен дайындалған талдау үлгілерін ойлап көріңіз. Бұл модельдер деректерде бар элементтер мен аурудың өзі арасындағы корреляцияны анықтау арқылы профилактикалық саясатты жақсартуға көмектеседі, клиницистердің көзінше мүлдем қисынсыз болып көрінуі мүмкін күтпеген корреляциялар.

Қажеттіліктерді басқару

Оны жинауға жылдар бойы рұқсат бермегеннен кейін адамдардың жеке өмірін құрметтеу мәселесін қою екіжүзділік. GDPR өзі күрделілігімен тармақтардың екіұштылығын және түсіну қиындығын пайдалана отырып, жеке деректерді өңдеуге рұқсат алуға мүмкіндік беретін көптеген манипуляцияларға жауап береді.

Бізге, әрине, заңды қолдану мүмкіндігін беретін жеңілдету және жеке ақпаратты саналы түрде пайдалануға нақты білім беру қажет.

Менің ұсынысым – компанияларға өз қызметтеріне тіркелген пайдаланушылардың жеке деректерін білуге ​​рұқсат бермеу, тіпті олар ақылы қызмет болса да. Жеке тұлғалардың жалған жеке деректерді пайдалануы олар онлайн жүйелерді пайдаланған кезде автоматты түрде орын алуы керек. Нақты деректерді пайдалану тек сатып алу процесімен шектелуі керек, бұл оның әрқашан қызмет дерекқорынан толығымен бөлек болуын қамтамасыз етеді.

Осы профильге атауды немесе бетті байланыстыруға рұқсат бермей, субъектінің талғамы мен қалауын білу, деректерді автоматты түрде жинауға және оларды жасанды интеллект сияқты автоматтандыру жүйелерінде пайдалануға мүмкіндік беретін жоғарыда жүзеге асырылатын анонимизация түрі ретінде қызмет етеді.

Артиколо ди Gianfranco Fedele

Инновациялық ақпараттық бюллетень
Инновация туралы ең маңызды жаңалықтарды жіберіп алмаңыз. Оларды электрондық пошта арқылы алу үшін тіркеліңіз.

Соңғы мақалалар

Баспагерлер мен OpenAI жасанды интеллект өңдейтін ақпарат ағынын реттеу үшін келісімдерге қол қояды.

Өткен дүйсенбіде Financial Times OpenAI-мен келісім туралы жариялады. FT өзінің әлемдік деңгейдегі журналистикасына лицензия береді…

30 Сәуір 2024

Онлайн төлемдер: Міне, ағынды қызметтер сізге мәңгілік төлем жасауға мүмкіндік береді

Миллиондаған адамдар ай сайынғы абоненттік төлемді төлей отырып, ағынды қызметтерге ақы төлейді. Жалпы пікір, сіз…

29 Сәуір 2024

Veeam қорғаныстан жауап беруге және қалпына келтіруге дейін төлемдік бағдарламалық құралға ең жан-жақты қолдау көрсетеді

Veeam ұсынған Coveware кибербопсалау оқиғаларына жауап беру қызметтерін көрсетуді жалғастырады. Coveware криминалистикалық және қалпына келтіру мүмкіндіктерін ұсынады ...

23 Сәуір 2024

Жасыл және цифрлық революция: болжамды техникалық қызмет көрсету мұнай және газ саласын қалай өзгертеді

Болжалды техникалық қызмет көрсету зауытты басқаруға инновациялық және белсенді көзқараспен мұнай және газ секторында төңкеріс жасайды.…

22 Сәуір 2024

Инновацияны өз тіліңізде оқыңыз

Инновациялық ақпараттық бюллетень
Инновация туралы ең маңызды жаңалықтарды жіберіп алмаңыз. Оларды электрондық пошта арқылы алу үшін тіркеліңіз.

Артымыздан