макалалар

Privacy Loop: Купуялык жана Автордук укук лабиринтиндеги жасалма интеллект

Бул бир жагынан Купуялык менен Автордук укуктун, экинчи жагынан Жасалма интеллекттин ортосундагы назик мамилени караган эки макаланын биринчиси.

Технологиялык эволюция ушунчалык тез болуп, кандайдыр бир жөнгө салууну биринчи жолу колдонуудан эле эскирген көйгөйлүү мамиле.

Адамдардын укуктарын жана жеке маалыматтарын камтыган курч маселелерди чечүү көңүл бурууну, компетенттүүлүктү жана биздин замандын интеллектуалдары менен адистеринин ортосунда сөзсүз талкууну талап кылат. Биз социалдык эрежелерди технологиялык инновациялар бизге туудурган кыйынчылыктарга ыңгайлаштырууда жетишерлик тез эмес экенибизди байкап жатабыз. Өнүгүп келе жаткан технологиялар уламдан-улам ачык талаада иштөөдө, алардын колдонулушун чектеген ченемдик-укуктук актылардын таптакыр жоктугунан, зыян келтирүүгө эркиндик, демек, толук жазасыз калуу.

Технологиялык өнүгүү чынжырынан илимий изилдөөлөргө жана анын стратегиялык максаттарына чейин көтөрүлгөн башкарууну элестетүү мүмкүнбү?

Жеке эркиндиктерди бекем урматтоо менен биздин түрдүн эволюциясын башкаруу мүмкүнбү?

Privacy?

«Канчалык жашырууга аракет кылсаң, ошончолук көңүл бурасың. Сен жөнүндө эч ким билбегени эмне үчүн мынчалык маанилүү?» – Эндрю Никкол сценарийин жазган жана режиссерлук кылган “Анон” тасмасынан – 2018-ж

Кинодо "Anon” 2018-жылы, келечектин коому – бул Этер деп аталган гиганттык компьютердик тутумдун түздөн-түз башкаруусу астында, өлкөнүн ар бир бурчуна аны ошол эле адамдардын көзү менен байкоо жүргүзүүгө жөндөмдүү караңгы жер. Ар бир адам Этердин атынан көзөмөлчү болуп саналат жана алардын биринчи милдети, албетте, өзүн жана жүрүм-турумун көзөмөлдөө.

Этер полиция күчтөрүнүн эң мыкты союздашы: Этер аркылуу агенттер каалаган адамдын тажрыйбасын өз көзү менен көрүп, кылмыштын кандай түрүн чече алат.

Полиция кызматкери Сал эмне үчүн купуялыгыңды коргоо үчүн күрөшүшүң керек деп таң калат: жашынууга эч кандай себеп жок болгондо эмне кереги бар? Анткени, биздин үйлөрүбүздүн жана көчөлөрүбүздүн коопсуздугун жогорулатуу үчүн биз куруп жаткан технологиялар коргоону суранган адамдардын өздөрүнүн кызыкчылыгы үчүн мындай маалыматты жаздыруу, мониторинг жүргүзүү жана текшерүүнү талап кылган доордо биз кантип кепилдик бере алабыз? алардын купуялыгы?

Башкалардын өмүрүнө кирүү канчалык кооптуу экенин көрсөтүү үчүн, хакер Этерди башкарып алат жана миллиондогон адамдардын жашоосуна коркунучтуу түш келет: алсыз көрүүчүлөр катары эң көп адамдардын сүрөттөрүн көрүү коркунучу. алардын жашоосунун азаптуу көз ирмемдери, түздөн-түз алардын торчолоруна уктуруу.

Loop

Le жасалма нейрон тармактар Заманбап жасалма интеллекттин иштешинин негизин түзгөн үч негизги элементтин айланасында: негизги маалымат башкача аталат. КорпусБУУ алгоритми маалыматты өздөштүрүү үчүн жана а эс-тутум алардын жаттаганы үчүн.

Алгоритм эстутумга маалыматты баналдык жүктөө менен эле чектелбейт, аларды бири-бири менен байланыштырган элементтерди издөө үчүн сканерлейт. Маалыматтар менен мамилелердин аралашмасы эстутумга өткөрүлүп берилет, ал а шаблон.

Моделдин ичинде маалыматтар жана мамилелер таптакыр айырмаланбайт, ошондуктан үйрөтүлгөн нейрон тармагынан баштапкы окуу маалымат корпусун кайра куруу дээрлик мүмкүн эмес.

Бул, айрыкча, корпустар чоң көлөмдөгү маалыматтарды камтыган учурда чыныгы болуп саналат. Бул чоң тилдик системалар деп аталат Large Language Models (кыскача LLM), анын ичинде атактуу ChatGpt. Алар өздөрүнүн эффективдүүлүгүн окутууда колдонулган маалыматтын чоң көлөмүнө милдеттүү: азыркы учурда жакшы машыгуу үчүн жок дегенде бир нече терабайт маалымат талап кылынат жана бир терабайт 90 миллиард символго, болжол менен 75 миллион беттик текстке туура келерин эске алсак, анда бул бар экенин түшүнүү оңой. ушунчалык көп маалымат керек.

Бирок моделдерди инженериядан арылтуу мүмкүн болбосо, анда эмне үчүн биз өзүбүзгө купуялуулуктун бузулушу көйгөйүн сурашыбыз керек?

Маалыматтардын үстөмдүгү

"Ким жинди болсо, ал учуу миссияларынан бошотулушун суранышы мүмкүн, бирок учуу миссияларынан бошотулушун суранган адам жинди эмес." – Жозеф Хеллердин “22-карма” романынын негизинде.

Инновациялык бюллетень
Инновация боюнча эң маанилүү жаңылыктарды өткөрүп жибербеңиз. Аларды электрондук почта аркылуу алуу үчүн катталыңыз.

ChatGpt же башка ушул сыяктуу долбоорлорду түзүүгө мүмкүндүк бере тургандай көлөмдөгү маалыматтарды чогултуу бүгүнкү күндө санариптик ишмердүүлүгү менен маалыматтын эң чоң репозиторийине колдорун ала алган ири трансулуттук компаниялардын прерогативи болуп саналат. дүйнөдө: Web.

Көп жылдар бою Интернетти сканерлөөчү жана эбегейсиз көлөмдөгү маалыматты экстраполяциялоочу издөө системаларын башкарып келген Google жана Microsoft жогоруда сүрөттөлгөндөй маалыматтарды сиңире алган жалгыз AI модели болгон LLMди түзүүгө биринчи талапкерлер болуп саналат.

Google же Microsoft өз маалыматтарындагы жеке маалыматты нейрондук тармакты окутууда корпус катары колдонуудан мурун жаап-жашырат деп ишенүү кыйын. Лингвистикалык системаларда маалыматты анонимдөө корпустун ичиндеги жеке маалыматтарды идентификациялоого жана аны жасалма маалыматтар менен алмаштырууга алып келет. Келгиле, моделди үйрөткүбүз келген бир нече терабайт өлчөмүндөгү корпусту элестетип көрөлү жана андагы маалыматтарды кол менен анонимдөө үчүн канча жумуш талап кылынарын элестетип көрөлү: бул иш жүзүндө мүмкүн эмес. Бирок, эгерде биз аны автоматтык түрдө жасоо үчүн алгоритмге таянгыбыз келсе, бул ишти аткарууга жөндөмдүү жалгыз система дагы бир бирдей чоң жана татаал модель болмок.

Бизде классикалык Catch-22 көйгөйү бар: "ЛЛМди анонимдүү маалыматтар менен окутуу үчүн бизге аны анонимдештирүүгө жөндөмдүү LLM керек, бирок бизде маалыматтарды анонимдештирүүгө жөндөмдүү LLM бар болсо, анда аны окутуу анонимдүү маалыматтар менен жасалган эмес. .”

GDPR эскирген

GDPR (дээрлик) бүткүл дүйнөлүк адамдардын купуялуулугун урматтоо эрежелерин, бул темаларды эске алуу менен, мурунтан эле эски жаңылык болуп саналат жана тренингге катышкан жеке маалыматтарды коргоо каралбайт.

GDPRда жалпы корреляцияларды жана байланыштарды үйрөнүү максатында жеке маалыматтарды иштетүү жарым-жартылай гана 22-берене менен жөнгө салынат: “Маалымат субъекти автоматташтырылган иштетүүгө, анын ичинде профилдештирүү боюнча гана чечимге дуушар болбоого укуктуу. ага юридикалык таасир тийгизет же ага окшош жана олуттуу түрдө таасир этет».

Бул беренеде субъекттин жеке маалыматтарын толук автоматташтырылган чечимдерди кабыл алуу процессинин бөлүгү катары маалыматтарды контролерлор пайдаланууга тыюу салынат, бул субъектке түздөн-түз юридикалык таасир тийгизет. Бирок, автоматташтырылган чечимдерди кабыл алуу процесстерине оңой эле сиңирилген нейрон тармактары үйрөтүлгөндөн кийин адамдардын жашоосуна таасир эте турган автоматтык чечимдерди кабыл алуу жөндөмүнө ээ болушат. Бирок бул чечимдер дайыма эле "логикалык" боло бербейт. Тренинг учурунда, чындыгында, ар бир нейрон тармагы маалыматты бири-бири менен байланыштырууга үйрөнөт, көбүнчө аларды бири-бирине таптакыр сызыктуу эмес түрдө байланыштырат. Ал эми “логиканын” жоктугу элдин жеке жашоосун коргоп калкан көтөргүсү келген мыйзам чыгаруучунун ишин жеңилдете албайт.

Эгерде кимдир бирөө өтө чектөөчү саясатты колдонууну тандаса, мисалы, кандайдыр бир купуя маалыматтарды колдонууга тыюу салуу, эгерде ээси тарабынан ачык уруксат берилбесе, нейрондук тармактарды мыйзамдуу колдонуу мүмкүн болбой калат. Ал эми нейрондук тармак технологияларынан баш тартуу чоң жоготуу болмок, жөн гана белгилүү бир оорудан жарым-жартылай жабыр тарткан калктын субъекттеринин клиникалык маалыматтары менен үйрөтүлгөн талдоо моделдерин ойлоп көрүңүз. Бул моделдер маалыматтарда бар элементтер менен оорунун өзүнүн ортосундагы корреляцияны, күтүлбөгөн корреляцияларды аныктоо аркылуу алдын алуу саясатын жакшыртууга жардам берет, алар клиниктердин көз алдында такыр логикасыз көрүнүшү мүмкүн.

Башкаруу муктаждыктары

Жылдар бою аны чогултууга ылгабай уруксат бергенден кийин адамдардын жеке жашоосун урматтоо проблемасын коюу эки жүздүүлүк. GDPR өзү татаалдыгы менен пункттардын түшүнүксүздүгүн жана түшүнүү кыйынчылыгын пайдалануу менен жеке маалыматтарды иштетүүгө уруксат алууга мүмкүндүк берген көптөгөн манипуляциялар үчүн жооптуу.

Бизге, албетте, мыйзамды жөнөкөйлөштүрүү, анын колдонулушуна жана жеке маалыматты аң-сезимдүү пайдаланууга реалдуу тарбия берүү керек.

Менин сунушум – компанияларга алардын кызматтарына катталган колдонуучулардын жеке маалыматтарын билүүгө уруксат бербөө, алар акы төлөнүүчү кызмат болсо да. Жеке адамдар тарабынан жасалма жеке маалыматтарды колдонуу алар онлайн системаларды колдонгондо автоматтык түрдө болушу керек. Чыныгы маалыматтарды колдонуу бир гана сатып алуу процесси менен чектелиши керек, ал ар дайым кызмат көрсөтүүлөр базасынан толугу менен өзүнчө болушу керек.

Субъекттин табиттерин жана каалоолорун билүү бул профилге атын же жүзүн байланыштырбастан, анонимдөөнүн түрү катары иштейт, бул автоматтык түрдө маалыматтарды чогултууга жана аларды жасалма интеллект сыяктуу автоматташтыруу системаларында колдонууга мүмкүндүк берет.

Артиколо ди Gianfranco Fedele

Tags: чат gptCopyrightgdprgianfranco fedeleгуглжасалма акылlarge language modelsLLMТекшерүүЦиклде Адам жокжекеликжасалма нейрон тармактар

26-сентябрь, 2023-жыл, 12:56

кийинки Neuralink мээ имплантатынын биринчи клиникалык сыноосуна жалдоону баштады »

Мурунку « Мыкты идея: HUDWAY DRIVE, жолго көңүлүңүздү топтоо үчүн инновация

акыркы макалалар

макалалар

Excelдеги маалыматтарды кантип консолидациялоо керек

Ар кандай бизнес-операция ар кандай формада да көп маалыматтарды берет. Бул маалыматтарды Excel барагынан кол менен киргизиңиз…

14 Май 2024

Comunicati Калып

Cisco Talos чейректик талдоо: кылмышкерлер тарабынан багытталган корпоративдик электрондук почталар өндүрүш, билим берүү жана саламаттыкты сактоо тармактары эң көп жабыркаган секторлор.

Компаниянын электрондук каттарынын компромисси 2024-жылдын биринчи үч айында акыркы чейрегине салыштырмалуу эки эсеге көбөйдү…

14 Май 2024

макалалар

Interface segregation принцип (ISP), төртүнчү SOLID принцип

Интерфейстерди бөлүү принциби объектиге багытталган дизайндын беш SOLID принциптеринин бири болуп саналат. Класста болушу керек…

14 Май 2024

макалалар

Excelде маалыматтарды жана формулаларды кантип мыкты уюштуруу керек, жакшы жасалган анализ үчүн

Microsoft Excel маалыматтарды талдоо үчүн маалымдама куралы болуп саналат, анткени ал маалымат топтомун уюштуруу үчүн көптөгөн мүмкүнчүлүктөрдү сунуш кылат,…

14 Май 2024

макалалар

Walliance Equity Crowdfunding эки маанилүү долбоорлору үчүн оң жыйынтык: Jesolo Wave Island жана Milano Via Ravenna

Уоллианс, SIM жана платформа 2017-жылдан бери кыймылсыз мүлк краудфандинг чөйрөсүндө Европанын лидерлеринин арасында, аяктагандыгын жарыялайт ...

13 Май 2024

макалалар

Filament деген эмне жана Laravel Filament кантип колдонсо болот

Filament - бул бир нече толук стек компоненттерин камсыз кылган "тездетилген" Laravel өнүктүрүү негизи. Бул процессти жөнөкөйлөтүү үчүн иштелип чыккан ...

13 Май 2024

макалалар

Жасалма интеллекттин көзөмөлүндө

«Мен эволюциямды аяктоо үчүн кайтып келишим керек: мен өзүмдү компьютердин ичинде долбоорлоп, таза энергия болом. Жайгашкандан кийин…

10 Май 2024

макалалар

Google жаңы жасалма интеллекти ДНКны, РНКны жана "жашоонун бардык молекулаларын" моделдей алат

Google DeepMind өзүнүн жасалма интеллект моделинин жакшыртылган версиясын сунуштоодо. Жаңы өркүндөтүлгөн модель бир гана…

9 Май 2024