품목

개인 정보 보호 루프: 개인 정보 보호와 저작권의 미로에 있는 인공 지능

이 글은 개인 정보 보호와 저작권, 그리고 인공 지능 사이의 미묘한 관계를 다루는 두 편의 기사 중 첫 번째입니다.

기술 발전이 너무 빨라서 첫 번째 적용부터 모든 규제 조정이 더 이상 쓸모 없게 되는 문제가 있는 관계입니다.

인간의 권리와 개인 데이터와 관련된 까다로운 문제를 해결하려면 우리 시대의 지식인과 전문가 간의 관심과 역량, 그리고 필수적인 토론이 필요합니다. 우리는 기술 혁신이 우리에게 제기하는 과제에 사회적 규칙을 적용하는 데 충분히 빠르지 않다는 것을 발견하고 있습니다. 신기술은 적용을 제한하는 규정이 전혀 없는 개방된 분야에서 점점 더 많이 작동하고 있으며, 자유롭게 피해를 입힐 수 있으므로 완전한 처벌을 받지 않습니다.

기술 개발의 사슬을 과학 연구와 그 전략적 목표로 되돌리는 통제를 상상하는 것이 가능합니까?

개인의 자유를 확고히 존중하면서 우리 종의 진화를 지배하는 것이 가능합니까?

은둔?

“숨기려고 하면 할수록 관심을 끌게 됩니다. 아무도 당신에 대해 모른다는 것이 왜 그렇게 중요합니까?” – Andrew Niccol이 각본 및 감독을 맡은 영화 “Anon”에서 – 2018

영화에서 "곧2018년, 미래 사회는 이더(Ether)라는 거대한 컴퓨터 시스템의 직접적인 통제를 받는 어두운 곳이며, 그곳에 거주하는 동일한 사람들의 눈을 통해 국가 구석구석을 관찰할 수 있습니다. 모든 인간은 Ether를 대표하는 감독자이며, 물론 그들의 첫 번째 책임은 자신과 자신의 행동을 모니터링하는 것입니다.

Ether는 경찰의 최고의 동맹입니다. Ether를 통해 요원은 모든 사람의 경험을 자신의 눈으로 재현하여 추적하고 모든 유형의 범죄를 해결할 수 있습니다.

경찰관 Sal은 왜 개인 정보 보호를 위해 싸워야 하는지 궁금해합니다. 숨을 이유가 없다면 무슨 의미가 있을까요? 결국, 집과 거리의 안전을 높이기 위해 우리가 구축하는 기술이 보호를 요청하는 사람들 자신의 이익을 위해 그러한 정보의 기록, 모니터링 및 검증을 요구하는 시대에 우리가 어떻게 보장할 수 있겠습니까? 그들의 프라이버시?

다른 사람의 삶에 접근하는 것이 얼마나 위험한지 보여주기 위해 해커가 Ether를 장악하고 끔찍한 악몽이 수백만 명의 삶에 내려올 것입니다. 삶의 고통스러운 순간이 망막에 직접 방송됩니다.

루프

Le 인공 신경망 현대 인공 지능의 기능의 기초가 되는 세 가지 주요 요소를 중심으로 진행됩니다. 원금하는 연산 정보의 동화와 기억 그들의 기억을 위해.

알고리즘은 정보를 메모리에 로드하는 단순한 작업에만 국한되지 않고 정보를 검색하여 서로 관련된 요소를 찾습니다. 데이터와 관계의 혼합이 메모리로 전송되어 하나의 기억을 형성하게 됩니다. 모델.

모델 내에서 데이터와 관계는 완전히 구별할 수 없으므로 훈련된 신경망에서 원래 훈련 정보의 코퍼스를 재구성하는 것이 거의 불가능합니다.

말뭉치에 많은 양의 데이터가 포함되어 있는 경우 특히 그렇습니다. 이것은 다음과 같이 알려진 대규모 언어 시스템의 경우입니다. Large Language Model악명 높은 ChatGpt를 포함한 s(줄여서 LLM)입니다. 훈련에 사용되는 많은 양의 정보 덕분에 효율성이 높아졌습니다. 현재 좋은 훈련을 위해서는 최소한 몇 테라바이트의 데이터가 필요하며, 90테라바이트가 75억 문자, 약 XNUMX만 페이지의 텍스트에 해당한다는 점을 고려하면 다음과 같은 사실을 쉽게 이해할 수 있습니다. 너무 많은 정보가 필요합니다.

하지만 모델을 디엔지니어링할 수 없다면 왜 개인 정보 침해 문제를 자문해야 할까요?

데이터 지배력

“미친 사람은 비행 임무 면제를 요청할 수 있지만, 비행 임무 면제를 요청하는 사람은 미친 것이 아닙니다.” – Joseph Heller의 소설 “Catch 22”를 원작으로 합니다.

혁신 뉴스레터
혁신에 관한 가장 중요한 뉴스를 놓치지 마세요. 이메일로 받으려면 가입하세요.

ChatGpt 또는 기타 유사한 프로젝트를 생성할 수 있는 크기의 데이터 수집은 오늘날 디지털 활동을 통해 가장 큰 정보 저장소를 손에 넣을 수 있는 대규모 다국적 기업의 특권입니다. 세계: 웹.

수년 동안 웹을 스캔하고 엄청난 양의 정보를 추정하는 검색 엔진을 관리해 온 Google과 Microsoft는 위에서 설명한 것과 같은 많은 양의 정보를 소화할 수 있는 유일한 AI 모델인 LLM을 만들려는 첫 번째 후보입니다.

Google이나 Microsoft가 신경망 훈련의 자료로 사용하기 전에 데이터에서 개인 정보를 모호하게 할 수 있다는 것은 믿기 어렵습니다. 언어 시스템의 경우 정보를 익명화하면 말뭉치 내에서 개인 데이터를 식별하고 이를 가짜 데이터로 대체합니다. 모델을 훈련하려는 몇 테라바이트 크기의 코퍼스를 상상하고, 포함된 데이터를 수동으로 익명화하는 데 얼마나 많은 작업이 필요한지 상상해 봅시다. 이는 사실상 불가능합니다. 그러나 알고리즘을 사용하여 자동으로 수행하려는 경우 이 작업을 수행할 수 있는 유일한 시스템은 똑같이 크고 정교한 또 다른 모델일 것입니다.

우리는 고전적인 Catch-22 문제에 직면해 있습니다. “익명화된 데이터로 LLM을 교육하려면 이를 익명화할 수 있는 LLM이 필요하지만 데이터를 익명화할 수 있는 LLM이 있는 경우 해당 교육은 익명화된 데이터로 수행되지 않았습니다. .”

GDPR은 더 이상 사용되지 않습니다

이러한 주제에 비추어 사람들의 개인정보를 존중하기 위한 규칙을 (거의) 전 세계적으로 규정하는 GDPR은 이미 오래된 뉴스이며 훈련 세트와 관련된 개인 데이터의 보호는 고려되지 않습니다.

GDPR에서 일반적인 상관관계 및 연관성을 학습할 목적으로 개인 데이터를 처리하는 것은 제22조에 의해 부분적으로만 규제됩니다. “데이터 주체는 프로파일링을 포함하여 자동화된 처리에만 기반한 결정을 받지 않을 권리가 있습니다. 그에게 법적 영향을 미치거나 유사하고 중요한 방식으로 영향을 미치는 경우."

이 문서에서는 데이터 컨트롤러가 대상에 직접적인 법적 영향을 미치는 완전히 자동화된 의사 결정 프로세스의 일부로 대상의 개인 데이터를 사용하는 것을 금지하는 방법을 소개합니다. 그러나 자동화된 의사결정 프로세스에 쉽게 동화될 수 있는 신경망은 일단 훈련되면 사람들의 삶에 영향을 미칠 수 있는 자동 결정을 내릴 수 있는 능력을 습득합니다. 그러나 이러한 결정이 항상 "논리적"인 것은 아닙니다. 실제로 훈련 중에 각 신경망은 정보를 서로 연관시키는 방법을 학습하며, 종종 절대적으로 비선형적인 방식으로 정보를 서로 연관시킵니다. 그리고 "논리"가 없다고 해서 사람들의 사생활을 보호하기 위해 방패를 들고 싶어하는 입법자의 일이 더 쉬워지는 것은 아닙니다.

예를 들어 소유자가 명시적으로 승인하지 않는 한 민감한 데이터의 사용을 금지하는 등 극도로 제한적인 정책을 적용하기로 선택한 경우 신경망의 합법적인 사용은 불가능합니다. 그리고 신경망 기술을 포기하는 것은 큰 손실이 될 것입니다. 특정 질병의 영향을 부분적으로 받은 인구 집단의 임상 데이터로 훈련된 분석 모델을 생각해 보십시오. 이러한 모델은 데이터에 존재하는 요소와 질병 자체 사이의 상관관계, 즉 임상의의 눈에는 완전히 비논리적으로 보일 수 있는 예상치 못한 상관관계를 식별함으로써 예방 정책을 개선하는 데 도움이 됩니다.

요구사항 관리

수년간 무분별하게 수집을 허가한 뒤 개인의 사생활을 존중한다는 문제를 제기하는 것은 아무리 말해도 위선적이다. 복잡한 GDPR 자체는 조항의 모호함과 이해의 어려움을 이용하여 개인 데이터 처리 권한을 획득할 수 있는 수많은 조작에 대한 책임이 있습니다.

우리에게는 개인 정보의 의식적인 사용에 대한 적용 가능성과 실제 교육을 허용하는 법률의 단순화가 확실히 필요합니다.

내 제안은 유료 서비스라 할지라도 회사가 서비스에 등록한 사용자의 개인 데이터를 알 수 없도록 하는 것입니다. 개인이 온라인 시스템을 사용할 때 가짜 개인 데이터의 사용은 자동으로 발생해야 합니다. 실제 데이터의 사용은 구매 프로세스에만 국한되어 서비스 데이터베이스와 항상 완전히 분리되어야 합니다.

이 프로필에 이름이나 얼굴을 연결하지 않고 대상의 취향과 선호도를 아는 것은 업스트림에서 수행되는 익명화의 한 형태로 기능하여 인공 지능과 같은 자동화 시스템 내에서 데이터 수집 및 사용을 자동으로 허용합니다.

아르티콜로 디 Gianfranco Fedele

태그 : 채팅저작권GDPRgianfranco fedele구글인공 지능large language modelsLLM마이크로 소프트루프에 인간이 없다개인 정보 보호인공 신경망

26년 2023월 12일 오후 56시

다음의 Neuralink는 뇌 이식에 대한 최초의 인간 임상 실험을 위한 모집을 시작합니다. »

Precedente « 기발한 아이디어: HUDWAY DRIVE, 도로에 집중할 수 있게 해주는 혁신

최근 기사

품목

미래가 여기에 있습니다: 해운 산업이 글로벌 경제를 어떻게 혁신하고 있습니까?

해군 부문은 150억 시장을 향해 항해해온 진정한 글로벌 경제강국입니다.

1 월 2024

품목

출판사와 OpenAI, 인공지능이 처리하는 정보의 흐름을 규제하기 위한 계약 체결

지난 월요일, Financial Times는 OpenAI와의 계약을 발표했습니다. FT는 세계적 수준의 저널리즘에 라이선스를 부여합니다…

4월 30 2024

품목

온라인 결제: 스트리밍 서비스를 통해 영원히 결제하는 방법은 다음과 같습니다.

수백만 명의 사람들이 스트리밍 서비스 비용을 지불하고 월간 구독료를 지불합니다. 당신은…

4월 29 2024

Comunicati Stampa

Veeam은 보호부터 대응, 복구까지 랜섬웨어에 대한 가장 포괄적인 지원을 제공합니다.

Coveware by Veeam은 계속해서 사이버 강탈 사건 대응 서비스를 제공할 것입니다. Coveware는 법의학 및 교정 기능을 제공할 것입니다…

4월 23 2024

개인 정보 보호 루프: 개인 정보 보호와 저작권의 미로에 있는 인공 지능

이 글은 개인 정보 보호와 저작권, 그리고 인공 지능 사이의 미묘한 관계를 다루는 두 편의 기사 중 첫 번째입니다.

기술 발전이 너무 빨라서 첫 번째 적용부터 모든 규제 조정이 더 이상 쓸모 없게 되는 문제가 있는 관계입니다.

은둔?

루프

데이터 지배력

GDPR은 더 이상 사용되지 않습니다

요구사항 관리

최근 기사

미래가 여기에 있습니다: 해운 산업이 글로벌 경제를 어떻게 혁신하고 있습니까?

출판사와 OpenAI, 인공지능이 처리하는 정보의 흐름을 규제하기 위한 계약 체결

온라인 결제: 스트리밍 서비스를 통해 영원히 결제하는 방법은 다음과 같습니다.

Veeam은 보호부터 대응, 복구까지 랜섬웨어에 대한 가장 포괄적인 지원을 제공합니다.

최근 기사

꼬리표