연세대학교 경영대학

사이드메뉴

컨텐츠 내용 시작

YSB Now
제31회 4차 산업혁명 런치포럼…빅데이터의 개인정보 문제점과 해결책
등록일: 2019-10-25  |  조회수: 66

연세대학교 경영대학 부속 경영연구소가 주관하는 제31회 4차 산업혁명 런치포럼이 지난 10월 22일 경영관 403호에서 개최되었다. 이번 포럼에서는 ‘빅데이터와 개인정보: 문제점 및 해결책’을 주제로 서울대학교 통계학과 김용대 교수가 발표했다. 김 교수는 개인정보보호 문제와 관련하여 고려되고 있는 기술적인 방법들을 소개하고 그와 관련된 문제들을 해결하기 위해서 어떤 노력이 이루어지고 있는지에 초점을 두고 강연을 진행했다.

 

 

 

빅데이터는 인간을 이해하는 기술로 다양한 종류의 대규모 데이터에서 저렴한 비용으로 가치를 추출하고 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처를 말한다. 이러한 빅데이터는 소비자의 니즈를 찾기 위해서는 필요하지만 동시에 개인정보보호의 문제를 야기시킨다. 개인정보보호는 헌법적 기본권, 범죄, 증오, 차별로부터 개인을 보호하기 위해서 필요하지만 빅데이터 이용과 긴장관계를 가지고 있다. 예를 들면, 현재 데이터를 사용하는 우리나라 기업들은 비 식별 정보 처리 방법 가이드라인이 있음에도 불구하고 개인정보 문제가 발생하면 기업이 모든 것을 책임지도록 법이 만들어졌기 때문에 데이터 이용에 어려움이 많다.

 

이렇게 법률적으로 개인정보를 보호하는 것에는 한계가 많기 때문에 데이터를 보호하면서 이용하는 방법에 대한 기술적인 연구가 진행되고 있다. 첫째, 개인 고유의 정보를 식별하지 못하도록 데이터를 가공 및 변형하여 개인정보를 보호하는 방법이 있다. 이러한 방법에는 가명처리, 데이터 범주화, 데이터 삭제, 데이터 마스킹 등을 이용하는 익명화 기반 비식별 조치와 민감한 원본 자료를 감추기 위해, 원본 데이터에 교란을 주어 식별이 힘들도록 하는 기법인 교란 기반 비식별 조치가 있다. 하지만 익명화 기반 비식별 조치의 경우에는 여러 데이터를 조합하면 개인을 식별하는 것이 가능해질 수 있는 단점이 있고, 교란 기반 비식별 조치의 경우에는 기술적으로 어렵기 때문에 아직 많은 사용이 되지 않고 있다.

 

둘째, 개인의 데이터를 다른 사람의 수많은 데이터와 조합해, 개인정보를 침해하지 않으면서도 통계를 얻을 수 있게 하는 기술인 차등정보보호가 있다. 차등정보보호는 한 개체가 자료를 추가하거나 제거할 때 증가하는 위험을 측정하고 제어하여 데이터에서 하나의 개체가 제외되어도 자료로부터 얻은 정보가 유의하게 변하지 않도록 해준다.

 

셋째, 암호화를 이용한 개인정보 보호가 있다. 특히, 암호화된 데이터를 복호화 없이도 연산할 수 있는 동형 암호에 대한 지속적인 연구가 이루어지고 있다. 동형 암호는 비밀 키를 노출하지 않고도 데이터를 활용할 수 있고, 결과값도 암호화되어 있어 보안리스크가 매우 낮아지지만 암호화된 데이터의 크기가 매우 커지게 되고, 암복화 속도가 매우 저하된다는 단점이 있기 때문에 많은 연구가 진행 중이다.

 

마지막으로 연합 학습(federated learning)이 있다. 구글에서는 데이터 이동없이 사용자 기기 내에서 AI학습이 이뤄지는 새로운 머신 러닝 방법인 연합 학습에 많은 연구 노력을 기울이고 있다. 기존의 인공지능을 만드는 방식이 데이터를 모두 한곳에 모아 학습시키는 것이었다면, 연합 학습은 데이터를 서버로 모으는 것이 아니라 모델을 각 데이터가 저장된 곳으로 보내 활용하게 하고 모델이 배운 업데이트된 내용만 다시 서버로 보내 기존 모델을 업그레이드하는 방식으로 학습이 진행된다. 따라서 데이터는 전혀 이동하지 않으며, 서버는 각 저장소의 데이터를 보지 못하기 때문에 개인정보보호에 유용하다. 하지만 수억 개의 모바일 기기와 통신에 많은 비용이 발생하며 많은 전원이 필요하다는 점 등은 앞으로 해결해야 하는 부분이다.

 

 

데이터를 이용하는 것과 보호하는 것은 개인정보보호 기술수준에 기반한다. 법률이나 기술 그 어떤 것도 정보보호에 완벽할 수 없기 때문에 개인정보 보호는 법률과 기술이 서로 보완하면서 발전하여야 한다. 또한 보호, 이용, 법률, 기술 전체를 조망하는 연구가 더 필요할 것으로 보인다.

컨텐츠 내용 끝

페이지 로딩 이미지 표시

페이지 로딩중 ...

페이지 로딩중 ...

x
x