<기획특집 ②> 검색 알고리즘과 권리침해 : 연관검색어-자동완성검색어 서비스의 명과 암
1. 들어가는 글
인터넷 시대가 되면서 ‘검색’이 중요한 정보 습득 수단이 됐다. 검색으로 출발했던 구글은 이젠 세계 최고 기업 반열에 올라섰다. “검색되지 않는 정보는 존재하지 않는 정보다”는 말이 유행할 정도로 검색의 영향은 절대적이다. 그러다보니 최근엔 검색 결과를 표현의 자유로 볼 수 있을지 여부를 놓고도 공방이 벌어지고 있다. 검색업체들이 어떤 결과를 표출하느냐에 따라 여론에 미치는 영향이 엄청나기 때문이다.
검색결과를 둘러싼 공방은 미국에서도 적지 않게 제기됐다. 특히 수정헌법 1조에 규정된 ‘표현의 자유’에 해당되느냐는 부분을 놓고 열띤 공방을 벌이고 있다. 일부 학자들은 표현의 자유이기 때문에 강력한 보호를 받아야 한다고 주장하는 반면, ‘단순 전달’에 불과하기 때문에 수정헌법 1조의 적용을 받기 힘들다는 반론을 펴는 학자도 적지 않다.1 따라서 법적인 공방은 여전히 진행 중인 이슈다.
이런 법적 공방에도 불구하고 강력한 검색이 갖는 부작용도 만만치 않다. 2016년 11월에 끝난 미국 대통령 선거 당시 구글 검색은 페이스북과 함께 ‘가짜 뉴스(fake news)’ 확산 도구 역할을 했다는 비판에 휘말렸다. 특히 구글은 검색 상위권에 가짜뉴스를 표출하면서 잘못된 여론을 확산했다는 지적을 받았다.
이처럼 검색 결과는 때론 사생활 침해 같은 부작용을 초래할 가능성도 배제할 수 없다. 이 글에선 특히 요즘 논란이 되고 있는 연관검색과 자동완성검색어 서비스에 대해 다룬다. 연관검색은 주로 국내 포털들이 제공하는 서비스이며, 자동완성검색어는 구글 검색에서 특히 논란이 되고 있다.
2. 연관검색어-자동완성검색어의 빛과 그늘
가. 맥락적 정보 제공
연관검색과 자동완성검색 서비스는 장점도 적지 않다. 특히 검색한 사안들과 관련이 있는 검색어를 함께 제시해주는 연관검색 서비스는 풍부한 정보습득이란 관점에서 크게 도움이 된다.
자동완성검색 서비스도 마찬가지다. 경험상 구글의 자동완성검색어는 크게 두 가지 장점이 있는 것으로 판단된다. 가장 큰 장점은 ‘자동완성’ 덕분에 검색어 입력이 한결 수월하다는 점이다. 또 다른 장점은 ‘맥락적 정보 습득’이 가능하다는 점이다. 어떤 검색어를 입력할 경우 가장 많이 검색된 관련 정보들을 보여줄 경우 서비스 이용자들이 실제로 정보를 찾는 데 큰 도움이 될 뿐 아니라 정보의 맥락을 잘 파악할 수 있다.
해당 업체 입장에서도 연관검색어나 자동완성검색어 서비스는 유용한 측면이 많다. 무엇보다 자사 서비스를 이용하는 유인이 될 수가 있기 때문이다. 게다가 이런 서비스는 아마존 같은 전자상거래 업체들에게 흔히 접할 수 있는 일종의 추천 서비스로 볼 여지도 있다.
따라서 연관검색어나 자동완성검색어 같은 서비스를 일방적으로 매도할 수는 없다. 이용자 편의성 제고나 자사 서비스 활성화 측면에서 도움이 되는 부분도 분명히 있기 때문이다. 그럼에도 불구하고 두 서비스에 대한 논란이 끊이지 않는 건 부작용이 만만치 않기 때문이다. 지나치게 친절한 ‘과잉맥락화’ 때문에 사생활 침해나 명예훼손 사례가 빈발하고 있다.
나. 검색과 과잉맥락화의 부작용
몇 년 전 실제 경험한 일이다. 편집국으로 전화가 한 통 걸려 왔다. 모 업체 홍보 담당자라면서 몇 년 전 기사에 게재된 대표 사진을 좀 삭제해줄 수 있냐고 부탁했다. 그 회사 대표가 우수 기업인으로 선정돼 상을 받은 기사였다. 몇 년 지난 기사이기도 했거니와, 사진이 빠지면 기사 자체가 성립이 안 됐다. 그래서 “좋은 얘기인데 왜 그러시냐?”고 질문했다. 그랬더니 “그냥 본인이 사진을 빼주길 원한다”는 말만 되풀이했다.
조금 이상해서 포털에서 해당 기사를 검색해봤다. 그랬더니 바로 그 분이 우수 기업인 상을 받은 지 1년 뒤에 비리 혐의로 구설수에 오른 기사가 함께 검색됐다. 그런데 두 개 기사가 나란히 검색되면서 본의 아니게 그 분의 얼굴이 공개됐다. 왜 그토록 예전 기사에서 사진을 빼길 원했는지 짐작할 수 있었다.
위 사례는 물론 연관검색어로 생긴 문제는 아니다. 시간적으로 거리가 있는 두 사건을 동시에 찾아주면서 본의 아니게 ‘맥락화’하면서 생긴 문제였다. 이런 부작용을 ‘과잉맥락화 오류’라고 지칭하면 어떨까?
연관검색어로 주제를 좁힐 경우엔 이런 부작용이 더 심각하게 발생한다. 역시 실제 사례를 통해 그 부작용을 찾아볼 수 있다. 몇 년 전 A가수가 여자 문제로 구설수에 오르면서 그 가수의 아버지이자 1970년대에 데뷔했던 B가수의 과거가 새롭게 이슈가 된 적 있다.
사정은 이랬다. A가수가 사귀던 여성과 헤어지면서 소송 공방까지 이어졌다. 이 사건이 널리 보도되면서 포털에선 아버지인 B가수 이름이 연관검색어로 표출됐다. 그러면서 자연스럽게 B가수가 신인시절이던 1970년대 간통사건에 휘말린 사실이 새롭게 뉴스거리로 떠올랐다. B가수 입장에선 포털의 과잉맥락화 때문에 ‘잊힐 권리’ 조차 제대로 보장받지 못하면서 아픈 과거가 다시 조명되는 피해를 입은 셈이다.
이처럼 연관검색어를 중심으로 한 과잉맥락화는 명예훼손을 비롯한 다양한 부작용을 초래할 수 있다. 경우에 따라선 가수 B 사례처럼 시간 속에 묻혔던 사건이 만천하에 공개되면서 2차 피해로 이어질 수도 있다. 서비스를 제공하는 곳에선 그냥 검색한대로 표출해줬다고 항변할 수도 있겠지만, 당하는 입장에선 이런 과잉맥락화는 편집행위나 마찬가지로 받아들여질 수 있다. 새로운 맥락을 부여하면서 의도하지 않았던 의미를 덧붙이기 때문이다.
다. 오만과 편견, 그리고 자동완성검색어 서비스
구글은 최근 자동완성검색어(search autocomplete) 중 일부를 수정했다. 구글에 ‘유태인은(are Jews)’이라고 입력할 때 뜨는 자동완성검색어 중 ‘사악하다(evil)’를 제거하기로 했다고 밝혔다.2 구글은 자동완성검색어 서비스는 웹 전체에서 유통되는 다양한 콘텐츠를 종합한 결과라는 입장이다. 이번 사례는 그 중 명예훼손을 비롯한 다양한 문제를 야기할 가능성이 있다는 판단에 따라 긴급 수정한 것이다.
하지만 전문가들은 자동완성검색어 서비스 문제가 생각보다는 심각하다고 주장하고 있다. 이번에 구글이 알고리즘 수정을 하면서 관심을 끈 ‘유태인은(are Jews)’이란 검색어 역시도 검색 상위권에 네오나치 사이트를 비롯한 문제 많은 콘텐츠들이 상당 부분 노출되고 있다는 주장도 만만치 않다. 구글은 이용 순위에 따라 링크해준다고 강변하고 있지만, 실제론 여론 왜곡 가능성도 적지 않아 보이기 때문이다.
지식을 습득하는 절대 경로나 다름없는 검색이 이런 편향된 추천을 할 경우 어떤 문제가 생길까? 서치엔진랜드(SearchEngineLand.com) 창업자로 유명한 대니 설리번이 이 문제에 대해 잘 지적하고 있다. 가디언에 따르면 대니 설리번은 유태인 관련 자동완성검색어 결과에 대해 “도서관에서 사서에게 유태인에 대한 책을 추천해달라고 했는데, 온통 미움과 증오와 관련된 책을 추천해주는 격이다”고 꼬집었다.3
웹상에서 많은 사람들이 주고받는 방대한 정보량을 토대로 자동완성검색어를 선정한다는 구글의 설명과 달리 이 서비스는 자칫하면 잘못된 편견을 심어줄 가능성이 적지 않다는 비판이 힘을 얻고 있다. ‘유태인’ 관련 자동완성검색어 사례는 이런 모순이 적나라하게 드러난 것으로 볼 수 있다.
3. 나오는 글
아날로그 시대에는 정보를 가진 자가 세상을 지배했다. 하지만 인터넷과 디지털 혁명이 본격화되면서 권력의 추가 ‘정보를 찾아주는 자’에게 넘어갔다. 검색 서비스가 인터넷 뿐 아니라 모바일 시대의 필수 경로로 떠오른 것도 이런 배경과 무관하지 않다. 망중립성에 이어 검색중립성이 관심을 모은 것 역시 마찬가지 배경 때문이다.
그런 배경에서 연관검색어와 자동완성검색어 서비스를 살펴봤다. 앞에서 서술한 것처럼 두 서비스는 과잉맥락화로 인한 부작용이 만만치 않은 것으로 판단된다. 그 과정에서 명예훼손이나 사생활 침해, 혹은 ‘잊힐 권리’ 침해 같은 새로운 문제가 제기되고 있다. 과연 이런 문제를 어떤 관점에서 봐야 할까? 그리고 이 문제를 어떻게 풀어야 할까?
개인적으론 연관검색어나 자동완성검색어 같은 서비스는 편집 행위에 버금가는 영향을 미친다고 생각하는 편이다. 게다가 연관검색어 서비스 같은 경우는 최근 조금씩 관심이 커지고 있는 ‘잊힐 권리’와 정면 배치되는 측면도 있다. 앞에서 소개한 가수 B씨 사례가 대표적이다. 예전 같으면 기억 속에서 사라졌을 사건이 ‘연관검색어’ 서비스 때문에 새롭게 조명되면서 2차 피해를 입었기 때문이다.
그렇다고 해서 검색 서비스업체들에게 언론기관에 준하는 책임을 물리는 것은 과잉 규제 우려가 있어 보인다. 따라서 이 문제는 일단 서비스 제공업체 차원의 자율적인 해법 마련이 우선 되어야 할 것이다. 이와 함께 이런 문제가 제기될 때마다 단골 논란거리인 검색 알고리즘 공개 문제에 대해서도 진지하게 생각할 필요가 있어 보인다. 알고리즘을 구성하는 기본적인 원칙을 공개하는 한편 알고리즘 구성 요소의 타당성과 공정성에 대해서도 사회적인 검토를 받는 방법을 고려할 필요가 있다는 지적4에 대해서도 진지하게 고민해볼 때가 된 것 같다.
———————————————————————————————-
<참고문헌>
박아란-오세욱, 검색 알고리즘과 인격권 침해, 『미디어와 인격권 침해』, 제2권 1호. 3~62.
Cadwalladr, C. O2016). Google, democracy and the truth about internet search, Guardian, 2016. 12. 4
Gibbs, S. (2016). Google alters search autocomplete to remove ‘are Jews evil’ suggestion, Guardian, 2016. 12. 6
<각주>
- 박아란-오세욱, 검색 알고리즘과 인격권 침해, 『미디어와 인격권 침해』, 제2권 1호. 3~62. [본문으로]
- available: https://www.theguardian.com/technology/2016/dec/05/google-alters-search-autocomplete-remove-are-jews-evil-suggestion [본문으로]
- available: https://www.theguardian.com/technology/2016/dec/04/google-democracy-truth-internet-search-facebook [본문으로]
- 박아란-오세욱, 검색 알고리즘과 인격권 침해, 『미디어와 인격권 침해』, 제2권 1호. 3~62. [본문으로]