디지털 시민역량으로서 데이터 리터리시

1. 데이터화 사회(Datafied Society)

우리는 일상 속에 항상 데이터와 함께 기거하고 있으며 노출되어 있다. 기상과 동시에 핸드폰을 만지작거리며 SNS를 통해 밤새 새로운 소식이 무엇이었는지 동태를 살피다가 더 궁금한 무언가를 살펴보기 위해 열어본 검색창. 그것이 흘러나온 음악이 궁금해서이든, 신작으로 발표한 소설을 구매하기 위해서이던. 링크를 타고 들어간 창에는 어김없이 나의 데이터 수집 동의를 구하는 쿠키(cookies) 배너를 만나게 된다. 쿠키는 “웹 서버가 웹 브라우저에게 보내어 저장했다가 서버의 부가적인 요청이 있을 때 다시 서버로 보내주는 문자열 정보”(한국정보통신기술협회, n.d.)를 말한다. 쿠키의 익명 수집 및 보고를 통해 나(방문자)와 웹사이트의 상호작용을 파악하고, 이를 통계로 활용해 데이터 분석이나 마케팅에 활용된다.

검색 기록, 신용카드 이용처럼 일상 속에서 자신이 직접 생성하거나 생성에 동의한 데이터 외에도, 기계에 의해 모니터링된 데이터, 인터넷, 스마트폰, 자동화 기계를 사용하면서 남긴 흔적 등에 의해 추정되거나 결정된 데이터 등 개인의 일상이 광범위하게 기록되고 그렇게 수집된 데이터로부터 개인의 생각을 추정하고 행동을 예측할 수 있게 되었다. 마이어-쉰베르거는 오늘날 인간뿐 아니라 컴퓨터에 의해 분류되고 분석될 수 있도록 사회적 존재나 현상이 디지털화되고 계량화되는 현상을 데이터화(datafication)라고 일컬었다. 그리고 개인의 디지털 상호작용까지 수집, 분석하고 기록으로 변환해 저장, 활용하는 양상이 굳어진 사회를 “데이터화 사회(datafied society)”라고 정의하였다(Mayer-Schoenberger & Cukier, 2013, 78).

책 속의 텍스트들이 컴퓨터가 읽고 처리할 수 있는 데이터가 되고, 사람이나 사물의 위치가 컴퓨터가 처리하는 데이터가 되며, 수많은 SNS를 통해 수집된 인간의 상호작용이 컴퓨터로 분석되는 데이터가 된다. 네트워크 환경이 크게 확장되고 스마트폰과 컴퓨터 시장이 확대되면서 데이터가 엄청난 규모로 증가하게 되었다. 데이터들은 의학이나 과학 분야에서 분석을 통해 질병을 진단하고 치료하는 등 유용하게 사용되기도 하지만, 다른 사람의 사회적 행동을 데이터로 정량화하여 예측 분석이 가능한 데이터화된 사회의 문제점을 이야기하지 않을 수 없다.

2. 데이터에 담긴 관점과 편향

데이터 편향성 문제는 차별과 혐오 등 다양한 사회 문제를 일으킬 수 있다. 우리가 익히 알고 있듯이, AI 데이터 편향성 문제는 AI가 학습하는 데이터가 지나치게 한쪽으로 편중되거나, 정보가 한정적일 때 발생하게 된다. 데이터 편향성 문제는 사회적 편견이나 혐오 문제와 직결되며, 편향된 데이터는 할루시네이션(hallucination)문제와도 연결된다. 다양한 데이터 속에서 연관성 및 관계성을 파악해 새로운 데이터를 추출하는 AI 특성상, 편향된 데이터 안에서는 한정된 답변밖에 할 수 없는 것이다. 기술적으로 편향성 문제를 완화하기 위해, 데이터 수집·전처리 과정에서 AI를 학습시킬 균일하고 질 높은 데이터를 확보하는 다양한 방법을 모색하고 있다.

그러나 현실에서 개인적, 사회적, 문화적, 정치적 편향과 편견이 내재하여 있듯이 우리 사회를 반영하는 데이터에서 편견을 완전히 배제하기는 어렵다. 데이터를 수집하고 구성하며 해석하는 일련의 과정에서 다양한 관점이 반영될 수 있다. 데이터는 수집될 때부터 특정 목적을 가지고 수집하는 자의 의도와 편향을 포함한다. 수집되지 않은 데이터는 남겨지고 배제되고, 수집 이후에도 데이터를 가공, 분석하는 사람의 다양한 관점이 개입되고 왜곡될 수 있다. 데이터를 취합, 재구조하여 데이터를 새롭게 구성하는 과정이나 이를 해석하는 과정에서도 관점이 반영되어 편파적이거나 왜곡될 가능성이 있다. 그러나 우리는 이처럼 데이터에 여러 단계를 걸쳐 다양한 관점이 반영될 수 있음을 망각하고, 접한 데이터를 맹신하고 만다.

3. 디지털 시민역량으로서 데이터 리터리시

데이터 리터러시는 정보전문가 직무의 필수적이고 핵심적인 역량으로 대두되면서, 데이터의 식별부터 접근, 정제, 분석, 관리, 보존까지 데이터 생애주기 동안 데이터 활용에 필요한 기술과 역량 개발에 힘써왔다. 지금까지 데이터 리터리시는 기술적 측면에만 중점을 두고 있어, 데이터의 신뢰성 및 공정성 등 윤리, 문화에 대한 연구와 교육은 여전히 미진한 실정이다. 데이터화 사회에서 우리는 실제로 어떠한 가치를 가지고 데이터를 다루고 이해, 해석하여야 하는지 시민의 기본적 역량 함양으로 데이터를 읽고 해석할 수 있는 데이터 리터리시를 재고할 필요가 있다. 최근 데이터 중심의 정보환경에서 무엇보다 정보를 생산하고 분배, 공유하려는 협력적 주체로서, 데이터에 대한 비판적 사고를 키우는 리터리시 강화가 요구되고 있다. 이는 데이터와 살아가는 일상에서 쏟아지는 방대한 양의 데이터를 비판적으로 선별하고, 수집하며 자신의 필요에 따라 가공하며 데이터를 활용한 의사소통, 데이터 윤리까지 포괄한다.

데이터 리터리시를 기반으로 한 시민적 자질은 포용성과 형평성, 데이터 주권, 참여 의식으로 설명할 수 있다. 포용성과 형평성은 데이터에 대한 각자의 다른 요구사항을 충족함으로써 기회에 대한 공정한 접근이 가능함을 뜻한다. 21세기 원유로 비유되는 데이터 시대에서 데이터를 많이 소유하거나 데이터를 잘 분석, 활용하는 사람들이 그렇지 않은 사람들에 비해 더 많은 권력을 차지할 가능성이 커졌다. 데이터의 범위와 유형 또한 광범위해지면서 데이터를 수집, 생산, 가공, 분배하는 과정에서 그 불평등과 격차가 더욱 커질 수밖에 없다. 이러한 데이터 격차를 해결할 수 있는 시민의 데이터 리터리시 역량이 더욱 중요해질 수밖에 없다.

데이터 주권(data sovereignty)은 정보 주체의 주도적인 통제권 및 선택권을 보장하고, 개인정보 자기 결정권을 강화하는 것을 의미한다. 개인이 정보 권리의 주체로서 자신의 데이터가 어떻게 활용될 것인지 결정할 수 있어야 한다. 이는 데이터 리터러시 관점에서 참여 역량과도 밀접하게 관련된다. 데이터 리터러시는 시민들이 디지털 시민의 권익을 보호하고 정부의 책임과 투명성을 높이게 한다. 공공데이터의 접근성이 높아졌다고 해서 본질적으로 사회적 영향이 생기는 것은 아니다. 오히려 시민들은 정부의 책임을 묻고 데이터 개방 시대에 소외된 커뮤니티에 확산하기 위해서는 데이터를 잘 이해, 해석할 수 있어야 한다. 데이터 리터러시는 시민들이 사회 전체에 영향을 미치는 의사 결정 과정에 적극적으로 참여하고 투명성과 부패 방지를 위한 시민 참여를 촉진한다.

데이터의 개방성과 함께 그 데이터의 신뢰성과 공정성의 확보가 무엇보다 중요해졌다. 시민 누구나 적절한 시기에 공평한 방법으로 데이터에 접근하고 활용할 수 있는 데이터 민주주의(data democracy) 개념이 부각되며 데이터 리터리시는 시민의 핵심역량으로 여겨지고 있다(박희진, 김지성, 2023). 데이터 리터리시와 교육의 중요성을 인식하고 있으나 아직까지 그 교육 구성과 내용에 대한 심도 깊은 논의는 부족하다. 다양한 민간 기관과 교육기관에서 이루어지고 있는 데이터 리터리시 교육에 대해 그 방향성과 체계적인 시스템 마련에 대한 논의가 더욱 활발해지기를 기대한다.

[참고문헌]

-박희진, 김지성(2023). 데이터 민주주의(data democracy)에 대한 규범적 접근. 『한국비블리아학회지』, 34(2), 137 – 158.

-한국정보통신기술협회(TTA) (n.d.). 정보통신용어사전. Available: http://terms.tta.or.kr

-Abraham, R., Schneider, J., & Brocke, J. (2019). Data governance: a conceptual framework, structured review, and research agenda. 『International Journal of Information Management』, 49, 424-438.

-Data-Pop Alliance(2015). 『Beyond Data Literacy: Reinventing Community Engagement and Empowerment in the Age of Data』. Available: http://datapopalliance.org/wp-content/uploads/2015/11/Beyond-Data-Literacy-2015.pdf

-Mayer-Schönberger, V. & Cukier, K. (2013). 『Big data: A revolution that will transform how we live, work, and think』. Boston: Houghton Mifflin Harcourt.

저자 : 박희진

한성대학교 크리에이티브 인문학부 교수