[이영환의 코리아 프리미엄 프로젝트]

[오피니언타임스=이영환] 요즘들어 ‘빅(big)’이라는 단어와 함께 사용되는 용어들을 종종 접하게 된다. 빅히스토리(Big History), 빅퀘스천(Big Question), 빅픽처(Big Picture), 빅씽크(Big Think) 그리고 빅데이터(Big Data) 등이다. 이들 용어는 종전에 비해 뭔가 큰 스케일을 가지고 문제에 접근할 때 주로 쓰인다. 장기적이고 거시적인 관점에서 현안 문제에 대해 고뇌하는 사람들이 만들어낸 용어라고 볼 수 있다.

이 가운데 4차 산업혁명 초입에 있는 현 시점에서 일반인들에게 가장 어필하는 것은 빅데이터이다. 빅데이터는 이미 우리의 일상생활에서 무시할 수 없는 대세로 자리매김했을 뿐만 아니라 사물인터넷(IoT) 및 인공지능(AI)과 결합해 앞으로 영향력이 더욱 커질 것이다. 글로벌 경제를 선도하는 초국적기업들은 진작부터 빅데이터와 이를 분석하는 인공지능 알고리즘을 활용해 비즈니스 영역을 확대하고 시장 지배력을 강화하고 있다. 애플, 구글, 마이크로소프트, 페이스북, 아마존은 시가총액 기준 세계 상위 5대 기업으로서 모두 빅데이터를 활용해 시장 지배력을 강화하고 있는 대표적인 기업들이다.

그런데 막상 빅데이터가 무엇을 의미하는지에 대해서는 제대로 알려지지 않은 것 같다. 무릇 우리가 처해있는 변화무쌍한 상황을 파악하려면 기초 개념에 대한 정확한 이해가 선행되어야 한다. 빅데이터는 단순히 많은 양의 데이터라는 차원을 넘어서 기존에 데이터로 취급되었던 정형 데이터(structured data)뿐만 아니라 과거에는 데이터로 취급되지 않았던 비정형 데이터(unstructured data)와 반정형 데이터(semi-structured data)를 모두 망라한 개념이다.

숫자로 되어 있어 연산가능하면 정형 데이터이며, 형태가 있으나 연산가능하지 않으면 반정형 데이터에 속한다. 비정형 데이터는 형태도 없고, 연산 가능하지도 않은 것으로 보통 텍스트, 영상, 음성 등의 형태로 나타난다. 이런 의미에서 데이터의 다양성 또한 빅데이터의 본질에 해당한다고 할 수 있다. 그렇기에 혹자는 빅데이터 대신 ‘스마트 데이터’라는 용어를 사용해야 한다고 말한다. 일리 있는 주장이다. 단순히 양적으로 크다는 것이 핵심이 아니기 때문이다.

필자는 데이터 과학자도 아니고 데이터 전문가도 아니다. 따라서 여기서는 빅데이터 분석과 관련된 수학적 알고리즘이나 데이터의 생성, 저장, 가공 등과 관련된 기술적인 문제에 대해서는 논의하지 않을 것이다. 오랫동안 정보의 경제적 분석에 관심을 가져온 사람으로서 빅데이터의 정보적 측면에 초점을 맞추고자 한다.

©픽사베이

빅데이터를 수집하고 분석하는 이유는 과거에는 데이터 부족으로 인해 파악할 수 없었던 일정한 패턴이나 규칙성을 발견한 후 이를 이용해 목적한 바를 달성하려는 것이다. 이때 정확한 정보는 결정적인 역할을 한다. 몇 년 전 작고한 유명한 물리학자 존 휠러(John A. Wheeler)는 우주의 기본 요소는 물질이나 에너지가 아니라 정보라는 견해를 밝히면서 “만물은 정보다(Everything is information)”라는 말을 남겼다. 빅데이터가 제공하는 정보가 우리의 삶을 지배하기 시작했고 모든 것이 빅데이터가 제공하는 정보를 바탕으로 해석되고 있다는 점을 감안할 때 이 말이 결코 과장이 아니라는 생각이 든다.

이런 관점에서 세상이 변하는 추세를 관찰하면서 특별히 두 가지 쟁점에 관심을 가질 필요가 있다는 생각이 든다. 하나는 경제적 측면에 관한 것으로서 효율성 및 공평성과 관련된 것이다. 다른 하나는 인간의 정체성과 자유의지에 관한 것이다.

먼저 빅데이터가 가져올 미래에 대한 전망은 대체로 낙관적이다. 빅데이터는 우리의 삶을 더욱 풍요롭게 하고 미래를 보다 정확하게 예측하는 데 기여함으로써 위험을 줄이고 자원의 낭비를 해결하는 데 기여할 것이라는 이유에서다. 이것은 대체로 빅데이터가 효율성을 높이는 데 기여한다는 논리에 근거를 두고 있다. 지금까지 확인된 바에 의하면 충분히 수긍이 간다. 그런데 빅데이터가 효율성에 초점을 맞출수록 공평성의 관점에서 여러 가지 문제가 제기될 수 있다는 주장이 간간히 제기되어왔지만 그다지 주목을 받지 못했다.

이와 관련해 필자가 최근에 읽었던 두 권의 책을 바탕으로 논의하고자 한다. 하나는 버나드 마(Benard Marr)의 『빅데이터: 4차 산업혁명의 언어』이고 다른 하나는 캐시 오닐(Cathy O’Neil)의 『대량살상 수학무기』이다. 버나드 마는 세계적으로 알려진 빅데이터 전문가이자 베스트셀러 작가로서 자신의 저서에서 45개의 다양한 기업과 비영리조직의 사례를 분석했다. 그는 크고 작은 여러 기업들이 빅데이터를 활용해 어떻게 비용을 절감하고 고객의 요구에 부응함으로써 시장의 확대하고 수익을 늘릴 수 있었는지 간단명료하게 설명했다.

소비자잉여와 생산자잉여를 늘림으로써 사회잉여를 증가시킨다는 경제원리에 비추어 볼 때 빅데이터는 사회 전반에서 효율성을 높이는 데 기여한다는 것은 분명하다. 사회잉여가 증가한다는 것은 곧 효율성이 향상된다는 객관적인 지표이기 때문이다. 그리고 이런 논리는 페이스북, 구글 및 우버나 에어비앤비 같은 인터넷 기반의 IT기업뿐만 아니라 월마트나 제너럴 일렉트릭과 같은 전통적인 대기업, 나아가 정육점이나 레스토랑 체인과 같은 소기업에도 적용된다. 뿐만 아니라 영국의 BBC와 같은 공영방송, 미국의 시저스와 같은 카지노호텔 및 미국 연방정부 등 크고 작은 다양한 조직들이 빅데이터를 이용해 최대한 효율을 달성하고 있다는 점을 지적했다. 한 마디로 버나드 마는 효율성의 관점에서 빅데이터의 ‘빛’에 초점을 맞추었다.

©픽사베이

한편 캐시 오닐은 하버드대학교에서 정수론으로 수학박사 학위를 받은 후 버너드 칼리지 수학과 교수로 재직하다가 현실 세계에 수학을 응용하는 데 매료되어 헤지펀드 디이쇼(D.E. Shaw)로 이직해 퀀트(Quant)로 활동했었다. 퀀트란 수학에 기반을 둔 금융공학을 이용해 파생상품을 설계하고 포트폴리오 전략을 실행하는 금융전문가를 지칭하는 용어다. 그러다가 오닐은 2008년 금융위기를 계기로 수학과 금융의 결탁이 초래한 파국에 환멸을 느껴 월스트리트를 떠난 후 지금은 IT업계에서 데이터 과학자로 활동하고 있다.

다양한 실무 경험을 바탕으로 오닐은 빅데이터 분석을 위한 수학적 알고리즘이 인공지능과 결합해 어떻게 여러 분야에서 파괴적인 영향을 미치고 있는지 여러 가지 사례를 통해 구체적으로 다루었다. 그렇기에 오닐은 ‘대량살상무기’를 패러디해 책 제목을 ‘대량살상 수학무기(Weapon of Math Destruction; WMD)’로 정한 것이다. WMD는 빅데이터 분석에 이용되는 수학적 알고리즘을 지칭한다. 이런 알고리즘이 없다면 빅데이터는 단지 잡다한 데이터의 뭉치에 불과하므로 빅데이터 분석의 핵심은 수학적 알고리즘이다.

오닐이 특히 강조한 점은 수학적 알고리즘이 대부분의 경우 공정하지 않다는 것이다. 알고리즘을 작성하는 과정에는 설계자의 주관적인 판단이 개입되는 경우가 상당수 있을 뿐만 아니라 현실과 모델의 차이로 인해 부정적인 피드백 루프(feedback loop)가 형성된다고 주장했다. 이런 이유로 빅데이터는 공정한 결과를 달성하기는커녕 불평등을 더욱 조장하게 된다는 것이다. 그래서 빅데이터에 대해 ‘대량살상 수학무기’라는 극단적인 표현을 사용한 것이다. 그러면서 오닐은 워싱턴 교육청이 빅데이터를 이용해 교사 평가 기법으로 개발한 ‘임팩트(IMPACT)’라는 프로그램이 초래한 황당한 결과를 대표적인 부정적인 사례로 언급한다.

그밖에도 오닐은 범죄예방을 위한 ‘재범위험성 모형’, 금융공학에 기초한 ‘포트폴리오 모형’, 온라인에서의 ‘약탈적 광고 모형’, 불공정을 조장하는 ‘인성적성검사 모형’, 종업원을 혹사시키는 ‘일정관리 모형’, 가난한 사람들을 더욱 궁지로 내모는 ‘신용평가점수 모형’ 등 실로 우리의 생활 전반에서 오로지 효율성만을 추구하는 각종 수학적 알고리즘들이 어떻게 대량살상 수학무기, 즉 WMD로 둔갑해 사회적 약자들을 궁지로 내몰고 있는지 상세하게 다루었다. 물론 오닐의 주장 가운데는 액면 그대로 받아들이기 어려운 부분도 있다. 그렇더라도 공정성이나 평등 같은 가치를 전제로 빅데이터 분석을 위한 알고리즘이 개발되지 않는 것만은 분명하다. 어떤 기업도 이런 가치를 전제로 빅데이터를 활용하지 않기 때문이다. 이런 의미에서 빅데이터의 ‘그림자’에 대해 제대로 알려주고 있는 오닐의 저서에 관심을 가질 필요가 있다.

©픽사베이

또한 빅데이터와 관련된 논의에서 빠뜨릴 수 없는 쟁점은 『사피엔스』로 우리에게도 널리 알려진 유발 하라리(Yuval Harari)가 『호모 데우스』에서 언급한 데이터주의(Dataism)의 급부상이다. 하라리가 이 용어를 처음 만들었는지는 불분명하지만 널리 알리는 데 결정적으로 기여한 것은 분명하다. 하라리는 데이터를 신(神)처럼 받드는 한편 인간 스스로 자유의지를 부정하고 빅데이터의 분석 결과를 맹종하게 되는 상황을 우려해 데이터주의를 언급했다. 예컨대 아마존이나 페이스북과 같이 우리의 일거수일투족에 대한 방대한 데이터를 축적한 기업들이 우리가 누구이고 무엇을 필요한지 우리 자신보다 더 많이 알고 있다면 우리는 자유의지를 포기하고 이들 기업의 지시에 따르게 될 가능성이 농후하다. 지금도 이런 현상이 벌어지고 있으며 앞으로 더 많은 데이터가 축적될 것이기에 이런 추세는 더욱 강화될 것이다.

이와 같이 인간이 내면에서 일어나는 욕망과 경험에 바탕을 두고 세상을 이해해온 인본주의 전통을 포기해야 한다면 도대체 인간은 어디서 의미를 찾을 것인가? 이에 대한 유일한 대안으로 등장한 것이 바로 정보이며 이를 처리하는 데이터주의, 즉 데이터 종교라는 것이 하라리의 주장이다. 인간은 데이터를 숭배하기 시작했다면서 하라리는 『호모 데우스』에서 다음과 같이 지적한다. “데이터주의에 의하면 우주는 데이터의 흐름으로 구성되어 있으며 어떤 현상이나 실체의 가치는 데이터 처리에 기여하는 바에 의해 결정된다는 것이다.” 이 말은 곧 데이터 처리라는 관점에서 인간보다 인공지능이 뛰어나다면 인간은 더 이상 가치가 없다는 것을 함축할 뿐만 아니라 무엇이든 데이터 축적에 기여할수록 더욱 가치가 있다는 의미를 담고 있다. 바야흐로 데이터 자체가 목적이 되고 이에 기여하지 못하는 인간은 쓸모없는 존재로 전락할 수 있다.

사물인터넷과 빅데이터, 그리고 이를 처리하는 인공지능의 발달은 데이터주의를 더욱 강화시킬 것이다. 그러면 이런 상황에서 인간의 역할은 무엇인가? 데이터주의를 신봉하는 사람들은 사물인터넷을 더욱 발달시켜 더욱 효율적으로 데이터를 처리하는 것이 목적이라고 주장할 것이다. 이런 상황에서 인간은 더 이상 자유로운 주체가 아니다. 마치 부족국가 시대에 외부에 존재하는 초월적인 절대자를 숭배했듯이 하라리가 말하는 기술적 인본주의 시대에 인간은 데이터를 숭배하는 상황에 처하게 될 것이다. 그리고 이럴 가능성은 점점 더 증가하고 있다. 이것이 자기 강화하는 시스템의 본질이다.

이와 같이 데이터주의는 인간을 기본적으로 하나의 알고리즘으로 해석하면서 기능적인 관점에서 이해한다. 데이터의 흐름에 기여하는 한 인간은 가치를 갖는다는 의미다. 인간의 모든 감정과 경험은 오로지 데이터 패턴으로 인식될 뿐이다. 따라서 데이터 처리라는 관점에서 인간보다 훨씬 더 우월한 능력을 갖는 인공지능을 숭배하게 되는 것은 자연스러운 수순이며 이런 상황에서 데이터 종교의 출현은 당연하다. 사실 자신보다 자신을 더 많이 아는 인공지능에 모든 판단을 맡기는 날이 멀지 않았다는 인식이 점점 널리 확산되고 있다. 지금도 구글, 페이스북 그리고 아마존은 우리가 무엇을 좋아하고 누구와 관계를 맺고 있고 과거 무엇을 했는지 등에 대해 더 많은 정보를 갖고 있다. 앞으로 이런 상황이 더욱 보편적으로 될 것이 명약관화하다. 그리고 이런 발전은 일정한 단계를 넘어서면 인간의 의지와는 무관하게 스스로의 논리에 의해 더욱 가속화될 것이다.

우리는 빅데이터의 빛과 그림자라는 두 대극적인 측면을 균형 감각을 갖고 이해해야 한다. 빛에 현혹되어 오로지 효율성을 금과옥조로 삼아 일로매진한다면 개별 기업 차원에서는 상당한 성과를 올릴 수 있을 것이나 사회 전반의 차원에서는 정보의 독과점에 따른 부작용을 피하기 어렵다. 이런 이유로 공정한 조정자로서 정부의 역할이 더욱 중요한 시점이다. 그런데 에드워드 스노든의 폭로에서 알 수 있듯이 정부도 빅브라더(Big Brother)가 되어 국민들의 사생활을 감시하고 통제하고자 하는 충동을 억제하기 어려운 것 또한 사실이다. 빅데이터를 활용하면 정치, 경제, 사회적인 모든 측면에서 일반대중을 효과적으로 통제할 수 있기 때문이다. 이와 같이 정부를 비롯한 공공기관 나아가 기업들이 오로지 빅데이터와 인공지능을 결합해 경쟁에서 우위를 점하는 데만 역량을 집중한다면 결국 빅데이터의 긍정적인 측면마저 퇴색될 수밖에 없다.

그렇다면 우리는 빅데이터가 생성한 정보가 지배하는 시대에 어떻게 대처해야 할 것인가? 지금까지 추세에 비추어볼 때 빅데이터를 이용해 기후변화의 영향을 더 잘 이해하고 지진과 같은 자연재해에 대해 더 나은 예측을 할 뿐만 아니라 우리의 오감(五感)을 만족시켜주는 더 나은 기회를 효과적으로 포착할 수 있다는 것은 무시할 수 없는 장점이다. 그러나 이런 상황에서 사람들은 대체로 빅데이터를 활용해 공익을 증진하는 것 보다는 개인적인 차원에서 감각적 쾌락을 강화하는 쪽에 관심을 집중할 가능성이 매우 높다. 보통 사람들은 감각적 쾌락보다 더 확실하게 어필하는 것을 찾기 어렵기 때문이다.

그러다보면 정작 우리가 궁구해야 하는 빅퀘스천이나 빅씽크와 같은 차원의 논의는 한낱 공허한 지적 유희(遊戱)로 전락할지도 모른다. 우리는 깊이 사고하는 습관을 버리고 점점 빅데이터와 알고리즘이 지시하는 데로 살아가게 될지도 모른다. 이른바 자발적인 좀비(zombie)의 출현이다. 그렇다면 우리 사회는 문화적인 측면에서는 더욱 저급한 수준으로 하락할 수밖에 없다. 빅데이터가 우리의 삶 곳곳에서 위력을 더해가더라도 “나는 누구인가?”, “우리는 무엇을 위해 살아야 하는가?”와 같은 근본적인 문제를 외면하지 않으려는 의식적인 노력이 절실하게 필요한 시점이다. 

 이영환

  동국대 경제학과 교수

  지식협동조합 경계너머 아하! 이사

  미시경제학 등 다수 출간

오피니언타임스은 다양한 의견과 자유로운 논쟁이 오고가는 열린 광장입니다. 본 칼럼은 필자 개인 의견으로 본지 편집방향과 일치하지 않을 수 있습니다.

칼럼으로 세상을 바꾼다.
논객닷컴은 다양한 의견과 자유로운 논쟁이 오고가는 열린 광장입니다.
본 칼럼은 필자 개인 의견으로 본지 편집방향과 일치하지 않을 수 있습니다.
반론(nongaek34567@daum.net)도 보장합니다.
저작권자 © 논객닷컴 무단전재 및 재배포 금지