대통령기록관 홈페이지로 이동합니다

통일시대

민주평화통일자문회의 민주평화통일자문회의

포커스

이전 홈 다음

언론 기사 빅데이터로 분석한 북한의 도발

외국 언론 부정적이면 다음달 도발 위험 높아

커버스토리
<사진> 북한이 미사일 발사 등의 무력도발을 하기 직전에 이미 외국 금융가에서는 이를 예견하는 경우가 많았다. 사진은 2월 21일 공개한 북한의 실크웜 미사일 발사 장면.

북한과 관련한 7만여 건의 신문 기사를 분석한 결과, 기사 논조를 통해 북한의 행동을 예측할 수 있는 것으로 밝혀졌다. 특히 한국이 북한에 대해서 비우호적 외교행동을 보이면 한 달 내에 도발이 자주 일어난 반면 한국이나 미국이 북한에 우호적 외교행동을 보였다고 해서 북한의 도발 확률이 줄어들지는 않은 것으로 드러났다.

2009년 4월 북한은 대포동 2호 미사일을 발사해 긴장 수위를 높였다. 급기야 5월 2차 핵실험을 단행했다. 극도로 고조됐던 남북한 간의 긴장 상태가 사람들의 뇌리에서 잊힐 무렵인 그해 늦가을, 북한은 서해에서 또다시 도발을 감행했다. 이어진 2010년은 더욱 잔인한 한 해였다. 3월 26일 천안함 피격 침몰의 아픔이 채 가시기도 전인 11월 23일 북한의 갑작스러운 연평도 포격 도발로 전쟁 일보 직전 상황까지 치달았다.

그런데 이 무렵 증권·금융가에서는 소문 아닌 소문이 떠돌았다. 외국계 헤지펀드들이 북한의 도발이 있기 직전, 어김없이 한국에 투자한 자금을 빼더라는 ‘카더라 통신’이 돌았던 것. 이런 루머는 실제 사실로 판명됐다. 2014년에 이뤄진 최신 연구에 따르면, 북한의 군사적 도발이 있기 며칠 전부터 영국계 등 일부 헤지펀드들이 한국 주식을 전보다 더 적극적으로 매도했다고 한다.

커버스토리
<사진> 같은 현상은 천안함 피격이 있었던 2010년 당시에도 발생했다. 사 진은 천안함 잔해 아래서 북한 어뢰 모형을 관찰하는 시민들.

그렇다면 이들 헤지펀드들은 어떻게 북한의 도발을 예견할 수 있었을까? 답은 바로 ‘빅데이터’에 있었다. 이들은 이미 2000년대 후반부터 언론에 실린 수많은 기사의 논조를 분석해 북한을 비롯한 위험 지역의 위기 발생 가능성을 예측해왔다. 또 그 결과를 실제 자산 운용에 반영하고 있었다. 2007년 폴 텟록(Paul Tetlock)이라는 학자가 이 같은 방법의 유용성을 밝혀낸 이후, 많은 연구자와 펀드가 주가지수의 향방과 수익성을 예측하는 데 언론 기사 빅데이터 분석을 활용하기 시작했던 것이다. 앞서 언급했듯이, 일부 펀드들은 실제 이 기법을 이용해 국제 금융시장에서 더 많은 이익을 올리고 있었다.

왜 많은 빅데이터 중에서도 언론 기사가 분석 대상이 됐을까. 언론사 기자들은 독자를 위해 더 새롭고 의미 있는 정보를 제공하려 한다. 이를 위해 다양한 정보원과 소스를 경쟁적으로 접촉하고 그로부터 얻은 정보를 기사화한다. 따라서 기자들이 신문에 내는 기사의 정성적인 논조를 컴퓨터 언어학적 도구(computational linguistic technique)로 분석하면 단순히 전통적인 방식으로 수집된 정보로는 잡아낼 수 없었던 새로운 사실을 알아낼 수가 있다. 즉 언론 기사라는 ‘빅데이터’로 분석과 예측의 정교함을 높일 수 있다는 것이다.

북한의 도발 예측, 빅데이터 분석으로 가능할까

그렇다면 예측 불가능성으로 유명한 북한의 도발적 행동도 빅데이터로 예측 가능할까? 한국 연구진(강형구 한양대 교수, 김영한 싱가포르 난양공대 교수, 이종규 한국개발연구원 연구원)이 북한과 관련한 7만여 신문 기사의 논조를 언어학적 도구로 분석한 결과, 언론 기사의 논조가 실제 북한의 행동에 대해 예측력을 갖는 것으로 밝혀졌다.

연구진은 1999년에서 2012년까지 14년간 일어난 북한과 관련된 287개의 사건들에 대해 당시 북한의 행동을 호전성에 따라 4단계로 분류했다(0 : 우호적인 행동, 1 : 아무런 행동 없음, 2 : 비우호적 외교행동 및 국지도발, 3 : 핵 및 장거리 미사일 실험). 한편 같은 기간 북한에 관한 영자신문 기사를 7만 개 이상 수집하고 컴퓨터 언어학적 기법을 동원해서 매일매일 북한에 관한 논조가 얼마나 부정적인지의 정도를 측정했다.

<그림> 북한 관련 주요 사건과 언론 반응
커버스토리
※ 붉은 선은 북한에 대한 언론 논조가 얼마나 부정적인지를, 푸른 선은 북한 관련 기사가 평균대비 얼마나 많이 등장했는지를 보여준다.

위 <그림>은 월별로 영자신문에 나타난 기사의 논조와 북한의 행동 간의 관계를 보여주는 그래프다. 붉은 선은 북한에 관한 각종 언론의 논조가 얼마나 부정적인지를 나타낸다. 푸른 선은 평균 대비 북한에 관한 기사가 얼마나 많이 등장하는지를 보여준다. 전반적으로 북한에 대한 부정적인 논조와 북한의 도발적 행동 간에 상관관계가 높았다. 특히 북한의 핵확산금지조약(NPT) 탈퇴와 2006년 최초의 핵실험 관련 언론 기사의 부정적인 논조가 특히 높았다.

연구진은 나아가 언론의 논조가 단순한 상관관계를 넘어 북한의 행동에 대해 예측력을 갖는지도 연구했다. 그 결과 북한에 관한 외국 언론의 기사가 부정적이면 한 달 이내 북한이 도발할 확률이 다른 때보다 높다는 것을 발견했다. 언론사를 국적별로 분류한 결과, 특히 영국 언론의 기사 논조가 예측력이 뛰어난 것으로 나타났다. 그 이유는 무엇일까.

영국은 오래 전부터 북한과 수교해왔다. 양국 간 대사가 상주하며 영국에는 친북한 성향의 영국인 단체가 많다. 그만큼 영국에는 북한에 관한 고급 정보가 다른 나라보다 많고, 그것을 이용해 우리 주식시장에서 이익을 추구한다는 점을 유추할 수 있다. 영국이 007 시리즈 같은 영화의 배경이 되는 일이 우연만은 아닌 것이다.

커버스토리
<사진> 2006년 북한이 첫 핵실험을 감행했을 당시 폭락한 한국 증시. 증시 폭락에는 발 빠르게 북한의 행보를 예측한 해외 펀드들의 급매도도한 몫을 했다.

한편 연구진은 한글 트위터 메시지의 논조도 같은 방법으로 분석했는데, 한글 트위터 빅데이터는 북한의 행동을 예측하는 데 별 도움이 되지 않는 것으로 나타났다. 여기에도 그나름대로 이유가 있다. 이는 전반적으로 한국 미디어에서는 북한에 관해 워낙 광범위한 이슈를 다루기 때문인 것으로 추측된다. 국내 언론의 북한 관련 기사는 군사적인 이슈 외에도 북한의 각종 비군사적인 측면과 주민생활 등 관련 정보를 폭넓게 다룬다. 이에 비해 외국 언론은 큰 관심을 끌 만한 군사적인 측면에 집중한다. 이 같은 차이가 외국 언론이 예측력이 높은 이유를 부분적으로 설명하는 것으로 보인다.

국내 언론의 논조가 예측력이 없다는 연구 결과가 국내 언론이나 정보기관의 첩보력이 떨어진다는 것을 의미하지는 않는다. ‘북한이 핵실험을 할 것 같다’는 첩보가 국내외 언론에 보도된 지 한 달 이내에 북한이 실제 핵실험을 할 확률이 유의하게 높았기 때문이다. 이는 한국의 첩보력이 유효함을 보여준다.

기념일은 도발일? 발표는 엄포성?

연구진은 북한의 각종 기념일과 언론 플레이, 한국 및 미국 정부의 동향 등의 변수와 북한의 행동 간에 어떠한 패턴이 있는지도 알아낼 수 있었다.

특징적으로, 김정은, 김정일, 김일성 생일을 전후한 5일 동안 도발이 두드러지게 많은 것으로 나타났다. 반면, 인민군 창설 기념일, 노동당 창설 기념일, 정부 창설 기념일 등의 기념일 전후에는 특별히 도발이 더 많지는 않았다. 북한의 국내총생산 증가율 추정치도 아무런 상관관계가 없었다. 이는 지도자 한 사람에게 집중돼 있는 전체주의적인 북한의 사회 구조를 반영하는 것으로 보인다.

한국이 북한에 대해서 비우호적인 외교행동을 보인 지 한 달 내에는 도발이 잦지만 미국이 북한에 대해 비우호적인 외교행동을 보인 지 한 달 내에는 별다른 도발이 일어나지 않았다. 반면에 한국이나 미국이 우호적인 외교행동을 보인 지 한 달 이내라고 해서 북한이 도발할 확률이 줄어들지는 않았다. 한국의 대통령과 미국의 대통령이 북한에 대해서 매파인지, 비둘기파인지 여부도 북한의 행동 예측에는 전혀 도움이 되지 않았다. 이는 북한이 미국보다는 한국과 치킨 게임을 추구하는 게 아닌가 추론하게 만든다.

커버스토리
<사진> 북한이 미국의 외교적 행보보다 한국 내 비우호적 여론에 더 민감한것은 미국보다 한국과의 ‘치킨 게임’을 추구하기 때문으로 추론된다. 사진은 북한의 도발에 핑계거리가 되곤 하는 대북 전단 살포 모습.

한편 연구진은 북한이 스스로 핵무기나 미사일 실험을 감행하겠다는 발표를 한 지 한 달 이내에 실제로 북한이 그러한 행동을 하는지도 분석했다. 그러나 북한의 발표와 행동 간의 상관관계는 크지 않았다. 이는 북한의 핵실험 계획 발표가 상대적으로 엄포성일 수 있다는 점을 보여준다. 북한의 행동은 예측이 불가능하기로 악명 높다. 특히 북한이 언제 핵실험 등의 도발을 감행할지는 더욱 내다보기 힘들다. 북한의 경우 정보를 구하기도 매우 힘들고 정보를 구하는 데도 많은 물적, 인적 자원을 투입해야 한다.

꼭 북한이 아니더라도 원래 지정학적 돌발 사태들은 예측이 매우 어렵다는 특성을 갖고 있다. 하지만 최근 연구들에 따르면, 예측하기 어려운 지정학적 사건도 빅데이터 기법을 활용하면 좀 더 효과적이고 효율적으로 예측할 수 있다는 사실이 속속 밝혀지고 있다. 이 같은 연구를 확장하면 북한 외에도 세계적으로 이슈가 되고 있는 다른 국가 및 단체의 행동을 예측하는 데도 도움이 될 것으로 보인다.

[이달의 메시지] 분단의 역사 마감 위해선 통일 준비 3박자 필요하다 [클로즈업]박근혜정부의 통일·외교·안보정책 2년 [COVER STORY] 남북 철도 연결 제안, 의미와 과제 [분석] 북한 철도의 현재와 가능성 [이슈] 오바마 행정부의 대북정책과 북·미관계 [진단] 김정은 외교 행보의 향배 [포커스] 언론 기사 빅데이터로 분석한 북한의 도발 [분석]북한 에너지난과 북·중관계 [분석] 남북 문화유산 공동 조사 [인터뷰] 국회 남북관계발전특별위원회 원혜영 위원장 [북한IN] <평양의 영어선생님> 저자 수키 김 [지상중계] 남북관계 전문가 초청 토론회 [현장중계] 원로 초청 통일·대북정책 간담회 [글로벌 평통] 김성혁 보스턴협의회장 [현장을 뛰는 사람들] 김순정 대구지역회의 행정실장 [협의회 탐방] 제주도 서귀포시협의회 [뉴스 & 민주평통] 2015 여성분과 위원장 정책회의 열려 2015 청년분과위원장 정책회의 개최 1분기 분과위원회 회의 잇따라 열려 대학생 통일동아리 신입회원 모집 활동 펼쳐 탈북민 3쌍 위한 희망결혼식 가져 북한이탈주민과 설맞이 장보기 나서 고교생 대상 나라사랑 토론대회 열어 북한이탈주민 사랑 나누기 행사 고교생 통일동아리 캠프 활동 벌여 ‘홀몸노인·이주여성 아름다운 동행’ 행사 가져 <통일로 가는 길> 제2호 발간 계획 수립 빅토리아·쿠리티바서 차세대 강연회 가져 ‘북한 인권’ 주제로 특별 강연 실시 ‘평화통일 염원의 날’ 지정, 동포사회 참여 촉구 범종교적인 통일 염원의 날 행사 갖기로 ‘2015년 남북관계’ 주제로 통일강연회 한국전 참전용사 초청 통일 특강 실시 제96주년 ‘무오독립선언’ 기념식 가져 [먼저 온 통일]‘일가족 탈북’ 김만철 씨 막내 딸 부부의 행복 [길 위에서] 전남 해남의 고찰 미황사와 대흥사 [통일칼럼] 통일 대박과 통일 예멘 | 김근식

페이스북 트위터 통일시대 뒤로가기버튼

맨 위로