2007년 8월 6일 월요일

블로그 쓰레드를 분석해서 중요한 블로거, 선동자를 찾는 방법

NICT와 협력 관계를 맺고 있는 우리 랩은 몇가지 공동 연구를 진행하고 있다.
(자세한 사항은 관리자가 아니라서 모르겠지만...)

블로그나 웹 마이닝, social network등에 관심이 있어 서베이를 하던 중 NICT에서 나의 연구 목표와 비슷한 주제로 수행했던 프로젝트 논문을 발표했다.

블로그엔 트랙백이라는 것이 존재하며, comment 기능도 있어서 conversational tool로서 볼 수도, 활용할 수도 있지만 블로그 사용자인 당신(?)은 hot topic 즉 뜨거운 감자인 논쟁 거리에 대해서 갑론 을박 서로 토론하는 내용의 글들을 트랙백을 따라서 보기는 뭔가 많이 부족하다고 느낀적이 없는가?

현재 우리 블로그는 이러한 conversational 측면에서 논리의 흐름을 보여주는 측면은 상당히 빈약하다. 대부분 그런 점을 느끼겠지만... 사실 게시판(bulletin board)의 순서대로 작성된 글들에 비해 선 이런 측면에서 뭔가 모자란 느낌을 받을 수 있다. 그것은 우리 블로그가 하이퍼 링크된 블로그들의 snapshot같은 역할을 하도록 보여지고 있기 때문이다.

이 논문은 그러한 내용들을 개선하고자 하는 노력으로 시도되었다.
그리고 hot conversation들을 찾기 위해 이러한 conversation에서 중요한 위치를 차지하는 블로거들을 찾는 방법을 제안하였다. 블로그를 돌아다니다 보면, 블로거들이 적은 이 전의 글들을 통해 그들의 관심사를 알게 되고 답글, 인용 수 등을 보면 그가 얼마나 좋은 글을 썼는 지 짐작할 수 있다. 이러한 정보가 절대적으로 블로거의 위상에 힌트가 되지는 않지만, 중요한 정보를 준다는 사실엔 틀림없다. 이러한 독자가 블로그를 돌아다니며, 블로거들에 대해 판단하는 과정들을 컴퓨터가 할 수 있도록 자동화해서 hot conversation을 찾겠다는 이들의 시도는 3가지 가설에 의거한다.

첫째, 선동자로서의 블로거는 다른 사용자들로 부터 in-link가 많을 것이다.
즉, 좋은 블로그 글을 남기기 때문에 trackback이라던지 reply-link가 많을 것이라는 예상이다.
둘째, 선동자로서의 블로거가 글을 남긴 뒤에는 topic에 있어서 변화가 있을 것이다.
즉, 선동자가 글을 남기기 전의 쓰레드에서의 글들은 통일성없이 다양한 형태의 논지로 글을 쓰지만, 선동자가 글을 남긴 뒤에는 그 뒤 블로거 글들은 선동자의 글의 논지를 따르게 될 것이라는 예상이다.
셋째, 선동자가 글을 남긴 뒤에는 일정 시간동안 쓰레드에 글이 더욱 많아질 것이다.
즉, 선동자가 쓰레드에 활력을 일으키는 역할을 할 것이라는 예상이다.

어찌 보면 당연한 얘기지만, 이러한 논문을 볼때 항상 경이로운 생각이 드는 것은 당연할 것 같은 이치에 대한 논리 정연한 논거와 그를 뒷받침하는 과학적 분석, 과학적 실험 설계에 대한 놀라움이다.

댓글 없음: