본문 바로가기
상상발전소/음악 패션 공연

빅데이터로 보는 음악의 또 다른 가능성-데이터 안에 개인의 음악적 취향이 있다

by KOCCA 2015. 1. 16.



<고건혁 붕가붕가레코드 대표이사>

 


지금 이 시점에서 축적되고 있는 빅데이터의 가능성은 더욱 발전해 갈 것입니다. 지금 소셜 미디어를 통해 쏟아지는 데이터는 소비자 개개인을 단위로 취향을 파악할 수 있는 바탕을 제공하고 있습니다. 그리고 만약 분석만 가능하다면 소비자의 취향을 분석하여 음악의 판매량을 늘리고 더 나아가서는 시장의 확대를 도모하는 것도 가능해질 것입니다. 

 

 

▲ 사진1



 

모든 산업 분야가 그러하겠지만, 음악을 생산하는 기업에서 지상 과제 중 하나는 소비자의 취향을 파악하는 것입니다. 물론 예전에도 데이터는 있었습니다. 빌보드 차트가 대표하는 음반/음원 판매량, 그것을 성별, 연령, 지역에 따라 나눈 통계들은 기업의 의사 결정에 중요한 지표가 되었습니다. 그런데 이제 웹의 사용이 전 세계적으로 광범위해지고 수집할 수 있는 범위가 넓어짐에 따라 예전에는 수집할 수 없었던 데이터가 수집되기 시작했습니다. 소위 빅데이터(big data)의 시대가 도래한 것입니다. 이에 한국의 음악 산업에서도 SM엔터테인먼트의 경우 자사의 유튜브(YouTube) 채널에서 뮤직비디오를 시청한 사용자의 지역 통계를 이용해 세계 진출 전략을 구상한다는 얘기는 대표적인 빅데이터 활용 사례로 여겨지고 있습니다.

 

하지만 지금 이 시점에서 축적되고 있는 빅데이터의 가능성은 이 정도에서 그치지 않습니다. 집단으로 뭉쳐 있던 예전의 데이터와 달리 지금 소셜 미디어를 통해 쏟아지는 데이터는 아예 소비자 개개인을 단위로 취향을 파악할 수 있는 바탕을 제공하고 있습니다. 그리고 만약에 소비자의 취향을 분석한다면 그에 입각한 표적화(targeting)를 통해 음악의 판매량을 늘리고 더 나아가서는 시장의 확대를 도모하는 것도 가능해질 것입니다. 

 

가장 큰 문제는 분석입니다. ‘구슬이 서 말이라도 꿰어야 보배’라는 옛말은 빅데이터와 관련한 이슈에 정확히 들어맞습니다. 데이터를 분석해 의미를 가진 정보(information)로 변환하는 문제가 될 것입니다. 그렇다면 음악 산업에서 소비자의 취향을 분석하기 위해 빅데이터를 어떻게 활용할 수 있을까요? 사실 빅데이터가 커다란 화두로 떠오르기 전부터 그와 관련한 시도는 있었습니다.

 


▲ 사진2

 


 

아직 빅데이터라는 개념이 존재하기 전인 1995년 MIT의 샤다난드(Shardanand)와 메이스(Maes)는 링고(Ringo)라는 이름의 음악 추천 시스템(recommender system)을 개발했습니다. 이 시스템의 목적은 특정한 사용자의 음악 취향을 추론해 그의 취향에 적합한 새로운 음악을 추천해주는 것입니다. 이를 위해 그들이 사용한 알고리즘은 아주 간단하지만, 상당히 효율적인 아이디어에 입각하고 있었습니다. 소비자가 새로운 음악을 찾으려고 할 때 자신과 비슷한 취향을 가진 사람들에게 추천을 받는 입소문(word-of-mouth)의 메커니즘을 자동화한 것입니다.

 

일단 링고는 사용자에게 특정한 노래에 대한 그 사람의 선호가 어떠한지를 7점 척도(아주 좋다 7점~보통 4점~아주 안 좋다 1점)로 평가하게 합니다. 이렇게 사용자의 프로필을 만들고 나면 이제 그것을 바탕으로 개인 간의 취향 유사도를 계산합니다. 예를 들어 A라는 사용자의 취향이 {소녀시대 : 7점, EXO : 6점, 비틀스 : 1점}이라면 이 사용자의 취향은 {소녀시대: 2점, EXO : 3점, 비틀스 : 7점}인 B보다 {소녀시대 : 5점, EXO: 5점, 비틀스 : 2점}인 C와 더 유사하게 판단되는 것입니다. 이렇게 A와 C가 유사하게 판단되면, 이제 C가 높게 평가한 것 중에 아직 A가 평가하지 않은 것(즉, 들어보지 못한 것)을 추천해 주는 것입니다. 요컨대 A와 C의 취향이 비슷하므로 C가 좋아하는 것은 A도 좋아할 것이라는 가정에 입각한 것입니다.

 

이러한 아이디어는 향후 협업 필터링(collaborative filtering)이라는 이름의 알고리즘으로 정립된 이후 실용화 과정에서 ‘노래를 들었다=좋아한다, 노래를 많이 들었다=많이 좋아한다’는 식으로 평점을 매기는 과정까지 생략한 단순한 알고리즘이 사용됩니다. 대표적인 예가 영국의 음악 추천 서비스인 라스트닷에프엠(Last.fm)입니다. 라스트닷에프엠은 취향을 분석하기 위해 오디오스크러블러(Audioscrobbler)라는 응용 프로그램을 이용, 사용자가 컴퓨터나 모바일 장치, 혹은 특정한 웹 서비스에서 들은 음악의 목록을 모두 긁어모읍니다. 한 사람의 음악 청취 이력이 고스란히 모이는 것입니다. 데이터가 많아질수록 사용자의 취향에 대한 분석은 한층 정확해질 것이고, 이렇게 분석한 취향을 바탕으로 협업 필터링 알고리즘을 통해 유사한 취향을 가진 다른 사용자의 재생 목록을 이용해 추천하는 것입니다.

 

이렇게 모인 데이터의 양은 얼마나 될까요? 노래 한 곡당 평균 3분이라 생각하고, 한 사용자가 하루에 1시간씩 노래를 듣는다고 치면 하루 한 사람에게 누적되는 데이터는 20곡의 재생 목록입니다. 4,000만 명이 사용한다는 라스트닷에프엠의 통계를 보면 하루에 8억 곡의 청취 이력이 누적된다고 볼 수 있습니다. 이미 2000년대 중후반부터 빅데이터라고 일컬을 수 있는 양의 데이터를 수집해 그것을 바탕으로 서비스를 구현하고 있었던 것입니다.

 


▲ 사진3

 


이러한 협업 필터링 알고리즘은 1차적으로 음악 소비자가 새로운 음악을 발견하는 데 도움을 주고, 이를 통해 더 많은 음악의 소비를 촉진하는 데 이바지하기 위해 만들어졌지만, 음악 생산자의 의사 결정에도 중요한 판단 근거를 제공하게 됩니다. 예전의 음악 제작사들이 주로 전문가의 ‘감’에 기대어 시장의 경향을 분석했다면, 이제는 객관적인 데이터를 기반으로 소비자 개개인의 취향에 한결 정확하게 접근할 수 있게 된 것입니다. 만약 신인 아티스트를 데뷔시킨다고 했을 때 해당 아티스트와 유사한 소비자군을 가지고 있는 아티스트를 벤치마킹하거나 혹은 그에 대항할 수 있는 경쟁 전략을 수립하기가 한층 쉬워진 것입니다.

 


 

그런데 라스트닷에프엠이 시작된 2000년대 중반과 달리 최근 빅데이터가 생성되는 원천은 주로 소셜 네트워크 서비스(social network service, SNS)를 비롯한 소셜 미디어(social media)입니다. 2011년 세계 최대의 SNS인 페이스북(Facebook)은 자사의 사이트에서 다양한 음악 애플리케이션을 이용해 이뤄진 사용자 간의 청취 경험의 공유가 한 달 사이에 15억 번에 이르렀다고 발표했습니다. 사용자의 취향을 표현하는 데이터가 하루에 5,000만 개, 초당 580개가 생성된 것입니다. 당시 페이스북을 기반으로 한 서비스 대다수가 초기 단계에 있던 스타트업(start-up)이었음을 고려하면 그로부터 3년이 지난 지금은 훨씬 더 많은 양의 데이터가 생성되고 있으리라 짐작할 수 있습니다. 단지 페이스북만이 아닙니다. 또 다른 대표적인 SNS인 트위터(Twitter)에서도 음악은 TV, 영화 및 스포츠에 이어 세 번째로 인기 있는 주제로서 200만 명의 사용자를 대상으로 한 조사 결과에 따르면 그들이 6개월 동안 생성한 음악 관련 트윗(tweet, 트위터에서의 게시물)의 개수는 1억 1,000만 개에 이릅니다.

 

스마트폰의 등장과 함께 모바일이 최대의 이슈로 떠오른 2000년대 중반의 데이터 수집이 주로 데스크톱과 모바일을 통합해서 한 개인의 데이터를 완전하게 수집하는 것을 목표로 했다면, 소셜 미디어 시대의 데이터 수집은 사회적 관계를 전제로 합니다. 따라서 오직 청취 이력만을 사용하던 예전의 협업 필터링과 달리 이제 사회적인 관계를 활용해 좀 더 정확한 유사성을 계산해낼 수 있게 된 것입니다.

 

이는 예전부터 사회학, 경영학 등 여러 분야에서 이뤄지던 정보 전달 과정에서의 영향력(influence) 연구에 입각한 것으로 특정한 사람이 정보를 찾는 과정에서 어떤 관계에 있는 이들에게 더 의존하는지를 이용한 것입니다. 예컨대 A와 B의 취향 유사도를 평가할 때 단순히 청취 이력만을 비교하는 것이 아니라 둘 사이에 메시지를 주고받는 등 상호작용을 하는 빈도가 어떻게 되는지, 서로 관계를 맺고 있는 사람들은 얼마나 유사한지를 수치화, 영향을 높게 받는 관계에 더 높은 유사도를 매기는 것입니다. 나는 비틀스와 유사한 음악을 들어본 경험은 없지만, 내 친구가 비틀스를 좋아한다면 나 역시 비틀스를 좋아할 가능성이 높다는 점입니다. 실제로 현재 세계적인 음악 스트리밍 서비스인 스포티파이(Spotify)의 경우 자신과 친밀한 친구를 통해 새로운 음악을 발견할 수 있게 하는 기능을 제공하고 있으며, 페이스북도 관계를 이용해 음악을 추천하는 서비스를 계획 중에 있습니다.

 


▲ 사진4

 


 

이처럼 음악 산업에서 빅데이터를 활용해 소비자의 취향을 분석하고 이에 따라 음악을 제공, 판매하는 것은 이미 그 가능성을 인정받고 있고 실제 현장에서도 활용되는 추세입니다. 하지만 그 가능성을 제대로 활용하는 것은 아직 데이터를 수집하고 그것을 다룰 수 있는 능력을 갖춘 플랫폼 사업자, 예컨대 페이스북, 트위터 같은 SNS나 스포티파이 같은 음원 유통업자들로 제한돼 있습니다. 위의 서비스들을 비롯해 최근에는 한국 최대의 음원 유통 플랫폼인 멜론이 사용자의 청취 정보를 API(Application Programming Interface) 등을 통해 외부 사업자에게 데이터를 제공하고 있지만, 아직 그 데이터를 제대로 활용하기에는 음악 생산자의 체질은 여전히 ‘감’에 의존하는 데 머물러 있습니다. 이제 음악 생산자가 데이터 분석(data analytics)의 전문가와 협업을 시작할 때가 된 것입니다.

 

한편 소비자 입장에서는, 개인 정보의 유출이 문제가 됩니다. 최근 페이스북에서 사용자 모르게 실시한 실험이 큰 파장을 일으켰듯, 개인의 취향에 대한 정보의 수집은 동시에 개인의 프라이버시를 침해할 가능성이 다분합니다. 이러한 측면에서 정보의 수집에 대해 명확하게 동의를 구하는 절차로부터 데이터의 활용 과정에서 투명성을 구축하는 것, 그리고 활용의 결과가 소비자에게 명백하게 효용을 준다는 점을 이해시키는 설득의 과정까지, 음악 산업에서 빅데이터를 활용하기 위해서 정책 기관과 각 기업이 앞으로 해결해야 할 과제가 산더미입니다. 물론 그럼에도 불구하고 현재 매년 위기가 심화되고 있는 음악 산업의 현황을 봤을 때 빅데이터가 가지고 있는 가능성은 이를 활용하기 위해 노력할 만한 가치가 있는 것임이 분명합니다.



ⓒ 사진 출처

- 표지 창조산업과 콘텐트

- 사진1 창조산업과 콘텐츠

- 사진2 스포티파이

- 사진3 뉴욕포스트

- 사진4 창조산업과 콘텐츠



 본 기사는 한국콘텐츠진흥원 정기간행물 <창조산업과 콘텐츠> 7·8월호(http://bit.ly/1q0z7tR)에서 발췌하였습니다.

ⓒ한국콘텐츠진흥원