'있는 그대로' 기록하려는 인류의 본능, 음악을 '디지털화'하다 [전문가의 세계 - 박주용의 퓨처라마 ②]

박주용 교수 2020. 6. 18. 20:35
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

기록 본능과 문화기술

[경향신문]

바닥이 안 보이는 우물 속 풍경처럼
시간은 인류에 망각을 강요하지만
인간은 망각에 대항하는 ‘기록’으로
언제나 새로운 삶의 모습으로 진화

우리에게 <예술사(The Story of Art)>라는 책으로 더 잘 알려져 있는 언스트 핸스 조지프 곰브리치(Ernst H J Gombrich·1909~2001)는 <어린 독자를 위한 작은 세계사(A Little History of the World)>라는 책을 사실 먼저 썼었다. 평소 곰브리치는 곧잘 따라주는 지인의 딸에게 미술과 역사에 대해 이런저런 설명을 해주었는데, 아이들에게 이야기해주는 것이 그리도 즐거웠는지 학자의 일생에서 제일 큰 일 가운데 하나인 학위 논문 발표를 앞둔 상황에서 한 출판사에서 번역해달라고 보내온 어린이용 역사책을 읽고 나더니 “내가 더 잘 쓸 수 있겠다”면서 6주 만에 완성한 책이다.

곰브리치는 역사란 우리 부모들의 이야기, 부모들의 부모들의 이야기, 부모들의 부모들의 부모들의 이야기… 이렇게 끝없이 거슬러갈 수 있는 것이라면서 바닥이 어디인지 모를 정도로 깊디깊은 우물을 상상해보라고 한다. 그리고 종이에 불을 붙인 다음 우물 속으로 던지고 나면 우리는 종이가 떨어지면서 불빛이 비치는 우물 안 벽의 모습을 한 조각씩 엿볼 수 있는데, 그 조각들을 모아 우리가 그려내는 우물 속의 모습, 그것이 바로 역사라고 말한다. 우물 깊이 종이가 멀어질수록 불빛은 희미해질 것이고, 우리에게 보이는 우물 속의 풍경은 더욱더 부정확해질 것이다. 이와 똑같이 시간이란 인류로 하여금 잊게 만드는 절대적인 힘을 갖고 있다. 하지만 변하지 않는 인류의 특징을 하나 꼽자면 이처럼 자연이 인류에게 강요하는 한계와 끝장을 볼 때까지 싸운다는 것이다. 그래서 인간은 망각이라는 것에 대항하는 ‘기록’이라는 무기를 만들어냈고, 이 무기 덕분에 인류는 언제나 새로운 삶의 모습으로 진보해왔다.

‘최고의 기록’에 대한 인간의 집착
소리의 기록에서 찾아볼 수 있어
‘원음 재생’이란 꿈을 좇던 인류에
디지털 음악의 등장은 최대 사건

기록에 관해 인간이 갖고 있는 또 하나의 특징은 바로 “있는 그대로의 기록이 최고의 기록이다”라는 정신에 대한 집착이다. 물론 ‘있는 그대로의 기록’이라는 게 도대체 무엇을 뜻하는 것인지는 나중에 따져볼 기회가 있겠지만, 그러한 집착이 오롯이 드러나고 있는 한 분야를 문화기술에서 찾을 수 있다. 바로 소리의 기록과 재생이다. 원물체를 아주 비슷하게 본뜨는 “높은 수준의 충실도”를 뜻하는 하이 파이델리티(high fidelity)의 줄임말인 하이파이(hi-fi)가 일상적으로는 좋은 오디오와 같은 말로 쓰이는 것을 보면, 우리 문명에서 들리는 그대로의 소리 즉 ‘원음’에 대한 집착과 사명감이 얼마나 큰지 짐작할 수 있다.

인류 최초의 녹음장치라고 하는 에디슨의 ‘포노그래프(phonograph)’가 만들어진 이후 계속 ‘원음’이라는 꿈을 좇던 인류가 만들어내는 최대의 사건 가운데 하나는 콤팩트디스크(CD)로 대변되는 디지털 음악의 등장이었다.

지금은 오히려 옛날 포노그래프와 원리가 같은 LP라고 하는 아날로그 매체가 소리가 더 좋다면서 각광을 받는 희한한 일이 시장에서 벌어지고는 있지만 값싼 순서대로 카세트테이프, LP, CD가 공존하던 시절에는 카세트테이프처럼 기계에 말려들어가거나(속된 말로 “씹히거나”) LP처럼 긁히고 먼지가 쌓여 사용하지 못하게 되는 일 없이 “언제나 똑같은 원음”을 약속하던 CD가 디지털 오디오 하이파이의 왕이었다. 그리고 앞으로 사진, 영상, 문서, 공연의 문화기술은 인간의 열정과 창의성의 ‘양’과 컴퓨터의 냉정함과 정확성의 ‘음’이 짝꿍이 되어 계속 발전해나갈 것이다. 그러므로 우리는 컴퓨터 언어인 디지털을 잘 이해해야 한다.

‘디지털(digital)’이란 손가락을 뜻하는 라틴어 디기투스(digitus)가 어원으로서, 손가락을 꼽으면서 눈에 보이는 물건을 하나하나 셀 수 있다는 데서 생겨난 말이다. 예를 들어, 내 오른쪽 엄지가 “산이”라는 친구, 왼쪽 엄지가 “윤이”라는 친구, 오른 새끼손가락이 “하늘이”라는 친구를 뜻한다고 우리끼리 약속을 한다면 나는 이제부터 산이, 윤이, 하늘이 이름을 소리내어 말할 필요 없이 해당하는 손가락을 들어올리기만 하면 될 것이다. 손가락이 열 개인 사람과 달리 컴퓨터는 손가락을 두 개 갖고 있는데, 컴퓨터의 이 두 손가락을 ‘비트(bit)’라고 부르고 각 손가락에 왼쪽 엄지, 오른쪽 엄지 대신 ‘0’과 ‘1’이라는 이름을 붙여 불러주고 있다.

0과 1, 두 종류의 비트를 이용해
1초에 4만4100번 파동의 높이를
6만5536개의 눈금으로 기록 가능
더 세밀한 고해상도 음원도 나와

그런데 이렇게 0과 1, 두 개의 손가락만을 갖고서도 세상에 존재하는 그 수많은 것들을 하나씩 다 표현할 수 있을까? 비트 하나가 아니라 여러 개를 사용한다면 가능하다. 예를 들어, 한 개의 비트만을 쓰는 “1비트”로는 두 개의 물체를 구별해 부를 수 있고(‘0은 여자’, ‘1은 남자’), 두 개의 비트를 쓰는 “2비트”로는 네 개의 물체(‘00-할머니’, ‘01-할아버지’, ‘10-외할머니’, ‘11-외할아버지’), “3비트”로는 000, 001, 010, 011, 100, 101, 110, 111을 써서 여덟 개의 물체, “4비트”로는 열여섯 개의 물체… 이런 식으로 백만 개의 물체이든 천만 개의 물체이든 비트만 충분히 있으면 되는 것이다.

(그림 1) 피아노 건반을 디지털로 표시하는 법. 피아노는 88개의 건반이 있으므로 0과 1의 비트를 일곱개 사용하여 각각에 디지털 이름을 붙여줄 수 있다(맨 왼쪽부터 0000000, 0000001로 시작해 맨 오른쪽 건반인 1010111에서 끝난다).

이러한 컴퓨터의 손가락인 비트가 음악에서 어떻게 쓰이는지 우리 주변에 흔히 볼 수 있는 보통 피아노를 한번 생각해보자. 피아노에는 제일 낮은 A0(아주 낮은 ‘라’음)에서 제일 높은 C8(아주 높은 ‘도’음)까지 88개의 건반이 있다. 그러면 피아노가 가진 건반을 모두 표현하기 위해 필요한 비트는 몇 개? 6비트이면 64개, 7비트이면 128개를 가리킬 수 있으니까 답은 일곱 개이다. 피아노의 맨 아래 건반을 0000000이라고 하고 나서 순서대로 0000001, 0000010, 0000011, … 이름을 붙여 나가면 마지막 88번째 건반은 1010111이 되는데(그림1), 피아노 악보의 각 음표를 그에 해당하는 디지털 이름으로 바꿔 써서 죽 늘어놓고 컴퓨터 파일로 저장하면 그게 바로 디지털 음원이 되어버리는 것이다. 그러면 여기에서 퀴즈. 다음의 음원은 무슨 노래?

‘0110000 0101111 0101100 0101111 0110000 0110000 0110000 0101111 0101111 0101111 0110000 0110000 0110000 0110000 0101111 0101100 0100010 0110000 0110000 0110000 0101111 0101111 0110000 0101111 0101100’

이 디지털 악보를 보고 실제로 해당하는 건반을 찾아서 쳐본 독자가 있다면 잠시나마 디지털 코드를 보고 음악을 재생한 ‘인간 스마트폰’이 되어본 기분이 어떤지 묻고 싶기는 하다. 답은 “떴다 떴다 비행기”이다. 그런데 이런 디지털화는 원리를 설명하기 위해 필자가 방금 막 만들어낸 것일 뿐, 실제의 음악을 위해 사용되기엔 부족한 점이 많다. 음악은 피아노 말고도 피리, 가야금, 사람의 목소리까지 무궁무진한 종류의 악기로 연주되고, 음의 길이와 세기가 계속 변하기 때문이다. 그러면 이런 것까지 다 포함해 음악을 디지털화하는 방법은 무엇일까?

(그림 2) 균일한 단음의 파동(왼쪽)이 중첩되어 복잡한 모양의 파동인 음악이 만들어지고(가운데), 이 파동의 높이를 일초당 4만4100번씩 측정하여 디지털 비트로 저장한 것이 CD와 스트리밍에 사용되는 디지털 음원이다(오른쪽).

‘소리가 난다’는 것은 과학적으로는 공기 분자가 앞뒤로 진동하면서 우리의 고막을 흔들어주는 현상을 말한다. 예를 들어 우리 고막이 1초에 440번(1초에 어떤 일이 반복되는 횟수를 헤르츠라고 부르고, ㎐라고 쓴다) 흔들게 되면 우리는 피아노 한가운데에 있는 ‘라’(A4) 건반을 쳤을 때 나는 단음(한 가지 소리)으로 인식한다. 음악은 다양한 헤르츠의 단음들이 수없이 많이 겹쳐져 매우 복잡한 모양으로 우리 고막을 흔드는 파동이다(그림2). 이러한 음악의 파동을 온전히 디지털로, 즉 0과 1을 이용해 표현하기 위해서 제일 흔하게 사용하는 방식은 다음과 같다. 1초에 4만4100번 파동의 높이를 0(소리 없음)에서부터 65535(제일 큰 소리)까지, 65536의 눈금을 가진 자로 재서 기록하는 것이다. 65536은 2의 열여섯 제곱으로서 16비트이니까 1초짜리 음악은 44100 곱하기 16, 즉 70만개의 비트로 표현되는 것이고, 한 시간이 넘는 베토벤의 9번 교향곡 ‘합창’은 약 30억개의 비트로 표현된다. 거기에 왼쪽 귀, 오른쪽 귀에 들어가는 소리가 별개인 스테레오를 만들면서 그 두 배인 60억개의 비트로 돼 있는 것이다. 앞에서 소개한 “떴다 떴다 비행기” 디지털 악보는 175개 비트로 돼 있는데도 필자는 눈이 어지러울 지경이었는데, 지구의 인구수와 비슷한 60억이 얼마나 큰 숫자인지는 상상하기도 어렵다. 후~ 불면 날아가는 가볍고 작은 플라스틱 조각에 그 많은 정보를 기록할 수 있게 만든 과학자들을 배출한 인류는 자랑스러워해도 될 것 같다.

마지막으로 덧붙이자면, 어떤 사람들은 1초에 4만4100번, 파동의 높이를 6만5536개 단계로 재어서 기록하는 것은 벌써 40년 전에 만들어진 낡은 방법으로서 이보다 더 자주, 더 세밀하게 기록하면 소리가 더 원음에 가깝게 들린다고 한다. 그들을 위해 이미 일반 CD의 예닐곱 배인 시간당 400억비트 크기의 정보를 가진 고해상도(hi-res) 음원이라는 것을 찾아볼 수 있다. 역시 사람은 힘이 닿는 데까지 ‘있는 그대로 모든 것’을 기록해야만 마음이 편해지는 본능이 있다. 디지털카메라의 해상도도 그러했고, 언제나 ‘이 정도면 충분하다’라며 멈춘 적이 없다. 물론 어느 인간도 본능이 시키는 대로 살아본 적은 없을 것이다. 언젠가 길을 가다가 고해상도 음원을 스트리밍으로 들어보려고 했더니 “데이터를 많이 소비할 수 있으니 와이파이로 들으세요”라는 경고가 떠서 놀라 꺼버린 적이 있다. 한 시간에 400억비트이면 2.5기가인데, 그 정도로 비싼 데이터값을 치를 능력은 없으니까. 하지만 지금도 세상 어딘가 누군가는 방법을 만들어주고 있을 것이다. 그것이 자연이든 경제이든 무언가를 못하게 하는 것과 싸우는 건 인간의 본능이니까.

▶박주용 교수

서울대학교 물리학과를 졸업하고 미국 미시간대학교(앤아버)에서 통계물리학·네트워크과학·복잡계과학으로 물리학 박사 학위를 받았다. 하버드 데이나-파버 암연구소에서 연구원으로 시스템스 생물학을 연구하고, 현재 카이스트 문화기술대학원에서 문화와 예술의 물리학을 연구하고 있다. 제주도에 현무암 상징물 ‘팡도라네’를 공동 제작·설치하였고, 대전시립미술관의 ‘어떻게 볼 것인가: 프로젝트 X’에 큐레이터로 활동하였다. 학창 시절 미식축구에 빠져 대학팀 랭킹 알고리즘을 창시한 뒤 지금도 빠져 있으며, 남는 시간에 자전거와 모터사이클을 타고 싶어 한다.』

박주용 교수

Copyright © 경향신문. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?