서울백북스

2014.11.08 20:11

<신호와 소음> 요약3

조회 수 1277 추천 수 0 댓글 1
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄

6. 평균과 불확실성(계속) - 나비효과

경제 전문가들이 해결해야 하는 과제는 기상예보관이 해결해야 하는 과제에 비유할 수 있다.

첫째, 경제는 대기처럼 역동적인 체계다. 모든 게 나머지 모든 것에 영향을 미치고, 체계는 끊임없이 운동한다. 기상학에서 이 문제는 말 그대로 카오스다. 기상은 카오스 이론의 지배를 받는다.둘째, 기상예보관들은 불확실한 초기 조건에 크게 영향을 받는다. 기상에 본질적 무작위성이 존재한다거나 또는 기상 전문가들이 기상을 지배하는 물리적 여러 과정을 충분히 이해하지 못했기 때문이 아니다. 기상 전문가들은 자기네가 설정한 초기 조건의 측정값이 정확하지 않다는 사실, 기상의 여러 양상은 초기 설정값에 극단적으로 민감하다는 사실을 잘 알기 때문이다. 경제 분야에서도 초기 자료의 품질이 좋지 않는 예가 허다. 토네이도와 달리 경제 분야에서 인과 관계는 모두 불투명하다. 특히, 인간행동에 따른 피드백 회로가 경제에 영향을 미쳐서 거품이 일거나 공황이 덮칠 때 더욱 그렇다. 모기지대출과 레버리지 투자자와의 인과관계 및 파급효과는 신용시장과 금융업 전반을 마비시킨다. 사람들은 보고 싶은 대로 본다. 집단의 예측이 개인의 예측보다 낫다는 사실은 연구가 진행된 거의 모든 분야에서 이미 증명된 사실이다.

경제 전문가들은 대부분 예측을 할 때 통계 모델이 산출한 결과를 취하기보다 자신의 판단에 상당히 의존한다. 누구든 자신의 경제적 동기나 정치적 신념과 맞아떨어지는 예측을 하게 된다. 사람들은 자기가 보고자 하는 방식으로 정보보고자 하는 자세와 싸워야 한다. 헨슨은 편향 극복하기라는 블러그를 운영하는데 블러그 방문자들에게 문화적 금기, 이데올로기적 신념 또는 잘못 설정된 동기들이 최적의 결정을 내리지 못하게 가로막는 건 아닌지 곰곰이 생각해 보라고 권한다.

7 전염병 신종플루에서 에이즈까지

외삽(자료에 나와 있지 않은 부분을 그 부분에 가까운 것을 이용해 추정하는 방법론)은 예측의 매우 기본적인 방법론이다. 외삽은 현재의 추세가 앞으로도 무한하게 계속 이어지리라는 가정을 전제로 한다. 빗나간 예측으로 유명한 것 다수가 이런 가정을 너무도 방만하게 적용한데서 빚어졌다.

예측이 행동을 바꾼다.

예측이 예측 내용을 스스로 실현하는 것을 자기충족적 예측 또는 자기 충족적 예언이라 한다. 대통령 후보 경선처럼. 자기 충족적 예측의 민감한 사례들은 디자인 분야나 연예처럼 소비자 취향을 예측하려는 경쟁이 사업의 승패를 결정하는 분야에서 찾아 볼 수 있다. 만일 영향력 있는 디자이너가 갈색이 내년을 지배할 유행 색이라고 판단해 갈색옷을 제작하고 디자인하게 되면 대중은 이 추세를 따라 갈 것이다. 대중은 갈색 옷의 마케팅에 반응할 뿐 자신의 선호에 대해 표현하지는 않는다. 이때 그 디자이너는 미래 수요를 예측하는데 상당히 능력이 있는 것처럼 비친다. 그러나 이 디자이너들이 갈색이 아니라 검은색이나 흰색, 옅은 자주색을 선택했다 하더라도 결과는 다르지 않았을 것이다. 질병과 여러 의학적 조건들 역시 자기 충족적 특성이 있다. 자기 부정적 예측은 자기 충족적 예측과 정반대다. 즉 예측이 그 자체로 예측 내용을 약화시킨다. 재미있는 관련 사례가 GPS. 빠른 길을 제시한 경로를 피해 느린 경로를 모두 택할 경우 갑자기 한 경로에 교통량이 몰리고, 상대적으로 빠르리라고 본 경로가 결과적으로 느려진다.

모든 모델은 빚나간다

내가 만난 역학자들은 다른 분야의 예측 전문가들과는 다르게 자기들이 운용하는 예측 모델에 얼마나 큰 한계가 있는지 명확히 알고 있었다. 1918,1957, 1968년에 발생한 독감 사태를 언급하면서우리가 할 수 있는 건 어쩌면 여러 시나리오를 준비하고 그 대비책을 세우는 게 아닐까요?’ 어떤 예측가가 정확한 예측을 할 수 없고 또 이런 사실을 알고 있음에도 예측을 할 수 있는 척하면 많은 사람이 위험해진다. 예측은 목적이 아니라 수단이다. 예컨대 예측은 모든 과학에서 가설검증에 매우 핵심적인 역할을 한다. 모든 모델은 빗나간다. 그러나 몇몇 모델은 유용하다통계학자 조지 박스가 한 말이다. 통계모델은 우리가 사용하는 도구 가운데서 우주의 어림값을 끄집어내는 유일한 게 아니다. 예컨대 언어도 일종의 모델이며 모든 사람과 소통하기 위해 사용하는 어림값이다. 오조노프는 이렇게 말했다. ‘ 우리가 하는 모든 예측은 빗나갈 수밖에 없다는 사실을 명심해야 합니다. 그러기에 얼마나 빗나갔는지 그리고 빚나갔을 때는 어떻게 해야 하는지 이해하는 것이 예측과 관련해서 우리가 해야 될 일입니다통계모델은 우주의 복잡성을 이해하는 데 도움이 되는 도구일 뿐이지 우주를 대체할 수 있는 게 아님을 명심해야 한다. 이것이 핵심이다. 신경과학자들은 사람의 뇌가 정보를 처리하는데 전체 과정을 일련의 어림값 계산 과정으로 이해한다. 더 정확한 예측을 하고자 한다면 우리 자신을 더 잘 이해하고 우리가 신호를 어떻게 해석 왜곡하는지를 잘 이해해야 한다.

 

미래를 내 손에 움켜쥐는 법

농구지식과 통계학 지식을 결합해 불가리스가 성공을 거둔 건 그만의 정보처리 방식 때문이다. 그는 특정한 양상을 쫒기만 하지 않았다. 그는 자료 속에 내재된 의미 있는 관계를 찾아내려 노력했다. 때로는 직감을 동원하기도 했다. 대단히 크고 또 복잡한 형태의 도박을 한 셈이다. 성공하는 도박사들은 미래를 100% 확실하다는 식으로 보지 않는다. 자기 예측이 완벽할 것이라고도 전혀 생각하지 않는다. 성공한 도박사들은 미래를 확률의 점수판으로 바라본다. 이들은 자기가 낸 여러 확률에 대한 추정치가 도박시장에서 나온 추정치와 상당히 차이가 날 때 비로소 돈을 건다. 불가리스의 커다란 비밀은 그에게는 커다란 비밀이 없다는 사실이다. 대신 그는 사소한 비밀들을 수도 없이 가지고 있다. 이렇게나 많은 정보를 한꺼번에 하나로 조합해서 방향성을 찾아낸다. 자료가 풍부한 환경에서는 특정한 양상을 찾아내는 일이 쉽다. 핵심은 그 양상들에 신호와 소음이 얼마나 반영되어 있는지 판단하는데 있다. 그의 판단과 결정에 도움을 주는 사고의 틀은 분명 존재한다. ‘베이즈주의적 추론이 바로 그것이다. 베이즈가 한 주장은 세상은 본질적으로 확률적이라거나 불확실하다는 것이 아니다. 그들이 고민한 것은 바로 우주에 대해 우리는 어떻게 깨우침을 얻을 수 있을까 하는 문제였다. 즉 어림값을 통해 우주에 대해 배우는데 증거들이 많이 모일수록 진리에 조금씩 더 가까이 다가갈 수 있다는 점이다. 베이즈주의적 관점은 합리성을 개연성(확률)과 관련된 문제로 본다. 회의주의의 껍질을 깨고 나와서 자연현상을 예측한다면, 당신은 아마 진리에 조금씩 더 가깝게 다가설 수 있다고 말이다. 베이즈는 우리가 불완전하다는 사실을 인정하는 것이야말로 구원의 길로 나아가는 첫걸음이라는 말이다. 라플라스는 베이즈 이론을 완성했다. 완벽한 자연과 불완전한 인간 사이에 괴리와 관련 있다. 그리고 확률을 무지와 지식 사이에 존재하는 중간 지점으로 이해했다. 베이즈 정리의 수학적 형식은 간단하다. 알려진 3개 변수와 알려지지 않는 1개 변수가 동원된 대수적 표현이다. 베이즈 정리는 조건부확률과 관련 있다. 즉 어떤 사건이 일어났다는 전제아래 이론이나 가설이 참이나 거짓일 확률을 따진다. (사전 확률), 새로운 사건 발생, 사후 확률)

우리는 일반적으로 가장 새롭고 가장 즉각적으로 활용할 수 있는 정보에 초점을 맞추며, 더 큰 그림인 전체는 놓쳐버린다. 예를 들면 테러, 유방암, 배우자의 바람 케이스처럼 베이즈 정리에서 유용한 결과를 얻어 낼려면 여기에 정보 특히 사전확률추정치를 입력해야 한다. 기본적으로 베이즈 정리는 인식론적불확실성, 즉 우리 지식의 한계를 다룬다.

예측은 왜 실패하기 쉬울까

우리가 할용 할 수 있는 정보의 양이 기하급수적으로 늘어남에 따라 엄정하게 검증해야 할 가설 역시 기하급수적으로 많아진다. 자료에 담겨있는 의미 있는 상관관계는 얼마 되지 않는다. 우주의 대부분이 텅 빈 공간이듯이, 자료 대부분은 소음으로 채워져 있다. 오류율이 왜 이리 높을까 사실 이 질문은 근본적인 것이다. 어떤 것들은 우리가 가진 심리적 편견과 관련이 있고 방법론적 오류도 있고 또 어떤 것들은 배열이 어긋난 동기들과 관련이 있다. 하지만 문제의 근원에 접근하면 연구자들이 적용하는 통계적 사고에 흠결이 있음을 확인할 수 있다.

불완전성을 어떻게 이해할 것인가

빈도주의에서는 통계의 불확실성은 전체 개체군이 아니라 모집단의 극히 작은 단위인 표본에서만 자료를 취합한 데서 전적으로 기인한다.고 본다. 이는 여론조사 같은 분야에서는 이리가 있는 말이다. 편견에 물든 도구를 사용한다면 아무리 많은 도치를 취한들 무슨 소용이 있겠는가? 엉뚱한 표적을 겨누고 있는데. 본질적으로 빈도주의적 접근법은 예측이 툭하면 빗나가는 이유, 인적 오류를 털어낼 방도를 찾는다. 불확실성은 실제 세상을 이해하는 인간 능력이 아니라 실험에 내재하는 것이라고 파악한다. 아무리 유용한 자료를 많이 모은다 해도 이 자료를 올바른 방식으로 사용하지 않는다면 전혀 소용이 없다. 게다가 빈도주의 방법론은 이론과 실제 모두에서 특별히 객관적이지도 않다. 수많은 가정을 전제로 진행되기 때문이다. 표본 집단는 여론조사에서는 정직하게 모집단을 대표하지만 그 밖의 여러 실용적 분야에서는 완전히 임의적이다. 또한 연구자가 자신이 설정한 가설에 내재하는 가능성 또는 전체 맥락 속의 의미를 고려하지 못하게끔 가로 막는다. 상관성이 언제나 인과관계를 뜻하는 게 아니라는 발상의 공로는 피셔에게 돌려야 할 것이다.

베이즈주의 관점에서 보자면 예측은 발전을 측정할 수 있는 척도다. 우리는 결코 100% 확신을 주는 어떤 진리를 알 수는 없다. 베이즈주의적 사전확률의 가장 실용적인 정의는 당신이 어떤 것에 기꺼이 돈을 걸 수 있는 승산(초조해하지 않을 수 있는 상한선)이라고 말할 수 있다. 불가리스와 같은 전문 도박사들은 승률이 54%이상으로 계산될 때 돈을 건다. 불가리슨 세상을 관찰하고 그리고 관련 정보를 수집하고 가설을 설정한다. (어떤 현상을 관찰. 가설. 설정한 가설에서 예측을 정식화한다. 그 예측을 검증한다. 사람은 누구나 자기 나름의 믿음과 편견이 있으며 이런 것들은 각자의 경험, 가치관, 지식, 정치적 또는 직업적 신조 등이 결합해서 긍어진 실체다. 즉 경험적 문제라는 말이다. 베이즈주의적 관점의 멋진 특성 하나는 우리 앞에 제시되는 새로운 증거를 해석하는 데 영향을 미치는 경험적 믿음들을 우리가 가지고 있음을 명쾌하게 인정할 때 세상의 변화에 반응하는 우리의 방식을 아주 자세하게 묘사한다는 점이다, 어떤 일이 일어날 확률이 05라는 사람과 100%라는 사람이 토론을 벌이고 있다면 이 토론에서 유익한 결과는 절대로 도출되지 않는다. (종교 분파, 정치)나는 우리 인간은 자기 믿음에 대해 완벽한 객관성, 정확성, 합리성을 결코 지닐 수 없다고 본다. 그저 덜 주관적이고 덜 비합리적이며 덜 잘못되려고 노력할 뿐이다. 자기 믿음을 토대로 예측하는 것은 스스로를 검증할 수 있는 최고의 길이다. 사실 베이즈주의의 한 가지 특성은 우리에게 더 많은 증거와 자료들이 주어지면 우리가 가진 믿음들은 저저로 진리를 향해 수렴한다고 보는 데 있다. 불가리스가 베이즈주의를 받아들여 도박에서 돈을 땃듯이 결국 베이즈주의자가 승리할 것으로 나는 예측한다.

  • ?
    박용태 2014.11.08 20:12
    <불멸의 이론>과 비교하면서 베이즈 이론이 현대에 어떻게 응용되고 있는지 살펴보는 재미가 있습니다.

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
511 김대식 교수님의 <빅 퀘스쳔> 2월 6일로 강연 일정 변경 1 박용태 2015.01.10 1574
510 2014년 송년인사드립니다 현영석 2014.12.25 1289
509 2014년을 보내면서..1월 30일 김대식 교수님의 <빅 퀘스쳔> 강연 안내 등 3 박용태 2014.12.24 1611
508 12 월 23일 <이종필 박사님의 인터스텔라> 강연 안내 2 박용태 2014.12.19 1755
507 <이종필 교수의 인터스텔라> 12월 23일 강연 안내 박용태 2014.12.02 1913
506 후기 75차 <의식> 후기 1 송동훈 2014.11.29 1445
505 <의식> 11월 28일 강연 안내 박용태 2014.11.26 996
504 <신호와 소음> 3부 정리. 끝 박용태 2014.11.18 1312
503 "불멸의 이론", "신호와 소음", 베이즈 정리, 몬티 홀 문제 2 file 고원용 2014.11.17 2595
» <신호와 소음> 요약3 1 박용태 2014.11.08 1277
501 후기 74차 불멸의 이론 후기 송동훈 2014.11.01 1302
500 <신호와 소음> 요약2 박용태 2014.10.30 1077
499 고원용 박사님의 <불멸의 이론> 31일(금요일)입니다. 박용태 2014.10.25 1063
498 <신호와 소음> 요약1 박용태 2014.10.25 1151
497 <우주의 끝을 찾아서> 9월26일 강연 안내 박용태 2014.09.25 1198
496 <바른 마음> 요약 2부 박용태 2014.08.28 2504
495 <양자역학의 철학적 기초> 이번주 29일 금요일 강연 안내 박용태 2014.08.28 1178
494 <바른 마음> 요약 1부 박용태 2014.08.04 2445
493 7월 발표 자료 3 file 한정규 2014.07.26 1190
492 <그곳은 소, 와인, 바다 모두가 빨갛다> 요약 2 박용태 2014.07.25 1125
목록
Board Pagination Prev 1 ... 2 3 4 5 6 7 8 9 10 ... 29 Next
/ 29