8월 4일 목요특강 강의에서 추천 도서입니다 

세상에서 가장 쉬운 베이즈통계학 입문 


고지마 히로유키지음 | 장은정 옮김 | 지상사 2017년 03월 31일 출간

책소개

이 책이 속한 분야

  • 경제/경영 > 경영이론 > 경영수학/경영통계
  • 과학 > 수학 > 통계 > 통계학일반

    비즈니스에 사용할 수 있는 베이즈통계『베이즈통계학 입문』. 베이즈통계는 인터넷의 보급과 맞물려 비즈니스에 활용되고 있다. 인터넷에서는 고객의 구매 행동이나 검색 행동 이력이 자동으로 수집되는데, 그로부터 고객의 ‘타입’을 추정하려면 전통적인 통계학보다 베이즈통계를 활용하는 편이 압도적으로 뛰어나기 때문이다. 현재 많은 인터넷 계열 기업이 실제로 베이즈통계를 이용하고 있다. 그중에서도 마이크로소프트는 일찍부터 베이즈통계를 비즈니스에 이용한 것으로 유명하다. 윈도우즈 OS의 도움말 기능에도 베이즈통계가 도입되었으며 웹상에서 사용자가 가령 ‘아이의 병 증상’이라고 검색했을 때 유망한 지침이 우선적으로 노출되는 소프트웨어 등도 개발했다.

    마이크로소프트의 전 대표 빌 게이츠 씨는 1996년에 신문을 통해, 자사가 경쟁상 우위에 있는 까닭이 베이즈통계로 인한 것임을 공표했다. 한편 구글도 자사 검색엔진의 자동번역 시스템에 베이즈통계의 기술을 활용한 것으로 알려져 있다. 따라서 금세기 비즈니스에 종사하는 사람은 베이즈통계에 통달하면 최강이 될 것이다. 이 책은 비즈니스맨이 실전에서 활용하는 데, 도움이 될 만한 사례와 해설을 싣고 있다.

저자소개 

저자 : 고지마 히로유키


경제학자

저자 고지마 히로유키(小島?之)
1958년 동경에서 출생했다. 동경대학교 이학부 수학과를 졸업하고 동대학원 경제학 연구과에서 박사과정을 수료했다.
현재 데이쿄(帝京)대학교 경제학부 교수로 재직 중이다. 경제학 박사이며 전공은 수리경제학이다.
저서로는
《세상에서 가장 쉬운 통계학 입문》
《확률적 발상법》
《제로에서부터 배우는 미분적분》
《비즈니스맨이 꼭 알아야 할 법칙》
《수학으로 생각한다》 등 다수가 있다.
원서명: 完全?習 ベイズ統計?入門 / ISBN 978-4-478-01332-8 / 小島 ?之

역자 : 장은정


번역가/통역사>일본어

역자 장은정은 한국방송통신대학교 일본학과를 졸업했으며 한국외국어대학교 국제지역대학원 일본학과를 수료했다. 현재 출판기획 및 일본어 전문 번역가로 활동하고 있다.

옮긴 책으로는

《암산이 빨라지는 인도 수학》

《수학 잘하는 창의 IQ160 만들기》

《사랑과 욕망의 중국 4000년사》

《1분 감각》 등 다수가 있다

목차


제0강 사칙연산만으로 이해하는 베이즈통계학
이 책의 특장
0-1 예비지식이 전무한 상태에서도 실제 활용할 수 있는 수준까지 도달할 수 있다.
0-2 면적도와 산수, 이 두 가지로 해결한다
0-3 빌 게이츠도 주목했다! 비즈니스에 사용할 수 있는 베이즈통계
0-4 베이즈통계는 인간의 심리에 의존한다
0-5 빈칸 채우기 형식의 간단한 연습문제는 독학에 최적이다

제1부
속성! 베이즈통계학의 에센스를 이해한다

제1강 정보를 얻으면 확률이 바뀐다
‘베이즈 추정’의 기본적인 사용 방법
제1강의 정리 / 연습문제

제2강 베이즈 추정은 때로 직감에 크게 반한다①
객관적인 데이터를 사용할 때 주의할 점
제2강의 정리 / 연습문제

제3강 주관적인 숫자여도 추정이 가능하다
곤란한 상황에서 쓰는 ‘이유 불충분의 원리’
제3강의 정리 / 연습문제

제4강 ‘확률의 확률’을 사용하여 추정의 폭을 넓힌다
제4강의 정리 / 연습문제
column 베이즈는 어떤 사람이었을까?

제5강 추론의 프로세스에서 부각되는
베이즈 추정의 특징
제5강의 정리 / 연습문제

제6강 명쾌하고 엄밀하지만 쓸 데가 한정된
네이만-피어슨식 추정
제6강의 정리 / 연습문제

제7강 베이즈 추정은 적은 양의 정보로
그럴듯한 결론을 이끌어낸다
네이만-피어슨 식 추정과 다른 점
제7강의 정리 / 연습문제

제8강 베이즈 추정은 ‘최우원리’에 근거해 있다
베이즈통계학과 네이만-피어슨 통계학의 접점
제8강의 정리 / 연습문제

제9강 베이즈 추정은 때로 직감에 크게 반한다②
몬티 홀 문제와 세 죄수 문제
제9강의 정리 / 연습문제
column ‘속설’에 대한 두 가지 법칙

제10강 복수의 정보를 얻었을 때의 추정①
‘독립시행 확률의 승법공식’을 사용한다
제10강의 정리 / 연습문제

제11강 복수의 정보를 얻었을 때의 추정②
스팸메일 필터의 예
제11강의 정리 / 연습문제

제12강 베이즈 추정에서는 정보를 순차적으로 사용할 수 있다
‘축차합리성’
제12강의 정리 / 연습문제

제13강 베이즈 추정은 정보를 얻을수록 더 정확해진다
제13강의 정리 / 연습문제
column 베이즈 역확률을 복권시킨 학자들


제2부
완전독학! ‘확률론’에서 ‘정규분포에 따른 추정’까지

제14강 ‘확률’은 ‘면적’과 동일한 성질을 지닌다
확률론의 기본
제14강의 정리 / 연습문제

제15강 정보를 얻은 후 확률의 표시법
‘조건부 확률’의 기본적인 성질
제15강의 정리 / 연습문제

제16강 더 범용적인 추정을 위한 ‘확률분포도’
제16강의 정리 / 연습문제

제17강 두 가지 숫자로 성격이 정해지는 ‘베타분포’
제17강의 정리 / 연습문제

제18강 확률분포의 성격을 결정짓는 ‘기대치’
제18강의 정리 / 연습문제
column 주관확률이란 어떤 확률인가?

제19강 확률분포도를 사용한 고도의 추정①
‘베타분포’의 경우
제19강의 정리 / 연습문제

제20강 동전 던지기나 천체 관측에서 관찰되는
‘정규분포’
제20강의 정리 / 연습문제

제21강 확률분포도를 사용한 고도의 추정②
‘정규분포’의 경우
제21강의 정리 / 연습문제
보강▶ 베타분포의 적분계산

마치며
연습문제 해답

출판사 서평

● 출판사 리뷰


베이즈는 어떤 사람이었을까
생애에 단 한 편의 수학 논문을 썼다

베이즈 역확률을 발견한 영국인 토마스 베이즈는 1702년에 태어나 1761년에 별세했다. 베이즈는 스코틀랜드의 에든버러대학에서 신학과 수학을 공부했고, 이후 부친의 뒤를 따라 목사가 되었다. 베이즈는 목사 일에 종사하면서 수학도 연구했다. 당시는 신을 섬기는 일에 종사하는 사람들 중에 수학을 연구하는 사람이 적지 않았기 때문에 그다지 특이한 일은 아니었다. 베이즈는 생애에 단 한 편의 수학 논문을 썼다. 그것은 <확률의 사고법에 있어서 어떤 문제의 해법에 관한 고찰>이라는 제목의 논문이었다. 이 논문 속에 베이즈 역확률의 원점이 있었다. 베이즈는 이 발견을 그다지 중요하게 생각하지 않았던 듯 오랜 세월 방치해 두었고 그 때문에 몇 년에 집필이 된 것인지 명확하지 않다. 1740년대 말, 필경 1748년 혹은 1749년이었을 것으로 추측한다. 베이즈의 발견을 세상에 알린 것은 목사였던 그의 친구 리처드 프라이스였다. 프라이스는 베이즈 친척의 의뢰로 베이즈가 남긴 문헌을 조사했다. 그러다가 전술한 논문을 발견하여 사고방법을 정리한 뒤 1764년에 로열소사이어티의 《철학기요》에 논문을 발표했다. 이것이 베이즈 역확률이 첫 선을 보인 자리였다. 그러나 프라이스의 보고는 거의 주목받지 못했다. 그 흐름을 바꾼 것은 프랑스의 천재 수학자 라플라스의 연구였다. 라플라스는 천문학, 물리학, 수학에 많은 업적을 남긴 사람이었는데, 베이즈의 연구를 알기 전 이미 베이즈 역확률의 착상에 육박한 논문을 썼다. 그 후 프라이스의 연구를 전해 듣고는 그것이 자신의 초기 연구를 완성으로 이끌어줄 것임을 깨달아 1787년경에 단번
에 베이즈 역확률을 현재의 공식 형태로 완성해 냈다. 따라서 베이즈 역확률은 라플라스의 발견이라고도 볼 수 있다

표준 통계학과 어떤 점이 어떻게 다른가
베이즈통계는 인간의 심리에 의존한다

‘베이즈통계에는 수상쩍은 측면이 있다’는 말을 0-2절에서 언급했다. 무슨 뜻일까? 다시 말해 그것은 베이즈통계가 다루는 확률이 ‘주관적’임을 뜻한다. 즉 베이즈통계로 나오는 확률은 객관적인 수치가 아니라 ‘인간의 심리’에 의존한 주관적인 수치임을 뜻한다. 그런 의미에서 베이즈통계는 ‘사상적’인 면을 갖추고 있다. 그렇기 때문에 베이즈통계는 객관성을 중시하는 과학계로부터 ‘가짜’라는 낙인이 찍혀 한때 매장되었던 것이다. 대다수 베이즈통계 책에는 유감스럽게도 이러한 내용이 나오지 않는다. 그 까닭이 ‘공공연하게 알려지는 것’을 저자들이 싫어해서인지, 아니면 그들이 단순히 지식이 없어서인지는 알 수 없지만, 여하간 이에 대해 적나라하게 해설하고 있는 책은 흔치 않다. 하지만 이 베이즈통계의 ‘주관성’, ‘사상성’은 베이즈통계의 본질이자 편의성의 원천이다. 그래서 이를 외면한 채 해설을 한다면 베이즈통계의 본질은 결코 독자에게 전달되지 못할 것이다. 그래서 이 책에서는 베이즈통계의 ‘주관성’, ‘사상성’을 숨김없이 백일하에 드러내어 해설을 진행해 나갔다. 특히 표준 통계학과 어떤 점이 어떻게 다른가에 대해 정성껏 해설했다. 분명 많은 독자가 ‘베이즈통계, 대단한데? 흥미롭군!’ 하고 박수쳐 주리라는 기대를 가지면서 말이다.