부대이북] 데이터 분석가의 숫자유감
리디셀렉트에 아티클 서비스가 존재할 당시 몇 번 재밌게 봤었는데 잘 정리된 한 권의 책으로 만나니 반갑다.
그림작가님의 작업이 마음에 들었다. 내용 잘 살리려고 고민 많이 하셨을 것 같다.
아무래도 가장 기억에 남는 목차는 '1화 상관관계와 인과관계'일 것이다.
"특히 1940년대 보건 전문가는 소아마비와 아이스크림 섭취 간에 상관관계가 있다는 것을 발견하고, 소아마비 예방을 위해 아이스크림을 적게먹을 것을 권고했다.하지만 한참 후에 단순히 소아마비가 여름에 많이 발병하고, 아이스크림도 여름에 주로 팔린다는 사실이 밝혀졌다. 소아마비와 아이스크림 섭취 간에는 어떤 인과관계도 없었고, 그저 '날씨'라는 외생 변수가 소아마비와 아이스크림 변수에 공통으로 영향을 주었을 뿐이다."
소아마비와 아이스크림 간의 상관관계와 인과관계는 기억에 오래 남을 것 같다.
(대대손손 좋은 이야깃거리로 남게 된 보건 전문가님 안되었다. 본인은 사명을 가지고 말했을 텐데 흑흑)
'요즘 마케팅본부에서 데이터 꼼꼼히 하면서 보고하기 시작한 거 참 좋긴 한데, 오히려 전보다 결과가 없는 같아요?' ---> 내 심정
멋진 작품을 이상하게 꼬아보게 되어 나 자신도 이상한 기분인데,
회사에서는 빠른 의사결정이 무엇 보다도 중요할 것인데,
데이터 분석가는 책 한 권 동안 내내 "그 데이터는 의미 없다, 95% 신뢰구간에서 유의미하게 증가한 것은 아니다" 라고 말을 하니, 아니 그럼 어쩌라는 건가 싶은 것이다.
예를 들어 A/B 두 사안 중에 무엇을 선택하여 광고할 것인가 의사 결정을 (빨리) 해야 하는데 시종 일관 "더 오랜 기간의 관찰이 필요하다. 우연에 의해서도 발생할 수 있는 차이다. 데이터 상으로 의미가 없다." 이런 태도가 내내 지속되니 (작가가 데이터 분석가로 활동하면서 속 터지고 답답한 경우가 많아 이렇게 표현하셨겠지만 나 같은 문외한은 이상하게 받아들이게 된다) 나중에는 그럼 늬들(데이터 분석가)은 하는 게 뭔데? 일(아니면 중요한 의사결정) 다~ 끝나고 나서 마지막으로 정리하는 것만 할 수 있는 거니? 싶은 것이다.
라벨: 감상문
0개의 덧글:
댓글 쓰기
에 가입 댓글 [Atom]
<< 홈