본문 바로가기

책 리뷰/비문학

모두 거짓말을 한다- 구글 빅데이터의 활용

모두 거짓말은 한다 - 욕망의 사실화

 

제목만 들어도 굉장히 흥미를 끈다.

 

책 표지만 봐도 구글트렌드로 밝혀낸 충격적인 인간의 욕망

미국 대선과 브렉시트를 예견한 유일한 데이터

 

 

 

 

 

구글 검색에서 사람들은 정말로 솔직해진다.

현실에서는 말하기 힘든 것들은 검색으로는 자기의 100%의 욕망을 가감없이 검색하고 정보를 얻는다.

얼마나 재미있는가?

 

굉장히 흥미로운 조사가 있는데 작가는 미국에서 가장 영향력있고 권위 있는 정보원으로 여겨지는 종합사회조사의 자료를 분석했다.

결과 이성애자인 여성은 평균적으로 연간 50회의 섹스를 하고 그중 콘돔 사용률은 16%이다. 계산해보면 연간 16억개의 콘돔이 사용된다는 것이다.

하지만 남자들은 매년 16억개의 콘돔을 사용한다고 한다. 정의상 두개는 동일 해야는데 진실을 말하는 쪽은 어디일까?

 

정답은 둘 다 아니다. Nielsen에 따르면 매년 판매되는 콘돔은 6억개에도 못 미친다.

그럼 결론은?

숫자의 차이이지 남,여 모두 거짓말을 하고 있는 것이다.

남자뿐만 아니라 여성도 섹스의 횟수를 부풀린다는 것은 정말 새로웠다.

 

위에서 작가가 언급했던 내용이 다시 나오는데 데이터 과학은 프로이트 이론의 많은 부분은 반증 가능하게 만든다.

현대에서는 인터넷을 통한 데이터연구가 가능해졌는데 프로이트의 이론이 어느정도 맞다고 하는 증거가 나온다.

 

유명 포르노 사이트 방문자 중 엄청난 수의 사람이 근친상간을 묘사한 포르노를 찾는다.

남성,여성 둘 다 포함이다. 남성의 경우 누나나 엄마에 관련해서 여성의 경우 보통 아빠와 연관된 것들의 검색 수가 높았다고 한다.

이 데이터가 바로 프로이트가 말한 오이디푸스 콤플렉스의 반증이라고 본다.

프로이트는 반대 성 부모와의 성 경험에 대한 욕구가 어린 시절에는 보편적이나 이후에는 억압된다고 가설을 세웠다.

구글 검색은 그러한 욕구가 있는 사람이 많다는 것을 보여준다

 

프로이트가 살아있던 시절의 경우 이런 데이터 분석은 할 수 가 없었다.

아니 불과 10년전만 해도 말이다.

즉 빅데이터가 이렇게 큰 힘을 가지게 되었는데 네가지의 힘이 있다고 설명은 한다.

 

1. 새로운 유형의 데이터 제공이 빅데이터의 첫번째 힘이다.

현 사회과학자들은 포르노데이터를 거의 이용하지 않는다.

하지만 그 검색과 관람 데이터의 광범위한 이용은 인간의 성적 취향을 이해하는 우리의 역량에서 가장 중요한 부분이다.

유명한 철학자들이 살았던 시대에는 존재하지 않았던 데이터이고 지금에서야 존재한다.

 

2. 솔직한 데이터 제공은 빅데이터의 두 번째 힘이다.

포르노 데이터와 구글 검색 데이터는 새로울 뿐만이 아니라 솔직하다.

이전에는 모두 숨기고 지내왔지만 익명성이 보장되는 현재는 그렇지 않다.

정말로 무엇을 원하는가에 대해 이야기 할 수 있는 것이다.

 

3. 작은 집단도 클로즈업해서 볼 수 있는 것이 빅데이터의 세 번쨰 힘이다.

데이터가 너무 많아서 작은 규모의 집단에 관한 유의미한 데이터로 추려질 수 있다.

 

4. 인과적 실험의 실행 가능성이 빅데이터의 네 번째 힘이다.

빠른 통제실험을 할 수 있다는 점이다. 즉 단순 상관관계만 아니라 인과관계도 확인이 가능하다.

 

 

 

도박에 대해서도 이야기가 나오는데 꽤나 흥미롭다.

카지노는 고객들의 성향을 파악하기 위해 도플갱어 수법을 쓰는데 기업들의 목표는 무엇일까?

가능한 최대의 이윤을 얻는 것이지만 고객이 또 다시 방문을 하게 하여야 하는 것이다.

 

원리는 도박하는 사람들에게는 '페인 포인트'가 있다. 이는 긴 시간동안 카지노를 찾지 않게 만들만큼 사람을 겁먹게 만드는 손실액이다.

예를 들어 헬렌이라는 사람의 페인 포인트는 3,000달러라 가정해보자.

그녀가 3,000달러를 잃으면 카지노는 꽤 오랜기간 손님 하나를 잃는다.

물론 2,999달러를 잃어도 헬렌은 즐겁지는 않을 것이다. 하지만 그녀는 다음 날 밤에 카지노를 다시 찾지 않을 정도로 의기소침해 지지는 않는다.

 

당신이 카지노의 경영자라고 생각해보면 최적의 결과는 무엇일까?

헬렌이 페인 포인트를 넘지 않고 그에 가까운 돈을 잃는 것이다. 즉 2999달러를 잃게 하는 것이다. 많은 수익도 얻고 고객도 잃지 않는 것이다.

방법은 헬렌이 돈을 꽤 잃으면 게임을 멈추게 하는 것이다.

 

그치만 헬렌의 페인 포인트를 어떤식으로 알 것인가?

여기서 데이터 과학이 나온다. 수많은 고객들에 관한 가능한 모든 정보를 얻는다. 그러고 도박습관으로부터 그들의 페인포인트를 추산한다.

헬렌에 대해 정보를 모아 그녀와 유사한 고객인 도플갱어를 찾으면 된다.

정교한 데이터를 분석해 이용하고 고객에게서 긴 시간동안 가능한 많이 짜내는 것이다.

 

물론 조금 다른 이야기지만 소비자라고 해서 늘 당하는 것은 아니다.

우리는 비교쇼핑사이트이 부킹닷컴이나 카약과 같은 기업들과 비교해 정보를 얻을 수 있는 것이다.

고객들 역시 반드시 피해야 할 기업에 대해 알 수있는 것이다. 모두가 공평한 싸움을 할 수 있게끔 도와줄 수 도 있다.

 

 

책에서는 다양한 주제로 이야기가 나온다.

여러가지로 흥미로운 정치, 인종차별, 낙태, 섹스, sns 그리고 왜 거짓말을 하는지에 대해서 말이다.

 

개인적으로는 책에 대한 기대감이 너무 컸던 탓일까 생각보다는 내용이 너무 나열하는 식으로 되어 있어서 다 읽기는 했다만

그렇게까지 추천을 하지는 않는다.

대략 5점 만점이라면 3.5점 정도???

 

구글 검색은 우리가 바라보는 세상과 다른 그림을 보여준다.

여러분들의 진짜 생각을 말이다.