본문 바로가기

책읽기

[사례 분석으로 배우는 데이터 시각화](황재진, 윤영진 著, 2022)

데이터 시각화 (Data Visualization, 데이터 가시화)

- 숫자 등으로 알아보기 힘들게 나열된 데이터를 그림으로 표현하는 일.

- 누군가에게는 궁극의 목적지이고 누군가에게는 수단일 뿐일 수도 있다.

- 데이터와 목적에 따라 결과물이 천차 만별이지만 전달력을 향상시키는 정석이 존재하는 것도 사실이다.

- 이 정석을 전달하려는 노력이 많지만 막상 예를 들자면 데이터가 너무 다양하고 방법이 다양해 전달이 쉽지 않다.

 

● Tableau

- 이 책의 저자들은 태블로를 사용해 데이터를 불러와 그림으로 변환하는 방법을 체계적으로 소개하고 있다.

- 태블로는 복잡한 명령어 없이 직관적으로 데이터 항목을 끌어다 놓는 방식을 사용하기 때문에,

- 명령어를 외우느라 에너지를 소비하는 일 없이 데이터의 메시지 전달에 집중하게 해 준다.

- 통계 분석이나 머신 러닝 모니터링 등 과정의 관점이라면 R이나 파이썬이 적합할 수 있지만,

- 데이터 시각화에 집중하기 위해서라면 태블로와 같은 GUI 기반의 도구가 더 적절할 수 있다.

 

● 책에 담긴 저자들의 고민

- 제한된 공간에 데이터 시각화의 목적부터 유형별 사용법을 거쳐 대시보드와 스토리까지 이어간다.

- 마지막으로 데이터 시각화 사례 네 가지를 보여주는 것으로 책을 마무리하는데,

- 각 부분은 전달력을 높이기 위한 이론 부분과 구현 방법을 설명하는 방법으로 나뉘어 있다.

- 이론 부분은 완성도가 낮은 그림을 차례로 높여가는 방식을 사용하는 지점에서,

- 실전 부분은 단계적으로 이론과 실전을 함께 전달하고자 하는 고민이 느껴진다.

 

● Chapter 3. 시각화 목적별 시각화 유형

- 막대, 선, 파이, 점 등등. 여러 형태의 그래프가 있고, 같은 데이터를 여러 가지로 표현할 수 있다.

- 하지만 마음대로 할 수 있다고 해서 아무렇게나 해도 되는 것은 아니다.

- 막대는 차이, 선은 변화, 파이는 비율, 흩뿌려진 점은 관계를 나타내기에 좋다.

- 여기에 가로와 세로로 놓이는 막대의 차이와 활용법, 기준선의 적절한 활용, 범주가 둘 이상일 때 등.

- 저자들은 실전에서 만나는 많은 경우마다 대응법을 최대한 친절하게 알려준다.

 

● Chapter 4. 대시보드와 스토리 만들기

- 저자들이 여러 데이터 시각화 도구 중 태블로를 택한 이유가 여기 있지 않나 싶다.

- Chapter 3까지는 어떤 도구를 택하더라도 보편적으로 적용될 수 있는 항목인데 반해

- 대시보드와 스토리는 태블로가 가지는 장점이기 때문이다. 

- R의 Shiny 등이 태블로의 대시보드와 경쟁할 수 있겠지만, 코딩을 하지 않아도 된다는 점이 큰 장점이다.

 

● 거듭되는 질문과 자문자답을 통한 전달력 향상

- 데이터 시각화는 데이터 분석 도구로 쓰일 때 그 효용이 극대화된다.

- 이 때 중요한 것은 기계적으로 어딘가에서 본 순서에 따라 진행하면 안 된다는 것이다.

- 문제를 해결하기 위해 데이터를 보면서 한 단계씩 솔루션에 접근해야 한다.

- 그러자면 매 순간 가설을 세우고, 그 가설을 검증하기 위한 데이터를 선택해 시각화하여 검증하는 과정을 반복해야 한다.

- 많은 곳에서 이런 가설 수립과 검증 반복이 강조되고 있지만 이 책에 이 과정이 잘 드러나 있다.

- 태블로는 잊어버리더라도 이 과정이 깊이 배일 수 있다면 그것만으로도 가장 중요한 핵심을 배웠다고 볼 수 있을 것 같다.

 

● 하나 아쉬운 점

- 분량의 한계로 인해 이 중요한 내용의 무게가 잘 전달될까 싶은 괜한 걱정이 든다.

- 이 책을 보시는 분이 있으시다면, 일부러 조금 천천히 읽으시면 좋겠다.

- 저자들이 담고자 했던 깊이를 충분히 받아가시기 바란다.

 

※ 한빛미디어 2022 도서 서평단 "나는 리뷰어다"의 일원으로 도서를 제공받아 작성한 리뷰입니다