본문 바로가기

책읽기

[핸즈온 데이터 시각화](잭 도허티, 일리야 일라얀코우 著, 김태헌 譯, 2022)

● 내돈내산

- 한빛미디어에서 <나는 리뷰어다> 활동을 2년째 하면서 한 달에 한 권씩 책을 받아보고 있다.

- 매달 메일로 목록을 받고 원하는 책 세 권을 회신하면 그 중 한 권을 받아 리뷰를 하는 구조.

- 간혹 진짜 원하는 책이 딱 한 권 있는데 그 책을 받지 못하는 경우가 있다. 

- 일(?)은 일대로 해야 하고 저 책은 읽고 싶고. 답답하지만 어쩔 수 없다.

- 그러면 내 돈을 주고 내가 살 수 밖에 없다. 리뷰 의무도 없다.

- 이 책이 그렇게 산 책이다. 그렇지만 리뷰를 남기지 않을 수 없다.

 

● 3분의 2만 데이터 시각화

- 이 책은 총 4개의 큰 단락으로 구성되어 있다: (1) 기본 기술, (2) 시각화 구축, (3) 코드 템플릿과 고급 도구, (4) 진실하고 의미 있는 스토리 전달하기

- 매우 짧은 네 번째 단락을 제외하고 나머지 세 단락의 비중이 150페이지 가량으로 비슷하다.

- 이 중 데이터 시각화는 (2)와 (3)에 집중적으로 나오고 (1)은 데이터 시각화보다 데이터를 읽는 방법 자체를 다룬다.

- 날선 눈으로 데이터를 바라보는 방법. 나도 모르게 잘못된 정보를 전달하지 않으며 구한 데이터를 검증하는 방법이다.

- 데이터 리터러시라고도 볼 수 있는데 이것만으로도 저자들의 진중함이 느껴진다. 

- 자기도 잘 못 보는 데이터를 남들에게 제대로 전달할 수 없기 때문이다.

- 저자들이 얼마나 진지한지 첫 단락을 읽는 동안 표지를 세 번은 다시 확인했다. "데이터 시각화 책 맞지?"

- 데이터 시각화를 표방한 책임에도 불구하고 이 책의 진수는 맨 첫 단락이라는 생각이 들 정도.

- 데이터를 다루는 이들이 알면서도 놓치기 쉬운 부분이기도 하고 기술 위주로 입문한 이들은 생각도 못 하는 부분도 많다.

 

● 단촐한 기법을 다양한 도구로 구현한다.

- 여러 데이터 시각화 서적을 보면, 이것도 그릴 수 있지!라고 외치는 것처럼 다양한 종류의 차트를 선보인다.

- Abela의 Chart Suggestion을 비롯해 목적에 맞는 시각화 형식이 중요함은 말할 것도 없지만 최근 너무 여기에 치우친 감이 있었다.

- 데이터 시각화 업체들도 "시각화 기법 공유!" 등의 제목을 걸고 여기 저기에 광고 글을 올리니 피로감이 더해진다.

- 이 책은 몇 가지 주의 사항을 제외하고는 많은 기법을 선보이지 않는다.

- line, bar, pie chart 등 기본 형식만을 빠르게 훑는데 파이썬이나 엑셀 같은 도구 뿐 아니라 웹 환경을 포함해 사용자가 접근할 수 있는 여러 환경에서 비슷한 그림들을 그린다.

- 제목에 있는 핸즈온(hands-on)이라는 단어는 보통 짧은 실습을 말하는데, 시각화 실습이 아니라 여러 도구를 사용하는 실습이라고 느껴질 만큼 다양한 도구를 다룬다.

- 이 도구를 모두 사용해야 한다는 뜻은 아니다.

- 저자가 초반에 말했듯 "내가 이미 쓰고 있는 도구가 가장 좋은 도구"이며,

- 간혹 새로운 상황을 만났을 때 더 좋을 수 있는 도구를 알려줄 뿐이다. 

 

● 지도 데이터를 이렇게나?

- 내가 본 대부분의 데이터 시각화 서적에서 지도 데이터는 마지못해 다룬다는 느낌이 들 만큼 살짝 건드리고 지나간다.

- 지도 데이터 외에도 다뤄야 할 내용이 매우 많은 것이 첫 번째,

- 지도 데이터를 다루는 이들이 일부에 한정되어 있다는 것이 두 번째,

- 지도 데이터를 다루는 라이브러리와 도구가 따로 있어 전체의 흐름이 깨진다는 것이 세 번째 이유라고 생각된다.

- GIS 하시는 분들은 ArcGIS, QGIS를 많이 사용하기 때문에 별도의 서적에서 커버가 되는 것도 사실이다.

- 그런데 이 책은 이렇게까지 해야 하나 싶을 만큼 지도 데이터를 많이 다룬다.

- 거꾸로, GIS를 다루는 이들에게는 매우 반가운 책이 될 수 있다. 지도 데이터를 다루는 도구를 선택할 수 있는 폭이 넓어지기 때문이다.

 

● 정말 독특한 책

- 일단 사놓고, 언뜻 보고 나서 엑셀 책인 줄 알았다.

- 스프레드 시트 화면이 초반에 적지 않게 나와서인데 알고보니 구글 시트였고,

- 엑셀을 치워버리고 싶어질 만큼, 구글 시트에서 활용할 수 있는 여러 데이터 검수 도구를 사용하는 법을 함께 알려준다. 

- 코드 없이 그림만 보여주는 책이 많은데 이 책은 참 다양한 코드와 도구를 함께 보여준다.

- 첫 단락은 모두에게 유익할 것이 분명하나 이후는 호불호가 갈릴 것 같다.

- "이런 기술도 있었네?" 하면서 도움을 크게 받을 분도 있을 것이고,

- "내용은 많은데 정작 내가 쓸 기술은 없네?" 하면서 무심하게 페이지를 느낄 분도 있을 것 같다.

- 특히 지도 데이터와 거리가 먼 분은 많이 심드렁해질 수도 있다.

- 각자 자기에게 맞는 내용을 잘 찾아가시면 좋겠다.

- 다만, 제목은 내용에 비해 너무 거창한 것이 아닌가 싶다.