● 내돈내산
- 한빛미디어에서 <나는 리뷰어다> 활동을 2년째 하면서 한 달에 한 권씩 책을 받아보고 있다.
- 매달 메일로 목록을 받고 원하는 책 세 권을 회신하면 그 중 한 권을 받아 리뷰를 하는 구조.
- 간혹 진짜 원하는 책이 딱 한 권 있는데 그 책을 받지 못하는 경우가 있다.
- 일(?)은 일대로 해야 하고 저 책은 읽고 싶고. 답답하지만 어쩔 수 없다.
- 그러면 내 돈을 주고 내가 살 수 밖에 없다. 리뷰 의무도 없다.
- 이 책이 그렇게 산 책이다. 그렇지만 리뷰를 남기지 않을 수 없다.
● 3분의 2만 데이터 시각화
- 이 책은 총 4개의 큰 단락으로 구성되어 있다: (1) 기본 기술, (2) 시각화 구축, (3) 코드 템플릿과 고급 도구, (4) 진실하고 의미 있는 스토리 전달하기
- 매우 짧은 네 번째 단락을 제외하고 나머지 세 단락의 비중이 150페이지 가량으로 비슷하다.
- 이 중 데이터 시각화는 (2)와 (3)에 집중적으로 나오고 (1)은 데이터 시각화보다 데이터를 읽는 방법 자체를 다룬다.
- 날선 눈으로 데이터를 바라보는 방법. 나도 모르게 잘못된 정보를 전달하지 않으며 구한 데이터를 검증하는 방법이다.
- 데이터 리터러시라고도 볼 수 있는데 이것만으로도 저자들의 진중함이 느껴진다.
- 자기도 잘 못 보는 데이터를 남들에게 제대로 전달할 수 없기 때문이다.
- 저자들이 얼마나 진지한지 첫 단락을 읽는 동안 표지를 세 번은 다시 확인했다. "데이터 시각화 책 맞지?"
- 데이터 시각화를 표방한 책임에도 불구하고 이 책의 진수는 맨 첫 단락이라는 생각이 들 정도.
- 데이터를 다루는 이들이 알면서도 놓치기 쉬운 부분이기도 하고 기술 위주로 입문한 이들은 생각도 못 하는 부분도 많다.
● 단촐한 기법을 다양한 도구로 구현한다.
- 여러 데이터 시각화 서적을 보면, 이것도 그릴 수 있지!라고 외치는 것처럼 다양한 종류의 차트를 선보인다.
- Abela의 Chart Suggestion을 비롯해 목적에 맞는 시각화 형식이 중요함은 말할 것도 없지만 최근 너무 여기에 치우친 감이 있었다.
- 데이터 시각화 업체들도 "시각화 기법 공유!" 등의 제목을 걸고 여기 저기에 광고 글을 올리니 피로감이 더해진다.
- 이 책은 몇 가지 주의 사항을 제외하고는 많은 기법을 선보이지 않는다.
- line, bar, pie chart 등 기본 형식만을 빠르게 훑는데 파이썬이나 엑셀 같은 도구 뿐 아니라 웹 환경을 포함해 사용자가 접근할 수 있는 여러 환경에서 비슷한 그림들을 그린다.
- 제목에 있는 핸즈온(hands-on)이라는 단어는 보통 짧은 실습을 말하는데, 시각화 실습이 아니라 여러 도구를 사용하는 실습이라고 느껴질 만큼 다양한 도구를 다룬다.
- 이 도구를 모두 사용해야 한다는 뜻은 아니다.
- 저자가 초반에 말했듯 "내가 이미 쓰고 있는 도구가 가장 좋은 도구"이며,
- 간혹 새로운 상황을 만났을 때 더 좋을 수 있는 도구를 알려줄 뿐이다.
● 지도 데이터를 이렇게나?
- 내가 본 대부분의 데이터 시각화 서적에서 지도 데이터는 마지못해 다룬다는 느낌이 들 만큼 살짝 건드리고 지나간다.
- 지도 데이터 외에도 다뤄야 할 내용이 매우 많은 것이 첫 번째,
- 지도 데이터를 다루는 이들이 일부에 한정되어 있다는 것이 두 번째,
- 지도 데이터를 다루는 라이브러리와 도구가 따로 있어 전체의 흐름이 깨진다는 것이 세 번째 이유라고 생각된다.
- GIS 하시는 분들은 ArcGIS, QGIS를 많이 사용하기 때문에 별도의 서적에서 커버가 되는 것도 사실이다.
- 그런데 이 책은 이렇게까지 해야 하나 싶을 만큼 지도 데이터를 많이 다룬다.
- 거꾸로, GIS를 다루는 이들에게는 매우 반가운 책이 될 수 있다. 지도 데이터를 다루는 도구를 선택할 수 있는 폭이 넓어지기 때문이다.
● 정말 독특한 책
- 일단 사놓고, 언뜻 보고 나서 엑셀 책인 줄 알았다.
- 스프레드 시트 화면이 초반에 적지 않게 나와서인데 알고보니 구글 시트였고,
- 엑셀을 치워버리고 싶어질 만큼, 구글 시트에서 활용할 수 있는 여러 데이터 검수 도구를 사용하는 법을 함께 알려준다.
- 코드 없이 그림만 보여주는 책이 많은데 이 책은 참 다양한 코드와 도구를 함께 보여준다.
- 첫 단락은 모두에게 유익할 것이 분명하나 이후는 호불호가 갈릴 것 같다.
- "이런 기술도 있었네?" 하면서 도움을 크게 받을 분도 있을 것이고,
- "내용은 많은데 정작 내가 쓸 기술은 없네?" 하면서 무심하게 페이지를 느낄 분도 있을 것 같다.
- 특히 지도 데이터와 거리가 먼 분은 많이 심드렁해질 수도 있다.
- 각자 자기에게 맞는 내용을 잘 찾아가시면 좋겠다.
- 다만, 제목은 내용에 비해 너무 거창한 것이 아닌가 싶다.
'책읽기' 카테고리의 다른 글
[당신은 다른 사람의 성공에 기여한 적 있는가?](이소영 著, 2021) (0) | 2022.10.15 |
---|---|
[대시보드 설계와 데이터 시각화](스티브 웩슬러, 제프리 섀퍼, 앤디 코트그리브 著, 최윤석 譯, 2018) (0) | 2022.10.03 |
[데이터 시각화 입문](후지 토시쿠니, 와타나베 료이치 著, 김태현 譯, 2020) (0) | 2022.10.01 |
[혼자 공부하는 머신러닝+딥러닝, 파이썬](혼공머신: 박해선 著, 혼공파: 윤인성 著, 2021) (2) | 2022.10.01 |
[개발자를 위한 머신러닝&딥러닝](로런스 모로니 著, 박해선 驛, 2022) (0) | 2022.09.30 |