본문 바로가기

책읽기

[데이터 시각화 교과서] (Fundamentals of Data Visualization. 클라우스 윌케, 2020)

  • 연구를 하겠다고 대학원에 간 이공계 학생들은 예상치 못한 벽을 둘 만난다.
    • 하나는 영어. 논문을 읽는건 그렇다 쳐도 길게는 수십페이지의 글을 써야 한다.
    • 또 하나는 그림. 학회발표, 과제발표, 랩미팅 등 PPT를 끼고 살고, 논문 그림도 작업량이 많다.
  • 많은 신입생들이 "난 공돌이라 이런거 못해", 또는 "못해도 돼" 라고 합리화를 한다.
    • 그러나 영어와 그림의 중요성은 조금만 지나도 알게 되는 일.
    • 랩미팅때 교수님에게 호통을 듣기도 하고 선배들에게 꾸지람을 듣는다.
    • 감이 있는 학생들이 간혹 등장하는데, 이들은 자신의 의지와 무관하게 이런 일을 전담하게 된다.
    • "외부 발표자료는 반드시 OOO학생의 검토와 수정을 받도록"이라는 교수님 지시가 떨어지면 많은 학생들은 안도의 한숨을 쉬는 반면, 이 담당 학생은 자기 일도 못하고 밤을 새게 된다.
    • 그리고, 이렇게 버릇이 잘못 들면 학생이나 교수나 "이런건 애들 시키면 되지"라면서 무능의 길로 간다.
  • "데이터 시각화 교과서"
    • 데이터 시각화라는 단어가 낯설게 느껴질 분들도 있겠으나, 우리가 실험결과, 시뮬레이션 결과, 통계 자료를 그래프로 표현하는 모든 과정이 데이터 시각화Data Visualization이다.
    • 이 책에는 "데이터 시각화 교과서"라는 다소 딱딱하면서도 거만하게 들릴 수 있는 제목이 붙어 있다.
    • 우리가 교과서를 가지고 한 학기, 또는 1년을 제대로 배우면 그 분야에 대해 깊지는 않더라도 전반적인 지식과 시야를 가지게 되는 것처럼 약 360 페이지 분량의 책을 읽으면 적어도 이렇게 그리지 말자최대한 이렇게 그리자는 두 가지 범주의 내용이 머리속에 어느 정도 정리된다.
  • 결과물만 있고 과정은 없다.
    • 데이터 시각화 프로그램은 가장 많이 쓰는 ExcelOrigin을 비롯해 R, Python 같은 프로그래밍 언어가 있고, 전문적인 프로그램으로 Power BI, Tableau, Spotfire등도 있다.
    • 최근 출판되는 많은 시각화 도서가 좋은 그래프 예제를 보여주고 어떻게 그리는지 step by step으로 과정을 친절하게 안내하는데 반해 R의 ggplot을 사용해서 만들어진 이 책은 코드를 본문에 제공하지 않는다.
    • "어떤 도구를 선택하든 무난하게 읽을 수 있는 책이 되기를" 원했던 저자의 의도이고, 대신 github를 공개하고 있기 때문에 원하면 소스를 내려받아 사용할 수 있다.
    • 책의 예제들을 Python으로 포팅을 해볼까 싶었으나 시간이 너무 많이 들어갈 것 같고, 간혹 어떻게 해야 이렇게 그릴지 모르는 것들이 있어 포기했다. - 구글링을 해봐도 안나오는 걸 보면 나와 비슷한 생각들을 하신 것 같다.
  • 필독서로 지정하고 싶다.
    • 교과서라는 제목처럼 데이터를 그림으로 그려내야 하는 사람들을 위한 책이다.
    • 나 스스로도 많이 부족하지만, 회의실 화면을 채우는 조악한 그림을 참기 힘들 때가 너무 많다.
      • "여기를 자세히 보시면" → 미리 좀 키워서 옆에 붙여줬으면 되잖아요
      • "잘 보이실지 모르겠는데" → 잘 보이게 그려오지 그러셨어요
      • 반사효과, 그림자가 포함된 현란한 3D 그래프 → 특히 경영, 예산, 성과 관련. 헷갈리게 하는게 의도죠? 
      • 강조는 무조건 빨간 글씨 → 다 좋은데 회색이나 초록 위에 빨강을 올리시면 글자 안보입니다.
    • 그렇다고 그림에 신경을 쓰기 시작하면, 데이터보다 더 예쁜 그림을 만들려고 애를 쓰는 경우가 많다.
      • 무의미한 무지개색을 입힌다거나 → 본문에도 언급되어 있지만 rainbow colormap은 피해야 한다.
      • 3D 그림을 그린다거나 → 숫자를 알아보기는 더 어려워진다.
      • 파워포인트에서 그림을 그린다거나 → 의외로 여러번 겪었다. 데이터 전체, 발표자까지 못 믿게 된다.
    • 데이터를 효과적으로 전달하는 것이 먼저, 아름다움을 (그에 못지 않게) 그 다음으로 챙겨야 한다.
      • 상대에 따라 간략과 상세를 조절해야 하고
      • 핵심 메시지를 왜곡 없이 전달해야 한다.
    • 데이터와 시각화 프로그램의 종류에 관계 없이, 그래프를 그리는 이들이라면 무조건 일독을 권한다.