본문 바로가기

책읽기

[데이터 과학자 원칙](이정원, 권시현, 권정민, 김영민, 김진환, 박준석, 변성윤, 이진형, 이제현 著, 2023)

● 21세기 가장 섹시한 직업에서 번아웃의 상징으로

- 2016년 알파고의 등장과 함께 휘몰아친 딥러닝의 흥분이 잠시 잠잠해지며 "데이터"라는 말이 많이 들렸다.

- 알고보니 진작 하버드 비즈니스 리뷰에 "21세기 가장 섹시한 직업" 이라고 일컬어졌고 (2012.10. 링크)

- 연봉이 2억부터니 숙련자는 몇억이니 하는 이야기가 언론을 덮었다.

- 하지만 작년 말 조사는 분위기가 완전 다르다.

- 데이터 과학자의 97%는 번아웃에 빠져 있고 79%는 업계 탈출을 고민한다고 한다. (2022.12. 링크)

- 이유는 데이터 수집, 관리, 활용 체계가 갖춰지지 않아서, 데이터 분석은 커녕 결함 해결에 지쳐서이고

- 그 와중에 고용주로부터는 비현실적인 기대를 받으며 비난의 대상이 되기 쉬운 환경에 놓여서라 한다.

 

● 3대 거짓말

- 노인의 "빨리 죽어야지", 상인의 "밑지고 팔아요", 결혼적령기 여성의 "시집 안가요"가 3대 거짓말이라는데

- 최근의 경향을 볼 때 세번째 내용은 데이터 과학자 고용주"우리 데이터 많아요"로 바뀌어도 될 것 같다.

- 경험에 비추어볼 때 저 지적은 대체로 사실이다.

- 자기 하드에 모아둔 파일을 데이터베이스라 부르는 현업 동료들 : 내가 필요할 때 가져올 수 없다.

- 기계가 읽기 부적절한 형태의 자료 : pdf, hwp 등 문서가 데이터면 들판의 황소가 스테이크다.

- 데이터를 그저 읽으려 해도 담당자의 지식이 결합해야 하는 상황 : 이런 걸 비밀번호가 필요한 암호라고 부른다.

- 기존의 방식으로는 문제 없이 일을 하던 분들이고, 데이터 담당자 입장에서만 문제가 있는 거라 어필하기도 어렵다.

- 속앓이가 거듭되다 보니 데이터를 다루기 전에 비해 성격이 몹시 나빠진 것이 느껴진다.

- 다행인지 불행인지 나만 그런 건 아니다. 알고 보니 거의 모든 곳이 이렇다. 

 

● 그럼에도 불구하고

- 열악한 환경에도 불구하고 고군분투하는 사람들이 있다.

- 바다 건너 나라처럼 연봉을 수억 받는 것도 아닌데 이런 시기에 데이터를 붙들고 있는 사람들을 보면,

- 비장하지까지는 않더라도 상당한 고집을 부리는 모습들이 보인다.

- 코로나도 끝났는데 평일 저녁 퇴근 후 밤 늦게까지 온라인 강의를 듣고 주말엔 사설 컨퍼런스를 다니고,

- 심지어 회사 안에 스터디 모임을 만들거나 돈을 받는 것도 아닌데 강연을 한다.

- 시키지도 않았는데 때로는 동료나 상관과의 마찰을 감수해가며 사내 데이터 파이프라인을 깐다.

- 이만하면 됐다고 그냥 하라고 하는 파트너에게 오류를 일일이 찾아 앞으로 예방할 방안까지 제시한다.

- 네트워크, 코드랑만 노는 게 아니라 사람들을 몰고다니며 일종의 분위기를 만들기도 한다.

 

● 왜 그럴까

- 이런 분들과 비슷한 입장에 처한 사람으로서 이유를 대신 말해주자면, 살아남기 위한 몸부림이다.

- 이렇게 해서 더 좋아진다기보다 이렇게 하지 않으면 일을 할 수 없는 환경에 처해있기 때문이고

- 이들에게 하라는 AI 개발, 데이터 분석은 안하고 무슨 쓸데없는 일만 하냐고 할 수 있겠지만

- 황무지 앞에 선 소작농은 지주가 뭐라건 맨 땅에 쟁기질부터 하지 않을 수 없는 법이다.

- 이 돌무더기 잡초땅에 씨를 뿌려봐야 수확을 기대하기 어렵다는 걸 알기 때문이다.

- 수년간 생존을 위해 고집을 부리며 살다 보면 나름의 원칙이 생기기 마련이다.

 

● 데이터 과학자 원칙

- 연초 출판사로부터 집필 제의를 받았을 때는 편하게 쓸 수 있을 것 같아 합류했고

- 데이터 커뮤니티를 통해 알게 된, 존경하는 마음으로 바라보는 분들과 함께 해서 놀랐다.

- 원고를 보내고 책을 기다리며 어떤 서평을 쓰게 될지 상상해봤다.

- 나를 제외한 8분의 글을 한 단락씩 짧게 요약할 생각을 하고 있었는데,

- 막상 원고를 읽고 보니 모두 각자의 환경에서 인프라와 인적 네트워크를 포함, 스스로의 밭을 일구는 분들이다.

- 경험과 깊이가 나보다 훨씬 깊을 뿐, 다른 저자 분들의 글에서도 낯익은 향기가 난다.

 

● 제발 그만해...! 나 무서워! 이러다가 다 죽어!!!

- <오징어게임> 중 오일남 할아버지의 대사.

- 데이터 팟캐스트 <데이터홀릭>의 어느 날 부제이기도 하다. (2023.03.30. 링크)

- 최근 ChatGPT를 비롯한 언어모델은 데이터 분석까지 자동으로 수행하기 시작했다.

- 조만간 공개될 MS Excel Copilot은 몇 마디 말로 통계 분석과 멋진 그래프를 그려줄 것이다.

- AI 연구자들이 스스로의 목을 조르고 있다는 표현도 있지만

- 표면에 드러난 극심한 변화를 따라가기 위해 필요한 것은 탄탄한 기본기다.

.