Activities/리뷰

[책 리뷰] 데이터 과학자 원칙

채얼음 2023. 12. 16. 21:27

 

데이터 과학자 원칙 표지

 
 
- 제목: 데이터 과학자 원칙
- 저자: 권정민, 권시현, 김영민, 김진환, 박준석, 변성윤, 이정원, 이진형, 이제현
- 출판사: 골든래빗
- 출반사 책 설명:
“데이터 과학자는 뭐하는 사람일까? 지금처럼 하면 되는 것일까? 나도 선배 데이터 과학자들처럼 성장할 수 있을까? 3년 10년 후에도 생존할 수 있을까? 데이터 분석 환경이 이다지도 척박한데 어떻게 데이터 분석을 한단 말인가? 팀워크는, 팀빌딩은 도대체 어떻게 해야 하는 걸까?” 데이터 과학자로 살아가면서 하루에도 천 번을 되묻는 물음에 아마존, IDT, 빅쏠, 우아한형제들, 코드스테이츠, 쏘카, 삼성전자, 11번가, 페블러스 전현직 데이터 과학자 9명이 답합니다. 데이터 과학자, 데이터 엔지니어, 데이터 분석가뿐만 아니라 데이터를 활용하는 비즈니스 조직의 리더라면 지금까지 만나볼 수 없었던 생존과 성장의 원칙에서 자신만의 해답을 찾아보세요.
 
 
 
3줄 책 리뷰
데이터 잡부라고 스스로를 칭하는 모든 이들에게 도움이 될 만한 책입니다!
사수가 없는 경우에도, 사수가 있지만 이렇게 해도 되는 걸까 싶은 막연한 의문에 질문하기 힘든 경우에도 도움이 될 이야기들이 담겨 있습니다.
평소 데이터 관련 직무에서 일하면서 커리어 방향성이나 일하는 태도에 대해 배우고 싶었던 사람에게는 특히 유용한 책일 것 같습니다! 👍🏼

 

자세한 책 리뷰

이 책에 대한 존재를 알게 되었던 계기는 2가지였습니다.

첫 번째는 제가 참여하고 있는 '글또' 커뮤니티를 운영하고 계신 변성윤 님의 글이 실렸다는 소식으로,

두 번째는 데가 다니는 회사의 리더분이 추천사를 작성하셨다는 소식으로 책을 알게 되었습니다.

책의 존재를 알자마자 읽고 싶었지만, 생각보다 늦게 완독하고 후기를 남기게 되었네요. ㅎㅎ

 

데이터 관련 업무를 하는 사람 중에 완벽한 데이터 파이프라인으로 오류가 없는 데이터를 수집하고, 완벽하게 준비된 플랫폼에서 데이터 분석으로 하고, 모델을 만드는 사람은 없을 것입니다.

(있다면 어느 회사인지.. 저에게 꼭 비댓 남겨주세요😉)

 

그래서 저는 데이터 과학자라는 직무가 아직 어렵고 모르겠다고 느끼는 주니어~중니어까지의 데이터 과학자분들께 이 책을 추천합니다.

(저도 데이터 사이언티스트라는 이름을 달고 회사에서 일한 지 2년 차입니다.)

특히 회사에 사수가 없거나, 있더라도 본인이 질문하고자 하는 바가 무엇인지 정확히 이해하지 못하는 분들께 추천합니다.

 

 

추천하는 가장 큰 이유는 데이터 분야에서 오래 일하신 분들의 생각과 경험, 그로부터 만들어진 원칙을 집에서 습득할 수 있다는 점입니다.

이런 분들을 오프라인에서 커피챗 혹은 행사를 통해 만나기란 쉽지 않은 일임을 모두 알고 있을 겁니다.

 

하지만, 책 한 권으로 무려 9명의 경험을 간접적으로 느끼고, 인사이트를 얻을 수 있습니다.

그리고 경험을 공유하는 것뿐만 아니라, '원칙 준수에 도움이 되는 정보'라는 섹션이 따로 있습니다.

이를 통해 공감 가거나 나의 것으로도 만들고 싶다고 생각한 원칙에 대해 더 많은 정보를 쉽게 찾아볼 수 있습니다.

제공해 주는 정보의 종류는 책, 영상, 아티클, 공식 가이드 등이 있습니다.

 

 

책의 스포일러가 약간 포함된 리뷰

본 내용에는 약간의 책 내용에 대한 스포가 있습니다.
괜찮으신 분들은 미리 읽어보셔도 좋고, 스포가 싫으신 분들은 바로 마무리 내용으로 스크롤을 내려주세요!

 

모든 분의 이야기가 저에게 도움이 되었지만, 9분의 데이터 과학자의 이야기 중 특히나 제게 큰 공감을 샀던 3가지 이야기를 공유합니다.

 

1. 데이터 과학자 생존 무기 만들기

더보기

권시현 님의 이야기는 소제목에서부터 공감이 가는 이야기라는 느낌이 들었는데요!

 

현실에서 접하는 데이터는 배울 때 사용했던 샘플 데이터와는 차원이 다르다,
실무에서 이러한 데이터와 함께 일을 해결해 나가려면 자연스럽게 생존을 걸고 학습하고 발전하게 된다는 이야기가 참 공감이 되었습니다.

 

그냥 발전도 아니고 차별화된 성장이라니!

옳은 방향으로, 나만의 방향으로 데이터 사이언스의 생존 무기를 만들어야 한다는 이야기가 머리에 콕 박히면서 내년에는 방향 설정을 잘하면서 공부해야겠다고 다짐했습니다.

 

기법이나 데이터 해석, 활용 능력 또는 분야에 대한 배경지식 모두가 무기가 될 수 있다는 말도 인상 깊었습니다.

꼭 수준 높은 딥러닝 모델을 구사하는 것만 아니라 다른 방법으로도 무기를 만들 수 있다는 희망이 생겼습니다.

 

2. 시작하는 데이터 과학자를 위한 개발과 운영 지침서

더보기

김영민 님의 이야기는 현실적인 조언이 가득해서 현재의 저에게 많은 인사이트를 주었습니다.

 

데이터 과학자의 평균 재직 기간이 1.7년이라는 설문 조사 결과를 말씀해 주셨는데, 저는 벌써 그 기간을 넘은 것으로 보니 위기를 한번은 넘겼구나! 라는 생각이 들었습니다. ㅎㅎ

회사의 비현실적인 기대치와 미비한 데이터 인프라를 보완하는 데 투자를 하지 않은 척박한 환경에서 주니어 데이터 과학자들이 흔히 하는 실수와 함정, 모범사례에 대해 알려주신 내용들이 하나하나 다 자세하고 현재의 저에게 도움이 되는 내용이라 좋았습니다.

 

소개해 주신 내용을 2개만 공유해봅니다.

- ML 모델을 처음부터 사용하지 말고, 우선 휴리스틱으로 시작하고 ML 모델로 고도화시키기

- Garbage In, Garbage Out! 시간을 내어 데이터를 이해하고, 검증하고, 레이블링 작업에도 큰 노력을 들이기

 

3. 데이터 과학자의 '기술 부채' 갚기

더보기

박준석 님의 이야기는 제가 요즘 가장 많이 고민하는 '기술 부채' 부분을 짚어주셔서 좋았습니다.

 

데이터 과학자들은 주로 개발이 아닌 분야에서 탄생하고(저도 통계학 전공입니닷) 이에 따라 엔지니어링 능력, 코딩이나 깃 사용법, 파이썬 코딩 스타일 등에 부실한 경우가 있습니다.

저도 취업을 하고 나서야 어느 정도 익혔고, 아직 많이 부족함을 느끼며 일할 때가 많습니다. 

모르면 배워야 한다는 가장 큰 원칙을 저자는 얘기하고 있습니다.

스타일 가이드, 협업 도구(깃), 코드 리뷰, 가독성, 문서 작성 등의 항목에 대해 기술 부채 내용과 그 대처법을 소개하고 있는데, 도움이 되는 내용이 많았습니다.

 

데이터 과학도 결국 엔지니어링이고, 기술 부채는 쌓이게 된다, 주기적으로 부채를 정리해야 한다는 저자의 말에 많이 공감했습니다.

 

마무리

오랜만에 데이터 과학자의 업무 전반을 돌아보고, 앞으로 성장해야 할 방향성을 생각하는 계기가 되어 책을 읽는 내내 즐거웠습니다.

공감이 간 내용도 많고, 데이터 관련 일을 하고 싶다는 생각 하나만 가지고 취업한 저에게 앞으로의 커리어에 대해서도 생각해 볼 수 있는 기반이 될 것 같습니다.

 

지금 당장 업무에 활용해 볼 만한 원칙, 두고두고 생각하면서 일하면 좋겠다는 원칙, 성장의 길잡이가 되어주는 원칙, 함정에 빠지지 않도록 도와주는 원칙, ...

수많은 원칙과 함께 3년 차 커리어를 맞이한다고 생각하니 조금은 덜 무서운 것 같습니다.

 

여러분도 막연하게 연차가 쌓여가는 게 두렵거나, 데이터 관련 업무를 함에 있어서 자주 막히는 부분이 있다거나, 먼저 앞서간 데이터 분야 선배들의 조언이 필요할 때,
<데이터 과학자 원칙>을 옆에 두고 도움이 되는 원칙을 하나씩 뽑아서 활용해 보시기를 추천합니다!