당신에게 필요한 진짜 데이터 분석 강의는 따로 있습니다.
직업과 나이를 불문하고 데이터 사이언스는 이제 필수적으로 배워야 한다고 말하는 사람! 데이터 분석부터 시작해서 많은 데이터 강의가 있지만 데이터 사이언스 교육에서 정말 중요한 것은 따로 있다고 말하는 사람! 바로 러닝스푼즈 데이터 사이언스 팀의 김규동 매니저입니다. 데이터 사이언스 강의 기획자로 누구보다 트렌드에 민감하게 데이터 사이언스 실무 교육을 기획해온 김규동 매니저와 함께 데이터 사이언스에 대한 솔직한 이야기를 나누어보았습니다.
안녕하세요. 저는 러닝스푼즈 텀블러 사일로의 데이터사이언스 PM 김규동입니다. 저는 데이터 사이언스에 대해 끊임없이 관심을 가지고 트렌드를 연구하며 강의를 기획하고 있습니다.
빅데이터 분석? AI? 데이터 사이언스?!
최근 뉴스에서 빅데이터, AI라는 키워드를 많이들 들어보셨을 것 같아요. 한 5, 6년 전부터 꾸준히 들려오고 있고 지금도 핫 트렌드죠. 반면 데이터 사이언스 또는 데이터 과학 많이 들어보셨나요? 빅데이터나 AI에 비해서는 많이 못 들어보셨을 거고 각각의 차이점이 무엇인지조차 모르시는 분들이 정말 많을 것 같습니다.
‘빅데이터’가 무엇인지부터 말씀드리자면 말그대로 엄청난 양의 데이터를 말해요. 우리 생활 곳곳에서 알게 모르게 데이터가 정말 많이 쌓이기 시작했고 그러다 보니까 관리가 너무 어려워지고 복잡해지기 시작했어요. 이런 데이터들을 잘 다루고 연구하는 분야가 생겨났는데, 이것을 ‘데이터 사이언스’라고 부르고있죠. 이 분야에서 데이터 분석과 데이터 엔지니어와 같은 직무들이 생겨나면서 새로운 데이터 시대를 열어가고 있습니다.
이와 관련된 자세한 내용은 제가 별도로 글을 재미있게 작성해 봤으니까 한번 읽어보시면 좋을 것 같아요.
👉 👉 매니저Q의 브런치 바로가기 👈👈
데이터 분석가와 엔지니어
취업 시장에서의 데이터 사이언스는 ‘뜨거운 감자'라고 표현하고 싶어요. 뉴스에서는 AI 기술이며 빅데이터며 열심히 홍보하고 있죠. 각각 하는 일이 정말 흥미로워 보이고 ‘이 일을 내가 정말 잘할 것 같은데’, ‘내일 같아 보이는데’라는 생각을 하게되죠. 근데 사실 실제로 강의 같은 것을 좀 받아보면 별거 없다고 느끼실 수 있어요. 채용 공고만 보더라도 정작 그 직무가 명확하게 구분되어 있지 않아서 이걸 배워야 하나 말아야 하나 싶은 거죠.
그래서 데이터 관련 직군에 대해서 정의해보자면 크게 ‘데이터 분석가’와 ‘데이터 엔지니어’ 이렇게 두 가지로 나눌 수 있습니다. 먼저 데이터 분석에는 데이터 수집부터 데이터 처리, 시각화, 학습까지 총 네 단계의 프로세스가 있죠. 여기서 수집, 전처리 등 데이터를 정리하는 단계는 주로 프로그래밍, 개발에 특화된 엔지니어가 담당하게 됩니다. 그리고 정리된 데이터를 분석하고 시각화해서 새로운 인사이트를 도출하거나 전략을 기획하는 그런 단계는 기획/분석에 특화된 분석가분들이 담당하죠. 흔히 이과와 문과로 나누잖아요. 이성적이고 객관적인 결정이 필요한 이과 스타일은 ‘엔지니어’, 감성적이고 주관적인 판단이 필요한 문과 스타일은 ‘분석가’라고 말씀드리는 것이 학생이나 취준생 분들께는 조금 더 공감이 되실지 모르겠네요.
그러면 데이터 사이언티스트는 무엇인가요?
‘데이터 사이언티스트’를 궁극적으로 말씀을 드리자면 이 모든 프로세스를 혼자서도 할 수 있는, 앞서 말씀드린 두 직군이 합쳐진 그런 문이과 통합직군이라고 보시면 좀 더 편할 듯합니다.
사실 데이터 사이언스가 특별한 기술이 있고 그런 건 아니에요. 그저 본인의 산업군에 함께 쓰이는 보조적인 스킬이라고 보시면 더 좋을 것 같아요. 예를 들면 스포츠 분야에서 선수 데이터나 경기 데이터를 분석하는 사람들은 ‘스포츠 데이터 분석가’라고 부르고, 금융 업계에서 차트 데이터를 모으고 정리하고 그러한 데이터 파이프라인을 구축하는 사람들은 ‘금융 데이터 엔지니어'라고 부릅니다.
최근에는 자연어 처리, 영상 인식, 자율주행, 비트코인이 그런 AI 관련 트렌드가 화제입니다. 결국 AI기술도 데이터 사이언스의 한 분야임을 알아주시면 좋을 것 같습니다.
결론만 말씀드릴게요.
대학은 물론 다양한 기업에서도 ‘데이터 사이언스와 빅데이터 교육을 받아야 한다’ 또는 ‘디지털 트랜스포메이션을 우리 기업에 도입해야 한다’ 그렇게 말이 많이 나오고 있어요. 결론만 말씀드리자면, 나이와 직업을 막론하고 대학이니 실무니 상관없이 무조건 데이터 사이언스는 배우셔야 합니다.
두 시점으로 나누어서 데이터 사이언스를 배워야 하는 이유를 말씀을 드려볼게요. 일단 대학에서는 왜 데이터 사이언스 교육이 필요할까요? 1년 넘게 코로나 바이러스가 유행하면서 대부분의 사람들이 집에서 벗어나지 않게 되고 그러다 보니까 컴퓨터와 휴대폰 등 인터넷의 세계로 진입이 좀 더 많아지게 되었죠. 자연스럽게 그 데이터베이스에는 정말 엄청난 데이터가 쌓이고 있습니다. 이런 시대에 살아남는 방법은 폭포같이 쏟아지는 이런 데이터들을 본인의 업무에 적극적으로 활용해서 새로운 생존 전략을 찾는 것인데요. 그 덕에 이제는 이 직업, 저 직업 할 것 없이 모든 사람들이 데이터를 다룰 줄 아는 능력을 필요하게 되었죠. 고등학생, 대학생, 취업준비생 여러분들은 어떤 전공, 어떤 분야로 가시던 데이터 사이언스를 꼭 배우셔야 합니다.
하지만 그렇다고 현재 전공을 놓치시면 안 됩니다. 채용공고에서 보면 데이터 사이언스’만’ 할 줄 아는 사람들은 뽑진 않아요. 현재 업무를 하고 계신 실무자 여러분에게는 더더욱 체계화된 데이터 사이언스 교육이 필요하다고 말씀을 드리고 싶어요.
가장 중요한 것은 데이터를 해석하고 분석할 줄 아는 능력
솔직히 최근 유튜브 영상이나 무료 강의들을 보면 그 퀄리티를 솔직히 무시할 수 없어요. SQL이나 파이썬과 같은 도구적인 스킬만 배우시겠다면 사실 독학으로 배우셔도 무방합니다. 하지만 세상에는 나만의, 나만 알고 있는, 내 것의 데이터 뿐만 아니라 타인의, 내가 모르고 있었던 데이터들이 훨씬 많아요. 내가 모르는 데이터를 잘 활용하기 위해서는 사람들과의 충분한 커뮤니케이션이 필요하다고 생각합니다.
이처럼 데이터를 목적에 맞게 활용하고 데이터를 통해서 조직원들과 소통하는 그러한 능력을 우리는 ‘데이터 리터러시’라고 부르는데요. 제가 만약 혼자 공부했더라면 이런 데이터 리터러시 능력을 기르기는 힘들 거라고 생각합니다. 그렇기 때문에 저는 온라인, 오프라인을 불문하고 사람들과의 소통을 통해 데이터 리터러시 능력을 자연스럽게 체득할 수 있는 커뮤니티형 강의 컨텐츠를 기획하고 있습니다.
최근에는 나름대로 데이터 관련 직무 커리어에 대한 커리큘럼이 좀 잘 구성되어 있어요. 국비교육도 그렇고 사설 교육도 그렇고요. 하지만 어떤 교육을 받던지간에 본인의 산업군에서 자신의 도메인 지식을 가지는 것이 가장 먼저라고 생각합니다. 그 전제 조건이 잘 갖춰졌다면 그때가서 통계나 프로그래밍 스킬, 데이터 리터러시를 배워도 늦지 않았다고 생각합니다.
데이터 사이언스는 여전히 뜨거운 감자라고 생각해요. 모두가 관심을 가지지만 ‘내가 배워서 어디 가서 내가 과연 배울 수 있을까'하는 그러한 생각을 동시에 가지는 거죠. 데이터 사이언스에 대한 트렌드와 학습 간의 간극이 그만큼 커져 있다는 거예요. 저는 그 간극을 줄이는 강의 기획하는 것이 목표입니다.
👇 러닝스푼즈의 진짜 데이터 사이언스 강의 만나러 가기 👇