데이터분석, 파이썬과 R 어떤 언어로 입문해야 될까요?

#데이터사이언스 #파이썬 #R

데이터 분석 입문, 파이썬과 R 어떤 언어로 입문해야 할까요?

데이터 분석의 시대

데이터 분석 스킬은 이제 직무에 관계없이 누구나 필요한 세상이 되었습니다. 데이터 사이언스 업무를 하는 분들 뿐만 아니라, 마케팅과 기획자 등 다양한 업무에서도 데이터 기반 의사결정이 이루어지고 있습니다. 데이터분석 입문 강의를 수강하시려는 분들이 제일 처음 고민하는 부분은 바로 파이썬 혹은 R 어떤 언어로 시작을 해야되는지에 대한 부분입니다. 비슷해보이기도 하고 도통 뭐가 다른지 모르겠다는 의견들도 많았구요.

데이터 분석 입문, 파이썬과 R 각각의 장단점은 무엇일까요?

결론부터 말씀을 드리자면, 파이썬이든 R이든 하나의 툴이라도 익숙하게 된다면 다른 하나는 금방 배울 수 있습니다.

R은 통계학적인 요소에 강하고, 파이썬은 범용적으로 더 많은 기능을 적용할 수 있다고 알려져 있습니다. 굳이 난이도로 따지자면 파이썬보다는 R이 약간은 더 쉽기는 하구요. 기본적으로 두 언어 모두 패키지가 잘 구성되어 있기 때문에 사실 하나만 잘해도 됩니다.

R을 활용하기 위한 패키지로는 시각화를 위한 ggplot2, shiny 그리고 문자열을 제대로 다루기 위한 stringr 등의 패키지가 있구요. 파이썬을 활용하기 위한 패키지로는 Numpy와 Pandas 등 다양한 패키지들이 잘 정리되어 있습니다.
러닝스푼즈 데이터 분석 수강생들은 대부분 현업에서 엑셀을 활용한 데이터분석을 진행하는데 있어 한계를 느끼는 분들이 많이 오시고 있습니다. 방대한 데이터를 다루는데 있어 엑셀은 버벅이고, 편리한 툴이지만 한계 또한 명확하거든요.

그리고 보고를 함에 있어 시각화를 통한 대시보드 구성은 엑셀보다는 R이 파워풀한 부분들이 많구요. 그래서 기획자나 마케터분들도 이런 니즈를 충족시키기 위해 참여하고 있습니다. 시각화 부분에 있어서는 파이썬보다는 R이 강력합니다. 특정분야에 국한되지 않는게 파이썬의 장점이자 단점으로 작용되는 부분이죠. R은 통계와 시각화에 강합니다.
러닝스푼즈 수강생의 데이터 분석 포트폴리오
기초적인 통계 또한 아셔야 제대로 된 데이터분석을 진행할 수 있구요. 추후 머신러닝 혹은 딥러닝을 하기 위해서도 기초적인 수학 및 통계는 꼭 아셔야 합니다. 단순히 라이브러리를 사용해서 돌려보는 것만으로는 본질적인 인사이트를 얻을 수 없습니다.

데이터 분석 어떻게 시작해야 할까?

우선 온라인을 살펴보면 해외 MOOC 서비스 중 코세라에 다양한 과정들이 준비되어 있습니다. 해외 유명 명문대 교수들의 강의들을 무료로 들을 수 있는 장점이 있죠. 그렇다면 오프라인 코스로는 러닝스푼즈 데이터 사이언스 분야가 준비되어 있습니다.

Step 01. 처음 시작하는 데이터 분석을 위한 R & 기초통계
Step 02. R을 활용한 데이터 분석 및 시각화
Step 03. 파이썬으로 시작하는 데이터 분석 입문

상세 페이지 내용을 참고하셔서 상담을 요청하시면 언제든 친절히 알려드리겠습니다.