파이썬으로 시작하는 데이터 분석 입문
- 데이터 수집, 전처리, 분석까지 입문 과정

 

비전공자/비개발자가 데이터 분석 입문하는 최적의 과정

진짜 사용하려는 데이터 수집부터 데이터 처리와 분석에 집중하는 과정! 언제까지 주어진 데이터 지원받아가며 분석하실 건가요? 데이터 수집부터 사용할 수 있게 가공하여, 분석까지! 단순히 모델 몇 가지를 배우는 것은 데이터 분석 입문에 있어 의미가 없습니다. 중요한 것은 직접 데이터에서 어떤 인사이트를 끄집어내는 경험이라고 생각합니다.

일    정02.07 ~ 03.07 | 5회
매주 목요일 19:30 ~ 22:30 | 일 3시간
총 15시간 강의
정    원20명
준비물노트북
가    격55만 원40만 원
장    소러닝스푼즈 강의장
강남대로94길 15, S2빌딩 3층

*강남역 11번 출구 3분 거리 (지도확인)

다른 데이터 분석 입문 강의의 문제점은?

매주 하나씩 배우는
분석 알고리즘,
써먹을 수 있나요?

"과연 3시간의 수업만으로 해당 알고리즘을 익히고 내 문제에 써먹을 수 있을까요?"
많은 데이터 분석 입문 강의는 한 주에 하나, 많게는 몇 개의 머신러닝 알고리즘(회귀분석, 랜덤 포레스트, 네이브 베이지안 등등)을 배웁니다. 보통 이런 알고리즘 하나만을 주제로 다룬 300페이지 이상의 책들을 아마존에 검색해보면 몇 권씩 나옵니다. 솔직해 집시다. 여러분은 머신러닝 알고리즘을 배운 것이 아니라 파이썬 혹은 R의 머신러닝 패키지에 함수를 한 번 돌려본 것뿐 입니다. 그것도 강사가 미리 정해준 데이터를 이용해서 말입니다. 실제 현실에서 여러분이 마주치는 문제들은 무엇이 데이터인지 정해져 있지 않고 머신러닝 패키지에 돌리기 좋은 포맷으로 제공되지도 않습니다.

가장 중요한
과정을 생략
하셨습니다

"여러분의 데이터 분석 입문 수업에 이 과정의 비중이 얼마나 되었나요?"
국내외를 막론하고 실제로 데이터 분석 업무를 하는 분들의 이야기를 들어보면 하나같이 데이터 전처리 과정이 전체 데이터를 분석하는 과정 중 가장 중요한 과정이라고 이야기 합니다. 데이터 전처리는 명확한 정의는 없지만 데이터 클렌징, 탐색 과정이라고도 불리며 보통 문제에서 데이터를 추출하고 노이즈를 확인, 처리하며 데이터를 분석하기 좋게 정리하는 모든 과정을 가리킵니다. 사실 많은 문제가 이 과정을 잘 수행하면 저절로 해결된다 할 정도로 데이터 분석에서 가장 중요한 영역입니다

비전공자들도
따라갈수 있는
데이터 분석 입문

"확실한 커리큘럼과 맞춤형 지도를 통해 배우는 데이터 분석 입문"
이 수업에서 다루는 영역은 수학적 지식이나 통계학적 지식이 전혀 없고, 프로그래밍 언어도 다뤄본 적 없는 초심자가 직접 데이터를 수집하고, 분석에 쓸 수 있게 데이터 전처리를 하여 시각화, 혹은 다양한 분석 방법을 배워보는 강의입니다.물론 다른 수업들과 다르게 내가 해결하고자 하는 문제에 직접 적용해볼 수 있는 데이터 분석 입문 과정이라는 것이 타 강의들과 차별화되는 부분입니다.

“많은 데이터 분석 입문 수강생들이 데이터 분석 강의를
듣고 재미있게 따라 해 보지만 강의가 끝나고 난 뒤엔?”

데이터 분석 입문 강의를 여러번 들어봤지만, 실무에 활용하려고 보면 데이터가 정제되어 있지 않아 사용할 수 없는 경우가 대부분이고, 이 작업부터 병행되지 않는다면 데이터 분석이나 시각화의 오류가 생기는 경우가 많습니다. (Garbage in, Garbage out)

강의특징

비전공자, 입문자를 위해 설계된 최적의 커리큘럼

1-2주에 걸쳐 데이터 분석에 필요한 가장 기본적인 파이썬 문법과 패키지 사용법에 대해서 배우게 됩니다. 그리고 전체 과정이 다양한 상황에서 데이터들을 수집하여 분석이 가능하게 데이터 프레임으로 정리하는 과정을 반복 연습하며 입문에 걸맞는 강의를 진행합니다.

데이터 수집, 데이터 전처리, 데이터 분석까지!

단순히 데이터를 학원에서 제공해줘 라이브러리로 돌려보는 수업이 아닙니다. 본인의 상황과 목적에 맞게 직접 원하는 페이지 혹은 API에서 데이터를 수집하는 과정을 다뤄봅니다. 이후 수집한 데이터를 분석할 수 있게 전처리 후, 실제 시각화 등 데이터 분석 사이클을 돌려봅니다.

본인의 문제를 해결할 수 있는 실전 위주의 수업

강사님의 개인 지도를 통해 본인의 상황과 목적에 맞는 프로젝트를 선정, 최대한 실전에서 사용할 수 있게 도와드립니다. 데이터를 수집하고자 하는 홈페이지, API 등을 선정하여 해당 데이터에 맞게 전처리 작업, 그리고 최종적으로 다양한 분석을 할 수 있는 이론들을 학습합니다.

실습예시

1. YES24에서 주식 책의 정보를 크롤링 하기

2. 데이터를 통해 연도별로 어떤 재테크가 인기 있었는지 분석

1. 부동산 데이터를 수집하여, 분석할 수 있게 데이터 전처리

2. 데이터셋을 활용하여 다양한 분석 방법을 적용

"프로그래밍을 처음 접하는데, 수업을 잘 따라갈 수 있을까요?"

강사님과 조교가 수업 시간에 1:1로 최대한 프로그래밍을 쉽게 익힐 수 있도록 도와드립니다.
프로그래밍을 처음 접하시는 분들도 충분히 이해가 가능하시도록 케어를 해드릴 예정입니다!

수강효과

내가 원하는 데이터로
내가 원하는 분석이 가능

데이터셋을 주고 알고리즘 사용법을 알려주며 데이터 분석이라고 가르쳐 봤자, 분석하기 좋은 데이터 셋이 주어지는 것이 아니기 때문에 의미가 없습니다. 데이터 분석을 시작하려면 스스로 자신의 상황에 맞는 데이터 셋을 정리하고 만들 수 있어야 합니다. 본 수업에서 자신의 목적에 맞는 데이터를 수집, 가공, 분석하여 실무에서 데이터 분석을 할 수 있는 역량을 쌓을 수 있습니다.

데이터 전처리 반복학습을
통해 어떤 상황에서도 적용

데이터 분석을 시작하면 학원에서처럼 데이터 셋이 깔끔하게 주어지는 경우가 없습니다. 대부분 지저분한 데이터를 힘들게 가져와 이를 분석자가 깔끔하게 가공해야 합니다. 이 수업은 이러한 과정을 여러 상황을 가정하여 반복 연습으로 진행이 됩니다. 웹에 있는 내용을 파싱하여 데이터로 만드는 것, API를 연결하여 데이터를 받아 하나의 데이터 셋으로 만드는 연습을 반복할 것입니다.

실무 데이터 분석 업무를
수행할 수 있는 역량

장황한 이론 설명을 배제하고 배워서 바로 사용할 수 있는 실전 노하우를 집중적으로 교육합니다. 다른 강의처럼 데이터가 놀라울 정도로 완벽하게 주어지는 경진대회에 참여하진 않습니다. 오히려, 정말 실전에서 사용할 수 있게 본인의 상황과 목적에 맞는 데이터를 수집하고, 이를 가공, 전처리하여 다양한 분석과 시각화까지 수행할 수 있는 역량을 반복학습을 통해 갖추게 됩니다.

내가 원하는 목적과 상황에 맞는
데이터를 수집, 가공하고, 분석할 수 있는 역량을 키워보세요!

수강대상

현재 직무에서 데이터 관련 업무가 주어져 당장 활용이 필요하신 분

데이터 관련 업무를 병행하여 승진 혹은 포지션 변경을 원하시는 분들

현재 하는 업무가 큰 비전이 없다고 느껴져 데이터 관련 업무로 포지션을 변경하고 싶은 분들

지금 취업을 준비하고 있으며 데이터를 활용한 분야로 취업을 원하시는 분들

데이터 사이언스라는 트렌드에 대해 공부하고, 적용해보고 싶으신 분들

비전공자/비개발자인데, 관련 데이터 분석 공부를 하고 싶으신 분들

수강후기

데이터 사이언스에 관심이 있는 분들께 추천하고 싶은 강의예요. 저는 문과출신에 컴퓨터 언어를 한번도 배운적 없었는데도 강사님이 눈높이에 맞춰서 과정을 진행해 주셔서 데이터 분석 분야의 전반적인 이해도를 높이는데 큰 도움이 되었습니다. 5주 이후 과정에도 필요한 내용은 맞춤형으로 교육받을 수 있어 처음 시작은 이 강의로 함께하시길 강력 추천합니다

수강생 서00님 후기 (회사원)

혼자 시작하려할 때 막막함이 좀 있었는데 같이 실습하며 차근차근 설명 해주셔서 처음에 접근하기가 훨씬 쉬웠습니다. 강사님께 데이터 분석을 하면서 어려운 점 물어보면서 수준에 맞게 적절한 주제로 진행해주셔서 큰 도움이 되었습니다!

수강생 윤OO 님 후기 (회사원)

강의 준비도 항상 철저히 해주시고 설명을 차분히 잘해주십니다. 그리고 수강생들이 흥미를 느낄 수 있도록, 각자 관심있는 주제로 데이터 분석이나 크롤링 등을 하게 도와주십니다. 각자 개인적인 상황을 고려해 주시고 도움되는 조언도 많이 해주셔서 수업 외적인 부분도 정말 많이 도움 받았습니다. 그동안 프로그래밍 배우려고 각종 교육기관에 돈도 많이 쓰고 삽질도 정말 많이 했는데, 현직 개발자 분께 수업을 듣고 여러가지 피드백을 받을 수 있다는 것 자체가 정말 좋은 기회인 것 같습니다.

수강생 손OO 님 후기 (회사원)

F사, D사 강의를 모두 들어봤는데, 실제로 데이터 분석 입문은 이런거다 하는 것을 느꼈습니다. 단순히 알고리즘만 돌려보고 끝나는 것이 아니라 나한테 필요한 데이터를 구하고, 이를 전처리하여 분석에 쉽게 도식화하구요! 그 이후 다양한 데이터 분석을 하면서 많은 인사이트를 얻을 수 있었어요.

 

수강생 김OO 님 (증권사)

커리큘럼

* 회차별 주제를 클릭하면 상세한 커리큘럼이 나옵니다.

1주차. 파이썬 기본 문법과 데이터 분석 기초 실습

첫 번째 강의에서는 무엇보다 먼저 실제 데이터 분석 과정이 어떻게 이루어 지는 지 살펴보고 우리가 5주 동안 훈련할 내용과 목적이 무엇인지 살펴봅니다. 앞에서도 이야기 했듯이 데이터 분석은 하나의 긴 프로세스입니다. 이 중에서 전처리 과정 없이 깔끔한 데이터가 주어졌다고 가정하고 단순히 머신러닝 알고리즘을 적용하는 것을 연습해 봤자 파이썬 머신러닝 모듈에 있는 함수를 몇 개 사용해 본 것 밖에 지나지 않습니다. 당연히 이렇게 학습하시면 수강이 끝나고 데이터 분석을 스스로 하실 때 막막해 질 수 밖에 없습니다. 현실에는 분석하기 좋은 깔끔한 데이터는 주어지지 않으니까요. 그래서 첫 번째 수업에서는 실제로 전체적인 데이터 분석 과정의 처음과 끝이 어떻게 이루어지는 지 살펴보고 우리가 함께 학습 할 부분이 어디인지도 알아보도록 하겠습니다.

이어서 강사가 준비한 실제 엑셀 데이터를 손으로 직접 깔끔히 정리하고 종합하여 어떤 인사이트를 이끌어내는 작업을 진행해 보도록 하겠습니다. 손으로 하는 실습이 끝나면 강사가 직접 짜온 코드를 시연하며 파이썬을 통하여 원본 데이터부터 분석이 진행되고 결과가 나오는 과정을 살펴보게 됩니다. 이를 통해 데이터 분석에 파이썬과 같은 프로그래밍 언어를 사용하는 이유를 더욱 확실하게 느끼실 수 있을겁니다. 데이터 분석에 파이썬이 필요한 이유를 몸으로 느끼셨다면 이제 파이썬을 배울 차례입니다. 한 시간 동안 데이터 분석에 필요한 가장 중요한 문법들만 골라 배우고 실습으로 간단한 장난감 챗봇을 만들어 볼 예정입니다.
 

이론 및 실습

  • 데이터 분석이란 무엇인가?
  • 엑셀과 손으로 직접 분석해 보기
  • 파이썬 기본 문법과 Pandas 활용법 실습

2주차. 파이썬 함수와 모듈 및 웹 크롤링으로 데이터 수집

3주차. 실습을 통한 데이터 분석 및 시각화

4주차. 데이터를 전처리, 가공하여 분석

5주차. 공공 API를 통한 데이터 수집 및 분석

강사소개 및 인터뷰

박준규 강사님

(현) 공간데이터 플랫폼 SpaceBar 대표
(전) 핀테크 기업 코스폴 데이터사이언티스트
(전) FN Pricing 퀀트팀 연구원
(전) 신한금융투자 퀀트 데이터 분석
고려대학교 경제학과 졸업 (수학 이중전공)
고려대학교 Finance Engineering 대학원 졸업

1. 데이터 분석을 할 때 '파이썬'을 사용하는 이유가 있나요?

크게 세가지 이유를 들 수 있습니다.

첫 번째로 이제는 양적으로나 질적으로 데이터 분석을 사람이 손이나 엑셀로 할 수 없기 때문입니다.
손(엑셀)으로 데이터를 직접 보면서 분석하기에는 양도 너무 많을 뿐 더러, 각 성질(feature)들을 연산하거나 조작하여 인사이트를 찾기가 불가능합니다. 어찌어찌 하여 결과를 도출하였다 하더라도 같은 유형의 업데이트 된 데이터가 다시 주어질 경우 분석 과정을 또 다시 손으로 수행해야 합니다. 이렇게 된다면 분석이 힘이 들 뿐 아니라 오류가 날 확률도 높습니다. 데이터 분석에 있어 프로그래밍을 사용할 경우 무엇보다 많은 양의 데이터 연산하고 조작하는 데 버벅이지 않고 깔끔하게 코드로 추상화하여 데이터를 요리하고 결과를 도출할 수 있습니다. 그리고 이렇게 한 번 결과를 도출하여 코드화 시켜 놓으면, 데이터가 업데이트 되었거나 같은 유형의 다른 데이터에 똑같이 적용할 수 있기 때문에 업무를 반복하지 않아도 되고 실수할 확률도 매우 낮출 수 있습니다.

두 번째로는 파이썬의 범용성 때문입니다.
데이터 분석 작업은 주어진 데이터를 분석하는 단일 작업이 아닙니다. 다른 웹 사이트의 데이터를 수집하거나(웹 크롤링) API 등을 통하여 데이터를 모으고, 이렇게 모아진 데이터를 결과를 조합, 집계하여 저장하고 머신러닝 등 알고리즘이나 통계 분석 기법 등을 이용하여 분석하고 결과를 대시보드나 웹사이트로 만드는 등 일련의 프로세스를 지칭합니다. 물론 주어진 환경에 따라 이 프로세스는 다를 수 있겠지요. 파이썬은 이러한 프로세스를 단일 언어로 구성할 수 있게 도와주는 최상의 툴이라 할 수 있습니다. 예를 들어 R로 데이터 분석을 할 경우 데이터 분석 도구로서는 파이썬과 큰 차이가 없을 지 모르겠지만 이런 일련의 모든 과정을 R로 구성할 수 없습니다. 단계, 단계 다른 언어끼리 통합을 고민해야 합니다. 하지만 파이썬은 이러한 고민을 최소한으로 줄여 줄 수 있습니다.

세 번째로는 파이썬의 수 많은 라이브러리 때문입니다.
파이썬이 큰 인기를 얻고 프로그래밍 언어에서 지금과 같은 위치에 오를 수 있었던 이유 중 하나는 수많은 라이브러리 들 때문입니다. 특히 데이터 분석의 경우 pandas, numpy, matplotlib과 같은 파워풀하고 유명한 라이브러리들이 존재합니다. (이 셋은 워낙 유명하고 같이 붙어다니기 때문에 저는 농담으로 파이썬 데이터 3형제라고 부릅니다) 이들이 중요한 이유는 첫 번째로 여러분이 파이썬으로 데이터 분석을 할 때 효율성을 매우 높게 올려주기 때문입니다. 이들의 도움 없다면 수 십, 수 백 줄의 코드를 더 짜야 할지도 모릅니다. 그리고 인기가 많기 때문에 구글링을 하면 쉽게 에러를 해결하거나 사용법을 익히거나 팁을 얻을 수 있습니다. 이미 여러 많은 사람들이 사용하고 있기 때문입니다.

2. 데이터 분석 입문 과정을 비전공자/비개발자도 따라갈 수 있을까요?

네, 물론입니다. 무엇보다 데이터 분석 입문 과정 자체가 비전공자/비개발자를 위하여 기획이 되었습니다. 커리큘럼을 보시면 아시겠지만 첫 번째 주와 두 번째 주를 걸쳐 데이터 분석에 필요한 가장 기본적인 파이썬 문법과 pandas 사용법에 대해서 배우게 됩니다. 그리고 전체 과정을 구성함에 있어, 다양한 상황에서 데이터들을 수집하여 분석이 가능하게 데이터 프레임으로 정리하는 (이런 과정을 전처리라고 부릅니다) 과정을 반복 연습하게 되어 있습니다. 비교적 쉬운 상황부터 어려운 상황까지 코스가 진행 되면서 조금씩 난이도를 조정하므로 열심히 따라오시면 누구든지 데이터 분석을 시작할 수 있다고 자신합니다.

 

3. 강의에서는 주로 어떤 내용을 다룰 예정이시고, 어떤 형태로 진행되나요?

본 강의는 다른 데이터 분석 강의와 다르게 데이터 전처리를 주로 다룰 예정입니다. 국내외를 막론하고 실제로 데이터 분석 업무를 하는 분들의 이야기를 들어보면 하나같이 데이터 전처리 과정이 전체 데이터를 분석하는 과정 중 가장 중요한 과정이라고 이야기 합니다. 데이터 전처리는 명확한 정의는 없지만 데이터 클렌징, 탐색 과정이라고도 불리며 보통 문제에서 데이터를 추출하고 노이즈를 확인, 처리하며 데이터를 분석하기 좋게 정리하는 모든 과정을 가리킵니다. 사실 많은 문제가 이 과정을 잘 수행하면 저절로 해결된다 할 정도로 데이터 분석에서 가장 중요한 영역입니다.

강의는 반복 연습으로 진행이 됩니다. 데이터 분석을 시작하면 절대 학원에서처럼 데이터 셋이 깔끔하게 주어지는 경우가 없습니다. 대부분 지저분한 데이터를 어디선가 힘들게 가지고 와서 이를 분석자가 깔끔하게 가공해야 합니다. 이 수업은 이러한 과정을 여러 상황을 가정하여 반복 연습하는 형태로 진행이 됩니다. 예를 들어 특정 웹에 있는 내용들을 파싱하여 데이터로 만든다 던지, API를 연결하여 여러 곳에서 데이터를 받아 하나의 데이터 셋으로 만든다던지 하는 것입니다. 강의가 진행되면서 상황의 난이도는 조금씩 올라가나 큰 틀은 같습니다. 데이터를 잘 정리하여 깔끔한 데이터(데이터 프레임)을 얻는 것 입니다.

 

4. 업무 일정으로 인해 수업을 못듣는 일정이 있는데 어떻게 도와주실 수 있나요?

출장과 주말 출근이 많은 직장인 분들을 배려하는 차원에서 원하시는 다른 기수의 회차 수업으로 교차수강을 지원해드고 있습니다. 빠지게되는 수업 회차만 교차수강을 하셔도 되고, 그 이후 모든 수업을 교차수강으로 이어가셔도 괜찮습니다. 또한 해당 강의는 현재 온라인으로 제작되고 있기때문에, 근시일 내에 업로드가 가능할 예정입니다. 빠지시는 회차가 있을 경우 개인 보강, 온라인 강의, 다른 기수 교차 수강을 통해 지원드리도록 하겠습니다.

 

5. 데이터 분석 입문 수강생들분들에게 하고 싶으신 말씀은?

예전에 어떤 분이 데이터 분석 외주를 의뢰하셨습니다. 그 분의 데이터를 함께 분석하면서 이런저런 이야기를 많이 나누었는데 놀란 것이, 기존의 비싼 데이터 분석 강의를 몇 개나 수강하셨더라고요. 그래서 ‘그런 강의도 비싸게 돈 주고 수강하셨는데 이런 거 저한테 외주 주지 마시고 직접하셔야 하는 거 아닌가요?’라고 물었더니, 자기도 수업 들을 땐 만족도도 높고 문제가 없었는데 실제 자기 문제에 써먹을 때 잘 적용이 안 된다고 하시더군요. 왜 비싼 수업도 들었는데 실제 자기 문제에는 적용이 안될까?

개인적으로 내린 해답이 이 수업입니다. 데이터 셋을 주고 알고리즘 사용법을 알려주며 데이터 분석이라고 가르쳐 주어 봤자 실제 업무에서는 분석하기 좋은 데이터 셋이 주어지는 것도 아닌데 아무런 의미가 없다고 생각합니다. 스스로 데이터 분석을 시작하려면 학생 스스로 자신의 상황에 맞는 데이터 셋을 정리하고 만들 수 있어야 한다고 생각합니다. 앞에서 이야기 했듯이 실제 데이터 분석에서 가장 많은 비중을 차지하는 과정이 바로 전처리 과정입니다. 이 과정에 대한 충분한 연습이 없이는 모래 위에 성을 쌓는 일이 될 뿐입니다. 이 기회에 데이터 분석의 가장 큰 비중을 차지하는 데이터 전처리에 대해서 학습해 보세요!

 

수강료 55만 원40만 원
 
수강신청은 결제 순으로 선착순 마감될 수 있습니다.
개강 후 환불은 학원법 시행령 <제18조 제3항> 수강료 반환기준에 의거합니다.
 
*환불 세부규정 확인하기 (클릭)

15만 원 할인, 놓치지 마세요!

러닝스푼즈의 추천 강의 ▼