마감임박

파이썬으로 시작하는
데이터 분석 입문

- 데이터 수집, 전처리, 분석까지 입문 과정

 

비전공자/비개발자가 데이터 분석 입문하는 최적의 과정

 

진짜 사용하려는 데이터 수집부터 데이터 처리와 분석에 집중하는 과정! 언제까지 주어진 데이터만 지원 받아가며 분석하실 건가요?
 
데이터 수집부터 사용할 수 있게 가공하여, 분석까지! 단순히 모델 몇 가지를 배우는 것은 데이터 분석 입문에 있어 의미가 없습니다. 중요한 것은 직접 데이터에서 어떤 인사이트를 끄집어내는 경험이라고 생각합니다.

일    정03.30 ~ 04.27 | 5회
매주 토요일 10:30 ~ 13:30 | 일 3시간
총 15시간 강의
정    원15명
준비물노트북
가    격65만 원50만 원
장    소러닝스푼즈 강의장
강남대로94길 15, S2빌딩 3층

*강남역 11번 출구 3분 거리 (지도확인)

다른 데이터 분석 입문 강의의 문제점은?

매주 하나씩 배우는
분석 알고리즘,
써먹을 수 있나요?

"과연 3시간의 수업만으로 해당 알고리즘을 익히고 내 문제에 써먹을 수 있을까요?"
많은 데이터 분석 입문 강의는 한 주에 하나, 많게는 몇 개의 머신러닝 알고리즘(회귀분석, 랜덤 포레스트, 네이브 베이지안 등등)을 배웁니다. 보통 이런 알고리즘 하나만을 주제로 다룬 300페이지 이상의 책들을 아마존에 검색해보면 몇 권씩 나옵니다. 솔직해 집시다. 여러분은 머신러닝 알고리즘을 배운 것이 아니라 파이썬 혹은 R의 머신러닝 패키지에 함수를 한 번 돌려본 것뿐 입니다. 그것도 강사가 미리 정해준 데이터를 이용해서 말입니다. 실제 현실에서 여러분이 마주치는 문제들은 무엇이 데이터인지 정해져 있지 않고 머신러닝 패키지에 돌리기 좋은 포맷으로 제공되지도 않습니다.

가장 중요한
과정을 생략
하셨습니다

"여러분의 데이터 분석 입문 수업에 이 과정의 비중이 얼마나 되었나요?"
국내외를 막론하고 실제로 데이터 분석 업무를 하는 분들의 이야기를 들어보면 하나같이 데이터 전처리 과정이 전체 데이터를 분석하는 과정 중 가장 중요한 과정이라고 이야기 합니다. 데이터 전처리는 명확한 정의는 없지만 데이터 클렌징, 탐색 과정이라고도 불리며 보통 문제에서 데이터를 추출하고 노이즈를 확인, 처리하며 데이터를 분석하기 좋게 정리하는 모든 과정을 가리킵니다. 사실 많은 문제가 이 과정을 잘 수행하면 저절로 해결된다 할 정도로 데이터 분석에서 가장 중요한 영역입니다

비전공자들도
따라갈수 있는
데이터 분석 입문

"확실한 커리큘럼과 맞춤형 지도를 통해 배우는 데이터 분석 입문"
이 수업에서 다루는 영역은 수학적 지식이나 통계학적 지식이 전혀 없고, 프로그래밍 언어도 다뤄본 적 없는 초심자가 직접 데이터를 수집하고, 분석에 쓸 수 있게 데이터 전처리를 하여 시각화, 혹은 다양한 분석 방법을 배워보는 강의입니다.물론 다른 수업들과 다르게 내가 해결하고자 하는 문제에 직접 적용해볼 수 있는 데이터 분석 입문 과정이라는 것이 타 강의들과 차별화되는 부분입니다.

“많은 데이터 분석 입문 수강생들이 데이터 분석 강의를
듣고 재미있게 따라 해 보지만 강의가 끝나고 난 뒤엔?”

데이터 분석 입문 강의를 여러번 들어봤지만, 실무에 활용하려고 보면 데이터가 정제되어 있지 않아 사용할 수 없는 경우가 대부분이고, 이 작업부터 병행되지 않는다면 데이터 분석이나 시각화의 오류가 생기는 경우가 많습니다. (Garbage in, Garbage out)

강의특징

비전공자, 입문자를 위해 설계된 최적의 커리큘럼

1-2주에 걸쳐 데이터 분석에 필요한 가장 기본적인 파이썬 문법과 패키지 사용법에 대해서 배우게 됩니다. 그리고 전체 과정이 다양한 상황에서 데이터들을 수집하여 분석이 가능하게 데이터 프레임으로 정리하는 과정을 반복 연습하며 입문에 걸맞는 강의를 진행합니다.

데이터 수집, 데이터 전처리, 데이터 분석까지!

단순히 데이터를 학원에서 제공해줘 라이브러리로 돌려보는 수업이 아닙니다. 본인의 상황과 목적에 맞게 직접 원하는 공공데이터 혹은 웹 페이지의 데이터를 수집하는 과정을 다뤄봅니다. 이후 수집한 데이터를 분석할 수 있게 전처리 후, 실제 시각화 등 데이터 분석 사이클을 돌려봅니다.

본인의 문제를 해결할 수 있는 실전 위주의 수업

강사님의 개인 지도를 통해 본인의 상황과 목적에 맞는 프로젝트를 선정, 최대한 실전에서 사용할 수 있게 도와드립니다. 데이터 분석을 하고자하는 데이터에 맞게 전처리 작업, 그리고 최종적으로 다양한 분석을 할 수 있는 이론들을 학습합니다.

실습예시

데이터를 들여다보기 위한 다양한 시각화와 분석 방법

1. 수 많은 엑셀을 한 번에 통합

2. Line-plot을 통한 월별 합계 분석

3. Box-plot을 통한 일별 데이터 분석

4. 데이터들의 상관관계 분석

5. 데이터셋을 활용하여 다양한 분석 방법을 적용

"프로그래밍을 처음 접하는데, 수업을 잘 따라갈 수 있을까요?"

강사님과 조교가 수업 시간에 1:1로 최대한 프로그래밍을 쉽게 익힐 수 있도록 도와드립니다.
프로그래밍을 처음 접하시는 분들도 충분히 이해가 가능하시도록 케어를 해드릴 예정입니다!

수강효과

내가 원하는 데이터로
내가 원하는 분석이 가능

데이터셋을 주고 알고리즘 사용법을 알려주며 데이터 분석이라고 가르쳐 봤자, 분석하기 좋은 데이터 셋이 주어지는 것이 아니기 때문에 의미가 없습니다. 데이터 분석을 시작하려면 스스로 자신의 상황에 맞는 데이터 셋을 정리하고 만들 수 있어야 합니다. 본 수업에서 자신의 목적에 맞는 데이터를 수집, 가공, 분석하여 실무에서 데이터 분석을 할 수 있는 역량을 쌓을 수 있습니다.

데이터 전처리 반복학습을
통해 어떤 상황에서도 적용

데이터 분석을 시작하면 학원에서처럼 데이터 셋이 깔끔하게 주어지는 경우가 없습니다. 대부분 지저분한 데이터를 힘들게 가져와 이를 분석자가 깔끔하게 가공해야 합니다. 이 수업은 이러한 과정을 여러 상황을 가정하여 반복 연습으로 진행이 됩니다. 웹에 있는 내용을 파싱하여 데이터로 만드는 것, API를 연결하여 데이터를 받아 하나의 데이터 셋으로 만드는 연습을 반복할 것입니다.

실무 데이터 분석 업무를
수행할 수 있는 역량

장황한 이론 설명을 배제하고 배워서 바로 사용할 수 있는 실전 노하우를 집중적으로 교육합니다. 다른 강의처럼 데이터가 놀라울 정도로 완벽하게 주어지는 경진대회에 참여하진 않습니다. 오히려, 정말 실전에서 사용할 수 있게 본인의 상황과 목적에 맞는 데이터를 수집하고, 이를 가공, 전처리하여 다양한 분석과 시각화까지 수행할 수 있는 역량을 반복학습을 통해 갖추게 됩니다.

수강대상

현재 직무에서 데이터 관련 업무가 주어져 당장 활용이 필요하신 분

데이터 관련 업무를 병행하여 승진 혹은 포지션 변경을 원하시는 분들

현재 하는 업무가 큰 비전이 없다고 느껴져 데이터 관련 업무로 포지션을 변경하고 싶은 분들

지금 취업을 준비하고 있으며 데이터를 활용한 분야로 취업을 원하시는 분들

데이터 사이언스라는 트렌드에 대해 공부하고, 적용해보고 싶으신 분들

비전공자/비개발자인데, 관련 데이터 분석 공부를 하고 싶으신 분들

내가 원하는 목적과 상황에 맞는
데이터를 수집, 가공하고, 분석할 수 있는 역량을 키워보세요!

수강후기

데이터 사이언스에 관심이 있는 분들께 추천하고 싶은 강의예요. 저는 문과출신에 컴퓨터 언어를 한번도 배운적 없었는데도 강사님이 눈높이에 맞춰서 과정을 진행해 주셔서 데이터 분석 분야의 전반적인 이해도를 높이는데 큰 도움이 되었습니다. 5주 이후 과정에도 필요한 내용은 맞춤형으로 교육받을 수 있어 처음 시작은 이 강의로 함께하시길 강력 추천합니다

수강생 서00님 후기 (회사원)

혼자 시작하려할 때 막막함이 좀 있었는데 같이 실습하며 차근차근 설명 해주셔서 처음에 접근하기가 훨씬 쉬웠습니다. 강사님께 데이터 분석을 하면서 어려운 점 물어보면서 수준에 맞게 적절한 주제로 진행해주셔서 큰 도움이 되었습니다!

수강생 윤OO 님 후기 (회사원)

강의 준비도 항상 철저히 해주시고 설명을 차분히 잘해주십니다. 그리고 수강생들이 흥미를 느낄 수 있도록, 각자 관심있는 주제로 데이터 분석이나 크롤링 등을 하게 도와주십니다. 각자 개인적인 상황을 고려해 주시고 도움되는 조언도 많이 해주셔서 수업 외적인 부분도 정말 많이 도움 받았습니다. 그동안 프로그래밍 배우려고 각종 교육기관에 돈도 많이 쓰고 삽질도 정말 많이 했는데, 현직 개발자 분께 수업을 듣고 여러가지 피드백을 받을 수 있다는 것 자체가 정말 좋은 기회인 것 같습니다.

수강생 손OO 님 후기 (회사원)

F사, D사 강의를 모두 들어봤는데, 실제로 데이터 분석 입문은 이런거다 하는 것을 느꼈습니다. 단순히 알고리즘만 돌려보고 끝나는 것이 아니라 나한테 필요한 데이터를 구하고, 이를 전처리하여 분석에 쉽게 도식화하구요! 그 이후 다양한 데이터 분석을 하면서 많은 인사이트를 얻을 수 있었어요.

 

수강생 김OO 님 (증권사)

커리큘럼

* 회차별 주제를 클릭하면 상세한 커리큘럼이 나옵니다.

1주차. 데이터 분석 기초와 파이썬 기본 문법

첫 번째 강의에서는 무엇보다 먼저 실제 데이터 분석 과정이 어떻게 이루어 지는 지 살펴보고 우리가 5주 동안 훈련할 내용과 목적이 무엇인지 살펴봅니다. 앞에서도 이야기 했듯이 데이터 분석은 하나의 긴 프로세스입니다. 이 중에서 전처리 과정 없이 깔끔한 데이터가 주어졌다고 가정하고 단순히 머신러닝 알고리즘을 적용하는 것을 연습해 봤자 파이썬 머신러닝 모듈에 있는 함수를 몇 개 사용해 본 것 밖에 지나지 않습니다. 당연히 이렇게 학습하시면 수강이 끝나고 데이터 분석을 스스로 하실 때 막막해 질 수 밖에 없습니다. 현실에는 분석하기 좋은 깔끔한 데이터는 주어지지 않으니까요. 그래서 첫 번째 수업에서는 실제로 전체적인 데이터 분석 과정의 처음과 끝이 어떻게 이루어지는지 살펴보고 우리가 함께 학습 할 부분이 어디인지도 알아보도록 하겠습니다.

이어서 앞으로 우리가 데이터 분석을 위해 사용할 파이썬과 주피터 노트북이라는 것을 배우겠습니다. 파이썬은 데이터 분석을 위해 필요한 프로그래밍 언어이고, 주피터 노트북은 파이썬을 편리하게 사용할 수 있게 도와주는 도구라고 생각하시면 됩니다. 이렇게 첫 번째 강의동안 데이터 분석에 필요한 가장 중요한 문법들만 골라 배우고 실습으로 간단한 게임을 만들어 볼 예정입니다.

 

이론 및 실습

  • 데이터 분석이란 무엇인가?
  • 파이썬 설치 (사전 안내)
  • 주피터 노트북 사용법 익히기: 입력/실행 방법
  • 파이썬 기초 문법
  • 파이썬을 활용한 구구단과 369 게임 만들기

2주차. 판다스에 대한 이해 및 고객 구매 데이터 분석 실습

3주차. 공공데이터를 활용한 데이터 분석 및 시각화

4주차. 파이썬을 활용한 웹 데이터 수집(크롤링)

5주차. 파이썬을 활용한 웹 데이터 수집 및 분석

강사소개 및 인터뷰

장남수 강사님

(현) 인사이저 텍스트분석 총괄
(전) 아모레퍼시픽
- 제품 수요예측
- 재고 및 공급 망 관리
- 데이터분석 프로젝트 진행

- 성향분석기반 추천 서비스 기술자문
- SNS 분석을 통한 예측 시스템 기술자문
- 데이터분석 컨설팅 및 기술자문
- 크롤링 전문 회사 기술자문
- POSTECH 산업경영공학과

1. '파이썬'을 사용하는 이유가 있나요?

엑셀은 능숙하게 다루시는 분들은 많으시죠?
그런데 엑셀에서는 많은 데이터를 다룰 때 종종 멈추거나, 수식 계산이 안되거나, 오류가 발생하는 문제를 겪어 보셨을 것입니다. 하지만 파이썬을 이용하면 여러 개의 엑셀 파일을 10초도 걸리지 않아 전체 파일을 통합하여 저장까지 할 수 있습니다. 본 강의 중 2주차에 진행되는 실습 코드 4~5줄 정도를 복사해서 넣으면 바로 할 수 있죠. 엑셀을 이용해 하루 종일 정리하던 일을 파이썬을 이용하면 10 ~ 20분 정도면 할 수 있습니다. 급여가 많고, 적음을 판단할 때 시급으로 판단해보기도 하잖아요. 급여는 쉽게 올리기 어렵죠. 이럴 때, 효율적으로 일해서 야근하지 않고 시간대비 수익을 늘리는 것도 좋을 것 같아요. 파이썬을 이용하면 그런 장점이 있습니다. 효율성이죠. 시간과 노력 대비 결과가 탁월합니다.

R이랑 파이썬 중 고민하시는 분도 있을 것 같습니다.
R은 데이터분석을 위해 만들어진 전용 도구이고, 파이썬은 많은 활용 방법 중에 데이터분석도 가능합니다. 데이터 분석에 관해서는 한쪽이 할 수 있는 것은 다른 쪽도 할 수 있고, 각각 데이터분석에서 사용할 수 있는 라이브러리들이 많이 개발되어 점차 그 경계는 허물어지고 있는 것 같습니다. 그래도 저에게 R과 파이썬 둘 중 딱 하나만 배워야 한다고 하면 저는 파이썬을 선택할 것 같습니다. 데이터분석 ’만’ 을 할 것인지, 데이터분석 ’도’ 할 것인지는 의미가 다르잖아요. 데이터 수집/분석에 머신러닝, 딥러닝 뿐만이 아니라 이후 데이터베이스 쪽이 라던지 웹 등으로 연결 시킬 수 있는 확장성이 높아서 파이썬이 더욱 효율적이라는 것입니다.

2. 데이터 분석 입문 과정을 비전공자/비개발자도 따라갈 수 있을까요?

“충분히 하실 수 있습니다.”
제가 자신 있게 말씀드릴 수 있습니다. 그동안 코딩을 한 번도 해보지 않은 분들 대상으로 50회 이상 강의를 진행하였는데, 다들 잘 하셨습니다. 물론, 해보지 않은 것이라 ‘익숙하지 않은’ 점은 있습니다. 이 부분을 해결하기 위해서는 최대한 직접 많이 해보는 것이 최고의 방법입니다. 그래서 본 강의시간에는 설명만 하거나, 미리 준비된 코드를 함께 작성하며 실행만 해보고 넘어가지 않습니다. 실제로 글자 하나씩 입력해보고, 오류도 많이 접해보는 실습을 많이 해볼 수 있습니다. 강의 시간에 이해가 다 된 것처럼 보이게 할 수도 있으나, 강의 종료 후에 어떻게 활용하실지가 저의 주된 관심사입니다. 강의 시간에는 직접 많이 해보고, 헤메고, 에러 문구도 많이 보고 하면서 함께 익숙해질 예정입니다. 파이썬, 익히기 가장 쉬운 언어라고 합니다. 어렵지 않아요. 한번 해보시죠

3. 강의에서는 주로 어떤 내용을 다룰 예정이시고, 어떤 형태로 진행되나요?

파이썬을 처음 접하는 분들을 기준으로 강의를 시작합니다. 파이썬은 어떻게 생겼고, 어떻게 실행하는지, 수정하는 방법은 무엇인지를 가장 먼저 살펴볼 예정입니다. 현재 엑셀로도 충분히 잘하고 계신 일을 파이썬으로 해보시라고 설명 드리지 않겠습니다. 동일한 시간과 노력을 투자해서 비슷한 결과가 나온다면 엑셀이나 파이썬 중 원하는 도구를 사용하시면 됩니다. 지금 배워서 당장 '엑셀보다 더' 효율적으로 활용 하실 수 있는 내용을 집중해서 알려드릴 예정입니다.

첫 번째는 Pandas 입니다. pandas 를 활용하면 대량의 데이터가 담겨있는 엑셀 파일을 쉽고 빠르게 통합할 수 있으며, 짧은 코드로도 다양한 그래프로 표현하여 해석할 수 있습니다. 또한 엑셀에서는 그리기 어려운 그래프도 그릴 수 있습니다. 본 강의에서는 box-plot, heatmap, pointplot 등을 이용해 그려보고 확인하겠습니다.

두 번째는 웹 크롤링 입니다. 진짜 정보는 웹에 있다는 이야기를 많이 합니다. 크롤링은 인스타그램, 네이버까페, 블로그, 뉴스기사, 쇼핑몰 등 웹에 올려져있는 정보를 쉽게 가져올 수 있는 것을 말합니다. 개인적으로는 크롤링을 알기 전과, 알고 난 후의 제 삶이 많이 바뀌었습니다. 여러분들도 실제 필요한 데이터를 원하는 곳에서 가져올 수 있도록 가이드해 드리겠습니다.

마지막으로 실제 데이터를 분석해보는 과정도 빠질 수 없습니다. 쇼핑몰 데이터 분석 프로젝트를 해보겠습니다. 네이버 쇼핑몰의 상품 판매 정보를 크롤링하여 엑셀 파일에 저장하고, pandas 를 통해 엑셀파일을 불러들이고 전처리 및 분석을 진행할 예정입니다. 데이터 수집 → 데이터 전처리 → 데이터 분석 → 시각화 까지 전 과정을 다루어 보면서 본 과정에서 익혔던 내용들에 대해서 사용법 및 활용계획을 다시 한번 더 정리할 것입니다.

 

4. 업무 일정으로 인해 수업을 못듣는 일정이 있는데 어떻게 도와주실 수 있나요?

본 과정은 교재의 형태로 강의 자료가 제공되며, 제가 작성한 코드를 확인/수정/실행을 해보실 수 있는 실습 파일도 별도 전달 드릴 예정입니다. 강의 자료 및 실습 자료를 보고 예습/복습을 하시면 되며, 이해가 가지 않는 부분은 언제든 메일과 카톡으로 연락 주시면 답변을 드릴 예정입니다.

 

5. 데이터 분석 입문 수강생들분들에게 하고 싶으신 말씀은?

데이터분석에 대해 기대감과 함께 막연한 두려움이 있으실 것으로 생각됩니다. 한번도 해보지 않은 것을 해본다는 것은 큰 용기가 필요하다는 것을 알고 있습니다. 그럼에도 불구하고 이렇게 강의에 대해 찾아보고 내용을 꼼꼼하게 살펴보고 계신 것 만으로도, 벌써 반은 시작하셨다고 생각합니다.

알파고 열풍이 불면서 많은 기업과 회사에서 인공지능, 빅데이터, 데이터분석에 대한 큰 기대감을 가졌었습니다. 많은 컨설팅, 기업내 연구과제등이 진행되어 왔으나 아시다시피, 현실적으로 활용 가능한 것들은 많지 않았죠. 관련 내용을 공부하고 실제 업무를 하는 사람들은 기술적인 부분도 중요하나 ‘도메인 지식’이 더 중요하다고도 말을 합니다. 머신러닝, 딥러닝은 기존에 구현되어 있는 코드로 간단하게 실행할 수 있으나, 이를 실행하기 위한 데이터를 정리 하는 것, 결과 데이터를 해석하는 것, 해석된 내용을 바탕으로 해결책을 제시하는 부분은 머신러닝이나 딥러닝으로 해결하기 어려운 부분입니다. 이러한 부분 때문에 기술적인 지식만 가지고 있는 개발자들이 필요한 것이 아니라, 실제 업무를 실행하고 경험해왔던, ‘도메인 지식’이 풍부한 현업 담당자가 데이터분석에 대해 배우고 활용해야 한다고 생각합니다.

음식업계의 백종원이 “~~하면 되쥬, 참 쉽쥬?” 하며 누구나 집에서 따라할 수 있는 요리법을 알려주는 것처럼, 누구나 쉽게 파이썬으로 데이터를 수집하고, 살펴보고, 분석/시각화 해볼 수 있도록 해보겠습니다. 개강일에 뵙겠습니다.

 

수강료 65만 원50만 원
 
수강신청은 결제 순으로 선착순 마감될 수 있습니다.
개강 후 환불은 학원법 시행령 <제18조 제3항> 수강료 반환기준에 의거합니다.
 
*환불 세부규정 확인하기 (클릭)

15만 원 할인, 놓치지 마세요!

▼ 텍스트 분석까지 필요하신가요? ▼