데이터 분석 정복을 위한 파이썬 머신러닝 실무

- 다양한 데이터 Case로 단 번에 끝내는 파이썬 머신러닝

난이도
3.5/5

“데이터 사이언티스트가 아니더라도
머신러닝 데이터 분석은 누구나 할 수 있습니다!”


✓ 헬스케어/얼굴분석 등 흥미로운 데이터로 배우는 머신러닝 실무
✓ 현업에서 가장 많이 사용하는 머신러닝 최신 트렌드 리뷰
✓ 당장 머신러닝 적용이 필요한 수강생분들을 위한 개별컨설팅까지!


본 강의 하나면 파이썬 머신러닝 기초부터 딥러닝 입문까지 단 번에 끝낼 수 있습니다. 다양한 데이터 Case를 분석해보며 머신러닝을 현업에 즉시 적용해보세요!
일    정03.14 ~ 04.18 | 6회
매주 토요일 14:00 ~ 17:00 | 일 3시간
총 18시간 강의
정    원15명
준비물노트북
가    격100만 원70만 원
장    소러닝스푼즈 강의장 강남대로94길 15, S2빌딩 4층
* 강남역 11번 출구 3분 거리 (지도확인)
광고마케팅기획

데이터 사이언티스트가 아니더라도
머신러닝 데이터 분석은 누구나 할 수 있습니다!


이제는 직무, 업계 상관없이
필수역량으로 자리 잡은 머신러닝!

다양한 사례를 통해 흥미롭게 머신러닝을 배우고,
현업에 직접 적용할 수 있는 기회를 가져보세요!

| 강의특징

01

 

다양한 데이터 Case로 흥미롭게 배우는 머신러닝!

 

숨막히는 통계 지식들, 수많은 머신러닝 기법들 … 언제까지 이해도 안되는 딱딱한 이론들을 들여다보고 있으실 건가요? ‘데이터 분석’, 그리고 ‘머신러닝’만큼은 ‘실습’이 필수입니다. 막막하고 딱딱한 이론에서 벗어나 SNS 데이터 분석, 뉴스 데이터 분석, 얼굴 특징점 분석, 헬스케어 데이터 분석, 대기질 데이터 분석 등 실생활 데이터 실습을 통해 재미있게 학습해봅니다.

02


최신 머신러닝 트렌드를 한 번에 학습!


현업에 즉시 적용하기 위해! 머신러닝의 큰 틀인 지도학습과 비지도학습의 차이점을 알아가는 것은 물론, 최근 트렌드인 앙상블기법과 머신러닝 전문가가 현업에서 가장 많이 사용하고 있는 차원감소와 특징선택 기술까지 모두 습득할 수 있습니다. 또한 Pandas, Numpy, 사이킷런, 텐서플로우, 파이토치 등 최근 머신러닝 구현에 필수적인 패키지들과 구글과 페이스북에서 사용하고 있는 최신 기술까지 경험해봅니다

03


Github 활용 과제를 통한 머신러닝 완벽 체득화!


머신러닝을 학습함에 있어 복습은 필수적입니다. 이러한 복습이 지루하지 않도록! 매 주 학습과 관련된 간단한 과제를 제공합니다. 특히 과제는 Github를 활용하여 진행하며, 강사님께서 line별로 꼼꼼하게 피드백을 진행하여 매 주 학습내용을 자연스럽게 모두 체득화할 수 있도록 만들어 드립니다.

| 실습영상(지속적으로 업데이트 예정)

| 수강효과

01


머신러닝 완벽정복!
강화된 분석 스킬 셋 장착

머신러닝의 기초 개념을 확실히 정리하는 것은 물론, 다양한 프로젝트와 과제의 반복으로 데이터 분석 스킬셋과 최신 머신러닝 트렌드를 완벽하게 체득화하게 됩니다. 그 결과 이제는 대용량 데이터 및 고차원 데이터를 처리하는데 있어 어떻게 해야 내가 원하는 결과물을 얻어낼 수 있는지 그 퍼포먼스를 모두 보여낼 수 있습니다.

 

02


최신 트렌드 기법 활용!
입맛대로 머신러닝 사용가능

파이썬 데이터 분석의 필수 요소인 Pandas 활용법을 강화하게 됩니다. 그리고 이를 바탕으로 머신러닝 및 딥러닝을 진행하며 Numpy, 사이킷런, 텐서플로우, 케라스, 파이토치 등의 활용법 또한 익힙니다. 그 결과 최근 머신러닝 및 딥러닝에서 가장 많이 쓰이고 있는 트렌드를 모두 학습하게 되었으며, 실습을 바탕으로 적재적소에 이를 활용할 수 있는 능력 또한 갖추게 됩니다.

03

 

현업 즉시 적용!
전문가의 개별컨설팅 진행

만약 개별 데이터로 논문, 프로젝트 및 직접적인 현업 적용을 하고 싶다면 실제 현업에서 머신러닝 및 딥러닝 전문가로 활동하고 계시는 강사님께서 직접 수업 외 별도로 코멘트를 드립니다. 이를 통해 수업 시간 외 강사님의 노하우를 100% 얻어갈 수 있으며, 전문가의 컨설팅으로 완성도 있는 결과물을 가져갈 수 있습니다.


| 수강대상

Pandas를 사용해본 적 있는,
파이썬 기초를 익힌 수강생

최신 머신러닝 기법을 익히고,
적용해보고 싶은 수강생

딥러닝 입문

머신러닝 및 딥러닝 관련 논문을
써야 하는 대학원생

지금 당장 업무에 머신러닝을
적용하여 활용하고 싶은 분

머신러닝부터 딥러닝까지
모두 경험해보고 싶은 수강생

머신러닝, 어렵지 않습니다.
또 이용 가능한 데이터는 언제나 여러분들 가까이에 있습니다.
프로젝트를 통해 재미있게, 꾸준히, 지치지 않고 흥미롭게
머신러닝 전문가가 될 수 있는 기회를 가져보세요.

- 강사님 인터뷰-

| 커리큘럼

머신 러닝의 기초 이해와 프레임워크 설치 및 사용법 학습을 진행하며, 데이터 수집, 랭글링, EDA, 결과도출의 과정을 거치는 데이터 분석 프로세스에 대해 배웁니다. 데이터 랭글링은 이중 데이터 수집 후에 복잡하고 지저분한 상태의 데이터들을 심플한 분석과 접근을 통하여 통합하는 과정으로 데이터 분석 및 머신러닝에 있어 필수 과정입니다. 본 강의에서는 데이터 랭글링과 관련한 Pandas 기초 정리 및 Pandas를 이용한 CSV/Excel/HTML의 데이터 읽기/전처리/랭글링 실습을 진행합니다

이론

  • 머신 러닝이란 무엇인가: 기계는 어떻게 학습하는가?
  • Pandas 기초
  • Pandas를 이용한 데이터 읽기/클리닝/랭글링

실습

  • Anaconda 설치 및 사용법
  • Jupyter Notebook 소개 및 Github연동 사용법
  • Pandas 프레임워크 사용법 기초
  • Pandas를 이용한 CSV/Excel/HTML 파일 읽기/데이터클리닝/랭글링 실습

머신러닝의 학습법 중에서 주요한 2가지 방법으로 지도학습과 비지도학습 중 비지도학습에 대해 배우고 실습합니다. 그 중 비지도학습에서 가장 중요한 군집화(clustering)에 대해서 학습합니다.

이론

  • 비지도학습의 기초 이론
  • k-평균 군집화(k-means clustering)의 이해

실습

  • 연령과 성별, 소득이 SNS 사용에 어떤 영향을 미칠까?
  • – k-평균군집화(k-means clustering)을 이용한 연령별/성별 SNS사용 습관 모델링
    – k-평균군집화(k-means clustering)을 이용한 소득별 SNS사용 습관 모델링

머신러닝과 같이 대용량의 데이터를 처리하는데 있어서 데이터의 차원이 증가하면 처리해야 할 데이터의 양이 엄청나게 증가하게 되어 데이터가 갖는 의미를 찾아내기 어려워집니다. 그 예로 스노우, 틱톡과 같이 얼굴 특징점을 추출하는 데이터 분석이 있습니다. 이를 해결을 위해 머신러닝에서는 차원감소(dimenstionality reduction)와 이의 주요한 방법으로 특징선택(feature selection)을 이용합니다. 본 강의에서는 차원감소, 특징선택에 대한 이해를 높이고, 특징선택 중 주성분분석(PCA) 기술을 실습 해봅니다.

이론

  • 차원 감소(dimenstionality reduction) 기초 이론
  • 주성분분석(PCA)의 이해

실습

  • 스노우, 틱톡과 같은 어플은 어떻게 얼굴 이미지의 특징점을 추출할 수 있을까?
  • – 주성분분석(PCA)를 이용한 얼굴 특징점 추출 실습

비지도학습에 이어 머신러닝의 학습법 중 주요한 알고리즘 중 하나인 지도학습(supervised learning)을 익히고 실습합니다. 정답을 알려주고 학습을 시키는 지도학습에서 가장 중요한 2가지 테크닉인 분류(classification)와 회귀(regression)에 대해 학습합니다. 그 후 k-최근접 이웃 알고리즘(KNN)분류기와 서포트벡터머신(SVM)에 대해 학습합니다.

이론

  • 지도학습(supervised learning) 기초 이론
  • 분류모델(classification model)의 정확도 측정 시 필요한 주요사항 이해
  • k-최근접 이웃 알고리즘(KNN)분류기(classification)의 이해
  • 서포트벡터머신(SVM)의 이해

실습

  • 최근 가장 많이 등장하는 뉴스 주제어는 무엇일까?
  • – k-최근접 이웃 알고리즘(KNN) 분류기(classification)
    – 서포트벡터머신(SVM)을 이용하여 최근 가장 많이 등장하는 뉴스 주제어 분석하기

앞서 배운 머신러닝 모델들을 서로 연결하면 더욱 강력한 모델을 만들어낼 수 있는데 이를 앙상블(ensemble)기법이라 합니다. 이중 모델을 구성하는 기본 요소로 공통적으로 의사결정트리를 사용하는 랜덤 포레스트(random forest)와 그래디언트 부스팅(gradient boosting)을 배우고 훈련하는 기회를 가집니다. 이 두 모델의 보다 깊은 이해를 위해 의사결정트리에 대한 학습도 병행합니다. 이를 위해 Python 기반 scikit-learn 패키지의 ensemble 서브 패키지를 이용해봅시다.

이론

  • 의사결정트리(Decision Tree)의 이해
  • 랜덤 포레스트(Random Forest)의 이해
  • 그래디언트 부스팅(Gradient Boosting)의 이해

실습

  • scikit-learn 설치 및 사용법 이해
  • 헬스케어 데이터로 배워보는 앙상블 기법
  • – 랜덤 포레스트(Random Forest) scikit-learn 실습
    – 그래디언트 부스팅(gradient boosting) scikit-learn 실습

머신러닝의 다음 단계인 딥러닝을 경험해봅니다. perceptron을 시작으로 인공신경망(ANN)기초를 익히고, 더 나아가 심층신경망(DNN)을 학습, 적용 훈련을 통하여 딥러닝의 기초를 익히며, PyTorch 프레임워크를 이용하여 간단하게 딥러닝을 실습해봅니다.

이론

  • Perceptron의 이해
  • 인공신경망(ANN)의 이해
  • 심층신경망(DNN)의 이해
  • Tensorflow & PyTorch 소개

실습

  • 딥러닝 기반의 대기질 예측 모델링 훈련하기
  • – PyTorch를 이용한 ANN 알고리즘 기반의 대기질 예측 모델링 실습
    – PyTorch를 이용한 DNN 알고리즘 기반의 대기질 예측 모델링 실습

| 강사소개 및 인터뷰

데이터 분석

정경민

현) 피타소프트 책임 연구원

(현) 소프트웨어 마에스트로(과학기술정보통신부 산하), 멘토(Mentor)
(전) 에이비일팔공, 모바일 파트 리드 소프트웨어 엔지니어(Lead Software Engineer)
(전) 에임, 개발팀 소프트웨어 엔지니어(Software Engineer)
(전) 위메프, 개발팀 소프트웨어 엔지니어(Software Engineer)
- 성균관대 전자전기컴퓨터공학과 석사 수료
- 성균관대 바이오메카트로닉스 학사 졸업
- 블랙박스 영상을 처리하는 클라우드 서비스 개발
- 클라우드에 업로드된 영상 속 특정 케이스 관련 머신러닝/딥러닝 분석 플랫폼 개발
- 클라우드 영상 정보 및 GPS, G센서 정보를 연동한 머신러닝/딥러닝 분석 플랫폼 개발

1. 자기소개 부탁드립니다.

안녕하세요. 정경민입니다. 학부와 대학원에서는 컴퓨터비전과 로보틱스 분야를 연구,개발하였고, 그후 필드에서는 모바일 데이터에서 시작하여 영상 데이터 처리까지 다양한 데이터 핸들링을 경험하고, 현재는 영상 기반의 대용량 데이터 처리 플랫폼 개발을 하고 있습니다. 또한 현재 과학기술정보통신부산하의 소프트웨어 마에스트로 프로젝트에서 멘토를 맡아 소프트웨어 엔지니어들을 길러내는데 도움을 드리고 있습니다.

저는 그동안 모바일 기반의 E-Commerce 플랫폼, FinTech 분야 중 컴퓨터 알고리즘 투자 플랫폼, 그리고 영상기반의 대용량 플랫폼 기술을 개발하며, 다양한 분야의 데이터들을 처리하는 기회를 가졌고, 이 많은 훈련 속에서 노하우를 축적해 왔습니다.

2. 강의에서는 주로 어떤 내용을 다룰 예정이시고, 어떤 형태로 진행되나요?

강의는 이론과 적용/실습이 각각 30:70의 비중으로 이루어질 것입니다. 머신러닝이라고 하면 어려운 이론때문에 고개를 젓는 경우가 많은데, 최근에는 Pandas와 같은 좋은 프레임워크들과 NumPy와 같이 좋은 라이브러리들이 많아져서 이론의 기초만 이해하면 실제 데이터에 적용하기가 한결 쉬워진 것이 사실입니다. 프레임워크나 라이브러리들의 활용에 있어서도 어려운 코딩이 아닌, 간단한 함수 몇줄의 사용만으로도 빠른 결과값 확인이 가능하기 때문에 머신러닝에 대한 문턱이 많이 낮아졌다고 볼수 있습니다.

잠깐 언급드린대로, 이 강의는 실습비중이 높은 머신러닝 강의로 수강생들이 실제 데이터들을 핸들링하여 머신러닝 기법들을 적용하는 다양한 훈련을 통해서 현업에 머신러닝을 즉시 적용할 수 있도록 도울 것입니다.
수강생분들은 가장 먼저, 머신러닝 기초 이론들. 즉 머신러닝이란 무엇인가에 대해서 학습하게 됩니다.
이 과정에서 비지도학습과 지도학습, 모수적학습과 비모수적학습 기법 등 각각의 특징들을 어렵지 않게 이해하게 됩니다. 그리고 나면, Pandas와 Anaconda 프레임워크에 대한 기본기를 다진 후, 실무에서 사용하는데 반드시 필요한 군집화와 분류에 기반한 머신러닝 기술 적용하고 훈련하게 됩니다. 차원감소과 특징선택에서는 주성분분석, 비지도 학습 군집화에서는 k-평균 군집화 알고리즘, 지도학습에서는 서포트벡터머신(SVM)기법을 배우고 적용하는 훈련이 수강생 여러분에게 준비되어 있습니다.
더 나아가서 요즘 최신 트렌드이자 다양한 모델을 연결하여 보다 강력한 퍼포먼스를 낼 수 있는 앙상블기법 중 랜덤포레스트 및 그래디언트부스트까지 트레이닝 할 수 있으므로, 수강생들은 머신러닝에 필요한 전반적인 기술셋은 모두 익히고 적용할 수 있으리라고 생각합니다.

그리고 주마다 부여되는 부담스럽지 않은 간단한 과제를 통하여 수강생들이 정해진 마감일까지 과제를 수행하면, 제가 그에 대한 피드백을 Github을 통하여 코드 레벨 단위에서 상세히 드릴 예정입니다. 이는 수강생들이 실무에서 머신러닝을 적용하는데 있어 좋은 밑거름이 될 것이라고 확신합니다. 이미 소프트웨어 마에스트로 과정에서 연수생들과 함께 하는 동안 증명된 좋은 케이스들을 갖고 있기에 자신있게 말씀드릴 수 있습니다. 

3. 본 강의에서 배운 내용을 수강생 분들이 어떻게 활용할 수 있을까요?

큰 틀에서는 강의에서 학습하고 훈련한 내용은 수강생들이 데이터 셋을 이용하여 스스로 모델링하고, 클러스터링, 분류 후, 결과값을 도출하고자 하는 모든 분야에 적용 가능합니다. 하지만 이렇게 이야기를 하면 너무 막막하기 때문에, 예를 들어보겠습니다.

마케팅에서 광고에 반응하고, 구매를 하는 고객들이 있다고 할 때, 광고에 반응하는 고객들과 구매하는 고객 들 간의 상관관계를 파악해서 기존의 데이터 셋을 바탕으로 새로운 마케팅 타겟군을 만들어서 타겟마케팅을 하고자 하는 경우, 커머스 데이터 셋에서 상품의 판매량을 기준으로 나열했을때, 이에 대한 요인 분석과 유사 상품의 타겟 고객을 설정하는 경우 등에 대해 실무에서 바로 적용 가능하다고 할 수 있습니다.

서두에 말씀드린 대로 데이터 셋이 존재하고, 수강생들이 그 데이터 셋을 이용하여 스스로 모델링하고, 클러스터링, 분류하고 결과값을 도출하고자 모든 분야에 적용 가능합니다. 

4. 다른 강의와 어떤 차별 점이 있나요?

이 강의는 프로젝트 기반의 실무적용에 중점을 두고 있습니다. 수강생들이 단순히 테크닉을 익히는 과정이 아닌, 가설설정-실행-검정의 프로세스 경험을 통해서 현업에 바로 적용할 수 있도록 트레이닝 되는 것은 물론, Self-Trained된 머신러닝개발자/연구자/데이터분석가가 될 수 있도록 돕는 과정입니다.

5. 마지막으로 수강생들에게 하고 싶으신 말

머신러닝은 어렵지 않습니다. 또, 이용 가능한 데이터는 언제나 여러분들 가까이에 있습니다. 하지만, 거저 이해되고, 또 쉽게 아무렇게나 적용할 수 없는 것이 또한 머신러닝입니다. ‘차근차근’과 ‘꾸준함’ 이 두 단어가 머신러닝을 다루는 데 이르는 핵심 키워드입니다. 본 강의는 는 수강생들에게 필수적인 기초이론과 실무 실습, 그리고 스스로 디벨롭 할 수 있는 과제수행과 피드백의 훈련 사이클을 제공합니다. 수강생 여러분들이 6주동안 차근히, 그러나 꾸준히 훈련한다면 어느새 자신이 익힌 머신러닝 기법들을 실무에 적용할 줄 아는 ‘준전문가’가 되어 있음을 발견하게 될 겁니다. 프로젝트를 통해 재미있게, 꾸준히, 지치지 않고 흥미롭게 머신러닝 전문가가 될 수 있는 기회를 누리세요!

수강료 100만 원70만 원
수강신청은 결제 순으로 선착순 마감될 수 있습니다.
개강 후 환불은 학원법 시행령 <제18조 제3항> 수강료 반환기준에 의거합니다.
   # 환불 세부규정 확인하기 (클릭)

30만 원 할인, 놓치지 마세요!