course thumbnail
  • 데이터사이언스
  • 중급

머신러닝 엔지니어링: 전처리부터 모델 서빙 및 관리까지

AI 엔지니어에게 배우는 머신러닝 엔지니어링 완벽 실무 강의! 전처리, 모델 학습은 기본! 앙상블, 파라미터 튜닝, 후처리, 실험 관리까지!

4기
22.09.17 ~ 22.10.29 (총 7회) 매주 토요일 10:00 ~ 13:00 (총 21시간)
  • 오프라인
  • LIVE
    온라인 라이브 (링크제공)

7주만에 완성하는 진짜 머신러닝

진짜 머신러닝 엔지니어라면, 코드 작성보다 모델 서빙과 로깅에 집중합니다.


강의소개

진정한 머신러닝 엔지니어로 거듭나는 가장 빠른 길,
7주만에 끝내는 엔지니어링 A to Z.

머신러닝

01. 그저 머신러닝 알고리즘만 알려주는 강의에 지쳤다면?

환경 구축 및 데이터 전처리부터 모델 성능 향상을 위한 알고리즘, 서빙&로깅까지 탄탄한 커리큘럼을 준비했습니다.

02. 흔한 타이타닉 데이터, IRIS 데이터가 아닌 실무 데이터로 경험하고 싶다면?

생체과학 뇌 내 성분 분석, 심리 성향 예측, 신용카드 사용자 연체 예측 등 실제 현업과 유사한 데이터셋을 활용해 실습을 진행합니다.

03. 기본적인 코드 리뷰 외에
강사님의 도움으로 내 환경을 완벽하게 구축하고 싶다면?

실습 시 어려움에 부딪힐 때를 대비해, Teaching Assistant가 함께 붙어 1:1 실습 피드백을 돕습니다.


본 강의에서
무엇을 얻어갈 수 있나요?

글로벌 기업 AI 엔지니어에게 배우는 머신러닝 엔지니어링!

  • 올바른 설계 능력

    머신러닝 알고리즘에서의 올바른 설계 방향을 배울 수 있습니다!

    전처리부터 모델 선택, 학습 ,후처리 등 머신러닝 파이프라인 설계 능력과 함께 결과물의 퀄리티가 올라갑니다.

    머신러닝 엔지니어링 강의
  • 포트폴리오

    커리어에 바로 활용할 수 있습니다.


    현업에서 사용하는 머신러닝 엔지니어링 실전 테크닉을 배워 실무와 유사한 프로젝트 결과물을 얻습니다.

    머신러닝 엔지니어링 강의
  • 1:1 피드백 코칭

    직접 실습을 도와드립니다.


    현업 전문가의 실무 노하우는 물론, 코드리뷰가 진행됩니다. 여기에 추가적으로 개인 코치가 붙어 1:1 피드백이 가능합니다.

    머신러닝 엔지니어링 강의

머신러닝 이론부터 프로젝트까지
배우는 것을 넘어 포트폴리오까지 완성해보세요.<


본 강의가 특별한 이유는
무엇인가요?

1

기초 라이브러리 활용부터
실무 필수 라이브러리까지

통계적인 지식이 없어도, 파이썬 기초 실력만으로 머신러닝 알고리즘을 기초부터 활용까지 탄탄하게 배울 수 있습니다. Pandas, Numpy, Scikit-Learn 등의 기초 머신러닝 라이브러리부터 XGBoost, LightGBM 등 현업 및 경진대회에서 자주 사용되는 최신 라이브러리를 학습할 수 있는 커리큘럼으로 구성되어 있습니다.

2

경진대회 데이터를 활용한
실무 머신러닝 엔지니어링 경험

힘들게 머신러닝 이론을 배웠는데 직접 적용하지 못하면 아무런 의미가 없습니다. 또한 샘플 데이터로 연습만 해서는 실전에서 활용할 수 없습니다. 본 과정은 이론 3 / 실습 7 비율의 커리큘럼으로 구성되어 있습니다. 그리고 캐글 및 데이콘에서 제공하는 실제 경진대회 데이터를 활용하여 현업과 유사한 데이터를 간접 경험할 수 있습니다.

3

Product 개선을 위한
1:1 피드백 제공

수업에서 진행하는 프로젝트와 관련된 피드백은 물론 실무 적용, 경진대회 등 다양한 상황에서의 머신러닝 적용과 관련된 피드백을 온·오프라인으로 받아볼 수 있습니다. 페이스북 캐글 코리아 운영진이자 캐글 상위 2%. 그리고 다양한 기업 프로젝트를 경험해보셨던 강사님과 함께 하는 머신러닝 강의!

FAQ

강의에 대해
궁금한 점이 있으신가요?

Q. 오프라인으로만 진행하나요?

해당 과정은 오프라인 현장 강의와 온라인 라이브가 동시 진행됩니다.
소통 채널을 통해 녹화본도 함께 제공해드릴 예정입니다.
과정 진행 시간 동안 담당 매니저가 디스코드 채널을 운영할 예정이며, 강사님과도 디스코드 채널을 통해 언제든 소통하실 수 있습니다.

Q. 수강 시, 준비 사항은 어떤 것이 있을까요?

실습을 위해 개인 PC가 꼭 필요합니다. OS는 Windows OS, Mac OS 모두 가능합니다.
또한 머신러닝 학습을 위해 파이썬 기초 문법 정도의 지식이 요구됩니다.

수료하신 분들의 추가적인 후기는 어떤가요?

CODE 작성 절차를 반복적으로 교육해주셔서 어려운 내용이었지만 잘 흡수하게 되었습니다.강사님께서 강의 전후로 질의응답을 정말 잘 해주셨습니다.

이민주, 머신러닝 엔지니어

머신러닝과 관련된 전반적인 프로세스를 배울 수 있어서 좋았습니다.특히 강의 자료가 굉장히 좋았음은 물론, 소통채널을 통한 강사님의 피드백이 즉각적이어서 너무 감사했습니다.

김한슬, 대학생

강사님은 실제 현업자이면서 부단히 노력하시는 분이구나 하는게 느껴졌고,다양한 이야기로부터 "타 강의에서는 이런 경험을 얻을 수가 있었을까?"라고 생각하면서 강의를 완강할 수 있었습니다.

정우성, 연구원
수강 대상

이런 분들은 꼭 들으셔야 해요!


이론으로만 배우는 머신러닝이 아닌 현업에서 머신러닝 모델을 어떻게 적용하는지 궁금한 분


실제 데이터를 다뤄보며 머신러닝 기초 뿐 아니라 전반적인 머신러닝 엔지니어링 기술을 익히고 싶은 분


개발자, 백엔드 엔지니어에서 머신러닝 엔지니어로 커리어 전환을 원하는 분

강사소개

우리 강사님을 소개할게요!

모델 서빙 강의
James
이력사항
  • (현) 인공지능 스타트업 AI Engineer
  • (전) SK주식회사 C&C DB Engineer
  • 삼성 청년 SW 아카데미 개발자 특강 진행
  • 서울 IT 직업전문학교, 캐글 & 머신러닝 특강
  • Dacon, 머신러닝 기초 특강
  • 한국토지주택공사 국토 도시 데이터분석 경진대회 자문
  • SK Planet, T-Academy 머신러닝 기초 특강 진행
  • 삼성전자 반도체 부문 임직원 머신러닝, 딥러닝 기초 실습 진행
투자이력
  • 페이스북 커뮤니티 캐글코리아 운영진
  • 캐글 경진대회 참여, 상위 2%
  • 국내 L 백화점 데이터 분석 프로젝트 참여
  • 충남대학교 병원 의료 데이터 분석 프로젝트 참여
1. 간단하게 자기소개 부탁드립니다.

안녕하세요. 인공지능 스타트업에서 AI Engineer 업무를 담당하고 있는 James입니다. 머신러닝 경진대회를 준비하거나 실무에 머신러닝 기술을 적용하고자 하는 분에게 현업 프로젝트 경험과 다양한 머신러닝 경진대회 경험을 압축하여 활용하실 수 있도록 도와드리겠습니다.

2. 강의에서는 주로 어떤 내용을 다룰 예정이시고, 어떤 형태로 진행되나요?

입문 강의가 아닌 기초~중급 단계의 강의이므로 머신러닝 알고리즘의 기초부터 실제 머신러닝 프로젝트에 사용할 수 있는 기술 및 노하우를 전달해드리려고 합니다. 프로젝트(과제)를 통해 배운 것을 즉시 활용하여 적용해볼 수 있도록 진행할 예정입니다.

3. 본 강의에서 배운 내용을 수강생 분들이 어떻게 활용할 수 있을까요?

머신러닝 입문 단계에서 기초, 중급으로 나아갈 수 있도록 도와드리겠습니다. 기초뿐만 아니라 경진대회나 실무에 도전할 수 있는 수준을 목표로 하는 강의이며, 본 강의를 수강한 이후에는 데이터를 살펴보고 목적에 맞는 머신러닝 파이프라인을 설계할 수 있는 능력을 갖출 수 있게 됩니다.

4. 다른 강의와 어떤 차별점이 있나요?

1. 실제로 프로젝트를 경험해보지 않으면 얻을 수 없는 노하우를 배울 수 있습니다. 뿐만 아니라 앙상블, 모델 튜닝(AutoML), 실험 관리 등 프로젝트를 진행하면서 유용하게 쓰일 수 있는 라이브러리들에 대해 배우고 실습을 진행할 수 있습니다.
2. 오프라인 강의뿐만 아니라 과제 및 별도의 온라인 세션을 통해 질의 응답 및 코칭을 진행할 예정입니다. 지속적으로 수강생분들의 의견을 반영하여 좋은 강의가 될 수 있도록 노력하겠습니다.

5. 마지막으로 수강생들에게 하고 싶으신 말이 있나요?

빠르게 전문가로 만들어드리겠습니다.’ 라는 말씀은 드리지 않겠습니다. 또한, 본 강의를 수강하며 과제와 프로젝트로 인해 힘드실 수 있습니다. 하지만 자신 있게 말씀드릴 수 있는 건 본 머신러닝 강의를 제대로 수강하신 분이라면 데이터를 보고 무엇을 시도해봐야 할지 어떤 방식으로 프로젝트를 진행해야 할지 판단하고 적용할 수 있는 수준으로 만들어드리겠습니다.

커리큘럼 (7)

  • 1회차. 프로젝트 환경 구축 및 데이터 전처리

    [강의 목표]

    - 전처리, 모델 선택, 학습, 후처리등으로 이루어진 기본 머신러닝 파이프라인의 흐름을 배웁니다. 또한, 프로젝트를 진행하며 저지르기 쉬운 실수와 주의사항에 대해 알아봅니다. 
    - Anaconda, Jupyter Lab등 머신러닝 개발 환경을 구축합니다. 
    - 정형 데이터를 다루기 위한 Numpy와 Pandas 라이브러리의 기본적인 사용 방법에 대해 실습을 진행합니다. 


    [이론]

    1) 머신러닝 프로젝트의 흐름

    2) Anaconda, Jupyter 등 머신러닝 개발 환경 라이브러리 소개

    3) Numpy, Pandas 라이브러리 소개


    [실습] 

    1) Numpy, Pandas 라이브러리 기본 사용법

    2) 개인 프로젝트 데이터 분리 실습


  • 2회차. 전처리 및 회귀를 위한 머신러닝 알고리즘 알아보기

    [강의 목표]

    - 데이터의 분포, 자료 형, 값의 범위를 조정하는 스케일링, 결측치를 처리하는 방법, 범주형 변수를 다루는 방법들에 대해 배웁니다.
    - 선형 회귀(Linear Regression)의 기본적인 개념에 대해 학습합니다. 
    - 머신러닝 모델을 기반으로한 회귀 모델의 개념 및 실습을 진행합니다. 
    - 회귀 모델을 위한 평가 방법과 회귀 모델 평가 시 주의 사항에 대해 배우고 실습을 진행합니다.


    [이론]

    1) 스케일링, 결측치 처리 범주형 변수 인코딩 등 기초 전처리 이론

    2) 회귀 모델 기초 이론

    3) 회귀 모델 평가 방법과 주의사항

    4) 머신러닝 모델을 기반으로한 회귀 모델


    [실습] 

    1) 스케일링, 결측치 처리(MICE), 범주형 변수 인코딩 등 전처리 실습

    2) Linear Regression 모델 및 머신러닝 모델을 기반으로 한 회귀 모델 실습 및 평가

    3) 개인 프로젝트 데이터에 전처리 및 회귀 모델 실습


  • 3회차. 분류를 위한 머신러닝 알고리즘 알아보기

    [강의 목표]

    - 지도 학습 알고리즘의 종류 중 하나인 분류(Classification)에 대해 학습합니다. 
    - 로지스틱 회귀, SVM, 결정 트리, 랜덤 포레스트 등 기본적인 머신러닝 알고리즘부터 경진대회에서 자주 사용되는 모델에 대해 학습하고 실습을 진행합니다. 
    - 분류 모델을 위한 평가 방법과 혼동 행렬(Confusion Matrix)을 통해 분류 모델 평가 시 주의 사항에 대해 배우고 실습을 진행합니다.


    [이론]

    1) 분류 모델 기초 이론

    2) 분류 모델 평가 방법과 주의사항

    3) 경진대회에서 자주 사용되는 모델


    [실습] 

    1) Logistic Regression, SVM, Decision Tree, Random Forest 모델 실습 및 평가

    2) XGBoost, LightGBM 라이브러리 모델 실습 및 평가

    3) 개인 프로젝트 데이터에 분류 모델 실습


  • 4회차. 모델의 성능을 향상시키기 위한 알고리즘 알아보기 (1)

    [강의 목표]

    - 주어진 데이터 뿐만아니라 학습하지 않은 데이터에 대해 일반화 성능을 향상시키기 위한 모델 검증과 앙상블에 대해 학습합니다. 
    - 교차 검증(Cross Validation), 투표 앙상블(Voting Ensemble) 등 모델의 일반화 성능을 향상시킬 수 있는 알고리즘을 배워봅니다.
    - 좋은 변수를 선별하기 위한 기법 중 하나인 Permutation Importance에 대해 학습하고 실습을 진행합니다.


    [이론]

    1) 모델 검증 기초 이론

    2) 앙상블 기초 이론

    3) 변수 선택 기법 이론


    [실습] 

    1) k-Fold을 활용하여 모델 교차 검증 실습

    2) Out-Of-Fold 모델 앙상블 실습

    3) 변수 선택 기법 실습 (Permutation Importance)

    4) 개인 프로젝트 데이터에 모델 검증 및 앙상블 실습


  • 5회차. 모델의 성능을 향상시키기 위한 알고리즘 알아보기 (2)

    [강의 목표]

    - 정형 데이터를 더 빠르게 다를 수 있는 병렬처리 방법에 대해 학습합니다.
    - AutoML 라이브러리를 활용한 파라미터 튜닝에 대해 학습하고 실습을 진행합니다.


    [이론]

    1) 병렬 처리 기초 이론, Modin Pandas, Ray 라이브러리 소개

    2) AutoML(WandB, Raytune) 라이브러리 소개


    [실습] 

    1) Modin Pandas 라이브러리 실습 

    2) AutoML (WandB, Raytune) 라이브러리를 활용한 하이퍼 파라미터 튜닝 실습


  • 6회차. Rest API Server / Database 구축해보기

    [강의 목표]

    - Rest API서버를 만들기 위해 기본 지식을 습득합니다.
    - Database를 구축하기 위해 기본 지식을 습등합니다..
    - Fast API 프레임워크를 사용해 Rest API서버를 구축해봅니다.
    - PostgreSQL Database를 구축해봅니다.


    [이론]

    1) Rest API / Database 기초 이론

    2) Docker 기초 이론


    [실습] 

    1) Fast API 프레임워크로 Rest API 서버 구축하기

    2) Docker를 사용해 PostgreSQL Database 구축하기


  • 7회차. 모델 서빙, 모델 로깅

    [강의 목표]

    학습한 모델을 서빙해 봅니다. 
    - 기존 Rest API 서버에 추가적인 라이브러리(redis, bentoml)를 사용해봅니다. 
    - 모델을 관리하기 위한 모델 관리 라이브러리 mlflow에 대해 학습합니다.


    [이론]

    1) 모델 서빙 기초 이론

    2) 모델 관리 기초 이론


    [실습] 

    1) Redis를 이용한 예측 서비스 만들기

    2) BentoML을 이용한 컨테이너 기반 예측 서비스 만들기

    3) 모델 및 프로젝트를 관리하기 위한Mlflow 서버 만들기


커리어 성장으로 가는 길, 러닝스푼즈와 함께 하세요!

지금 보고 계시는 강의의 관련 태그로 다른 강의도 찾아보세요.

오프라인 LIVE

머신러닝 엔지니어링: 전처리부터 모델 서빙 및 관리까지

매일 선착순 20명 한정! 할인가 확인하고 커리어 성장하세요!