머신러닝, 데이터 전처리, 강의, 모델링
  • 데이터사이언스
  • 중급

머신러닝 엔지니어링: 전처리부터 모델 서빙 및 관리까지

실무에 바로 적용할 수 있도록 알려주는 머신러닝 강의! 머신러닝 모델링부터, 머신러닝 성능을 위한 데이터 전처리 비결까지!

7기
강의 일정
23.06.18 ~ 23.08.06 (총 8회) 매주 일요일 10:00 ~ 13:00 (총 24시간)

데이터 추출 → 모델 선정 및 학습 → 모델 서빙 ML 파이프라인 구축!

5000개 이상의 머신러닝 파이프라인을 운영하는 현직 ML Engineer의 노하우

강의소개

3년차 수준의 머신러닝 엔지니어는

ML 프로젝트의 전과정을 커버할 수 있어야 합니다.

머신러닝 엔지니어링 강의

01. 최신기술을 활용한 MLOps 인프라 구성

Prefect, MLflow, MinIO, FastAPI 등 MLOps 인프라를 구축하기 위해 필요한 최신 오픈소스 라이브러리와 툴들을 활용합니다. 이를 통해 구축한 인프라를 활용하여 머신러닝 모델을 학습하고 배포하는 전체적인 과정을 실습합니다. 이를 통해 머신러닝 모델을 보다 효율적으로 학습하고 배포하는 능력을 갖출 수 있습니다.

02.머신러닝 모델 이해도와 엔지니어링 역량

책, 인강에서 머신러닝 엔지니얼이 과정은 ML LifeCylce의 일부만 다룹니다. 이 강의는 데이터 추출부터 모델 학습 및 예측, 모델 파이프라인 구축과 자동화 전 과정을 다루어 머신러닝 모델에 대한 이해도 뿐 아니라 머신러닝 엔지니어링에 필수인 개발 역량을 향상시킬 수 있습니다.

03. 머신러닝 파이프라인,자동화 3개 프로젝트 완성

회귀, 분류 머신러닝 파이프라인 프로젝트와 MLOps 인프라 구축을 통해 머신러닝 파이프라인 자동화 프로젝트까지 총 3개의 프로젝트를 완성할 수 있습니다. 오프라인 수업과 별개로 매주 1회 온라인 현직자의 밀착 피드백을 통해 머신러닝 엔지니어링 프로젝트를 완성하세요.


본 강의에서

무엇을 얻어갈 수 있나요?

머신러닝 알고리즘부터 파이프라인 자동화, 모델 서빙까지

  • 머신러닝 기법에 대한 이해도

    각 전처리, 머신러닝 기법들에 대한 기초적인 이론 지식을 바탕으로 다양한 조합 방식을 훈련하는 시간을 갖습니다.이를 통해 각 기법들의 특성에 맞게 조합하여 머신러닝 파이프라인을 작성할 수 있는 역량을 가질 수 있습니다.

    머신러닝 엔지니어링 강의
  • 머신러닝 엔지니어링 역량

    Numpy, Pandas, Scikit-learn, XGBoost, LightGBM, Optuna를 이용한 ML 학습 파이프라인을 개발합니다. 이를 통해 현업에서 머신러닝 엔지니어에게 요구되는 엔지니어링 역량을 쌓을 수 있습니다.

    머신러닝 엔지니어링 강의
  • 현직 머신러닝 엔지니어의 노하우

    5000개 이상의 머신러닝 파이프라인을 운영하는 현업 전문가의 실무 노하우는 물론, 코드리뷰가 진행됩니다.온프레미스, 클라우드 두 가지 환경에서 머신러닝 엔지니어링을 경험해본 강사님의 노하우를 모두 전달해 드립니다.

    머신러닝 엔지니어링 강의

현직 ML엔지니어에게 ML 포트폴리오 피드백 받으세요.


본 강의가 특별한 이유는

무엇인가요?

1

ML Lifecycle의 모든 부분을 다룹니다.

데이터 추출부터 모델 API 서버 개발까지 전 ML Lidecycle을 다루는 강의입니다. 또한 오픈소스 기반 기술 스택을 사용하여 데이터 도메인, 인프라에 의존성 없는 실습 환경을 제공합니다.

2

머신러닝 입문자도 이해 가능한 강의

반복 학습할 수 있도록 정규 이론, 실습 뿐 아니라 과제를 제공하여 과제 리뷰 강의를 진행합니다. 이에 따라 머신러닝 입문생도 이해를 바탕으로 한 머신러닝 프로젝트 진행이 가능합니다.

3

프로젝트 형식으로 알고리즘을 구현합니다.

전처리, 분류, 모델 성능 향상의 각 단계에서 핵심이 되는 알고리즘을 배우고 실습합니다.이를 통해 알고리즘이 현업에 적용되는 방식을 익힐 수 있습니다.

강의자료

이런 자료를 통해 학습해요!

머신러닝 엔지니어링 강의

데이터 전처리

머신러닝 엔지니어링 강의

FastAPI 모델 서빙

머신러닝 엔지니어링 강의

회귀 머신러닝 파이프라인 프로젝트

머신러닝 엔지니어링 강의

머신러닝 파이프라인 구축

머신러닝 엔지니어링 강의

MLflow로 MLOps 인프라 구축

머신러닝 엔지니어링 강의

Prefect로 MLOps 인프라 구축

머신러닝 엔지니어링 강의

파이프라인 자동화 실습
FAQ

강의에 대해

궁금한 점이 있으신가요?

Q. 강의진행은 어떤식으로 되나요?

해당 과정은 오프라인 현장 강의로 진행됩니다.과정 진행 시간 동안 담당 매니저가 디스코드 채널을 운영할 예정이며, 강사님과도 디스코드 채널을 통해 언제든 소통하실 수 있습니다.

Q. 수강 시, 준비 사항은 어떤 것이 있을까요?

실습을 위해 개인 PC가 꼭 필요합니다. OS는 Windows OS, Mac OS 모두 가능합니다.

Q. 사전지식이 필요할까요?

머신러닝 학습을 위해 파이썬 기초 문법 정도의 지식이 요구됩니다.

수료하신 분들의

추가적인 후기는 어떤가요?

CODE 작성 절차반복적으로 교육해주셔서 어려운 내용이었지만 잘 흡수하게 되었습니다.강사님께서 강의 전후로 질의응답을 정말 잘 해주셨습니다.

이민주, 머신러닝 엔지니어

머신러닝과 관련된 전반적인 프로세스를 배울 수 있어서 좋았습니다.특히 강의 자료가 굉장히 좋았음은 물론, 소통채널을 통한 강사님의 피드백이 즉각적이어서 너무 감사했습니다.

김한슬, 대학생

강사님은 실제 현업자이면서 부단히 노력하시는 분이구나 하는게 느껴졌고,다양한 이야기로부터"타 강의에서는 이런 경험을 얻을 수가 있었을까?"라고 생각하면서 강의를 완강할 수 있었습니다.

정우성, 연구원
수강 대상

이런 분들은 꼭 들으셔야 해요!


이론으로만 배우는 머신러닝이 아닌 현업에서 머신러닝 모델을 어떻게 적용하는지 궁금한 분


실제 데이터를 다뤄보며 머신러닝 기초 뿐 아니라 전반적인 머신러닝 엔지니어링 기술을 익히고 싶은 분


개발자, 백엔드 엔지니어에서 머신러닝 엔지니어로 커리어 전환을 원하는 분

강사소개

우리 강사님을 소개할게요!

머신러닝 엔지니어링 강의
James
이력사항
  • (현) 인공지능 스타트업 MLOps Engineer
  • (전) 신약개발 인공지능 스타트업 AI Engineer
  • (전) SK주식회사 C&C DB Engineer
  • Naver Boostcourse AI Tech 멘토
  • SK플래닛 T-Academy AI Course 멘토
  • 삼성청년 SW 아카데미 개발자 특강 진행
  • SK Planet, T-Academy 머신러닝 기초 특강 진행
  • 삼성전자 반도체 부문 임직원 머신러닝, 딥러닝 기초 실습 진행
기타 이력
  • 페이스북 커뮤니티 캐글코리아 운영진
  • 캐글 경진대회 참여, 상위 2%
  • 국내 L 백화점 데이터 분석 프로젝트 참여
  • 충남대학교 병원 의료 데이터 분석 프로젝트 참여
1. 간단하게 자기소개 부탁드립니다.

안녕하세요. 인공지능 스타트업에서 AI Engineer 업무를 담당하고 있는 James입니다. 머신러닝 경진대회를 준비하거나 실무에 머신러닝 기술을 적용하고자 하는 분에게 현업 프로젝트 경험과 다양한 머신러닝 경진대회 경험을 압축하여 활용하실 수 있도록 도와드리겠습니다.

2. 강의에서는 주로 어떤 내용을 다룰 예정이시고, 어떤 형태로 진행되나요?

입문 강의가 아닌 기초~중급 단계의 강의이므로 머신러닝 알고리즘의 기초부터 실제 머신러닝 프로젝트에 사용할 수 있는 기술 및 노하우를 전달해드리려고 합니다. 프로젝트(과제)를 통해 배운 것을 즉시 활용하여 적용해볼 수 있도록 진행할 예정입니다.

3. 본 강의에서 배운 내용을 수강생 분들이 어떻게 활용할 수 있을까요?

머신러닝 입문 단계에서 기초, 중급으로 나아갈 수 있도록 도와드리겠습니다. 기초뿐만 아니라 경진대회나 실무에 도전할 수 있는 수준을 목표로 하는 강의이며, 본 강의를 수강한 이후에는 데이터를 살펴보고 목적에 맞는 머신러닝 파이프라인을 설계할 수 있는 능력을 갖출 수 있게 됩니다.

4. 다른 강의와 어떤 차별점이 있나요?

1. 실제로 프로젝트를 경험해보지 않으면 얻을 수 없는 노하우를 배울 수 있습니다. 뿐만 아니라 앙상블, 모델 튜닝(AutoML), 실험 관리 등 프로젝트를 진행하면서 유용하게 쓰일 수 있는 라이브러리들에 대해 배우고 실습을 진행할 수 있습니다.2. 오프라인 강의뿐만 아니라 과제 및 별도의 온라인 세션을 통해 질의 응답 및 코칭을 진행할 예정입니다. 지속적으로 수강생분들의 의견을 반영하여 좋은 강의가 될 수 있도록 노력하겠습니다.

5. 마지막으로 수강생들에게 하고 싶으신 말이 있나요?

빠르게 전문가로 만들어드리겠습니다.’ 라는 말씀은 드리지 않겠습니다. 또한, 본 강의를 수강하며 과제와 프로젝트로 인해 힘드실 수 있습니다. 하지만 자신 있게 말씀드릴 수 있는 건 본 머신러닝 강의를 제대로 수강하신 분이라면 데이터를 보고 무엇을 시도해봐야 할지 어떤 방식으로 프로젝트를 진행해야 할지 판단하고 적용할 수 있는 수준으로 만들어드리겠습니다.

커리큘럼 (8)

  • 1회차. 프로젝트 환경 구축 및 데이터 전처리

    강의 목표

    • 전처리, 모델 선택, 학습, 후처리등으로 이루어진 기본 머신러닝 파이프라인의 흐름을 배웁니다. 또한, 프로젝트를 진행하며 저지르기 쉬운 실수와 주의사항에 대해 알아봅니다.Anaconda, Jupyter Lab등 머신러닝 개발 환경을 구축합니다.정형 데이터를 다루기 위한 Numpy와 Pandas 라이브러리의 기본적인 사용 방법에 대해 실습을 진행합니다.

    이론

    • 머신러닝 프로젝트의 흐름
    • Anaconda, Jupyter 등 머신러닝 개발 환경 라이브러리 소개
    • Numpy, Pandas 라이브러리 소개

    실습

    • Numpy, Pandas 라이브러리 기본 사용법
    • 개인 프로젝트 데이터 분리 실습
  • 2회차. 전처리 및 회귀를 위한 머신러닝 알고리즘 알아보기

    강의 목표

    • 데이터의 분포, 자료 형, 값의 범위를 조정하는 스케일링, 결측치를 처리하는 방법, 범주형 변수를 다루는 방법들에 대해 배웁니다.선형 회귀(Linear Regression)의 기본적인 개념에 대해 학습합니다. 머신러닝 모델을 기반으로한 회귀 모델의 개념 및 실습을 진행합니다. 회귀 모델을 위한 평가 방법과 회귀 모델 평가 시 주의 사항에 대해 배우고 실습을 진행합니다.

    이론

    • 스케일링, 결측치 처리 범주형 변수 인코딩 등 기초 전처리 이론
    • 회귀 모델 기초 이론
    • 회귀 모델 평가 방법과 주의사항
    • 머신러닝 모델을 기반으로한 회귀 모델

    실습

    • 스케일링, 결측치 처리(MICE), 범주형 변수 인코딩 등 전처리 실습
    • Linear Regression 모델 및 머신러닝 모델을 기반으로 한 회귀 모델 실습 및 평가
    • 개인 프로젝트 데이터에 전처리 및 회귀 모델 실습
  • 3회차. 분류를 위한 머신러닝 알고리즘 알아보기

    강의 목표

    • 지도 학습 알고리즘의 종류 중 하나인 분류(Classification)에 대해 학습합니다. 로지스틱 회귀, SVM, 결정 트리, 랜덤 포레스트 등 기본적인 머신러닝 알고리즘부터 경진대회에서 자주 사용되는 모델에 대해 학습하고 실습을 진행합니다. 분류 모델을 위한 평가 방법과 혼동 행렬(Confusion Matrix)을 통해 분류 모델 평가 시 주의 사항에 대해 배우고 실습을 진행합니다.

    이론

    • 분류 모델 기초 이론
    • 분류 모델 평가 방법과 주의사항
    • 경진대회에서 자주 사용되는 모델

    실습

    • Logistic Regression, SVM, Decision Tree, Random Forest 모델 실습 및 평가
    • XGBoost, LightGBM 라이브러리 모델 실습 및 평가
    • 개인 프로젝트 데이터에 분류 모델 실습
  • 4회차. 모델의 성능을 향상시키기 위한 알고리즘 알아보기

    강의 목표

    • 주어진 데이터 뿐만아니라 학습하지 않은 데이터에 대해 일반화 성능을 향상시키기 위한 모델 검증과 앙상블에 대해 학습합니다.AutoML 라이브러리를 활용한 파라미터 튜닝에 대해 학습하고 실습을 진행합니다.

    이론

    • 모델 검증 기초 이론
    • 앙상블 기초 이론

    실습

    • k-Fold을 활용하여 모델 교차 검증 실습
    • Out-Of-Fold 모델 앙상블 실습
    • AutoML 라이브러리를 활용한 파라미터 튜닝에 대해 학습하고 실습을 진행합니다.
    • 개인 프로젝트 데이터에 모델 검증 및 앙상블 실습
  • 5회차. 모델 서빙 기초 이론 학습하기

    강의 목표

    • 모델을 학습하고 서빙하기 위한 전체적인 흐름에 대해 학습합니다.앞으로 우리가 직접 구축할 내용이 무엇인지 하나하나 살펴봅니다.우리 강의에서 자주 사용하게 될 도커에 대해 알아봅니다.

    이론

    • 모델 서빙 기초 이론 (파이프라인, 모델 레지스트리, 모델 서빙 API 등)
    • 도커 기초 이론

    실습

    • 도커 실습, 데이터 베이스 구축하기
    • 데이터베이스에 데이터셋 저장하기 (파이프라인 사전 작업)
  • 6회차. 모델 학습 파이프라인 작성해보기

    강의 목표

    • 모델 학습 파이프라인을 자동화할 수 있도록 합니다.Prefect를 활용해 파이프라인을 작성하고 자동화합니다.

    이론

    • 파이프라인 및 Prefect 기초 이론

    실습

    • 강의에서 사용한 학습 파이프라인을 Prefect 파이프라인으로 만들기
    • 데이터베이스 연동하기
  • 7회차. 모델 레지스트리 구축 및 파이프라인과 연동하기

    강의 목표

    • 모델 레지스트리의 역할과 구축 방법에 대해 학습합니다.Mlflow를 활용해 모델 레지스트리를 구축합니다.

    이론

    • 모델 레지스트리 기초 이론

    실습

    • MLflow, Minio, PostgreSQL로 모델 레지스트리를 구축하기
    • Prefect 파이프라인에 MLflow를 연동하기
  • 8회차. 모델 API 서비스 개발 및 모델 레지스트리 연동하기

    강의 목표

    • API 서버를 만들기 위한 기본 지식을 학습합니다.API 서버와 모델 레지스트리를 연동해 파이프라인에서 학습한 모델을 서빙합니다.

    이론

    • 모델 서빙 기초 이론

    실습

    • FastAPI로 모델 API 서버 만들기
    • MLflow 모델 레지스트리와 연동하기

커리어 성장으로 가는 길, 러닝스푼즈와 함께 하세요!

지금 보고 계시는 강의의 관련 태그로 다른 강의도 찾아보세요.

오프라인

머신러닝 엔지니어링: 전처리부터 모델 서빙 및 관리까지

강의찾기