메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

대규모 머신러닝 시스템 디자인 패턴

14가지 패턴으로 분산 머신러닝 파이프라인 구축하기

한빛미디어

번역서

판매중

  • 저자 : 위안 탕
  • 번역 : 정민정
  • 출간 : 2024-11-29
  • 페이지 : 304 쪽
  • ISBN : 9791169213134
  • eISBN : 9791169218832
  • 물류코드 :11313
  • 초급 초중급 중급 중고급 고급
1 2 3 4 5
4.6점 (18명)
좋아요 : 4

책소개

14가지 패턴으로 대규모 머신러닝 시스템을 완성하라!


머신러닝의 급속한 발전과 함께 데이터와 트래픽이 폭발적으로 증가하면서, 단순히 성능 향상뿐 아니라 안정적이고 확장 가능한 시스템 설계가 중요해지고 있다. 이에 본 책은 대규모 머신러닝 시스템을 설계하고 운영하기 위한 14가지 실용적인 설계 패턴을 소개하고, 실무에서 빈번히 발생하는 문제와 해결책을 제시한다. 또한 텐서플로, 쿠버네티스, 쿠브플로, 아르고 워크플로 등 클라우드 기반의 최신 도구를 활용한 실무 예제를 통해 이론과 실무를 함께 학습할 수 있도록 구성했다. 특히 시스템 장애나 과부하 상황에서의 대처 방안, 효율적인 자원 관리를 상세히 다룸으로써 실무자들의 기술적 문제 해결 역량을 높이는 데 중점을 두었다. 복잡해지는 머신러닝 시스템의 난관을 뚫고 나아가려는 모든 개발자에게 이 한 권이 길잡이가 될 것이다.
 

14가지 패턴

  • 데이터 수집 패턴: 배치 처리, 샤딩, 캐싱
  • 분산 학습 패턴: 파라미터 서버, 집합 통신, 탄력성 및 내결함성
  • 모델 서빙 패턴: 레플리카 서버, 서비스 샤딩, 이벤트 기반 처리
  • 워크플로 패턴: 팬인 및 팬아웃, 동기 및 비동기, 스텝 메모이제이션
  • 운영 패턴: 스케줄링, 메타데이터

 

저자소개

위안 탕 저자

위안 탕

Akuity의 창립 엔지니어로, 개발자를 위한 기업용 플랫폼을 구축하고 있다. 이전에 알리바바와 Uptake에서 데이터 과학 및 엔지니어링팀을 이끌며 AI 인프라와 AutoML 플랫폼 개발에 주력했다. 아르고(Argo)와 쿠브플로(Kubeflow)의 프로젝트 리더이자 텐서플로(TensorFlow)와 XGBoost의 메인테이너로 활동 중이며, 이 외에도 다양한 오픈 소스 프로젝트를 만들어 운영 중이다. 세 권의 머신러닝 서적을 집필하고 여러 논문을 발표했다. 다양한 콘퍼런스에서 정기적으로 다양한 발표를 정기적으로 진행하고 있으며, 여러 조직에서 기술 자문과 리더, 멘토 역할을 수행하고 있다.

위안 탕 역자

정민정

국내 주요 IT 기업에서 머신러닝 엔지니어로 활동하며 대규모 실시간 추론 시스템을 설계 및 운영하고 있다. 컴퓨터 비전과 자연어 처리를 중심으로 다양한 도메인의 머신러닝 모델을 실제 서비스에 적용해왔으며, 현재는 머신러닝 서비스팀을 이끌고 있다. 확장 가능하면서도 안정적인 시스템을 구축하는 데 주력하고 있으며, 실용적인 머신러닝 엔지니어링 문화를 전파하는 데 힘쓰고 있다.

목차

[PART 1 분산 머신러닝 시스템의 배경지식]


CHAPTER 01 분산 머신러닝 시스템 소개
_1.1 대규모 머신러닝
_1.2 분산 시스템
_1.3 분산 머신러닝 시스템
요약

 

[PART 2 분산 머신러닝 시스템의 설계 패턴]


CHAPTER 02 데이터 수집 패턴
_2.1 데이터 수집이란?
_2.2 Fashion-MNIST 데이터셋
_2.3 배치 처리 패턴: 제한된 메모리로 무거운 연산 실행하기
_2.4 샤딩 패턴: 매우 큰 데이터셋을 여러 워커에 분산시키기
_2.5 캐싱 패턴: 효율적인 학습을 위해 데이터 재활용하기
요약

 

CHAPTER 03 분산 학습 패턴
_3.1 분산 학습이란?
_3.2 파라미터 서버 패턴: 8백만 개의 유튜브 영상에 태그 달기
_3.3 집합 통신 패턴: 파라미터 서버가 병목이 되지 않도록 개선하기
_3.4 탄력성 및 내결함성 패턴: 제한된 연산 자원으로 인한 실패 대응하기
요약

 

CHAPTER 04 모델 서빙 패턴
_4.1 모델 서빙이란?
_4.2 레플리카 서버 패턴: 늘어나는 요청량 처리하기
_4.3 서비스 샤딩 패턴: 고해상도 영상을 처리하는 대규모 모델 서빙 다루기
_4.4 이벤트 기반 처리 패턴: 이벤트 기반으로 모델 서빙하기
요약

 

CHAPTER 05 워크플로 패턴
_5.1 워크플로란?
_5.2 팬인 및 팬아웃 패턴: 복잡한 머신러닝 워크플로 체계화
_5.3 동기 및 비동기 패턴: 병렬성으로 더 빠르게 처리하기
_5.4 스텝 메모이제이션 패턴: 반복되는 작업 생략하기
요약

 

CHAPTER 06 운영 패턴
_6.1 머신러닝 시스템 운영하기
_6.2 스케줄링 패턴: 공유 클러스터 자원을 효과적으로 할당하기
_6.3 메타데이터 패턴: 실패를 적절히 처리하는 방법
요약

 

[PART 03 분산 머신러닝 시스템 구축]
 

CHAPTER 07 실습 프로젝트 둘러보기
_7.1 프로젝트 개요
_7.2 데이터 수집 단계
_7.3 모델 학습 단계
_7.4 모델 서빙 단계
_7.5 전체 워크플로 구조
요약

 

CHAPTER 08 실습 관련 기술 둘러보기
_8.1 텐서플로: 머신러닝 프레임워크
_8.2 쿠버네티스: 분산 컨테이너 관리 시스템
_8.3 쿠브플로: 쿠버네티스 머신러닝 워크로드 관리 시스템
_8.4 아르고 워크플로: 컨테이너 기반 워크플로 엔진
요약

 

CHAPTER 09 실습 프로젝트
_9.1 데이터 수집
_9.2 모델 학습
_9.3 모델 서빙
_9.4 전체 워크플로
요약

출판사리뷰

대규모 데이터 처리와 분석을 위한 분산 머신러닝 실무 가이드

 

이 책은 분산 시스템에서 머신러닝을 구현하고 최적화하는 데 필요한 14가지 핵심 패턴과 모범 사례를 소개하는 실무 지침서다. 복잡한 분산 머신러닝 개념을 쉽게 이해할 수 있도록 설명하고, 실무에서 바로 적용할 수 있는 실질적인 방법론을 제시한다. 데이터 분산 처리, 모델 학습의 병렬화, 효율적인 리소스 관리 등 분산 머신러닝의 전반적인 과정에서 발생할 수 있는 다양한 문제를 해결하기 위한 체계적인 패턴을 소개한다. 이를 통해 AI와 데이터 과학 분야의 전문가들뿐만 아니라, 대규모 데이터 처리 및 분석을 다루는 모든 이에게 실용적인 가이드가 될 것이다.

 

주요 내용

  • 데이터 수집, 분산 학습, 모델 서빙 등 다양한 단계로 구성된 ML 파이프라인 구축
  • 쿠버네티스, 텐서플로, 쿠브플로, 아르고 워크플로를 사용해 ML 작업 자동화
  • 다양한 패턴과 접근 방식 간의 트레이드오프 평가
  • 대규모 머신러닝 작업 관리 및 모니터링

독자리뷰

오탈자 보기

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원 무료배송
닫기

리뷰쓰기

닫기
* 상품명 :
대규모 머신러닝 시스템 디자인 패턴
* 제목 :
* 별점평가
1 2 3 4 5
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
대규모 머신러닝 시스템 디자인 패턴
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
대규모 머신러닝 시스템 디자인 패턴
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?