SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチームの概要/参照本/参照された本一覧

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチームについて

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチームの原著

タイトル

Site Reliability Engineering: How Google Runs Production Systems

出版社

O'Reilly

出版日

2016-05-10

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチームの概要/目次

サイトリライアビリティエンジニアリング(SRE)とは、Googleで培われたシステム管理とサービス運用の方法論です。 GoogleのSREチームの主要メンバーによって書かれた本書は、ソフトウェアのライフサイクル全体にコミットすることで世界最大規模のソフトウェアシステムがどのように構築、導入、監視、維持されているのかを解説します。 はじめにリスク管理やサービスレベル目標、リリースエンジニアリングなどSREの行動の基礎となる原則について解説し、次にインシデント管理や障害の根本原因分析、SRE内でのソフトウェア開発など大規模分散コンピューティングシステムを構築し運用するSREの実践について詳述します。 さらにSREのトレーニングやコミュニケーションなどの管理について紹介します。 急速にスケールするサービスを高い信頼性で運用する方法を解説する本書はエンジニア必携の一冊です。

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチームの参照している本/参照されている本

参照/引用/紹介している本0件)

見つかりませんでした

参照/引用/紹介されている本1件)