PagerDuty

About

このサイトはPagerDutyのインシデント対応プロセスの一部を文書化したものです。PagerDutyの社内文書の一部を切り取ったもので、PagerDutyでは重大なインシデントの発生時や、新入社員のオンコール対応準備に使用しています。インシデントの準備だけでなく、インシデント発生中や発生後に何をすべきかについての情報も提供しています。

重大インシデントに対処するための社内プロセスについて語る企業はほとんどないようです。このような状況を変えたいと思い、私たちのドキュメントをコミュニティに公開することにしました。さらに、他の人が改善を提案する機会を提供することで、結果的にすべての人の助けになるのです。

これは何?#

重大なインシデントが発生した際に効率的に対処する方法や、効果的にオンコール体制を取る方法についての詳細を記したページ集です。これには、苦労して得られた教訓や、迅速に状況を把握するためのトレーニング資料が含まれています。

これは誰のためのもの?#

オンコール実務者や運用上のインシデント対応プロセスに関わる人々、あるいは正式なインシデント対応プロセスを実施したいと考えている人々を対象としています。

なぜこれが必要か?#

インシデント対応は、決して必要にならないことを願うものですが、いざ必要となった際には、円滑かつシームレスに進行することが望まれます。通常、企業内でのインシデント対応の知識は時間をかけて蓄積され、インシデントを重ねるごとに改善されていきます。PagerDutyのIncidents Responseのようなツールが迅速な復旧を支援できますが、従うべきプロセスも同様に重要です。この文書は、私たちが長年かけて構築してきたものを、最初から学ぶ機会を提供します。これにより、最短の復旧時間につながる方法で重大なインシデントに対処する方法について、あなたに先行きの利点を与えます。

どこまでカバーしている?#

オンコールの準備から、重大度の定義、インシデント通話のエチケット、さらにはポストモーテムの実施方法、そしてポストモーテムテンプレートの提供に至るまで、あらゆる内容を網羅しています。セキュリティインシデント対応プロセスも含まれています。

何が欠けているのか?#

これは私たちの内部文書の完全な複製ではなく、一部の情報が削除されています。たとえば、電話会議の番号、(まだ)オープンソース化されていない内部ツールやシステムの名称、ダッシュボードの画像などです。基本的に、PagerDuty固有の情報や、共有するには機密性が高すぎる情報は除外されています。

ライセンス#

この文書はApache License 2.0の下で提供されています。平易な言葉で言えば、この文書を使用および修正し、商業目的でも個人使用でも利用できるということです。ただし、元の著作権表示と元のLICENSEファイルを含める必要があります。 PagerDutyの顧客であるかどうかにかかわらず、この文書をあなたの会社内で内部的に使用する能力を持っていただきたいと考えています。この文書のソースコードはすべて当社のGitHubアカウントで閲覧できます。リポジトリをフォークして、あなた自身の内部文書の基礎として使用することを歓迎します。