Verda Reliability Engineering チーム
はじめに こんにちは。この度、Verda Reliability Enginneringチームにて技術職就業型インターンシップに参加させていただきました、慶應義塾大学政策・メディア研究科修士1年の上田です。この記事では私の担当した業務の内容についてご紹介します。 Verda Reliability EngineeringチームはLINEのプライベートクラウドであるVerdaのSRE業務を行なっているチームです。そのため今回のインターンシップでは、次節で述べるVerdaにおける運用上の課題を解決することを目指しました。 課題 Verda上ではOpenStackをベースに、VMやベアメタルマシン、Kubernetes、ロードバランサ、ストレージ、DBなどをはじめとした多くのサービスが提供されています。そして、これらのサービスを提供するためにVerdaの内部では多くのソフトウェアが動作していますが、その依存関係は非常に複雑なものとなっています。 そのため、あるサービスの特定の部分に障害が発生した場合、どれだけの範囲に影響が及ぶのか瞬時に判断することが難しいという問題がありました。例えばVer