Zhu Lingmo
2023-08-23開発5センター
こんにちは、開発5センターの Zhu です。現在は LINE NEWS の SRE チームに所属しています。
この記事は、2023年3月末にサービス提供を終了したライブ配信サービス「LINE LIVE」において、今まで行ってきた施策の紹介や大規模サービスならではのクロージングに関わる話を連載するシリーズの2本目の記事です。今回の記事では、データベース上で Replication Delay によって起きていた問題と解決までの経緯やDB構成について、図を交えて紹介します。
背景
LINE LIVE では、大規模のアクセスに耐えるために DB(MySQL) へのアクセスは Read/Write で分離しています。つまり書き込みは MySQL のクラスター Source へ、読み込みは Replica から行う実装でした。よく使われている手法ですが、イメージの概要は下図の通りです。
DB に書き込み処理をしてコミットした際の大まかなフローは下記です。
バイナリログ (binlog) に書き出されます。次に、バイナリログダンプスレッドがバイナリログの