もう一度読むSRE

https://twitter.com/Read_SRE_Again

「もう一度読むSRE」は、株式会社Topotal(トポタル)の高村と菱田がディスカッション形式で「SRE サイトリライアビリティエンジニアリング」を読み進めるポッドキャストです。 SRE を今から知りたい方はもちろん、SRE の基礎を改めて学びたい方もぜひ視聴ください。Twitter のハッシュタグは #もう一度読むSRE です。

フィード

記事のアイキャッチ画像
もう一度読むSRE #91
もう一度読むSRE
23.4.8 ディスクアクセス
16日前
記事のアイキャッチ画像
もう一度読むSRE #90
もう一度読むSRE
23.4.5 パフォーマンスに関する考察:Fast Paxos から 23.4.7 バッチ処理 まで
1ヶ月前
記事のアイキャッチ画像
もう一度読むSRE #89
もう一度読むSRE
23.4.2 読み取り負荷が大きいワークロードのスケーリングから23.4.4 分散合意のパフォーマンスとネットワークのレイテンシまで
1ヶ月前
記事のアイキャッチ画像
もう一度読むSRE #88
もう一度読むSRE
23.4.1 Multi-Paxos:詳細なメッセージフロー
2ヶ月前
記事のアイキャッチ画像
もう一度読むSRE #87
もう一度読むSRE
23.3.5 信頼性を持つ分散キュー及びメッセージング から 23.4 分散合意のパフォーマンス まで
3ヶ月前
記事のアイキャッチ画像
もう一度読むSRE #86
もう一度読むSRE
23.3.3 リーダー選出を利用する高可用性を持つ処理 から 23.3.4 分散協調及びロックサービス まで
3ヶ月前
記事のアイキャッチ画像
もう一度読むSRE #85
もう一度読むSRE
23.3 分散合意のためのシステムアーキテクチャパターン から 23.3.2 信頼性を持つ複製データストア及び設定ストアまで
4ヶ月前
記事のアイキャッチ画像
もう一度読むSRE #84
もう一度読むSRE
23.2 分散合意の動作 から 23.2.1 Paxosの概要: サンプルプロトコル まで
4ヶ月前
記事のアイキャッチ画像
もう一度読むSRE #83
もう一度読むSRE
23.1 合意を利用する目的:分散システムの協調障害 から 23.1.3 ケーススタディ 3:問題のあるグループメンバーシップアルゴリズム まで
7ヶ月前
記事のアイキャッチ画像
もう一度読むSRE #82
もう一度読むSRE
23章 クリティカルな状態の管理: 信頼性のための分散合意
7ヶ月前
記事のアイキャッチ画像
もう一度読むSRE #81
もう一度読むSRE
SRE NEXT 2023 Chair ぐりもおさん をゲストに迎え、SRENEXTのことをお聞きしました。
8ヶ月前
記事のアイキャッチ画像
もう一度読むSRE #80
もう一度読むSRE
22.6 カスケード障害に対応するためにすぐに行うべき手順 から 22.7まとめまで
9ヶ月前
記事のアイキャッチ画像
もう一度読むSRE #79
もう一度読むSRE
22.4 カスケード障害を引き起こす条件 から 22.5.3 重要度の低いバックエンドのテスト まで
9ヶ月前
記事のアイキャッチ画像
もう一度読むSRE #78
もう一度読むSRE
22.3 起動直後の低パフォーマンスとコールドキャッシュ から 22.3.1 スタックは常に下っていくようにすること まで
9ヶ月前
記事のアイキャッチ画像
もう一度読むSRE #77
もう一度読むSRE
22.2.4 レイテンシとタイムアウト から 22.2.4.4 二峰性のレイテンシ まで
10ヶ月前
記事のアイキャッチ画像
もう一度読むSRE #76
もう一度読むSRE
22.2.2 ロードシェディングとグレースフルデグラデーション から 22.2.3 リトライ まで
10ヶ月前
記事のアイキャッチ画像
もう一度読むSRE #75
もう一度読むSRE
22.1.3 利用できないサービス から 22.2.1 キューの管理 まで
10ヶ月前
記事のアイキャッチ画像
もう一度読むSRE #74
もう一度読むSRE
22章 カスケード障害への対応 から 22.1.2.5 リソース間の依存関係 まで本編は12分05秒あたりからになります。
1年前
記事のアイキャッチ画像
もう一度読むSRE #73
もう一度読むSRE
21.7 接続によって生じる負荷 から 21.8 まとめ まで
1年前
記事のアイキャッチ画像
もう一度読むSRE #72
もう一度読むSRE
21.5 利用率のシグナル から 21.6.1 リトライの判断 まで
1年前
記事のアイキャッチ画像
もう一度読むSRE #71
もう一度読むSRE
21.3 クライアント側でのスロットリング から 21.4 重要度 まで
1年前
記事のアイキャッチ画像
もう一度読むSRE #70
もう一度読むSRE
21章 過負荷への対応 から 21.2 顧客単位での制限 まで
1年前
記事のアイキャッチ画像
もう一度読むSRE #69
もう一度読むSRE
20.4 ロードバランシングのポリシー から 20.4.1.3 マシンのばらつき まで
1年前
記事のアイキャッチ画像
もう一度読むSRE #68
もう一度読むSRE
20.3.3 サブセット選択のアルゴリズム : 決定的なサブセット選択
1年前
記事のアイキャッチ画像
もう一度読むSRE #67
もう一度読むSRE
20.3 サブセットの設定によるコネクションプールの制限 から 20.3.2 サブセットの選択アルゴリズム:ランダムなサブセットの選択 まで
1年前
記事のアイキャッチ画像
もう一度読むSRE #66
もう一度読むSRE
20章 データセンターでのロードバランシング から 20.2.2 不健全なタスクへの確実なアプローチ:レイムダック状態 まで
1年前
記事のアイキャッチ画像
もう一度読むSRE #65
もう一度読むSRE
19.3 仮想 IP アドレスでのロードバランシング まで
1年前
記事のアイキャッチ画像
もう一度読むSRE #64
もう一度読むSRE
19章 フロントエンドにおけるロードバランシング から 19.2 DNS を使ったロードバランシング まで
1年前
記事のアイキャッチ画像
もう一度読むSRE #63
もう一度読むSRE
18.3.5 チームの力学 から 18.5 まとめ まで
1年前
記事のアイキャッチ画像
もう一度読むSRE #62
もう一度読むSRE
18.3.4 認知の向上と採用の推進 から 18.3.4.4 適切なレベルでの設計 まで
1年前
記事のアイキャッチ画像
もう一度読むSRE #61
もう一度読むSRE
18.3.2 Auxon の紹介 から 18.3.3.1 近似 まで
1年前
記事のアイキャッチ画像
もう一度読むSRE #60
もう一度読むSRE
18.2.2 Google におけるソリューション:インテントベースのキャパシティプランニング から 18.3.1.2 パフォーマンスメトリクス まで
1年前
記事のアイキャッチ画像
もう一度読むSRE #59
もう一度読むSRE
18章 SRE におけるソフトウェアエンジニアリング から 18.2 Auxon のケーススタディ:プロジェクトの背景と問題の領域 まで
1年前
記事のアイキャッチ画像
もう一度読むSRE #58
もう一度読むSRE
17.3.7 プロダクション環境におけるプローブ から 17.4 まとめ まで
1年前
記事のアイキャッチ画像
もう一度読むSRE #57
もう一度読むSRE
17.3.6 結合 まで
1年前
記事のアイキャッチ画像
もう一度読むSRE #56
もう一度読むSRE
17.3.5 予想されるテストの失敗 まで
2年前
記事のアイキャッチ画像
もう一度読むSRE #55
もう一度読むSRE
17.3.4 プロダクションへのプッシュ
2年前
記事のアイキャッチ画像
もう一度読むSRE #54
もう一度読むSRE
17.3.2 ディザスタのテスト から 17.3.3 速度の重要性 まで
2年前
記事のアイキャッチ画像
もう一度読むSRE #53
もう一度読むSRE
17.3 大規模なテスト から 17.3.1 スケーラブルなツールのテスト まで
2年前
記事のアイキャッチ画像
もう一度読むSRE #52
もう一度読むSRE
17.2 テストの作成と環境の構築 まで
2年前
記事のアイキャッチ画像
もう一度読むSRE #51
もう一度読むSRE
17.1.2.2 ストレステスト から 17.1.2.3 カナリアテスト まで
2年前
記事のアイキャッチ画像
もう一度読むSRE #50
もう一度読むSRE
17.1.2 プロダクションテスト から 17.1.2.1 設定テスト まで
2年前
記事のアイキャッチ画像
もう一度読むSRE #49
もう一度読むSRE
17 信頼性のためのテスト から 17.1 ソフトウェアテストの種類 まで
2年前
記事のアイキャッチ画像
もう一度読むSRE #48
もう一度読むSRE
16章 サービス障害の追跡 から 16.2.4 予想外のメリット まで
2年前
記事のアイキャッチ画像
もう一度読むSRE #47
もう一度読むSRE
15章 ポストモーテムの文化: 失敗からの学び から 15.4 まとめと改善の継続 まで
2年前
記事のアイキャッチ画像
もう一度読むSRE #46
もう一度読むSRE
15章 ポストモーテムの文化: 失敗からの学び から 15.1 Google におけるポストモーテムの哲学本編は3分35秒からです。
2年前
記事のアイキャッチ画像
もう一度読むSRE #45
もう一度読むSRE
14.3 インシデント管理のプロセスの構成要素 から 14.5 インシデントと宣言すべき場合 まで本編は11分00秒からです。
2年前
記事のアイキャッチ画像
もう一度読むSRE #44
もう一度読むSRE
13.6 過去から学び、繰り返さない から 14.3.4 はっきりとした引き継ぎ まで本編は6分22秒からです。
2年前
記事のアイキャッチ画像
もう一度読むSRE #43
もう一度読むSRE
13.4 プロセスが引き起こした緊急事態 から 13.5 解決できない問題は存在しない まで本編は3分10秒からです。
2年前
記事のアイキャッチ画像
もう一度読むSRE #42
もう一度読むSRE
13.3 変更が引き起こした緊急事態 から 13.3.3.2 学んだこと まで本編は4分10秒からになります。
2年前
記事のアイキャッチ画像
もう一度読むSRE #41
もう一度読むSRE
13章 緊急対応 から 13.2.3.2 学んだこと まで本編は5分50秒からになります。
2年前
記事のアイキャッチ画像
もう一度読むSRE #40
もう一度読むSRE
12.4 ケーススタディ から 12.6 まとめ まで今回雑談はありません。
2年前
記事のアイキャッチ画像
もう一度読むSRE #39
もう一度読むSRE
12.2.5 テストと対応 から 12.3 否定的な結果の素晴らしさ まで今回雑談はありません。
2年前
記事のアイキャッチ画像
もう一度読むSRE #38
もう一度読むSRE
12.2.4 診断から 12.2.4.4 特定の診断 まで本編は4分03秒からです。
2年前
記事のアイキャッチ画像
もう一度読むSRE #37
もう一度読むSRE
12.2 実践 から 12.2.3 検証 まで雑談はありません。
2年前
記事のアイキャッチ画像
もう一度読むSRE #36
もう一度読むSRE
12章 効果的なトラブルシューティング から 12.1 理論 まで本編 : 03:10〜
2年前
記事のアイキャッチ画像
もう一度読むSRE #35
もう一度読むSRE
11.5 不適切な負荷の回避 から 11.6まとめ まで本編 : 03:45〜
2年前
記事のアイキャッチ画像
もう一度読むSRE #34
もう一度読むSRE
11.3 バランスの取れたオンコール から 11.4 安心感 まで本編 : 00:00〜※今回雑談はありません。
2年前
記事のアイキャッチ画像
もう一度読むSRE #33
もう一度読むSRE
11章 オンコール対応 から 11.2 オンコールエンジニアの日常生活 まで雑談 : 00:00〜04:02本編 : 04:03〜
2年前
記事のアイキャッチ画像
もう一度読むSRE #32
もう一度読むSRE
10.4 時系列のアリーナにおけるストレージ から 10.10 10 年が経過して まで雑談 : 00:00〜07:05本編 : 07:05〜
2年前
記事のアイキャッチ画像
もう一度読むSRE #31
もう一度読むSRE
10章 時系列データからの実践的なアラート から 10.3 エクスポートされたデータの収集雑談 : 00:00〜02:09本編 : 02:10〜
2年前
記事のアイキャッチ画像
もう一度読むSRE #30
もう一度読むSRE
第III部 実践雑談 : 00:00〜03:07本編 : 03:08〜
2年前
記事のアイキャッチ画像
もう一度読むSRE #29
もう一度読むSRE
9.5 最小限のAPI から 9.8 単純な結論 まで
2年前
記事のアイキャッチ画像
もう一度読むSRE #28
もう一度読むSRE
9章 単純さのまとめ から 9.4 削除した行の計測 まで
2年前
記事のアイキャッチ画像
もう一度読むSRE #27
もう一度読むSRE
8.4 設定管理 から 8.5 まとめ まで
2年前
記事のアイキャッチ画像
もう一度読むSRE #26
もう一度読むSRE
8.3.5 Rapid から 8.3.6 デプロイメント まで
2年前
記事のアイキャッチ画像
もう一度読むSRE #25
もう一度読むSRE
8.3 継続的ビルドとデプロイメントから 8.3.4 パッケージ化まで
2年前
記事のアイキャッチ画像
もう一度読むSRE #24
もう一度読むSRE
8章 リリースエンジニアリング から 8.2.4 ポリシーと手順の強制 まで
2年前
記事のアイキャッチ画像
もう一度読むSRE #23
もう一度読むSRE
7.7 基本的機能としての信頼性 から 7.8 自動化のすすめ まで
2年前
記事のアイキャッチ画像
もう一度読むSRE #22
もう一度読むSRE
7.5.4 サービス指向のクラスタのターンアップ から 7.6 Borg:ウェアハウススケールコンピュータの誕生まで
2年前
記事のアイキャッチ画像
もう一度読むSRE #21
もう一度読むSRE
7.5 苦痛の緩和:クラスタのターンアップへの自動化の適用 から 7.5.3 特化する傾向 まで
2年前
記事のアイキャッチ画像
もう一度読むSRE #20
もう一度読むSRE
7.3.2 自動化のクラスの階層 から 7.4 自分の仕事の自動化:何もかも自動化する まで
2年前
記事のアイキャッチ画像
もう一度読むSRE #19
もう一度読むSRE
7.2 Google SREにとっての価値 から 7.3.1 Google SREによる自動化のユースケース まで
3年前
記事のアイキャッチ画像
もう一度読むSRE #18
もう一度読むSRE
7章 Googleにおける自動化の進化 から 7.1.5 時間の節約 まで
3年前
記事のアイキャッチ画像
もう一度読むSRE #17
もう一度読むSRE
読む範囲 : SRE 本 6.10 原則のとりまとめ から 6.12 まとめまで。
3年前
記事のアイキャッチ画像
もう一度読むSRE #16
もう一度読むSRE
読む範囲 : SRE 本 6.7 テイルレイテンシに関する懸念 から 6.9 可能な限りシンプルに、ただしやり過ぎないこと まで
3年前
記事のアイキャッチ画像
もう一度読むSRE #15
もう一度読むSRE
読む範囲 : SRE 本 6.5 ブラックボックスとホワイトボックス から 6.6 4大シグナル まで
3年前
記事のアイキャッチ画像
もう一度読むSRE #14
もう一度読むSRE
読む範囲 : SRE 本 6.3 モニタリングにおける妥当な期待値の設定 から 6.4 症状と原因 まで
3年前
記事のアイキャッチ画像
もう一度読むSRE #13
もう一度読むSRE
読む範囲 : SRE 本 6章 分散システムのモニタリングから 6.2 モニタリングの必要性 まで
3年前
記事のアイキャッチ画像
もう一度読むSRE #12
もう一度読むSRE
読む範囲 : SRE 本 5.2 トイルは少ない方が良い理由から5.5 まとめまで
3年前
記事のアイキャッチ画像
もう一度読むSRE #11
もう一度読むSRE
読む範囲 : SRE 本 5章 トイルの撲滅から5.1 トイルの定義まで
3年前
記事のアイキャッチ画像
もう一度読むSRE #10
もう一度読むSRE
読む範囲 : SRE 本 4.3.3 計測値のコントロールから4.4 アグリーメントの実際まで
3年前
記事のアイキャッチ画像
もう一度読むSRE #9
もう一度読むSRE
読む範囲 : SRE 本 4.2.4 指標の標準化から4.3.2 ターゲットの選択まで
3年前
記事のアイキャッチ画像
もう一度読むSRE #8
もう一度読むSRE
読む範囲 : SRE 本 4.2 指標の実際から4.2.3 集計まで
3年前
記事のアイキャッチ画像
もう一度読むSRE #7
もう一度読むSRE
読む範囲 : SRE 本 4章 サービスレベル目標 から、4.1.3 アグリーメントまで
3年前
記事のアイキャッチ画像
もう一度読むSRE #6
もう一度読むSRE
読む範囲: SRE 本 3.4章 エラーバジェットの活用
3年前
記事のアイキャッチ画像
もう一度読むSRE #5
もう一度読むSRE
読む範囲: SRE 本 3.1〜3.3章
3年前
記事のアイキャッチ画像
もう一度読むSRE #4
もう一度読むSRE
読む範囲: SRE 本 2章、3章 3.1 リスクの管理まで
3年前
記事のアイキャッチ画像
もう一度読むSRE #3
もう一度読むSRE
読む範囲: SRE 本 コラム〜1.4
3年前
記事のアイキャッチ画像
もう一度読むSRE #2
もう一度読むSRE
読む範囲: SRE 本 1.2
3年前
記事のアイキャッチ画像
もう一度読むSRE #1
もう一度読むSRE
読む範囲: SRE 本 1.1〜1.2の途中まで
3年前