Schedule

タイムテーブル

DAY 1: 7/10

Track A

Track B

Track C

7/10 10:00
-
10:30

開場

7/10 10:30
-
10:40

Track A

トラックB,C：サテライト

Track BTrack C

開会式

7/10 10:40
-
11:20

Track A

トラックB,C：サテライト

7/10 11:20
-
11:35

休憩

7/10 11:35
-
12:05

Track A

7/10 11:35 - 12:05

GitHub Actions runnerの運用から見るニンテンドーシステムズのチーム体制

ニンテンドーシステムズでは、社内向けに共有の GitHub Actions self-hosted runner 基盤を運用しています。社内の GitHub Enterprise Server と連携し、コードのビルドはもちろん、PR の AI レビュー、Confluence, Jiraの自動更新、Terraform の PR コメントなど多岐にわたる用途で日々利用されており、平日1日あたり約2万ジョブ、月間で50万ジョブを超える規模で稼働しています。しかしこの基盤を運用しているのは、専任の CI/CD プラットフォームチームではありません。それぞれが別のサービスをメインで担当する3名のメンバーが、 SRE 職と開発職の垣根を越えて兼務で運用してきました。さらに特徴的なのは、その成り立ちです。トップダウンで設計された基盤ではなく、各プロダクトチームの現場で生まれた「より良い CI/CD 基盤がほしい」という要望に有志が応える形で立ち上がり、結果としてニンテンドーシステムズ全体で使われる横断基盤に育ちました。本セッションでは、Actions Runner Controller(scale-set), EKS, Karpenter, Datadog, HCP Terraform で構成されるこの基盤の概要に手短に触れたあと、3名で月50万ジョブ規模を捌くために採っている「細く長く」の運用ポリシーについてお話しします。あわせて、この体制で得られているメリットと避けられないデメリットの両面を、運用エピソードを交えて紹介します。専任チームを立てるべきか悩んでいる方、少人数で CI/CD 基盤を回している方、現場発のプラットフォーム活動をどう持続させるか考えている方のご参考になれば幸いです。

登壇資料

ニンテンドーシステムズ株式会社チーフ

坂東聖博

2020年に任天堂株式会社に入社後、2023年にニンテンドーシステムズ株式会社に出向。ZELDA NOTESなどのゲーム連携サービスの運用を担当しています。

ニンテンドーシステムズ株式会社チーフ

田中克磨

2016年に任天堂株式会社に入社後、2023年にニンテンドーシステムズ株式会社に出向。Nintendo Switchの本体機能から利用されるネットワークシステムの開発・運用を担当しています。

Track BTrack C

入場不可（会場転換）

7/10 12:05
-
12:20

休憩

7/10 12:20
-
12:35

7/10 12:35
-
13:00

休憩

7/10 13:00
-
13:30

Track A

7/10 13:00 - 13:30

AI-native時代の信頼性を育てる、インシデント学習と改善ループの実践

生成AIの導入によって開発速度とリリース回数が大きく増える中、サービスにはこれまで以上に多くの変更が加わり、インシデントが発生するリスクも高まっています。こうした環境では、インシデントを適切に収束させるだけでなく、そこから得た学びを継続的に改善へつなげることがこれまで以上に重要になります。しかし現実には、改善の必要性が見えていても優先度が上がらず、機能実装が先に進むことで、同種の問題が繰り返されやすいという課題があります。本発表では、メルカリで進めている AI Native Incident Management の実践をもとに、インシデント対応、ポストモーテム、リスク評価、改善への反映をひとつのフィードバックループとして捉え直す取り組みを扱います。具体的には、AI を用いた状況整理、レポーティング、ポストモーテム作成、類似事例分析を通じて、対応中と収束後の知見をどう蓄積し、バグ修正、アーキテクチャ改善、運用ルールや監視の見直し、優先度判断への反映などにつなげているかをお話しします。この発表で伝えたいのは、AI がすべてを自動化してくれる未来像ではありません。むしろ AI-native 時代だからこそ、インシデントから学び、何が本当にリスクなのかを評価し、その学びを次の変更と改善に活かすという“当たり前のこと”を、より速く、より継続的に、そして必要に応じて丁寧に深掘りできる形で回していくことが重要だという点です。実際の取り組みと現場の実体験を通じて、AI-native 時代の信頼性を支えるフィードバックループをどう設計し、どう育てていくかをお話しします。

株式会社メルカリ Engineering Manager

foostan

2019年にメルペイのSREチームにエンジニアとして入社。金融サービスの信頼性を保証するため、SLOを用いた監視基盤の構築、インシデントマネジメント体制の強化、BCP/DR戦略の策定・推進を担当。2021年よりエンジニアリングマネージャーに就任。現在はFintech事業およびメルカリのSREチームのマネージャーを兼務し、組織横断で信頼性向上に取り組んでいる。

7/10 13:30
-
13:45

休憩

7/10 13:45
-
14:10

Track BGold Sponsor

7/10 13:45 - 14:10

最適な自走を最小限の支援で ── M&Aで拡大する組織で少人数SREが挑んだ1年 (13:45 ~ 14:00)

GENDAは「世界一のエンタメ企業」を目指し、M&Aによってグループ企業とプロダクトを急速に拡大しています。新しい企業がグループインし、新規事業が立ち上がり、共通基盤も広がっていきます。その一方で、SREチームはグループ規模の急拡大に対して、少人数で向き合っています。プロダクトが拡大していく環境において、すべてのプロダクトに専任SREを置くのは現実的ではありません。そこで私たちは「最適な自走を最小限の支援で実現する」ことを掲げ、開発チームに任せる範囲・SREが入り込む範囲・全体施策に昇華する範囲を意識的に分けて活動してきました。その戦略を1年間運用してきた現場の学びを本セッションで共有します。チームが現場で何を学び、信頼性と組織をどう進化させてきたのかをお伝えします。扱うトピックは次の二つです。 1. 信頼性への取り組み：守る範囲が広がり続ける中、オブザーバビリティやセキュリティガバナンスを通じて信頼性をどのように底上げしてきたか。「現状の可視化」や「プロダクトへの入り込み」「AIエージェントの活用」など、現場で効いた打ち手・効かなかった打ち手とそこで得た学びを率直に振り返ります。 2. 組織としての進化：増え続けるグループ会社・プロダクトに対し、少人数SREチームがどう関わり方を変えてきたか。グループインした企業へのオンボーディング、開発チームへの入り込み方、属人化の解消、知見の横展開の仕組み、タスクの選択基準など、プロダクトとの距離感を調整してきた試行錯誤と現在地を共有します。少人数SREでスケールに挑むチームにとって、戦略とは現場で進化させ続けるものです。増え続けるプロダクトと向き合う皆さんにとって、何かひとつでも持ち帰れるヒントになれば幸いです。

株式会社GENDA SRE/インフラマネージャー

布田遼平

2013年から野村総合研究所でインフラエンジニアとしてプライベートクラウドのインフラの設計・構築、運用改善でエンジニアのキャリアをスタート。7年ほど経験してから、次はアマゾンウェブサービスジャパン合同会社でAWSを軸にした技術支援で、多様な業界のお客様へ自動化や統制基盤導入に取り組む。2025年からGENDAでSRE/インフラとして複数のプロダクト基盤や共通基盤改善を実施中。現在はマネージャーとしてチームの目標設定や運営も行っている。

7/10 14:10
-
14:25

7/10 14:25
-
14:40

休憩

7/10 14:40
-
15:10

Track A

7/10 14:40 - 15:10

環境凍結というToilを倒す——セルフサービス型Ephemeralテスト環境の設計と実践

マイクロサービスアーキテクチャを採用する組織では、結合テストのために複数のSTG環境を運用し、チーム間で環境を共有するのが一般的です。しかし環境数が増えるほど、あるチームがテスト中は他チームがデプロイできない「環境凍結」が常態化し、リリースリードタイムの増大・環境コストの肥大化・チーム間調整コストの増加といった問題に陥りがちです。SREの観点から見れば、これは典型的なToilであり、DORA指標におけるLead Time for ChangesとDeploy Frequencyを著しく悪化させます。私たちも最大6つのSTG環境を運用していましたが、環境を増やすアプローチでは根本的な解決に至りませんでした。環境を追加するたびにコストは線形に増加し、構築に約2〜3週間を要し、ゴミデータの蓄積によりテストデータの品質も低下していました。私たちはKTC全体の組織横断タスクフォースとして、「必要な時に作り、不要になったら消す」Ephemeral Environmentの実現に取り組みました。DBREチームによる本番データマスキング基盤の構築、本番に近いSTG環境のIaCを同期するセルフサービス型インフラプロビジョニング、テスト専用AWSアカウントによる環境分離の3つの柱により、環境構築リードタイムを劇的に削減し、環境凍結というToilを構造的に排除しました。本セッションでは、マスキング基盤のアーキテクチャ設計、IaC同期によるテスト環境の再現手法、テスト専用AWSアカウント戦略を中心に、マイクロサービス構成でテスト環境の運用やToil削減に課題を抱えるSRE・クラウドインフラエンジニアが、自組織で検討を始められる実践的な知見を共有します。

KINTOテクノロジーズ株式会社 Cloud Engineer

白井裕二

2023年8月にKINTOテクノロジーズ株式会社に入社。前職まではデバイス・バックエンド・フロントエンドの開発からAWSのインフラ環境構築まで幅広く経験。入社後はAWSインフラの構築を担当し、現在はAWSインフラやIaCの改善など、クラウド利用に関するカイゼン活動に幅広く取り組んでいる。好きな食べ物はラーメン。趣味でIoTに触っている。

KINTO テクノロジーズ株式会社 DBRE Engineer

陳路銘

2024 年 8 月に KINTO テクノロジーズ株式会社に入社。前職では中国の IT 企業にて、Go を用いたバックエンド開発や Kubernetes を中心とした運用自動化・基盤開発に従事。入社後は DB 関連の自動化ツール開発を担当し、運用効率化と安定性向上に取り組んでいる。好きな食べ物はフルーツ盛り合わせ。趣味はスノーボードと美術館巡り。

Track C

7/10 14:40 - 15:10

クラウド上のデータ復旧で見落としがちな制約: 医療系 SaaS の BCP 設計から得た教訓

BCP対応において、バックアップの取得は出発点にすぎません。実際に復旧できる状態を維持し続けることこそが難しく、計画と実践の間には大きなギャップが存在します。既に稼働中のシステムに後追いでBCP対応を組み込んでいくためには、顧客業務の優先度を整理したうえで復旧手段に応じたサービス復旧目標（RTO / RPO）を設計し、アプリケーションのアーキテクチャや技術的制約を加味した復旧戦略を策定する必要があります。さらに、カケハシではAWS上にサービスを構築しているため、各種データストアサービスの特性や制約を理解したうえでの設計判断も求められます。マネージドサービスを利用している場合、バックアップの取得は比較的容易です。しかし、いざ復旧しようとすると、計画段階では見えなかった技術的な困難が次々と現れます。加えて、医療系SaaSでは厚労省ガイドラインへの準拠やデータの国内保持要件といった規制対応、本番相当データでの訓練コスト、関係者との合意形成など、ドメイン固有の難しさも重なります。本セッションでは、医療系SaaSのSREとしてマルチリージョンDR構成の設計やデータ復旧戦略の策定に取り組む中で直面した技術的課題と、その対処の考え方を具体的にお話しします。これからBCP対応に取り組むSREチームのメンバーやリーダー、既存の復旧設計を見直したいインフラエンジニア、医療や金融など高い可用性が求められる領域でサービス運用に携わる方にとって、復旧設計の勘所や判断軸を考えるきっかけとしてお役立ていただければ幸いです。

株式会社カケハシ SRE

森藤敏之

2016年にヘルステック系のスタートアップに入社。開発部門の新規立ち上げ、放射線画像や病理画像を用いた遠隔画像診断サービスの新規開発から運用までを担当。 2025年より株式会社カケハシに入社。コアプロダクトである「Musubi」のEmbedded SREとして、クラウドリソースの管理や監視、運用を担当している。

7/10 15:10
-
15:25

休憩

7/10 15:25
-
15:55

Track BPlatinum Sponsor

7/10 15:25 - 15:55

ポストモーテム！DDoSからサイトは守れた。でもビジネスは守れなかった。

私たちが大規模なDDoS攻撃に遭遇したときのポストモーテムを共有します。弊社では大規模なDDoS攻撃を受けましたが、AWS WAFをはじめとした対策が功を奏し、幸いにもダウンタイムゼロでサイトを守ることができました。しかし安堵したのも束の間、WAFのリクエスト数課金によるインフラコストが急増し、平常時の千倍を超えるコストが発生する事態に陥りました。「サイトは守れた。でもビジネスは守れなかった。」これが私たちの直面した現実です。さらに苦い教訓もありました。攻撃初日にAWSの予算アラートが届いていたにもかかわらず、月末に届く月額予算アラートと金額が似ていたため、「月末のいつものアラートだ」と判断してしまい、対応が遅れました。残念ながら、いつDDoS攻撃が来てもおかしくない時代です。本セッションでは、「WAFを外せばサイトが落ちる、WAFを続ければ費用がかさむ」という答えのないジレンマに直面した経緯、ポストモーテムで明らかになった構造的な問題点、そしてAWS Shield Advanced導入までのプロセスをお話しします。技術的な対策だけでなく、アラートの見逃しという人間的な失敗や、コストと可用性のジレンマにおける意思決定プロセスまで、リアルな運用の話を包み隠さずお伝えします。 DDoS攻撃が来てから慌てて対応するのではなく、平常時からアクセス数に比例して利用料金が増加する部分を把握し、システム構成の見直しや予算アラート設計の改善に取り組むための実践的な知見を共有します。私たちの経験が、翌営業日にチーム全員で話し合い、DDoS対策の検討を始めるきっかけになれば幸いです。

弁護士ドットコム株式会社

原口慎太郎

2023年4月より弁護士ドットコム株式会社にてSREとして業務に従事。プロジェクトマネージャーの経験を活かし、エンジニアリングに閉じない、組織横断の信頼性向上に取り組んでいます。モータースポーツが好きで、とくにF1が大好き。仕事中のたとえ話にもしばしばF1ネタを挟んでしまいます。推しパーツはパワーユニット、推しPUメーカーはHONDA。

7/10 15:55
-
16:10

休憩

7/10 16:10
-
16:40

Track A

7/10 16:10 - 16:40

OSINT for SRE: 学術論文とポストモーテムから探るシステム障害の共通パターン

私はソフトウェアエンジニア(DBRE)として実務におけるシステム運用に関わりながら、博士後期課程でシステム障害原因の分析を研究しています。研究活動で学術論文やポストモーテムの記事を読むうちに、システム障害の事例や分析結果が十分に運用で活用されていないことに気づきました。こうしたシステム障害の知見が活用しきれていない要因の一つは、システム障害の事例を包括的に分析した日本語の資料の不足にあると考えます。本セッションではインターネットに公開されている20以上の英語で書かれた論文やポストモーテムを使い障害原因の傾向の分析(OSINT for SRE)を行います。セッションでは、まずMicrosoftやeBayのエンジニアによるものを含む5件の論文を分析し、その中から主要な4種類の共通した障害原因を紹介します。さらに、それら4種類の主要な障害原因をポストモーテムや論文、具体的な事例とともに詳細に分析します。4種類の主要な障害原因の1つには連鎖障害があります。マイクロサービスアーキテクチャで設計されたシステムでの連鎖障害は、あるマイクロサービスで起きた障害が別のマイクロサービスへ連鎖して障害が発生することです。システムの運用で連鎖障害を知っていても、いくつのマイクロサービスに連鎖するケースが最も多いか、どんな種類のシステムから連鎖障害が発生しやすいかを把握しきれていない状況にあると考えています。本セッションでは運用経験にもとづく感覚的な認識ではなく、データを使った定量的な分析を行います。本セッションを通じてシステム障害の原因の傾向を具体的なデータをもとに定量的に把握できます。またデータを把握することにより、自社でのシステム障害の対策において対象や優先度の決定を正確に行えます。

株式会社メルカリ DBRE

小山智之

2024年より株式会社メルカリにてDatabase Relibility Engineer。同年より東京工科大学大学院バイオ・情報メディア研究科コンピュータサイエンス専攻博士後期課程（社会人学生）。研究対象は、障害の根本原因の分析、故障の局所化。

Track B

7/10 16:10 - 16:40

インフラ寄りSREでも開発に踏み出せる ~境界を越えてユーザー体験に向き合いたい~

信頼性に向き合うために開発にも踏み出したいインフラ寄りSREの皆さん、頑張れば意外といけます。この発表を事例にマネージャーに相談してみてください。私はインフラ寄りSREとして、決済基盤の設計構築やSLO導入、IaC推進、ポストモーテム導入、オブザーバビリティの向上などに取り組んできました。しかし、信頼性に向き合う中でアプリケーションを読めない・変更できないと解決できない課題が増えていると感じていました。クラウドによりインフラが抽象化される中、ユーザー体験に直結するパフォーマンス課題などはアプリケーションを含めたアプローチも必要になります。本セッションでは、インフラ寄りSREだった自分が開発領域に踏み出し、SWEとして働く中で見えた景色をお伝えします。 SWEになるまでに「開発をやりたい」と言い続け、自己学習を重ねる日々を過ごしました。反対意見もある中で組織が挑戦させてくれたこと、そこに至るまでの背景もお話しします。実際に開発チームで働いてみると、インフラで培った経験が意外と活きました。ユーザー体験を起点にして仕様レベルから複雑さを落とす提案など、インフラだけでは辿り着けなかったアプローチができるようになりました。また、AI活用によって経験不足も補うことができ、今後さらに開発に踏み出すハードルは下がっていくと感じています。一方で、この選択が正解かはわかりません。王道のキャリア戦略ではないですし、AI時代にジュニアSWEから始めるリスクも感じています。正直ビビっています。それでも、ユーザー視点の信頼性に向き合えている実感は確実にあります。インフラ・開発の境界を越えてSREに取り組む選択肢を、一つの生き様としてお伝えします。皆さん自身の選択を考えるきっかけになれば嬉しいです。

Sansan株式会社ソフトウェアエンジニア（SRE）

上司陽平（じょーし）

Sansan株式会社でソフトウェアエンジニア兼SREとして活動しています。決済サービスなどのインフラ設計・構築やCI/CDの改善、組織へのIaC導入などインフラ寄り業務経験の方が多いです。SREとして信頼性を向上するためにアプリケーションも触れるようになりたいと考え、2025年からソフトウェアエンジニアとして機能開発をしています。運用自動化とラーメンが好きです。

Track C

7/10 16:40
-
16:55

休憩

7/10 16:55
-
17:25

Track C

7/10 16:55 - 17:25

AIと共生する開発者プラットフォーム：バクラクのモノレポ×マイクロサービス基盤

マイクロサービスが増えるにつれ、サービスの状態把握やリリース管理の複雑さは増し、開発者の認知負荷は高まっていきます。バクラクではそれが100以上のマイクロサービスをモノレポで運用するという環境でより顕著になり、内製のInternal Developer Portal（IDP）「ServiceConsole」を開発しました。このモノレポ運用において、私たちは主に3つの課題に直面しました。 1つ目は、マイクロサービスの状態が複数のプラットフォームに分断されているという問題です。1つの変更をマージして動作確認するだけでも、GitHub・AWS・Datadogなど複数のプラットフォームを横断する必要があります。さらに100以上のサービスがモノレポで管理されているため、各プラットフォームで正しいリソースを見つけるのも困難な場合があります。そのため各マイクロサービスの状況把握が困難となっており、日々の開発フロー全体を一元管理できる仕組みが必要でした。 2つ目は、本番環境へのリリースの複雑性という問題です。バクラクはSaaSとして全体での定期リリースを行っており、マイクロサービスが増えるにつれ一回あたりのリリースにかかる時間も増大し、安全かつ確実なオーケストレーションや自動化の実現が急務でした。 3つ目は、AI活用が十分に行えていなかったことです。モノレポの構造・依存関係・デプロイ状態といった独自基盤のコンテキストをAIに提供できる基盤が必要でしたが、既存の仕組みでは実現できていませんでした。 Backstageのような既存ツールは我々のモノレポエコシステムにフィットせず、生成AIの活用により開発コストを抑えながら内製化しました。ServiceConsoleはAWSとGitHubをデータソースとして、バクラクのすべてのマイクロサービスに関する情報を集約するプラットフォームです。人間向けにはダッシュボードUIによる直感的な状況把握・操作を、AIエージェント向けにはリリース操作や障害時の状況収集に必要な構造化されたコンテキストの提供を実現しています。本発表では、その設計思想・実装の工夫・運用を通じて得た知見を共有します。

株式会社LayerX SRE

坂田純

2026年からLayerXに入社。通常のSRE業務の傍ら、開発者プラットフォームを開発中。AI Agent時代のガードレールとイネーブルメントを模索しています。

7/10 17:25
-
17:35

休憩

7/10 17:40
-
18:20

Track C

7/10 17:40 - 18:20

「ちゃんとやっている」は独りよがりだった ― 不安に寄り添うインシデント対応へ (17:40 ~ 18:10)

SRE NEXT 2025にて、弊社ログラスはSRE不在の開発チームがインシデント対応体制をゼロから構築した経験を発表しました。教科書的なベストプラクティスに沿い、インシデントコマンダーの専任化、障害レベル定義の整備、対応フローの刷新、ツールによる可視化を進め、MTTRの改善という数値的な成果も手にしました。「ちゃんとやれている」という手応えを感じていました。しかしそれは独りよがりでした。数ヶ月後、CS・Salesなど顧客最前線の部門から「うまく回っているとは思えない」という声が上がります。MTTRは縮んでいました。でも、その裏でCS担当者は顧客に伝えるべき情報が届かないまま問い合わせに応じ続けていたのです。インシデントのレベル定義は顧客影響の視点が欠けていた。復旧に向けた対応は動いていても、顧客と向き合うチームの手元には何もなかった。私たちは「速く直す」という数値を追うあまり、「誰のために、何のためにやるのか」を見失っていました。なぜそうなったのか。根本にあったのは、開発部門と事業部門の間に対話がなかったこと、そしてそもそも対話できる関係性が築けていなかったことでした。お互いが何を大切にし、何に困っているのかを知らないまま、開発チームだけでプロセスを作り上げていたのです。本セッションでは、この気づきから関係性を再構築し、事業部門と対話しながらインシデント対応を作り直した道のりをお話しします。合同の振り返り、お互いの思い・期待の共有、そして協業の中で具体的に何を決め、何が変わったのか。起票から数時間連絡がないこともあった状態から30分以内の全体周知へ、情報共有スタイルの変革、事業部門の満足度向上に至るまでの四苦八苦をリアルにお伝えします。 MTTRを改善したのに現場から「変わっていない」と言われた経験がある方、開発と事業部門の連携に課題を抱えている方へ。プロセスの前にある「対話」と「関係性」の話をお届けします。

株式会社ログラス SRE

mekka

SIer にてアプリケーションエンジニアとしてキャリアをスタート。ToBのSaaS企業でのSRE組織の立ち上げを経て、2024年10⽉より株式会社ログラスに参画。現在は共通基盤部にて、開発組織への SRE の推進およびプラットフォーム開発に取り組んでおり、SRE を⽂化として根付かせることをテーマに活動しています。

7/10 18:20
-
18:30

Track A

トラックB：サテライト

Track B

閉会式

Track C

トラックB：サテライト

7/10 18:30
-
18:50

会場準備

7/10 18:50
-
20:00

Discussion Night

DAY 2: 7/11

Track A

Track B

Track C

7/11 10:00
-
10:30

開場

7/11 10:30
-
10:40

Track A

トラックB：サテライト

Track B

開会式

Track C

トラックB：サテライト

7/11 10:40
-
11:20

Track A

トラックB：サテライト

Track BKeynote

7/11 10:40 - 11:20

誰のためのリライアビリティ？

私は普段、デザインの分野で、ユーザーへのインタビューや観察を通して人々が抱える課題やニーズを理解し、その発見をもとに新しいサービスやプロダクトを構想し、試作しながら価値を検証しています。いわゆるUXデザインやサービスデザイン、デザインリサーチと呼ばれる領域で、人々の目的達成を支える体験や仕組みづくりに取り組んでいます。デザインの世界では、「誰のためのデザイン？」という問いが繰り返し語られてきました。特にUXデザインやサービスデザインの分野では、デザインとは単に美しいものや機能的なものをつくることだけではなく、人々の目的達成を支えるための営みとして捉えられています。本カンファレンスのテーマであるSREには、「Reliability（リライアビリティ）」という言葉が含まれています。では、SREにおいてリライアビリティは誰のためのものなのでしょうか。システムの可用性やレイテンシ、エラー率といった指標は、サービスを支える上で欠かせないものです。しかし、それらの指標は最終的に誰のために存在しているのでしょうか。近年、SREの世界ではCritical User JourneyやEnd-to-End Reliabilityといった考え方が広がりつつあります。これはシステム単体ではなく、ユーザーが目的を達成できるかという視点からサービス全体を捉えようとする試みとも言えるでしょう。本講演では、デザインや顧客理解の視点から、リライアビリティという概念を眺めてみたいと思います。ユーザーの目的達成や体験全体に目を向けながら、「私たちは何のためにリライアビリティを高めているのか」「その指標は誰の価値を表しているのか」という問いについて、皆さんと一緒に考えます。

アンカーデザイン株式会社代表取締役

木浦幹雄

奈良先端科学技術大学院大学修士課程修了後、キヤノン株式会社にて新規事業／商品企画に従事したのち、デンマークCIIDにてデザインを活用したイノベーション創出を学ぶ。デザインリサーチによる人々の理解と仮説検証としてのプロトタイピングを通した持続可能な体験作りを得意とする。IPA未踏スーパークリエータ、グッドデザイン賞など受賞多数。著書に「デザインリサーチの教科書」「デザインリサーチの演習」がある。

Track C

トラックB：サテライト

7/11 11:20
-
11:35

休憩

7/11 11:35
-
12:05

Track A

7/11 11:35 - 12:05

サンプリングは統計学である: 数理的根拠に基づき、オブザーバビリティのコストと精度を両立する

分散トレーシングの導入において、SREが直面する大きな抵抗の一つは「データを捨てたら、SLIの計測精度が下がるのではないか」という懸念です。P99レイテンシの算出やエラー率の監視において、サンプリングがどのような誤差をもたらすのかを定量的に説明できないまま、不安を解消するために高額なストレージ費用を支払い続けているケースは少なくありません。本セッションでは、サンプリングを「統計学」の視点から再定義し、数学的根拠に基づいたオブザーバビリティ設計の手法を提示します。SRE本などの既存のプラクティスを一歩超え、中心極限定理や信頼区間の考え方をテレメトリーデータに適用することで、どの程度のサンプリング率であれば必要な精度を維持できるのかを論理的に導き出します。具体的には、以下の3点にフォーカスします。 1.サンプリングの数学的モデル化：サンプリング率と推計誤差の関係をシミュレーションし、サービス規模に応じた「適正なサンプリング率」の算出方法を提示します。 2.OpenTelemetryによる「重み付け」の管理：サンプリングされたデータから元の全量を推定するための「Adjusted Count（調整済みカウント）」の仕組みと、バックエンドでの正しい統計処理 3.精度を担保したコスト最適化の実践：全件収集を前提としない、新しいSLOモニタリングのあり方を示します「なんとなく1%」という意思決定を卒業し、数理的なバックボーンを持って、コスト効率が高く、かつ信頼できるオブザーバビリティ基盤を設計するための知見を共有します。

グラファナラボ日本合同会社スタッフデベロッパーアドボケイト

山口能迪

グラファナラボ日本合同会社スタッフデベロッパーアドボケイト。Grafana CloudとGrafanaスタックOSSの普及と技術支援を担当。オブザーバビリティ、SRE、DevOpsといった領域を専門とする。OpenTelemetryやGoのコミュニティの支援も活発に行っている。「入門OpenTelemetry」「SREをはじめよう」「効率的なGo」「SLO サービスレベル目標」「オブザーバビリティ・エンジニアリング」翻訳、「SREの探求」監訳をはじめ、技術書の翻訳に多数関わる。

Track B

7/11 11:35 - 12:05

生成AIに「技術」を任せ、「非技術」で仲間を集める〜一人目SREが採用・組織化を最大化した軌跡〜

スタートアップの一人目SREとして入社すると、膨大なシステムのキャッチアップや構築に追われ、「何でも自分一人で解決しなければ」という孤独やプレッシャーを抱えがちです。SRE界隈では「高い技術力で負債をなぎ倒す」スーパーマンが求められがちですが、そのアプローチでは属人化が進み、開発チームへの価値提供やSRE組織の拡大（採用）まで手が回りません。私はそんな「一人で全てを解決しなければ」という思い込みを手放し、インフラ構築の手足を生成AI（Claude Code等）に委ねました。AIを相棒にブラックボックスだったインフラの技術課題を次々と乗り越える中で、誰も触れなかった負債が徹底的に整理され、インフラからアプリ層に至る「システム全体の課題」が可視化されていきました。その結果、インフラ専任の領域を越えてバックエンド開発チームの負債回収にも自ら参画し、非技術的な強みであるコミュニケーションで開発者を巻き込む越境的な立ち回りが可能になりました。さらに、技術的負債を一人で全て解決しようとせず、結果的に残った「明確化された課題」を"次の仲間が活躍できる余白"として提示した結果、採用のカジュアル面談からの選考移行率が「0%」から「80%」へと劇的に向上。新規で入社したメンバーも爆速でオンボーディングを完了させ、さっそく組織の課題解決に貢献してくれています。本セッションでは、この2024年10月から現在までの軌跡を通じ、「生成AI」を武器にして採用・チーム組成という「非技術的な要素」を磨き上げた事例から、これからの時代における新しいInclusive SREの体現方法を共有します。

クロスマート株式会社 SRE

長野太一

2024年10月に正社員一人目のSREとしてクロスマートへジョイン。一人のSREがチームを作っていく経験を味わっています。目指すはエンジニア全員が迷わず価値提供に集中できるためのSRE文化の醸成、ここに向かって日々精進しています。

Track C

7/11 11:35 - 12:05

SRE依存からの脱却 — 運用を開発チームへ移すフルサイクル開発体制の実践

システム数・サービス数が増えることによって運用チームがボトルネックになるという現象は多くの組織が経験していたり、危惧していることかと思います。弊社が運用するサービスはリリース直後から急速に成長していきました。 SREの採用の難易度とサービスの成長速度を鑑みて、早い段階から開発者がシステム運用も担う「フルサイクル開発体制」を理想と考え、SREのプラクティスであるSLI / SLOの整備、Runbookの作成、ポストモーテムの実施などを行って来ました。しかし、チームが少人数のときには「開発者が運用もやろう」でなんとなく回っていた状態が、 - チームメンバーの増加 - チーム数の増加 - 関連サービスの増加等によりシステム運用は再びSREのロールを持つメンバーに暗黙的に集約されていきました。結果的に、開発時に運用面が十分に考慮されず対応が後追いになる、運用の属人化、運用負担の集中や認知負荷の増大が発生してしまいました。そこで、チームやサービスが大きくなっても開発メンバーが運用も担うという文化を醸成するために、組織と責任に対してアプローチし、改めて文化の定着を目指しました。組織との合意形成、評価制度や責任の明文化、ガードレール付きの権限設計などを通じて、責任と権限を開発チームに移譲していきました。さらに、AllHandsやプロダクト開発に関わるチーム全体での継続的な発信や開発者との対話を通じて認識を揃えること、運用に対する学習のフィードバックサイクルの構築などを実施しました。結果として、アプリケーション起因のインフラコストの削減や、SLOの改善、障害対応、キャパシティプランニングなど多くのシステム運用項目において開発者が自律的にアクションを取り、運用のフィードバックサイクルが回る組織へと変化してきました。本セッションは、SREがボトルネックになっている、または運用の移譲に課題を感じている、今後課題になりそうななチームを持つ方を対象とし、運用の移譲を「SREとしての仕組み」だけではなく「責任 / 組織構造と文化の醸成」として捉え実践した知見を共有します。

クラシル株式会社

joooee0000

高山さやかクラシル株式会社開発 BU バックエンドチームリーダー / SRE 2014 年から株式会社 VASILYにてバックエンドエンジニアを経験。 2018 年にクラシル株式会社に入社し、バックエンドエンジニアや SRE を経験。 2022 年よりレシチャレの開発・DevOps・SRE チーム立ち上げなどを担当。

7/11 12:05
-
12:20

休憩

7/11 12:20
-
12:35

Track ALunch Sponsor

7/11 12:20 - 12:35

一人目専任SREの立ち上げを加速する ― AIと進めたオンボーディングで2分を0.04秒にした話

PKSHA Technologyでは、各プロダクトにEmbedded SREを配置する体制を取っています。社内ヘルプデスク業務をAIで自動化するSaaS「AI Helpdesk」では、これまでSWEがSRE業務を兼務する形で運用されてきましたが、事業規模の拡大に合わせ、専任SREの一人目として、ゼロからSREというポジションを立ち上げる形で私が着任しました。頼れる同僚も新規機能開発で多忙な時期。プロダクト固有のドメイン知識も、SLO違反の原因調査に必要なシステムの経緯も、自分で掘り起こす必要がありました。そこで選んだのが、「AIとの対話で自分の解像度を先に上げ、限られた同僚の時間を最大限活かす」という進め方です。本セッションでは、一人目SREとして入社してから2か月でプロダクトのパフォーマンス改善をリードした事例を取り上げながら、どのように早期にオンボーディングを行い、なぜ成果を出せたのか、その背景にあるDevinやClaudeといったAIエージェントの活用についてお話しします。Notionに蓄積されたADRなど過去ドキュメントを横断的に探索したアプローチや、同僚への質問をどう高密度な対話へ転換していったかにも触れる予定です。本セッションで一番お持ち帰りいただきたいのは、次の気づきです。 - Embedded SREは体制上、少数精鋭になりやすい。その制約下でも、コンテキストが整備されたAgentによるオンボーディングは一定の効果をもたらす - Slack上でのDevin利用により、他メンバーのプロンプトと対話の流れまで可視化され、誰がどう働いているかが見え、他人の仕事から学びを得られる（副次的に、PRやLinearチケットとも自動で紐づき、トレーサビリティも高まります）「チームが小さい」「気軽にpingできる相手が限られる」——そんな立場のSRE・プラットフォームエンジニアの方に、コンテキストを整えてAgentで自由に索引・探索できるインターフェースを用意するだけで、オンボーディング体験は大きく変わるという実感を持ち帰っていただければ嬉しいです。

株式会社 PKSHA Technology AI BackOffice開発部 / AI Helpdesk開発グループ / SRE リーダー

星野裕紀

2015年新卒で某MSP事業会社へインフラエンジニアとして入社。物理/クラウド問わずサーバー設計運用保守やオンコールの対応等様々な領域に従事。その後事業会社にて派遣/アルバイトの総合求人情報サイトやAIを活用した自然言語求職者サポートサービスのSREとして担当。現在は PKSHA Technology のAI バックオフィス開発部のSREの立ち上げをリード中。未来の姿を想像しながら取り組むことが好きです。

7/11 12:35
-
13:00

休憩

7/11 13:00
-
13:40

Track B

7/11 13:00 - 13:40

しぶいSRE: サーバから見えない障害にどう向き合うか。ラストワンマイルのデバッグ実践 (13:00 ~ 13:30)

サーバは正常、メトリクスも問題なし、アラートもない。それでもお客様からは「使えない」という声が…このような “観測できない障害” に遭遇したことはありませんか？本セッションでは、企業向けプロダクトの運用に携わるエンジニアを主な対象として、ユーザー環境に起因する問題に対して実践的に切り分け・調査を行うための具体的なアプローチを解説します。プロダクトとユーザーの間には、ブラウザ、メーラー、プリンター、ネットワーク機器といった無数のソフトウェア、そしてデバイスが存在します。とりわけ企業ネットワークにおいては、環境の差異やセキュリティへの取り組みによって「サーバサイドから見ているだけでは気づかない」問題が起こりやすい傾向があります。こうした問題が起こると、どこに原因があろうとユーザーから見れば「使えないプロダクト」と感じられてしまいます。サービスの信頼性に責任を持つSREとしては、こうした問題にも踏み込んでいくことが求められます。本セッションでは、発表者が企業向けプロダクトの運用において実際に遭遇した「ページが表示されない」「表示が遅い」「メールが届かない」といったトラブルを題材に、調査から解消に至るまでのプロセスを具体的に紹介します。業務効率化AIエージェントサービス「バクラク」の事例をもとに、HARファイルの読み解きによるパフォーマンス問題の特定、SMTPやメール仕様に起因する配送トラブル、DNSリゾルバと長大なレコードによる問題など、現代でも発生する“ラストワンマイル”の障害に対する実践的なデバッグ手法を解説します。これらの知見を通じて、サーバサイドの観測だけでは捉えきれない問題に対して、再現性のある調査・切り分けを行い、ユーザー環境に踏み込んで解決できるようになるための視点と具体的な手法を提供します。

株式会社LayerX 執行役員 CISO 兼バクラク事業 VPoE

星北斗

2024年1月に株式会社LayerXに入社。コーポレートエンジニアリング室室長、バクラク事業部 PlatformEngineering部 SRE グループマネージャーを務め、2024年7月より部門執行役員 CISO、2025年10月より現職。クラウドとセキュリティと料理が好き。

7/11 13:40
-
13:55

休憩

7/11 13:55
-
14:20

7/11 14:20
-
14:35

7/11 14:35
-
14:50

休憩

7/11 14:50
-
15:20

Track C

7/11 14:50 - 15:20

グローバル基準のSREは、運用現場でどう機能したか：成熟度アセスメントの実践

SREを任命し活動を始めたものの、実践の全体像が組織として見えにくい——こうした課題はエンタープライズ領域で広く見られます。SLA優先・障害ゼロ志向・責任分界・契約モデルといった構造が、個々のSREの活動を埋もれさせやすくするためです。各デリバリー部門でも、グローバル標準に基づきSREが任命されましたが、同じ課題に直面していました。さらに、エンタープライズ企業のミッションクリティカルなシステムを預かる立場では、複雑なマルチベンダー環境・厳格な変更管理プロセス・外部承認の多段階化が重なり、改善のサイクルを回すにはより多くの工夫が求められます。私たちはこの課題に対し、社内のSRE実践基準に基づく成熟度アセスメントを組織横断に実施しました。可観測性、インシデント対応、自動化、改善活動、役割認識といった観点で評価した結果、"隠れたSRE実践"が体系的に可視化され、SRE本人に「自分は既にSREとして価値を発揮していた」という気づきと自信をもたらしました。他組織の実践も見えるようになり、学び合いと横展開が始まっています。実施を通じて得られた気づきとして、評価軸を現在地に合わせて段階適用できるよう刻む余地があることが分かりました。これはアセスメント結果から見えた今後の検討課題であり、日本固有にとどまらず、外から来た原則を自組織の文脈で読み解く場面であれば同様に機能する可能性があると考えています。このセッションでは、任命されたSREがなぜつまずきやすいのか、成熟度アセスメントをどう進め、何が変わったのかを、再現可能な形でお話しします。原則を自組織の文脈で読み解くプロセスそのものが、SREを前に進める力になります。

キンドリルジャパン株式会社 Lead SRE

渡辺宇

キンドリルジャパン株式会社 Lead SRE。開発とクラウド移行を経験した後、信頼性エンジニアリングの領域へ転向。Platform SREとして組織共通基盤の標準化に取り組み、現在は顧客環境の可観測性整備・運用改善支援と、社内SREコミュニティの主催を通じた文化醸成・人材育成の両面で活動。組織横断でのSRE成熟度向上と、実践知の共有・循環に取り組んでいる。 LinkedIn: https://jp.linkedin.com/in/sora-watanabe-6a4175171

7/11 15:20
-
15:35

休憩

7/11 15:35
-
16:05

Track CPlatinum Sponsor

7/11 15:35 - 16:05

SREプラクティスを複数のプロダクト・組織で自律的に回し続けるための仕組みづくり

KINTOテクノロジーズでは、SREをはじめ、クラウドインフラ、Platform Engineering、DBRE、CCoE、Security、QAなど、複数の横断組織が独立して活動しています。私たちが関わるプロダクトはBtoBからBtoCまで大小さまざまあり、技術スタックや組織の成熟度、現場が優先すべき課題はプロダクトごとに大きく異なります。そのため、SREのプラクティスを横断的に展開しようとすると、各プロダクトの事情に合わせた対応が難しい状況がありました。こうした環境の中で私たちは、Central SREとして汎用的なSREプラクティスの実践や実装を進め、Embedded SREで各プロダクトの現場に合わせて適用・改善してきました。現在はこの形で複数プロダクトを支えており、そこで得た仕組みや知見をグループ会社への支援・展開にもつなげていくことを目指しています。しかし対象が広がるほど、メンバーが毎回現場に伴走して知見を移植するだけでは時間も人手も足りなくなります。限られたリソースで運用モデルをどうスケールさせるか。この問いに向き合う中で、運用の一部をagentとして補助する取り組みを始めました。本セッションでは、この実践と試行錯誤の途中経過を共有します。 Central SREで作った仕組みやプラクティスをEmbedded SREで現場の文脈に合わせて適用・改善し、その知見を再利用可能な形に整えて、複数プロダクトやグループ会社への支援・展開につなげる。この循環を人手だけに頼らず回し続けるにはどうすればよいか。その問いを軸に話を進めます。まだ完成した形があるわけではありませんが、実際に試しながら見えてきた、人が担うべき責務とagentに任せられる補助の境界、そして両者が協業するための設計をどう考えるかについて、現時点の学びとして共有します。

KINTOテクノロジーズ株式会社プラットフォーム開発部 xREグループ / SRE

手崎

いくつかの事業会社にてSREを担当後、2025年10月にKINTOテクノロジーズ株式会社に入社。現在はCentral SREやEmbedded SREとして複数のプロダクトのSRE文化の醸成に取り組んでいます。

7/11 16:05
-
16:20

休憩

7/11 16:20
-
16:50

Track A

7/11 16:20 - 16:50

CSに"SLO"は要らない、経営層に"99.9%"は伝わらない - SREを全社に"翻訳"する3原則

こんな壁にぶつかった経験はないでしょうか。 CSに「SLO」と言っても「何それ？」と返される。経営層に「SLO 99.95%」と報告しても「ほぼ100%で問題ないよね」で終わる。SREのプラクティスは優れた仕組みですが、エンジニアの外に出た途端、言葉も温度感も通じなくなります。私はSRE・情報システム・セキュリティの3領域を同時に統括するEMです。エンジニア側と非エンジニア側の両方を日常的に見ている立場だからこそ、「SREが届かない構造的な理由」と「届ける具体的な方法」が見えてきました。本セッションでは、CS・経営層を含む非エンジニア部門にSREをIncludeする過程で直面した3つの壁──①専門用語の壁、②温度差の壁、③完璧主義の壁──と、それぞれを「翻訳レイヤー設計」「ビジネスインパクト変換」「役割別Include設計」で乗り越えた方法を共有します。成果として、CS初期回答は30分から30%短縮、信頼性投資の承認は2ヶ月から60%改善。ただし、この道のりは一度の大きな失敗──全員に同じ理解を求めた完璧主義──から始まりました。重要なのは、全員に同じ理解を求めるのではなく「役割に応じた関わり方」を設計したこと。どの組織でも応用できるフレームワークとして、明日から使える設計テンプレートとともにお届けします。 --- SREの導入は進んだ。SLOもエラーバジェットも定着した。でも、それはエンジニア組織の中だけの話だった。昨年のSRE NEXTで「管理職への翻訳」を確かめた後に残った問いが、「エンジニア以外の全員に、SREはどう届けられるか？」だ。登壇後には「他の職種や領域へのスキル転用はどうするか」という問いが複数届いた。PMとの共通言語化を実践した後も、参加者から「他部門への展開は？」「持ち帰って実践できた」という声があった。本セッションは、その次の答えだ。

株式会社サイバーセキュリティクラウド VP of Engineering Operations

川崎雄太

2020年にココナラへ入社。Head of Information / グループ会社の執行役員として、プロダクトインフラ・SRE、社内情報システム、セキュリティ、技術広報を管掌。 2026年7月より、サイバーセキュリティクラウドでVP of Engineering Operationsとして、EM of EMs、DevRel、DevHRを担当する。

Track B

7/11 16:20 - 16:50

オブザーバビリティ、本当に活用できてる？―API連携×生成AIで成熟度を自動評価

「オブザーバビリティツールを導入したけど、チームによって活用度がバラバラ…」「セルフアセスメントをやってみたけど、主観的で形骸化してしまった…」。本セッションでは、こうした課題に対し、オブザーバビリティツール（New Relic / Datadog）のAPI連携と生成AIを組み合わせてデータ駆動型の成熟度評価を構築・展開した実践事例を紹介します。評価基準には特定のツールに依存しない6軸×5段階の成熟度モデルを採用し、API経由で自動収集した実データをこのモデルに照らすことで、成熟度レベルの判定から具体的な改善アクションの生成までを自動化しています。構築したアセスメント基盤を用いてNew Relic利用チームへの自動評価を実施しており、対象は現在も拡大中です。Datadogへの展開も進行中です。AIが生成した評価レポートを活用した各サービスへの支援活動から得た、チーム間の成熟度ギャップの傾向や評価精度向上の知見と、「生成AIの評価結果が実行ごとに異なる問題にプロンプト設計と評価基準の構造化でどう再現性を高めたか」「レポートをチームに読んでもらえる形にするまでの試行錯誤」といった失敗談もお伝えします。 SRE / Platform Engineeringチームでオブザーバビリティの全社推進を担当する方が対象です。成熟度モデルはOSS公開済みのため、セッション後すぐに自社での評価を始められます。

合同会社DMM.com

にわさと

2021年7月よりDMM.com SRE部に所属し、2024年頃からはオブザーバビリティの全社推進を担当しています。オブザーバビリティ成熟度モデルの策定、オブザーバビリティツールAPI・生成AIを活用した自動アセスメントの展開とデータ駆動型のチーム支援、New Relic/Datadog両ツールの活用推進などの実績があります。対外的にはObservability Conference Tokyo 2025での登壇、SRE Kaigi 2026でのスタッフ参加、社内テックブログでの技術記事執筆経験があります。成熟度モデルはOSSとしてGitHubに公開し、継続的にメンテナンスしています。

7/11 16:50
-
17:05

休憩

7/11 17:05
-
17:45

Track A

トラックB：サテライト

Track C

トラックB：サテライト

7/11 17:45
-
18:05

Track A

トラックB：サテライト

Track B

Chairs Talk & 閉会式

Track C

トラックB：サテライト

7/11 18:05
-
18:20

会場準備・移動

7/11 18:20
-
20:20

Schedule

DAY 1: 7/10

Track A

Track B

Track C

開場

トラックB,C：サテライト

開会式

トラックB,C：サテライト

Reliability is a Question

David Blank-Edelman

Reliability is a Question

David Blank-Edelman

休憩

GitHub Actions runnerの運用から見るニンテンドーシステムズのチーム体制

坂東 聖博

田中 克磨

GitHub Actions runnerの運用から見るニンテンドーシステムズのチーム体制

坂東 聖博

田中 克磨

入場不可（会場転換）

休憩

何でも屋からの脱却。SREとCTO室の役割を再定義し、本来のSRE業務を取り戻すまでの道のり

尾藤正人

何でも屋からの脱却。SREとCTO室の役割を再定義し、本来のSRE業務を取り戻すまでの道のり

尾藤正人

Embedded SREと共に達成した会員管理システムのAWS移行

西原俊輔

Embedded SREと共に達成した会員管理システムのAWS移行

西原俊輔

ABEMAにおけるIncident Management再設計

宮﨑 大芽

ABEMAにおけるIncident Management再設計

宮﨑 大芽

休憩

AI-native時代の信頼性を育てる、インシデント学習と改善ループの実践

foostan

AI-native時代の信頼性を育てる、インシデント学習と改善ループの実践

foostan

事業価値を生み出すSREへ ー SREが担うべき意思決定の5層

菱田健太

事業価値を生み出すSREへ ー SREが担うべき意思決定の5層

菱田健太

テクニカルプロジェクトマネージャーとSREが協働して構築する信頼性

Yuzuru Ohira

テクニカルプロジェクトマネージャーとSREが協働して構築する信頼性

Yuzuru Ohira

休憩

AI Agent SaaS を支える自社仮想化基盤への挑戦と実運用

OJI

AI Agent SaaS を支える自社仮想化基盤への挑戦と実運用

OJI

最適な自走を最小限の支援で ── M&Aで拡大する組織で少人数SREが挑んだ1年 (13:45 ~ 14:00)

布田遼平

最適な自走を最小限の支援で ── M&Aで拡大する組織で少人数SREが挑んだ1年 (13:45 ~ 14:00)

布田遼平

PR単位で使い捨てるカイポケコネクトのpreview環境の設計と運用 (13:45 ~ 14:00)

小笠原翔太

PR単位で使い捨てるカイポケコネクトのpreview環境の設計と運用 (13:45 ~ 14:00)

小笠原翔太

AI Agent SaaS を支える自社仮想化基盤への挑戦と実運用

OJI

AI Agent SaaS を支える自社仮想化基盤への挑戦と実運用

OJI

"正しいはずの依頼"が届かなかった理由 ― 依頼設計を見直す

Kawaguchi Kota

"正しいはずの依頼"が届かなかった理由 ― 依頼設計を見直す

Kawaguchi Kota

Terraform CI/CDに潜む権限昇格リスクと対策 〜金融システムにおける権限分離と制御事例〜

荒引 健

Terraform CI/CDに潜む権限昇格リスクと対策 〜金融システムにおける権限分離と制御事例〜

荒引 健

休憩

環境凍結というToilを倒す——セルフサービス型Ephemeralテスト環境の設計と実践

白井 裕二

陳 路銘

環境凍結というToilを倒す——セルフサービス型Ephemeralテスト環境の設計と実践

白井 裕二

陳 路銘

SREの積み重ねがAI駆動開発のガードレールになった ― 7つの実践例

坂東聖博

田中克磨

坂東聖博

田中克磨

宮﨑大芽

宮﨑大芽

事業価値を生み出すSREへー SREが担うべき意思決定の5層

事業価値を生み出すSREへー SREが担うべき意思決定の5層

Terraform CI/CDに潜む権限昇格リスクと対策〜金融システムにおける権限分離と制御事例〜

荒引健

Terraform CI/CDに潜む権限昇格リスクと対策〜金融システムにおける権限分離と制御事例〜

荒引健

白井裕二

陳路銘

白井裕二

陳路銘

北浦智也

北浦智也

森藤敏之

森藤敏之

低コストなログ基盤を支えるアーキテクチャ〜Grafana Lokiの設計思想〜

反田光洋

低コストなログ基盤を支えるアーキテクチャ〜Grafana Lokiの設計思想〜

反田光洋

原口慎太郎

原口慎太郎

なぜ私たちのSREプラクティスはなかなか機能しないのか〜システムより先に組織を見る〜

なぜ私たちのSREプラクティスはなかなか機能しないのか〜システムより先に組織を見る〜

小山智之

小山智之

渋谷充宏

渋谷充宏

檜垣慶太

檜垣慶太

坂田純

坂田純

後藤祥

後藤祥

酒井浩平

末藤悠

酒井浩平

末藤悠