Schedule

タイムテーブル

DAY 1: 7/11

Track A

Track B

Track C

7/11 10:00
-
10:30

Track ATrack BTrack C

開場

7/11 10:30
-
10:40

Track A

開会式

Track BTrack C

トラックA：サテライト

7/11 10:40
-
11:20

Track BTrack C

トラックA：サテライト

7/11 11:20
-
11:30

Track ATrack BTrack C

休憩

7/11 11:30
-
12:00

7/11 12:00
-
13:00

Track A

休憩

7/11 13:00
-
13:40

7/11 13:40
-
13:50

Track ATrack BTrack C

休憩

7/11 13:50
-
14:10

7/11 14:10
-
14:20

Track ATrack BTrack C

休憩

7/11 14:20
-
14:30

7/11 14:30
-
14:40

Track BGold Sponsor

7/11 14:30 - 14:40

モニタリング統一への道のり - 分散モニタリングツール統合のためのオブザーバビリティプロジェクト

本発表では、事業会社において複数のシステムを抱えるチームが直面した監視の課題と、その解決に向けた取り組みをご紹介します。私たちのチームでは、フルスクラッチで開発したアプリケーションから既製品まで、多様なシステムを運用していました。これらのシステムはアーキテクチャが異なり、システムごとに監視項目やアラート内容が統一できていない状況でした。また、監視方法もシステムごとに異なり、PATROLCLARICEやmunin・クラウド内のモニタリング機能・prometheus/Grafana/Alert Manager・Datadogなど同じ用途のモニタリングツールを複数併用している状態でした。その結果、モニタリングツールの保守運用コストの増加やチーム内での監視ノウハウ共有の難化、システム異常調査のコスト増加などが課題となっていました。これらの課題を解決するために、Azure Monitor を用いたモニタリングツールの統一を試みました。本セッションでは、複数システムのオブザーバビリティのベストプラクティスについて考えつつ、Azure Monitor を選定した理由やそのツールへ移行したときの移行戦略、運用効率化のための施策について話していこうと思います。また、移行したことで新たに見えてきた課題や今後の方針についてもお話します。

ニフティ株式会社

仲上浩豪

2021年にニフティ株式会社に新卒入社。書面発送システムやニュースサービスなどを担当後、現在はカスタマーサポートセンターのシステムを担当。顧客向けマイページサイトのSLO管理や継続的なシステム改善を行っており、主にバックエンドやインフラ、モニタリングツールの運用などを担当。普段はPythonとPHPを書いている。社内向けツールの開発・保守運用も手がけ、InnerSource活動にも積極的に参加。クラウドプラットフォームにも精通しており、AWS、GCP、Azureの基本資格を保有。現在はAzureの活用機会が増えてきたので、Azure Monitor を使いこなせるよう学習を進めている。

7/11 14:40
-
14:50

Track ATrack BTrack C

休憩

7/11 14:50
-
15:30

Track B

7/11 14:50 - 15:30

対話型音声AIアプリケーションの信頼性向上の取り組み ~ Webアプリケーション以外でどうSREを実践するのか ~ (14:50 - 15:20)

国内SREの実践を見ると、多くの事例はWebアプリケーションを前提とした取り組みが中心となっています。しかし、Webアプリケーション以外のシステムにもSREを適用することで、同様に高い可用性や信頼性を実現できる可能性があります。弊社では対話型音声AIアプリケーションを開発運用しており、これらのシステムにおいてもSREを実践しています。対話型音声AIアプリケーションは、音声処理や自然言語処理を利用して、ユーザーとのスムーズな対話を実現しています。しかし、特に電話を使用したサービスでは、システムのダウンタイムやパフォーマンス低下が顕著な影響を与えるため、高い信頼性が求められます。対話型音声AIアプリケーションでは、外部サービスとの連携やリアルタイム性の確保が重要であり、これらの要素をうまく管理することがSRE実践における大きな課題です。この発表では、対話型音声AIアプリケーションの信頼性を向上させるための戦略を紹介します。具体的には、外部APIやサービスに依存した部分で発生する遅延や障害を最小化するためのリトライ戦略、障害発生時の迅速な対応方法、そしてオブザーバビリティの向上を通じて、全体の可用性をどのように保つかについて議論します。SREの観点から、可用性の高い対話型音声AIサービスの運用方法を実践的に解説し、特にリアルタイム性とシステム全体の健全性を維持するために取り組んでいる具体的なプラクティスをご提供します。取り上げるトピック - WebSocketアプリケーションにおけるオブザーバリティ - LLMを使ったアプリケーションの信頼について - Webアプリケーション以外でのSLI/SLO - 「対話アルゴリズム的Anomaly」と「システム的Anomaly」の違いから考えるSLI/SLO - DataDog LLM observabilityの実践 - (コラム)1プロセスの突死がビジネス影響が大きい理由

株式会社IVRy AI Engineer / SRE

森谷浩幸

株式会社IVRy AI engineer / SRE AI音声対話サービスの開発に携わっています。AI・インフラ関連のトピックに関心があります。 DMM.comでデータサイエンス、Microsoft developmentにてMSN/Bingの開発に携わっていました。

株式会社IVRy

渡部龍一

株式会社IVRyでSREをやりつつSRE NEXT 2025ではCo-Chairをやっています。積読と猫とEOL対応が好きです。

7/11 15:30
-
15:40

Track ATrack BTrack C

休憩

7/11 15:40
-
16:10

Track A

7/11 15:40 - 16:10

とあるSREの博士「過程」

ソフトウェアエンジニアがより高みを目指すために、計算機科学（コンピュータサイエンス）を修めることがキャリアを充実させる一つの手段として知られています。計算機科学あるいはそれを取り囲むより広範な情報学が、エンジニアが普段取り扱う情報技術の基礎であるためです。そして、そのような基礎そのものに新しい発見や課題解決を積み上げるための訓練を積む場が、大学院の博士課程であると考えています。通称SREBookの序文では、"PhDs"に関する言及もあり、SREとも縁の感じられるキーワードです。博士課程の体験記は、学位を取得された先人たちがウェブ上で公開しているケースが多数あります。しかし、社会人のソフトウェアエンジニアが学位を取得する事例は少なく、それゆえに、博士課程とは何であり、何を得られるのか、研究と開発は何が違うのかは広く共有されていません。実際、研究や博士課程がどのようなものか想像もつかないと言われることもありました。そこで、本発表では、今年に博士（情報学）の学位を取得した実体験を踏まえて、博士論文の表題となった"Scaling Telemetry Workload"と呼ぶ体系に辿り着くまでの研究の道のりを紹介します。要素技術としては、時系列データベース、Linuxネットワークスタック、eBPF、AIOpsなどが含まれます。 SREのようなシステム管理は、工学や研究対象としては見なされなかった歴史があることからわかるように、SREに関する問題解決を学術研究としていかに帰着させるかは自明ではありません。実際に、博士学位を得ることは、容易なことではありませんでした。自分で考える一つのテーマに向き合い、いつ役に立つかもよくわからないことに数年がかりで、論文やOSSを調べ、手を動かし、思考し続けることになります。しかし、大変なだけでなく、博士研究は面白いものです。こんなことを考えているのは自分だけかも、と思う瞬間もあります。博士論文を書き上げる上で、自分の中に体系を築いていく実感もあります。これらは自分がエンジニアをやっていたころにはなかった感覚です。本発表が、大学院進学に興味のある方、あるいはマネージャーやスタッフエンジニア以外のキャリアパスがないかを模索されている方に、博士という道を知るきっかけとしていだければ幸いです。

さくらインターネット株式会社上級研究員

yuuk1

SREの研究者。博士（情報学）。2019年よりさくらインターネット研究所所属。最近の取り組みはAIインフラとLLMの分散学習。SRE NEXTでは登壇皆勤。

Track B

7/11 15:40 - 16:10

60以上のプロダクトを持つ組織における開発者体験向上への取り組み -チームAPIとBackstageで構築する組織の可視化基盤-

組織が大きくなるにつれて、「誰が何をしているのかわからない」「困ったとき誰に連絡すればいいのかわからない」という問題が増えてきます。マネーフォワードでは60を超えるプロダクトを持つ組織として、この複雑性に日々向き合っています。特に互いのチームが連携して開発している組織では、チーム間のコミュニケーションフローが複雑化し、情報の分断が顕著になってきました。本発表では、SREチームが取り組んだチームAPIとBackstageを活用した組織の可視化基盤構築について紹介します。弊社では、このBackstageはインシデント発生時に責任者や関係性を素早く理解するためにもともと導入されていたものです。今回私たちが特に注力したのは、このBackstageにおける情報登録障壁の軽減と、チームAPIを使った他チームに公開すべき情報の整理です。多くの開発者にとってYAML編集は煩雑で、レイアウトやパラメータの把握だけでも意外に時間がかかります。そのチームの情報は登録されなければ効果を発揮しないため、まずはそのハードルを下げるためにBackstageテンプレートを実装しました。この実装によって開発者がYAMLを書かなくても必要な情報を登録できる環境を整えることで、実際に使われやすい仕組みへと進化させました。その結果、チームとシステムの関係を1:Nで表現できるようになり、組織の複雑な関係を理解が容易になりました。この発表では、チームトポロジーのチームAPIに触れつつ、Backstageテンプレートの実装における技術的なTipsや、チームAPIをどのように利用したかという具体的な知見を共有します。組織の複雑化に悩むマネージャー、開発者、SREの方々。また、今後複雑化することが予見される方々に向けて、今からできることはなにか？についてもお話します。「誰が何の責任を持っているのかわからなくなってきた」という課題解決の第一歩として、実際に使われる仕組みづくりのヒントを持ち帰っていただけると幸いです。

株式会社マネーフォワード SRE

VTRyo

2021年マネーフォワードに入社。とある部署でSREグループを立ち上げ後、HR領域のプロダクトを担当。現在はSREや開発者のExperience向上や、グループ企業との連携などに従事している。趣味はビール・ラーメン二郎・カレーという人類三大欲求が主。ビールはほどほどに好きで、協会公認のビアジャッジとしてビールの審査もする。最近は自作スパイスカレーにハマったので間借りカレー屋を目指している。日々何かしらを制作していないと気が済まないらしい。

Track C

7/11 15:40 - 16:10

〜『世界中の家族のこころのインフラ』を目指して”次の10年”へ〜 SREが導いたグローバルサービスの信頼性向上戦略とその舞台裏

2015年4月に誕生した『家族アルバムみてね』は、「世界中の家族のこころのインフラをつくる」というミッションのもと2025年に10周年を迎え、世界中で2,500万人以上のユーザーにご利用いただくサービスへと成長しましたその歩みの中で、海外ユーザーの増加に伴い、ネットワークレイテンシーなどの課題が浮上します。この壁を乗り越えるべく、SREチームは段階的な取り組みを重ね、最終的にAWSマルチリージョン構成への移行を実現しました。さらに、持続可能なサービス運用のためのコスト最適化にも継続的に取り組んできました。特にマルチリージョン化に際しては、リージョンごとのトラフィック傾向を考慮した設計、オブジェクトのレプリケーション戦略、コストに見合う効果的なサービスレベルの見極めが重要な判断軸となりました。本セッションでは、みてねのサービス成長とそれに伴う改善の歴史を【追体験】いただくかたちで、以下のポイントについて詳しくお話しします。【課題の発見と分析】レイテンシーの問題をどのように特定し、影響を評価したか【段階的な取り組み】 CloudFrontの導入やネットワーク最適化など、マルチリージョン対応に至るまでのステップ【アーキテクチャの選定】マルチリージョン構成への移行における技術的な選択とその理由【移行プロセス】データベースやマネージドサービスの選定、移行時に直面した課題とその解決策【成果と効果】移行後に得られたレイテンシの改善や信頼性の向上【今後の展望】みてね’s NEXT〜 ”次の10年”グローバルサービスとしてのさらなる信頼性向上に向けた取り組みこの発表は、グローバルサービスの信頼性向上、またサービスを""次のステップ""（NEXT）へ進めるために奮闘するSREやインフラエンジニアにとって、実践的な知見と戦略を共有する場となることを目指しています。

株式会社MIXI みてね事業本部みてねプラットフォーム部 SREグループ

杉本浩平

2022年4月株式会社ミクシィ（現MIXI）に入社。『家族アルバムみてね』のSREとして主にサービス安定性、オブザーバビリティの改善に取り組む。

7/11 16:10
-
16:20

Track ATrack BTrack C

休憩

7/11 16:20
-
16:40

7/11 16:40
-
17:00

Track ATrack BTrack C

休憩

7/11 17:00
-
17:30

Track BTrack C

トラックA：サテライト

7/11 17:30
-
17:35

Track A

閉会式

Track BTrack C

トラックA：サテライト

DAY 2: 7/12

Track A

Track B

Track C

7/12 10:00
-
10:30

Track ATrack BTrack C

開場

7/12 10:30
-
10:40

Track A

開会式

Track BTrack C

トラックA：サテライト

7/12 10:40
-
11:20

Track AKeynote

7/12 10:40 - 11:20

すみずみまで暖かく照らすあなたの太陽でありたい

「いつもヨドバシカメラのご利用ありがとうございます」お客様への感謝の心をもっていつでも快適にサービスをご利用いただけるように、インフラとアプリケーションの安定稼働は私たちの使命です。SREは、システム全体に光を照らし、目を背けたくなるような問題も直視する包容力を持ち、潜在的なリスクを早期に発見し、解決することで、安定した状態を維持します。ヨドバシカメラのシステム運用は、1985年のPOS導入から始まり、ポイントシステム、EC、配送システムなど、規模を拡大してきました。それぞれのシステムで複雑性が増す「カオス化」と呼ばれる状態も経験しました。この状況を打破するため、私たちは継続的に運用方式を見直してきました。監視ツール、IaCやデプロイメントパイプラインによる標準化と自動化の実現。インシデントによる対応管理なども行いました。現在注力しているのは、オンプレミス型プライベートクラウドの構築と運用です。セキュリティと柔軟性を両立させ、変化の激しい環境に迅速に対応するための重要な戦略です。仮想化技術やマイクロサービスアーキテクチャの導入により、効率性と独立性を高めています。過去の経験を活かし、最新技術を取り入れながら、これからもお客様に安全なサービスを提供し続けられるよう、私たちは挑戦を続けています。

株式会社ヨドバシリテイルデザインサービスデプロイメント事業部事業部長

戸田宏司

1982 年、小学生時代からプログラミングを始め、1998 年からはフリーランスとして小規模 CGI サーバ構築からキャリアをスタート。その後、入社したソフトウェアハウスで一般的な業務システムから証券取引所開設プロジェクトまでの幅広い開発に携わってきました。2017 年にヨドバシリテイルデザインに入社し、オンサイトプライベートクラウドの構築・運用、サービス設計、アーキテクチャ設計、セキュリティ設計などを担当しています。幅広い経験と知識を活かし、現在に至るまで様々なプロジェクトに貢献しています。 https://yodobashi.jobs/

Track BTrack C

トラックA：サテライト

7/12 11:20
-
11:30

Track ATrack BTrack C

休憩

7/12 11:30
-
12:00

7/12 12:00
-
13:00

Track A

休憩

7/12 13:00
-
13:20

7/12 13:20
-
13:30

Track ATrack BTrack C

休憩

7/12 13:30
-
13:50

7/12 13:50
-
14:00

Track ATrack BTrack C

休憩

7/12 14:00
-
14:10

7/12 14:10
-
14:20

7/12 14:20
-
14:30

Track ATrack BTrack C

休憩

7/12 14:30
-
15:00

7/12 15:00
-
15:10

Track ATrack BTrack C

休憩

7/12 15:10
-
15:40

Track C

7/12 15:10 - 15:40

Pullリクエストは証拠、Pull型Appが実行、DeviceFlowで認証：Githubを中心にPull型AppとDevice Flowでつくる安全なSQL実行と参照

自動化をとりいれた属人化解消に取り組みたいといった要望が皆さんの開発現場でもあるのではないでしょうか？しかし、安全性や確実な実行の観点、費用の問題から日々の運用作業が人手に頼らざるを得ず、業務の属人化が避けられない状況があると思います。従来の手法では、安全性を確保するために特定の人にしか操作を許可しない体制が取られ、属人化や業務のボトルネックを生みます。また、依頼するためのブランチや依頼DBの権限管理、定型挨拶の手動依頼フローなど、効率を下げる業務が定常的に起きるでしょう。今回は定常業務からSQLクエリの実行にフォーカスし解決を模索しました。依頼フローの調査やヒアリングから - 依頼する上で手続きが面倒 - すぐに結果が得られない。 - 依頼回数を削減のため一度に大量の情報を取るような特大クエリ（及び業務時間外実行）これらを単純に自動化するならば簡単ですが、そのようにはいきません。自動化の場合、注意点があります。 - 不正なSQLの実行の防止 - 証跡に残らないSQLの実行の防止 - 取得した情報への適切なアクセス制御このように、自動化には現状の手動作業と以上のセキュリティが求められます。本発表ではこの解決に至ったGithubとGitや複数のOSSを活用したセキュアなPull型のSQL自動実行アプリケーション・およびデータ取得者のアカウント管理不要をフリーにする手法について発表します。この成果により、クエリレビュー後、人間の関与なく実行が行え、依頼が不要な状態になりました。 PRが残ることから、実行するSQL、作成者、レビュアー全てがGithubに集約された監査証跡として機能し管理が容易です。 Githubを活用することで、SQLのレビュー、監査証跡の管理、結果へのアクセス管理など自動化に必要な作業を大幅に簡略化しました。アプリ側では、Pull型の仕組みの採用や許可されていない操作をブロックする安全なガードレールを構築によってセキュアなアプリを構築しました。この手法に至るまでの変遷や考慮事項、技術的な詳細、SQL実行以外にも活かせるGitHubを活用した認証方法について話します。 - この発表を聞いてほしい人属人化した業務の自動化をしてトイルの削減をしたい人 GitHub, Gitを使い倒したい人アカウント管理に悩まされている人

株式会社ラクス

竹田　舜

2023年に株式会社ラクスに新卒入社、BEエンジニアを経てSREとして業務に従事

7/12 15:40
-
15:50

Track ATrack BTrack C

休憩

7/12 15:50
-
16:20

7/12 16:20
-
16:30

Track ATrack BTrack C

休憩

7/12 16:30
-
17:10

Track BTrack C

トラックA：サテライト

7/12 17:10
-
17:30

Track A

Chairs Talk & 閉会式

Track BTrack C

トラックA：サテライト

7/12 18:00
-
20:00

Schedule

DAY 1: 7/11

Track A

Track B

Track C

開場

開会式

トラックA：サテライト

Fast by Friday: Making performance analysis fast and easy

Brendan Gregg

Fast by Friday: Making performance analysis fast and easy

Brendan Gregg

トラックA：サテライト

休憩

Learn about the benefits of the "follow-the-sun" team model

Shiv Ahlawat

豊田稔

Learn about the benefits of the "follow-the-sun" team model

Shiv Ahlawat

豊田稔

SRE へのサポートケースをAIに管理させる方法

guni

SRE へのサポートケースをAIに管理させる方法

guni

SRE不在の開発チームが障害対応と向き合った100日間

勝丸 真

SRE不在の開発チームが障害対応と向き合った100日間

勝丸 真

休憩

クラウド開発の舞台裏とSRE文化の醸成 (12:15 - 12:25)

長野 雅広

クラウド開発の舞台裏とSRE文化の醸成 (12:15 - 12:25)

長野 雅広

事例で学ぶ！B2B SaaSにおけるSREの実践例 (12:15 - 12:25)

星野貴信

事例で学ぶ！B2B SaaSにおけるSREの実践例 (12:15 - 12:25)

星野貴信

スタートアップでのSRE実践 (13:00 - 13:40)

高木潤一郎

橋本 和宏

成田 一生

唐澤弘明

北野勝久

スタートアップでのSRE実践 (13:00 - 13:40)

高木潤一郎

橋本 和宏

成田 一生

唐澤弘明

北野勝久

オフィスビルを監視しよう：フィジカル×デジタルにまたがるSLI/SLO設計と運用の難しさ (13:00 - 13:30)

三河内 拓也

オフィスビルを監視しよう：フィジカル×デジタルにまたがるSLI/SLO設計と運用の難しさ (13:00 - 13:30)

三河内 拓也

SREチームの越境と対話〜どのようにしてイオンスマートテクノロジーは横軸運用チームの廃止に至ったか〜 (13:00 - 13:30)

齋藤 光

SREチームの越境と対話〜どのようにしてイオンスマートテクノロジーは横軸運用チームの廃止に至ったか〜 (13:00 - 13:30)

齋藤 光

休憩

Rethinking Incident Response: Context-Aware AI in Practice

Ryota Yoshikawa (@rrreeeyyy)

Rethinking Incident Response: Context-Aware AI in Practice

Ryota Yoshikawa (@rrreeeyyy)

複雑なシステムにおけるUser Journey SLOの導入

土屋 健司 / yakenji

複雑なシステムにおけるUser Journey SLOの導入

土屋 健司 / yakenji

100% AI コード生成開発！ AI Agent 時代の信頼性と開発効率のためのガードレール

川津 雄介

100% AI コード生成開発！ AI Agent 時代の信頼性と開発効率のためのガードレール

川津 雄介

休憩

サービス連携の“謎解き”を可能にする Datadogによる分散トレース導入の一歩

徳富 博

サービス連携の“謎解き”を可能にする Datadogによる分散トレース導入の一歩

徳富 博

OpenTelemetryセマンティック規約の恩恵とMackerel APMにおける活用例

朝倉一希 (Arthur)

OpenTelemetryセマンティック規約の恩恵とMackerel APMにおける活用例

朝倉一希 (Arthur)

モニタリング統一への道のり - 分散モニタリングツール統合のためのオブザーバビリティプロジェクト

勝丸真

勝丸真

長野雅広

長野雅広

橋本和宏

成田一生

橋本和宏

成田一生

三河内拓也

三河内拓也

齋藤光

齋藤光

土屋健司 / yakenji

土屋健司 / yakenji

川津雄介

川津雄介

徳富博

徳富博

仲上浩豪

仲上浩豪

大久保俊彦

大久保俊彦

宮川倫瑠

宮川倫瑠

森谷浩幸

森谷浩幸

浅野大我

浅野大我

杉本浩平

杉本浩平

三吉貴大

土田悠輝

三吉貴大

土田悠輝

小沼小織

林如弥 aka もりはや

小沼小織

林如弥 aka もりはや

システムから事業へ〜SREが描く“その先”のキャリア〜

原智子

システムから事業へ〜SREが描く“その先”のキャリア〜

原智子