Schedule

タイムテーブル

DAY 1: 7/11

Track A

Track B

Track C

7/11 10:00
-
10:30
Track ATrack BTrack C

開場

7/11 10:30
-
10:40
Track A

開会式

Track BTrack C

トラックA:サテライト

7/11 10:40
-
11:20
Track AKeynote

Fast by Friday: Making performance analysis fast and easy

Brendan Gregg
Track AKeynote

7/11 10:40 - 11:20

Fast by Friday: Making performance analysis fast and easy

It is not ok that we speed weeks, even months, trying to solve why software or hardware is slow. In the meantime, companies waste money on datacenter or cloud compute costs, users are unhappy with latency, and product evaluations can run out of time, leading to poor choices. It should not take more than a week to identify the root cause or causes for a system's poor performance, such that any issue reported on a Monday should be solved by Friday, or sooner. This talk explores a vision called "fast by Friday," a new approach to performance engineering made practical by eBPF superpowers, and explores engineering work we all need to do to make it possible. This involves default tools, compiler, and runtime options to support immediate analysis, and new production diagnosis tools to exonerate components, focusing the target of analysis. This work can also be adopted by SREs, who must solve issues in much shorter time frames, for a similar vision: "Fast by five minutes!"

Intel Fellow

Brendan Gregg

Brendan Gregg is an internationally renowned expert in computing performance and an Intel Fellow. Previously at Netflix, he authored Systems Performance and BPF Performance Tools (Addison-Wesley). He has created widely used tools, methodologies, and visualizations, including flame graphs.

Track BTrack C

トラックA:サテライト

7/11 11:20
-
11:30
Track ATrack BTrack C

休憩

7/11 11:30
-
12:00
Track A

Learn about the benefits of the "follow-the-sun" team model

Shiv Ahlawat
豊田稔
Track A

7/11 11:30 - 12:00

Learn about the benefits of the "follow-the-sun" team model

Building a "Follow the Sun" operations model at scale requires strategically assembling teams around the globe to ensure seamless 24/7 support. Establishing a new operations team in Tokyo from scratch involves recruiting top talent, fostering a collaborative culture, and aligning with existing teams across different time zones. This model ensures continuous coverage by making use of the strengths of regional teams, optimizing workflows, and utilizing technology to ensure smooth handoffs. In Tokyo, it’s essential to integrate local expertise, training, and communication tools to maintain consistent quality and efficiency, in order to ultimately enhance customer satisfaction and operational resilience.

Engineering Team Lead

Shiv Ahlawat

Engineering Team Lead of Triage Operations APAC

Bloomberg L.P. Triage Operations Engineer

豊田稔

Mino has a strong background in implementing, supporting, and maintaining trading systems. Having been involved with designing infrastructure and operational models for exchange connections, Mino brings experience from the intersection of technology, finance, and -- most importantly -- people.

Track B

SRE へのサポートケースをAIに管理させる方法

guni
Track B

7/11 11:30 - 12:00

SRE へのサポートケースをAIに管理させる方法

この発表では、Ubie におけるプロダクトチームからSREチームへ寄せられる問い合わせを生成AIなどの技術を駆使して解決していく取組みについて紹介します。 Ubie の SRE はプロダクトチームから新サービスのインフラ設計の相談、デプロイやパフォーマンスの問題や各種エラー対応、インフラへのフィーチャーリクエストなど、多くの相談を受けます。 Ubie ではそれら全てをチケットとして管理していますが、月間100件以上のチケットが発行され、その対応によって根本的なインフラの改善業務に支障をきたしていました。 私たちはこの課題に対し、生成AIを活用したチケット管理システムをSREチーム自ら内製することで解決しました。 AI によるチケットの優先度判定、サマライズ、過去のサポートケース・社内ドキュメント検索と回答提案を行い、問い合わせ対応にかかる工数を最小限に抑えました。AIがサジェストするドキュメントで解決できるケースが増え、チケット管理に割いていた工数も削減することができました。 本発表では、SREへの問い合わせ業務をどのようにして改善したか、AIの具体的な活用事例も合わせて紹介します。SREチームのメンバーやマネージャー、開発効率化に課題を感じるDevOpsエンジニア、生成AIの業務活用を検討するプラットフォームチームなど、明日からの業務改善にお役立ていただければ幸いです。

Ubie株式会社 SRE

guni

大手通信会社に新卒入社後、バックエンドエンジニアとして大企業向けのIaaSのネットワークコントローラー開発に従事。2024年より Ubie株式会社に入社し、SREチームの一員として toC/toB のマイクロサービスを支える監視基盤やネットワーク構築などを行っている。

Track C

SRE不在の開発チームが障害対応と向き合った100日間

勝丸 真
Track C

7/11 11:30 - 12:00

SRE不在の開発チームが障害対応と向き合った100日間

創業以来、障害対応はエンジニアの持ち回りで行ってきた私たちのチーム。大きな混乱もなく、うまくやれているつもりでした。 しかしある日、カスタマーサクセスチームから「最近の障害対応はうまくいっていない」というフィードバックを受けました。最初は「そんなはずはない」と思っていましたが、会話を重ねるうちに、対応品質のばらつきや伝達の不統一など、顧客視点でのズレが少しずつ明らかになっていきました。 マニュアルはあったものの、読み合わされることもなく、ドキュメントの存在すら知らないメンバーもいた。「誰に何をどこまで伝えるか」は人によってまちまちで、知らないうちにチームが期待を毀損していたのです。 このセッションでは、そこから障害対応の品質改善プロジェクトを発足し、約3ヶ月かけて取り組んだ改善活動を紹介します。 インシデントコマンダーの専任化から始まり、障害対応フローの整備、Slack運用の見直し、外部ツールの導入、ステークホルダーとの対話を通じた文化づくりなど、仕組みと会話の両輪で信頼性を回復させていった試行錯誤の記録です。 SREやEMのような肩書きがなくても、信頼性には向き合えます。 信頼を取り戻し、チーム全体で障害対応に向き合える土壌をつくっていく。そのプロセスと得られた気づきを共有します。

株式会社ログラス Engineering Manager

勝丸 真

株式会社ログラス所属。クラウド基盤チームマネージャー。 2020年にログラスにジョイン。バックエンドエンジニア、クラウドエンジニアを経て、現在はEMとしてチームのマネジメントを担当。社内に足りないロールに挑戦し、その領域をなんとかして、誰かに渡すことを繰り返しています。

7/11 12:00
-
13:00
Track A

休憩

Track BLunch Sponsor

クラウド開発の舞台裏とSRE文化の醸成 (12:15 - 12:25)

長野 雅広
Track BLunch Sponsor

7/11 12:00 - 13:00

クラウド開発の舞台裏とSRE文化の醸成 (12:15 - 12:25)

さくらインターネットではさくらのクラウドのガバメントクラウド正式認定と、フルスペックのクラウドプラットフォームを目指した開発を進めています。 2025年2月には13の新しい機能をリリースし、現在取り組みをさらに加速させています。 本セッションでは大きなチャレンジをする開発組織をどのように作り上げてきたのか、また高信頼なサービスを実現するためのSRE文化醸成の取り組みについて紹介します。

さくらインターネット株式会社 クラウド事業本部 副本部長

長野 雅広

2021年1月さくらインターネットに入社。さくらのクラウドのガバメントクラウド正式認定、サービスの発展を目指し開発組織、ソフトウェアエンジニアリングのリードを行っている

Track CLunch Sponsor

事例で学ぶ!B2B SaaSにおけるSREの実践例 (12:15 - 12:25)

星野貴信
Track CLunch Sponsor

7/11 12:00 - 13:00

事例で学ぶ!B2B SaaSにおけるSREの実践例 (12:15 - 12:25)

ビットキーでは「つなげよう。人は、もっと自由になれる」をビジョンに掲げ、B2C、B2BからB2B2Cまで、幅広い領域に複数のプロダクトを展開しています。本セッションではその中からB2B SaaS領域に着目し、直面した課題にSREが向き合って改善した事例を紹介します。 はじめに、基幹システムとの連携処理において、パフォーマンスバジェットを計算することで、サービスが繁忙期においても安定して稼働可能か検証した事例を紹介します。 次に、顔認証システムのSLIの設定において、テレメトリデータが特定顧客が偏る問題に対してデータの収集方法を工夫することで、ノイズを減らしていく事例を紹介します。 最後に、この後に行われるビル監視のセッションが聴きたくなる紹介を行います。 このセッションを通じて、明日からつながりを感じながらSREの実践に役立つヒントが得られることを目指します。

株式会社ビットキー SRE

星野貴信

2022年11月株式会社ビットキー入社。主にオブザーバビリティ、CI/CD、IaC周りを担当。

7/11 13:00
-
13:40
Track Aパネルディスカッション

スタートアップでのSRE実践 (13:00 - 13:40)

高木潤一郎
橋本 和宏
成田 一生
唐澤弘明
北野勝久
Track Aパネルディスカッション

7/11 13:00 - 13:40

スタートアップでのSRE実践 (13:00 - 13:40)

スタートアップでのSRE実践

newmo株式会社 Software Engineer

高木潤一郎

前職のメルペイではSREチームのテックリードやエンジニアリングマネージャーを担当し、2024年にnewmoに入社。

株式会社タイミー プラットフォームエンジニアリング部 マネージャー

橋本 和宏

SIerやゲーム業界でインフラ構築・運用、自動化、SREの実践に従事。複数社でクラウド移行やKubernetes基盤の構築、SREチームの立ち上げなどをリードし、信頼性とスケーラビリティの向上を目指した活動を行ってきました。 2024年7月より株式会社タイミーにJOINし、現在はプラットフォームエンジニアリング第1グループのマネージャーとして、クラウドインフラによる開発基盤の整備や技術支援を通じてプロダクト開発を支えています。

株式会社IVRy Principal Engineer

成田 一生

2024年2月より株式会社IVRyに入社し、プリンシパルエンジニアとしてSREやデータ基盤領域の課題に取り組む。前職はクックパッド株式会社で、14年間在籍。バックエンドやインフラのエンジニアを経て、2016年から執行役CTOとして経営に携わった。

株式会社ダイニー VP of Technology

唐澤弘明

株式会社ダイニーで VP of Technology をしています。お酒が好き。

一般社団法人 SRE NEXT / 株式会社スタディスト 代表理事 / CTO

北野勝久

SRE NEXT Founder 兼、一般社団法人 SRE NEXT 代表理事。株式会社スタディストのSRE兼、CTOも務める。

Track B

オフィスビルを監視しよう:フィジカル×デジタルにまたがるSLI/SLO設計と運用の難しさ (13:00 - 13:30)

三河内 拓也
Track B

7/11 13:00 - 13:40

オフィスビルを監視しよう:フィジカル×デジタルにまたがるSLI/SLO設計と運用の難しさ (13:00 - 13:30)

本セッションでは、ビットキーが提供する「workhub」を題材に、フィジカル×デジタルをまたぐサービスにおける、SLI/SLO設計と運用の実践的な知見を紹介します。 workhubは、オフィスやビルの入退室や顔認証、座席予約などの機能を通じて、「働く空間」と「働くひと・業務」をつなぐワークスペース運用のためのサービスです。デジタルだけで完結しない分、SLIやSLOをどう定義して、誰が対応して、どうやって運用するかには独自の工夫が求められます。 本発表では、CUJを起点にしたサービスレベル設計の進め方、物理デバイスを含めたサービスレベルの考え方、Datadogでビル単位にアラートを出すためのTips、そしてCSチームが初動対応する前提で構築したDatadogとWaroomを連動させたアラート運用の話など、現場で得られた具体的なTipsを紹介します。 フィジカルを含むプロダクトに携わる方はもちろん、既存の枠組みにとらわれずにSLO運用を改善したいすべてのSREにとって、明日から活かせる工夫を持ち帰っていただける内容です。

株式会社ビットキー Data Platform Team Manager

三河内 拓也

データコンサル企業でデータアナリストとして、様々な業界のデータ活用プロジェクトに従事。その後2020年にビットキーにジョイン。データ活用プロジェクトの一環として、サービスレベルの計測・運用を担当しています。

Track C

SREチームの越境と対話〜どのようにしてイオンスマートテクノロジーは横軸運用チームの廃止に至ったか〜 (13:00 - 13:30)

齋藤 光
Track C

7/11 13:00 - 13:40

SREチームの越境と対話〜どのようにしてイオンスマートテクノロジーは横軸運用チームの廃止に至ったか〜 (13:00 - 13:30)

イオングループのDXをリードする役割を持つイオンスマートテクノジーでは、iAEONアプリやネットスーパーを通じたお客様のお買い物体験の向上や店舗業務のDXを推進・展開しております。そんな当社では、SREチームを立ち上げ4年目に入ろうとしています。立ち上げ当初はSREへの理解も内製開発への正しい理解も少ない状態でしたが、この3年間を通してDX事業内において「障害対応の民主化」、「SLI/SLOの策定」そして「旧来の横軸運用チームの廃止」に至りました。その過程を振り返ると、キーファクターとして、チームを超えた越境的アプローチと対話があるのではないかと考えております。 越境と対話の対象としては・開発チーム・ビジネスメンバー・経営などが挙げられます。このセッションでは「障害対応の民主化」、「SLI/SLOの策定」、「旧来の横軸運用チームの廃止」をはじめとした事例を通して、その過程においてどのような越境と対話を実践してきたかを具体的に解説します。 本セッションが、これからSREを立ち上げる方、現在の取り組みに悩まれている方、SREを通じて組織文化の変革を進めようとしている方々へのヒントになれば幸いです。

イオンスマートテクノロジー株式会社 DevSecOps Division/Director

齋藤 光

2022年5月イオンスマートテクノロジー株式会社に入社。SIer2社を経た後に事業会社でインフラ/運用部門責任者やプロダクトマネージャーを経験した後に現職。入社以来SRE文化の醸成に勤しむ日々。本業は猫の下僕。

7/11 13:40
-
13:50
Track ATrack BTrack C

休憩

7/11 13:50
-
14:10
Track ADiamond Sponsor

Rethinking Incident Response: Context-Aware AI in Practice

Ryota Yoshikawa (@rrreeeyyy)
Track ADiamond Sponsor

7/11 13:50 - 14:10

Rethinking Incident Response: Context-Aware AI in Practice

生成AIの活用はさまざまな分野で進展していますが、インシデント対応のように高い信頼性と文脈理解が求められる領域では、適切な設計と制御が不可欠です。 本発表では、インシデントレスポンスSaaS「Waroom」における“文脈を理解するAI”の構想を起点として、インシデント対応における生成AI活用の可能性と課題について検討します。AIが実運用において意思決定支援を行うために必要な情報の構造化や文脈の注入、またそのためのシステム設計の観点について紹介します。 あわせて、MCP(Model Context Protocol)をはじめとする技術的アプローチや、他社の事例に見られる運用上の工夫から得られる知見を参照しながら、属人的な対応から再現性ある運用への移行を支援する技術のあり方を考察します。 本セッションは、今後の実装に向けた構想段階の内容として、現場での課題意識と接続可能な技術的視点を整理し、今後の議論の出発点となることを目的としています。

株式会社Topotal CTO

Ryota Yoshikawa (@rrreeeyyy)

株式会社 Topotal で CTO をしています。SRE の技術支援 (SRE as a Service) と、インシデントレスポンスを行うための SaaS の Waroom を作っています。

Track BPlatinum Sponsor

複雑なシステムにおけるUser Journey SLOの導入

土屋 健司 / yakenji
Track BPlatinum Sponsor

7/11 13:50 - 14:10

複雑なシステムにおけるUser Journey SLOの導入

メルカリでは数百のマイクロサービスが連携してお客様にサービスを提供しています。 このような状況では、あるマイクロサービスで障害が発生した場合にお客様から見てどのような問題が実際に発生しているかわからなくなる場合があります。 障害時にお客様がどのような状況に直面しているかを把握することは、お客様対応の高度化や障害対応の優先度判断、何より障害の早期復旧において効果を発揮します。 本発表では、複雑なシステムにおいてお客様から見てAvailableな状態かをどのように判断しているか、リリースによってシステムが変化しても観測可能な状態をどのように維持しているかを紹介します。

株式会社メルカリ Cloud Network Engineer

土屋 健司 / yakenji

SIerにおいて約4年間、様々な大規模システムの性能問題解決を経験した後、2024年1月に株式会社メルカリにSREとして入社。フリマアプリ「メルカリ」の信頼性向上に取り組む。最近Network teamに移動してNetwork engineerを名乗りはじめる。

Track CPlatinum Sponsor

100% AI コード生成開発! AI Agent 時代の信頼性と開発効率のためのガードレール

川津 雄介
Track CPlatinum Sponsor

7/11 13:50 - 14:10

100% AI コード生成開発! AI Agent 時代の信頼性と開発効率のためのガードレール

生成AIが登場した2023年以降、2024〜2025年には AI エージェントによるコード生成の精度が飛躍的に向上し、AI 駆動開発は“前提条件”になりつつあります。 しかし、開発が高速化するほど、設計者が実装過程を直接確認しないことによる品質劣化リスクは高まります。また、現状の AI エージェントの能力を考慮しても、開発者が介入せずに生成されたコードの品質は決して高いとは言えません。 私はリンクアンドモチベーションで SRE として信頼性全体を見渡すと同時に、新規プロダクト開発で AI に 100% コードを生成させる取り組みを進めており、最近では既存プロダクトの開発にも適用できるようになりつつあります。 本講演では、その試行錯誤を通じて得た「速度と品質の両立」の知見を共有します。AI に高品質なコードを迅速に生成させるには、生成物の品質を担保するガードレールが不可欠です。さらに、AI に与えるタスクを小さく分割することで、より正確なアウトプットが得られます。これらの具体的なノウハウをアプリケーション開発層からインフラ層 / SRE 領域に渡って詳しく解説します。

プロダクトデザイン室 SRE・ENABLINGグループ エンジニアリングマネージャー

川津 雄介

2008年、某複写機メーカーへエンジニアとして入社。OSレイヤーからWeb/モバイルまで様々な領域で開発に従事。リンクアンドモチベーションに入社後はモチベーションクラウドシリーズの SRE やプラットフォーム開発など複数の自社プロダクトを横断した開発を担当。現在はエンジニアリングマネージャーとしての活動や、AI Agent を用いて開発組織全体の生産性向上に取り組んでいる。

7/11 14:10
-
14:20
Track ATrack BTrack C

休憩

7/11 14:20
-
14:30
Track BGold Sponsor

サービス連携の“謎解き”を可能にする Datadogによる分散トレース導入の一歩

徳富 博
Track BGold Sponsor

7/11 14:20 - 14:30

サービス連携の“謎解き”を可能にする Datadogによる分散トレース導入の一歩

サービスが増え、システムが複雑になる中で、「どこで何が起きているか?」を追いかけるのは難しくなっています。 本LTでは、Datadogを使ったサービス間の分散トレースの実践について、トレース情報の受け渡し方法や利用するヘッダー、仕組みの概要を解説します。 具体的には、分散トレースの基本、情報をサービス間で受け渡すために使われる標準や独自方式、そしてそれを運ぶ「Carrier」について触れます。 これから分散トレースを導入したい方、仕組みを整理したい方に向けて、現場で役立つ知識をお伝えします。

2024年5月株式会社Timee入社。主にCI/CD、IaC周りを担当。

Track CGold Sponsor

OpenTelemetryセマンティック規約の恩恵とMackerel APMにおける活用例

朝倉一希 (Arthur)
Track CGold Sponsor

7/11 14:20 - 14:30

OpenTelemetryセマンティック規約の恩恵とMackerel APMにおける活用例

テレメトリーの生成・収集を標準化するフレームワークであるOpenTelemetryから、セマンティック規約という概念を取り上げて、その概観と効能について解説します。セマンティック規約は、メトリクス名や属性名といったデータに対して共通の名前を定義するものです。命名が標準化されることで、オブザーバビリティツールはプラットフォームや言語などの違いを超えてシグナル間を相関付けやすくなります。 また、オブザーバビリティプラットフォームMackerelに新しく登場したAPM機能においても、セマンティック規約に準じた形式でトレースを投稿すると、アプリケーションの内部の様子を分かりやすく可視化することができます。Mackerel APMにおけるセマンティック規約の活用例をデモとしてご紹介します。

株式会社はてな Mackerel開発チーム サブディレクター・テックリード

朝倉一希 (Arthur)

東京工業大学情報工学科卒業後、2022年4月にはてなに新卒入社。以来、オブザーバビリティプラットフォームであるMackerelの企画・開発・運用に携わっている。現在はプロダクトオーナーとしてAPM機能の企画・開発を主導している。また、テックリードとして高速な開発・リリースを支える環境整備や、オブザーバビリティに関する知識習得の場づくりに取り組んでいる。

7/11 14:30
-
14:40
Track BGold Sponsor

モニタリング統一への道のり - 分散モニタリングツール統合のためのオブザーバビリティプロジェクト

仲上 浩豪
Track BGold Sponsor

7/11 14:30 - 14:40

モニタリング統一への道のり - 分散モニタリングツール統合のためのオブザーバビリティプロジェクト

本発表では、事業会社において複数のシステムを抱えるチームが直面した監視の課題と、その解決に向けた取り組みをご紹介します。 私たちのチームでは、フルスクラッチで開発したアプリケーションから既製品まで、多様なシステムを運用していました。これらのシステムはアーキテクチャが異なり、システムごとに監視項目やアラート内容が統一できていない状況でした。また、監視方法もシステムごとに異なり、PATROLCLARICEやmunin・クラウド内のモニタリング機能・prometheus/Grafana/Alert Manager・Datadogなど同じ用途のモニタリングツールを複数併用している状態でした。 その結果、モニタリングツールの保守運用コストの増加やチーム内での監視ノウハウ共有の難化、システム異常調査のコスト増加などが課題となっていました。 これらの課題を解決するために、Azure Monitor を用いたモニタリングツールの統一を試みました。 本セッションでは、複数システムのオブザーバビリティのベストプラクティスについて考えつつ、Azure Monitor を選定した理由やそのツールへ移行したときの移行戦略、運用効率化のための施策について話していこうと思います。 また、移行したことで新たに見えてきた課題や今後の方針についてもお話します。

ニフティ株式会社

仲上 浩豪

2021年にニフティ株式会社に新卒入社。書面発送システムやニュースサービスなどを担当後、現在はカスタマーサポートセンターのシステムを担当。顧客向けマイページサイトのSLO管理や継続的なシステム改善を行っており、主にバックエンドやインフラ、モニタリングツールの運用などを担当。普段はPythonとPHPを書いている。 社内向けツールの開発・保守運用も手がけ、InnerSource活動にも積極的に参加。クラウドプラットフォームにも精通しており、AWS、GCP、Azureの基本資格を保有。現在はAzureの活用機会が増えてきたので、Azure Monitor を使いこなせるよう学習を進めている。

Track CGold Sponsor

Intel SGXをAzureで本番運用するための構成事例と実践知見

大久保 俊彦
Track CGold Sponsor

7/11 14:30 - 14:40

Intel SGXをAzureで本番運用するための構成事例と実践知見

本セッションでは、Azure Confidential Computing を活用した Intel SGX の実運用に関する知見を紹介します。Enclave のライフサイクル管理、DCAP(Data Center Attestation Primitives)による証明取得、THIM API を通じた証明情報の取り扱い、さらに TCB Recovery 発生時の対応など、実際の運用現場で直面した課題とその対策を具体的に解説します。加えて、Datachain による SGX Enclave ベースのクロスチェーン検証基盤「LCP(Light Client Proxy)」の事例を取り上げ、SGX を活用した信頼性の高いアプリケーション構築例も紹介します。

大久保 俊彦

Datachain創業から参画し、Blockchain Walletの開発、実証実験におけるスマートコントラクト、バックエンドの設計、実装を担当。 直近では、SREとして、異種ブロックチェーン間のインターオペラビリティを実現するOSSプロジェクトであるYUIを使用したクロスチェーンプラットフォーム「TOKI」の運用、構築を担当。

7/11 14:40
-
14:50
Track ATrack BTrack C

休憩

7/11 14:50
-
15:30
Track Aパネルディスカッション

ロールモデルなき道をゆく、女性SREキャリア談義 (14:50 - 15:30)

あいさか
宮川 倫瑠
大平かづみ
板谷藍子
Track Aパネルディスカッション

7/11 14:50 - 15:30

ロールモデルなき道をゆく、女性SREキャリア談義 (14:50 - 15:30)

ロールモデルなき道をゆく、女性SREキャリア談義

株式会社 iCARE SRE

あいさか

株式会社 iCARE SRE。「Carely 健康管理クラウド」サービスの健康を守る SRE として、インフラレイヤーの設計構築、セキュリティ対策、EOL対応、ポストモーテム運用などを SRE, SWE のみなさまと一緒にやっています。Ruby とビールが好き。

株式会社ワンキャリア エンジニアリングマネージャー

宮川 倫瑠

2020年に株式会社ワンキャリアへ新卒入社。SREチームの立ち上げから複数サービスのインフラ構築・運用保守に従事。現在はSREチームのエンジニアリングマネージャーとして、全サービスの信頼性向上に尽力。さらに、DevHRチームのマネージャーとしてエンジニア組織開発、技術広報や採用にも携わる。

株式会社オルターブース

大平かづみ

Microsoft MVP for Azure/Developer Technologies。フリーランスから出産を経て就職後、再びGitHub公認トレーナーとして技術アドバイザリやワークショップの講師を担当。個人では、女性エンジニアを応援するコミュニティCode PolarisやGitHub dockyardを立上げ運営しているほか、様々な技術コミュニティで活動している。0歳児育児との両立を模索中。

株式会社Linc’well

板谷藍子

株式会社Linc’well リライアビリティ&セキュリティチーム所属。New Relic User group(NRUG)運営、JAWS-UG SRE支部運営。a.k.a. Mary。楽器演奏と、大きなお風呂、コミュニティ運営はライフワーク。

Track B

対話型音声AIアプリケーションの信頼性向上の取り組み ~ Webアプリケーション以外でどうSREを実践するのか ~ (14:50 - 15:20)

森谷 浩幸
渡部龍一
Track B

7/11 14:50 - 15:30

対話型音声AIアプリケーションの信頼性向上の取り組み ~ Webアプリケーション以外でどうSREを実践するのか ~ (14:50 - 15:20)

国内SREの実践を見ると、多くの事例はWebアプリケーションを前提とした取り組みが中心となっています。しかし、Webアプリケーション以外のシステムにもSREを適用することで、同様に高い可用性や信頼性を実現できる可能性があります。弊社では対話型音声AIアプリケーションを開発運用しており、これらのシステムにおいてもSREを実践しています。 対話型音声AIアプリケーションは、音声処理や自然言語処理を利用して、ユーザーとのスムーズな対話を実現しています。しかし、特に電話を使用したサービスでは、システムのダウンタイムやパフォーマンス低下が顕著な影響を与えるため、高い信頼性が求められます。対話型音声AIアプリケーションでは、外部サービスとの連携やリアルタイム性の確保が重要であり、これらの要素をうまく管理することがSRE実践における大きな課題です。 この発表では、対話型音声AIアプリケーションの信頼性を向上させるための戦略を紹介します。具体的には、外部APIやサービスに依存した部分で発生する遅延や障害を最小化するためのリトライ戦略、障害発生時の迅速な対応方法、そしてオブザーバビリティの向上を通じて、全体の可用性をどのように保つかについて議論します。SREの観点から、可用性の高い対話型音声AIサービスの運用方法を実践的に解説し、特にリアルタイム性とシステム全体の健全性を維持するために取り組んでいる具体的なプラクティスをご提供します。 取り上げるトピック - WebSocketアプリケーションにおけるオブザーバリティ - LLMを使ったアプリケーションの信頼について - Webアプリケーション以外でのSLI/SLO - 「対話アルゴリズム的Anomaly」と「システム的Anomaly」の違いから考えるSLI/SLO - DataDog LLM observabilityの実践 - (コラム)1プロセスの突死がビジネス影響が大きい理由

株式会社IVRy AI Engineer / SRE

森谷 浩幸

株式会社IVRy AI engineer / SRE AI音声対話サービスの開発に携わっています。AI・インフラ関連のトピックに関心があります。 DMM.comでデータサイエンス、Microsoft developmentにてMSN/Bingの開発に携わっていました。

株式会社IVRy

渡部龍一

株式会社IVRyでSREをやりつつSRE NEXT 2025ではCo-Chairをやっています。積読と猫とEOL対応が好きです。

Track C

TLSから見るSREの未来 (14:50 - 15:20)

浅野 大我
Track C

7/11 14:50 - 15:30

TLSから見るSREの未来 (14:50 - 15:20)

WebにおけるTLS証明書は、安全な通信を実現するための基盤技術として、現在も進化を続けています。Let's Encryptをはじめとする自動発行可能な認証局の登場は、Web全体のセキュリティレベル向上に大きく貢献しており、クラウドプロバイダなども認証局を提供することで、開発者はより容易にサービスを安全に保てるようになっています。 本発表では、進化し続けるTLSを取り巻く状況が、SREの役割にどのような影響を与えていくのかを改めて考察します。 具体的には、セキュリティ強化の流れとしての証明書有効期限の短縮化、より効率的で安全な暗号化方式であるECDSA証明書へのの移行について俯瞰することで、SRE活動の一助となるヒントを提供します。

STORES 株式会社 技術推進本部 エンジニア

浅野 大我

バックエンドやクラウドインフラをはじめとして組織横断の課題を改善するソフトウェアエンジニア。2020年に新卒で入社した企業でスマートフォンゲームのバックエンドエンジニアを経て、2024年にSTORES 株式会社入社。SECCON 実行委員。

7/11 15:30
-
15:40
Track ATrack BTrack C

休憩

7/11 15:40
-
16:10
Track A

とあるSREの博士「過程」

yuuk1
Track A

7/11 15:40 - 16:10

とあるSREの博士「過程」

ソフトウェアエンジニアがより高みを目指すために、計算機科学(コンピュータサイエンス)を修めることがキャリアを充実させる一つの手段として知られています。計算機科学あるいはそれを取り囲むより広範な情報学が、エンジニアが普段取り扱う情報技術の基礎であるためです。そして、そのような基礎そのものに新しい発見や課題解決を積み上げるための訓練を積む場が、大学院の博士課程であると考えています。通称SREBookの序文では、"PhDs"に関する言及もあり、SREとも縁の感じられるキーワードです。 博士課程の体験記は、学位を取得された先人たちがウェブ上で公開しているケースが多数あります。しかし、社会人のソフトウェアエンジニアが学位を取得する事例は少なく、それゆえに、博士課程とは何であり、何を得られるのか、研究と開発は何が違うのかは広く共有されていません。実際、研究や博士課程がどのようなものか想像もつかないと言われることもありました。 そこで、本発表では、今年に博士(情報学)の学位を取得した実体験を踏まえて、博士論文の表題となった"Scaling Telemetry Workload"と呼ぶ体系に辿り着くまでの研究の道のりを紹介します。要素技術としては、時系列データベース、Linuxネットワークスタック、eBPF、AIOpsなどが含まれます。 SREのようなシステム管理は、工学や研究対象としては見なされなかった歴史があることからわかるように、SREに関する問題解決を学術研究としていかに帰着させるかは自明ではありません。実際に、博士学位を得ることは、容易なことではありませんでした。自分で考える一つのテーマに向き合い、いつ役に立つかもよくわからないことに数年がかりで、論文やOSSを調べ、手を動かし、思考し続けることになります。しかし、大変なだけでなく、博士研究は面白いものです。こんなことを考えているのは自分だけかも、と思う瞬間もあります。博士論文を書き上げる上で、自分の中に体系を築いていく実感もあります。これらは自分がエンジニアをやっていたころにはなかった感覚です。 本発表が、大学院進学に興味のある方、あるいはマネージャーやスタッフエンジニア以外のキャリアパスがないかを模索されている方に、博士という道を知るきっかけとしていだければ幸いです。

さくらインターネット株式会社 上級研究員

yuuk1

SREの研究者。博士(情報学)。2019年よりさくらインターネット研究所所属。最近の取り組みはAIインフラとLLMの分散学習。SRE NEXTでは登壇皆勤。

Track B

60以上のプロダクトを持つ組織における開発者体験向上への取り組み -チームAPIとBackstageで構築する組織の可視化基盤-

VTRyo
Track B

7/11 15:40 - 16:10

60以上のプロダクトを持つ組織における開発者体験向上への取り組み -チームAPIとBackstageで構築する組織の可視化基盤-

組織が大きくなるにつれて、「誰が何をしているのかわからない」「困ったとき誰に連絡すればいいのかわからない」という問題が増えてきます。マネーフォワードでは60を超えるプロダクトを持つ組織として、この複雑性に日々向き合っています。特に互いのチームが連携して開発している組織では、チーム間のコミュニケーションフローが複雑化し、情報の分断が顕著になってきました。 本発表では、SREチームが取り組んだチームAPIとBackstageを活用した組織の可視化基盤構築について紹介します。弊社では、このBackstageはインシデント発生時に責任者や関係性を素早く理解するためにもともと導入されていたものです。 今回私たちが特に注力したのは、このBackstageにおける情報登録障壁の軽減と、チームAPIを使った他チームに公開すべき情報の整理です。 多くの開発者にとってYAML編集は煩雑で、レイアウトやパラメータの把握だけでも意外に時間がかかります。そのチームの情報は登録されなければ効果を発揮しないため、まずはそのハードルを下げるためにBackstageテンプレートを実装しました。この実装によって開発者がYAMLを書かなくても必要な情報を登録できる環境を整えることで、実際に使われやすい仕組みへと進化させました。 その結果、チームとシステムの関係を1:Nで表現できるようになり、組織の複雑な関係を理解が容易になりました。 この発表では、チームトポロジーのチームAPIに触れつつ、Backstageテンプレートの実装における技術的なTipsや、チームAPIをどのように利用したかという具体的な知見を共有します。 組織の複雑化に悩むマネージャー、開発者、SREの方々。また、今後複雑化することが予見される方々に向けて、今からできることはなにか?についてもお話します。 「誰が何の責任を持っているのかわからなくなってきた」という課題解決の第一歩として、実際に使われる仕組みづくりのヒントを持ち帰っていただけると幸いです。

株式会社マネーフォワード SRE

VTRyo

2021年マネーフォワードに入社。とある部署でSREグループを立ち上げ後、HR領域のプロダクトを担当。現在はSREや開発者のExperience向上や、グループ企業との連携などに従事している。趣味はビール・ラーメン二郎・カレーという人類三大欲求が主。ビールはほどほどに好きで、協会公認のビアジャッジとしてビールの審査もする。最近は自作スパイスカレーにハマったので間借りカレー屋を目指している。日々何かしらを制作していないと気が済まないらしい。

Track C

〜『世界中の家族のこころのインフラ』を目指して”次の10年”へ〜 SREが導いたグローバルサービスの信頼性向上戦略とその舞台裏

杉本 浩平
Track C

7/11 15:40 - 16:10

〜『世界中の家族のこころのインフラ』を目指して”次の10年”へ〜 SREが導いたグローバルサービスの信頼性向上戦略とその舞台裏

2015年4月に誕生した『家族アルバム みてね』は、「世界中の家族のこころのインフラをつくる」というミッションのもと2025年に10周年を迎え、世界中で2,500万人以上のユーザーにご利用いただくサービスへと成長しました ​ その歩みの中で、海外ユーザーの増加に伴い、ネットワークレイテンシーなどの課題が浮上します。 ​この壁を乗り越えるべく、SREチームは段階的な取り組みを重ね、最終的にAWSマルチリージョン構成への移行を実現しました。​ さらに、持続可能なサービス運用のためのコスト最適化にも継続的に取り組んできました。特にマルチリージョン化に際しては、リージョンごとのトラフィック傾向を考慮した設計、オブジェクトのレプリケーション戦略、コストに見合う効果的なサービスレベルの見極めが重要な判断軸となりました。 本セッションでは、みてねのサービス成長とそれに伴う改善の歴史を【追体験】いただくかたちで、以下のポイントについて詳しくお話しします。 【課題の発見と分析】 レイテンシーの問題をどのように特定し、影響を評価したか 【段階的な取り組み】 CloudFrontの導入やネットワーク最適化など、マルチリージョン対応に至るまでのステップ 【アーキテクチャの選定】 マルチリージョン構成への移行における技術的な選択とその理由 【移行プロセス】 データベースやマネージドサービスの選定、移行時に直面した課題とその解決策 【成果と効果】 移行後に得られたレイテンシの改善や信頼性の向上 【今後の展望】 みてね’s NEXT〜 ”次の10年”グローバルサービスとしてのさらなる信頼性向上に向けた取り組み この発表は、グローバルサービスの信頼性向上、またサービスを""次のステップ""(NEXT)へ進めるために奮闘するSREやインフラエンジニアにとって、実践的な知見と戦略を共有する場となることを目指しています。​

株式会社MIXI みてね事業本部 みてねプラットフォーム部 SREグループ

杉本 浩平

2022年4月株式会社ミクシィ(現MIXI)に入社。『家族アルバム みてね』のSREとして主にサービス安定性、オブザーバビリティの改善に取り組む。

7/11 16:10
-
16:20
Track ATrack BTrack C

休憩

7/11 16:20
-
16:40
Track B

LT

三吉 貴大
Ayana Murakami
Erika Takada
土田 悠輝
Track B

7/11 16:20 - 16:40

LT

『衛星運用をソフトウェアエンジニアに依頼したときにできあがるもの』: 三吉 貴大 私の所属するアークエッジ・スペースは、超小型衛星に強みをもつスタートアップであり、2025年4月現在複数機の衛星を運用しています。昨年のSRE NEXT 2024では探査機SLIMの基調講演がありましたが、探査機と地球周回衛星では運用上求められる性質が異なります。探査機は月着陸などクリティカルなイベントへの対応に重点が置かれる一方、私たちが運用する地球周回衛星は日々の継続的な運用が求められるため、よりITインフラの運用に近いアプローチが可能です。本LTでは、衛星運用をソフトウェアエンジニアの視点で捉え、ITインフラ運用との共通点・相違点を解説します。さらに、現在取り組んでいる衛星運用の自動化について、実例を交えて簡単に紹介します。 『毎晩の負荷試験自動実行による効果』: Ayana Murakami 『ホットペッパービューティー』の開発において、要件定義からリリースまでの期間のうち実装後の性能試験・テストフェーズが多くの工数を占めています。特に負荷試験では、本番環境に近い条件を整える必要があり、そのためのシナリオ準備や負荷試験環境の整備には多くの工数を要します。負荷試験にかかる工数を分析した結果、一連の作業の中でも負荷試験シナリオの準備・メンテナンスに時間を要していることが判明しました。 この課題に対し、我々はリリース前のブランチに対して毎晩自動で負荷試験が実行される仕組みを導入しました。この仕組みにより、改修が原因で既存の負荷試験シナリオが失敗した場合、即座に検知できるようになります。結果として、案件担当者の記憶が新しいうちに、これまでよりも短い時間で負荷試験シナリオを修正できるようになります。本発表では、我々の取り組みに対する効果を実際のデータを交えて紹介します。 『MCPサーバで始めたアラート整理の実験的取り組み』: Erika Takada 「AIに任せすぎるのは不安。でも使わないのももったいない」──そんな思いから、SREの現場で“ちょい使い”のAI活用を模索しました。いくつかのMCP(Model Context Protocol)サーバを通じて、アラートの文脈補足や軽微なインシデント整理などを支援する仕組みを試行中です。本セッションでは、活用の工夫や開発構成、実用性のリアルについて紹介します。 『セキュアな社内Dify運用と外部連携の両立 ~AIによるAPIリスク評価~』: 土田 悠輝 社内で構築したAIツールであるDifyと、Slack、GAS、Github Actions等の業務システムとの連携は業務自動化を加速させますが、SREにとってはAPI公開に伴うセキュリティリスク管理が課題です。特に、LLMが個人情報や社内情報を含んだ回答を生成し、それがAPIレスポンスとして外部へ送信されるリスクは無視できません。本セッションでは、APIレスポンスをAIでリアルタイム評価し、機密情報流出を検知して即時アラートを発する仕組みの構築についてお話しします。

株式会社アークエッジ・スペース ソフトウェアエンジニア

三吉 貴大

大規模Webサービスのバックエンド開発や公共機関の衛星データ提供システム開発を経て、2023年より現職。衛星管制システムのスクラムマスター兼開発者を担当している。

株式会社リクルート

Ayana Murakami

2023年4月 株式会社リクルートに新卒入社。バックエンドエンジニアとして『ホットペッパービューティー』アプリのバックエンド開発に携わる。

株式会社モニクル SRE

Erika Takada

2023年に株式会社モニクルに入社。SREチームの立ち上げに携わり、現在はSLO導入、運用自動化、障害対応プロセスの改善などを通して複数プロダクトの信頼性向上に向け取り組んでいます。

株式会社ZOZO 計測プラットフォーム開発本部 SRE

土田 悠輝

AWSサポートエンジニア、広告代理店のクリエイティブエンジニアを経て2024年5月より現職。計測プラットフォーム開発本部 SREとして、ZOZOMETRYやZOZOMAT等の計測技術を用いたプロダクトの開発・運用に関わっています。

Track C

LT

小沼 小織
林 如弥 aka もりはや
じょーし(上司陽平)
sugar cat
Track C

7/11 16:20 - 16:40

LT

『SREを知らずにSREマネージャーになった話 〜求められたのは技術力より◯◯だった〜』: 小沼 小織 SRE経験ゼロのまま、ある日突然SRE組織のマネージャーに。 知識も実績もない中で、どうやってチームと信頼関係を築き、SREの成果を出していけたのか。本セッションでは、未経験者だからこそ陥りやすい落とし穴や、逆に未経験だからこそ役立った視点、SRE組織のマネジメントに必要な心構えとケイパビリティを、実体験を交えてお話しします。 マネジメント職にある方はもちろん、これからSREに関わる全ての方にお届けしたい内容です。 『SREがコストセンターではないことを大きな声と実例で伝えたい』: 林 如弥 aka もりはや ある日、部門を跨いだ会議の中で「SREチームはコストセンターだからね」といったフレーズが飛び出したそうです。言い換えれば「SREチームは利益を生まない」チームとみなされたわけです。 ちょっと待って欲しい...!たしかにクラウド費用の削減などはコストセンター的な動きかもしれません。 一方でToilの削減による開発時間の増加や、システムの信頼性向上によるサービス品質改善は利益につながっているのではないでしょうか。このLTではSREの価値をプロフィットセンターとしての目線で事例を備えて紹介します。 『インフラ寄りSREの生存戦略』: じょーし(上司陽平) Google Cloud Runなどマネージドサービスの普及で、インフラ担当の役割は急速に縮小しています。 私はインフラ寄りSREとして決済サービスのインフラ設計・構築や、レスポンス遅延を引き起こしていたDB性能問題を解決し、信頼性向上に貢献しました。 しかし、インフラ課題が解決されるにつれて、アプリケーション側の課題の比重が明らかに多くなっていきました。 今後、信頼性向上のためにSREが取り組む課題は、インフラよりアプリケーション側が中心になると感じています。そこで、エンべデットSREとして課題に直接踏み込めるようにソフトウェアエンジニアへ転向した話をします。 『メタバースプロジェクトにおけるObservability構築とユーザー視点での信頼性可視化の現在地』: sugar cat メタバースプロジェクト「ホロアース」は2025年4月に正式リリースを迎えました。リリースに向け、まずObservability基盤をDatadogの自動計装およびSentryの導入により整備し、クライアント・サーバーサイド両面で包括的なエラートラッキングを実現しました。その後開発チーム、プランナーと共にプラットフォーム内のエリアごとにおけるプリミティブな機能(UJ)の洗い出しを行い、各UJ成功率を包括的にダッシュボード化することで、エンジニアのみならずビジネスサイドへのサービスの信頼性向上に向けたサービスの稼働状態を可視化し、今後のSLI/SLO定義の基盤を整えました。本発表ではObservability基盤を用いたユーザージャーニーの定義と成功率の具体的な可視化と運用と今後の展望についてお話しします。

株式会社マネーフォワード Product SRE部 部長

小沼 小織

モバイルアプリ開発者としてエンジニアキャリアをスタートし、サーバーサイド開発者に転身。2021年に株式会社マネーフォワードに中途入社。toC事業部でエンジニアリングマネージャーを経験後、現在は全社横断のSRE組織のマネージャーとして信頼性と生産性の向上に日々奮闘しています。

イオンスマートテクノロジー株式会社 SRE

林 如弥 aka もりはや

新人時代をSIerのネットワークエンジニアとして金融系プロジェクトでハードワークを経験し、事業会社のインフラエンジニアやSREとしての経験を積んで2024年03月よりASTへジョイン。好きなトップバリュは「トップバリュベストプライス ゆでたパスタにまぜるだけ ペペロンチーノ」好きな空間は「イオンシネマ」。

Sansan株式会社 ソフトウェアエンジニア兼SRE

じょーし(上司陽平)

Sansan株式会社にて、インボイス管理サービス「Bill One」のソフトウェアエンジニア兼SREとして活動しています。 有志メンバによるCI/CD改善チームを運営し、日々の開発者体験の向上にも取り組んでいます。最近は、GitHub Actionsのパフォーマンスや効果測定を可視化するためのOSS「GitHub Actions OpenTelemetry」の開発にも注力しています。

カバー株式会社 CTO室 インフラチーム SRE

sugar cat

本業SRE。アプリケーション開発からインフラの運用まで何でもやる人。パフォーマンスチューニングの話が好き。

7/11 16:40
-
17:00
Track ATrack BTrack C

休憩

7/11 17:00
-
17:30
Track AGuest Session

システムから事業へ 〜SREが描く“その先”のキャリア〜

原 智子
Track AGuest Session

7/11 17:00 - 17:30

システムから事業へ 〜SREが描く“その先”のキャリア〜

SREとしてインフラや信頼性を支えてきた私が、今は“事業全体の最適化”を考える立場にいます。それはキャリアチェンジではなく、視点の拡張でした。 本セッションでは主に、SRE/DBREとしてシステムの信頼性向上を担っていた経験をどのように活かしながら、システムの枠を越えて「事業をどう動かすか」に関わるようになったのか。その過程で直面した葛藤や、技術を手放さずに事業に貢献するために必要だった視点の変化についてお話します。 「このままSREを続けていいのか」と悩んでいる方や、技術者としてのスキルをどう次に活かすか模索している方に向けて、ひとつの“その先”のストーリーをお伝えします。

ソフトバンク株式会社 課長

原 智子

2024年2月よりソフトバンク株式会社に在籍。PM/DBA(SIer)やSRE/DBRE(EC企業)などの経験を活かし、現在はシステムを通じて事業全体をより良くする事業企画に携わっています。

Track BTrack C

トラックA:サテライト

7/11 17:30
-
17:35
Track A

閉会式

Track BTrack C

トラックA:サテライト

DAY 2: 7/12

Track A

Track B

Track C

7/12 10:00
-
10:30
Track ATrack BTrack C

開場

7/12 10:30
-
10:40
Track A

開会式

Track BTrack C

トラックA:サテライト

7/12 10:40
-
11:20
Track AKeynote

すみずみまで暖かく照らすあなたの太陽でありたい

戸田 宏司
Track AKeynote

7/12 10:40 - 11:20

すみずみまで暖かく照らすあなたの太陽でありたい

「いつもヨドバシカメラのご利用ありがとうございます」 お客様への感謝の心をもっていつでも快適にサービスをご利用いただけるように、インフラとアプリケーションの安定稼働は私たちの使命です。SREは、システム全体に光を照らし、目を背けたくなるような問題も直視する包容力を持ち、潜在的なリスクを早期に発見し、解決することで、安定した状態を維持します。 ヨドバシカメラのシステム運用は、1985年のPOS導入から始まり、ポイントシステム、EC、配送システムなど、規模を拡大してきました。それぞれのシステムで複雑性が増す「カオス化」と呼ばれる状態も経験しました。 この状況を打破するため、私たちは継続的に運用方式を見直してきました。監視ツール、IaCやデプロイメントパイプラインによる標準化と自動化の実現。インシデントによる対応管理なども行いました。 現在注力しているのは、オンプレミス型プライベートクラウドの構築と運用です。セキュリティと柔軟性を両立させ、変化の激しい環境に迅速に対応するための重要な戦略です。仮想化技術やマイクロサービスアーキテクチャの導入により、効率性と独立性を高めています。 過去の経験を活かし、最新技術を取り入れながら、これからもお客様に安全なサービスを提供し続けられるよう、私たちは挑戦を続けています。

株式会社ヨドバシリテイルデザイン サービスデプロイメント事業部 事業部長

戸田 宏司

1982 年、小学生時代からプログラミングを始め、1998 年からはフリーランスとして小規模 CGI サーバ構築からキャリアをスタート。その後、入社したソフトウェアハウスで一般的な業務システムから証券取引所開設プロジェクトまでの幅広い開発に携わってきました。2017 年にヨドバシリテイルデザインに入社し、オンサイト プライベートクラウドの構築・運用、サービス設計、アーキテクチャ設計、セキュリティ設計などを担当しています。幅広い経験と知識を活かし、現在に至るまで様々なプロジェクトに貢献しています。 https://yodobashi.jobs/

Track BTrack C

トラックA:サテライト

7/12 11:20
-
11:30
Track ATrack BTrack C

休憩

7/12 11:30
-
12:00
Track A

ABEMA の本番環境負荷試験への挑戦

宮﨑 大芽
Track A

7/12 11:30 - 12:00

ABEMA の本番環境負荷試験への挑戦

ABEMAでは、経営ボードからの要求水準、突発的なトラフィックの急増、そして大型配信イベントに対応するため、揺るぎないシステム耐久性の確保が事業継続には不可欠です。過去の大規模スポーツイベント配信を通じて、本番環境と完全に同一の検証環境を構築・維持することの技術的困難さとコスト的非効率性に直面しました。 本セッションでは、ABEMAが従来のアプローチを根本から見直し、「本番環境での負荷試験」という挑戦的な道を選択した背景から、その実践における技術的な工夫、継続的な運用、そして今後の展望までを包括的に紹介します。 具体的には、本番環境での負荷試験を実現するためのシステムアーキテクチャの設計思想、段階的な実施計画、ユーザー体験を守りながらの安全な実行手法、モニタリング方法、そして本番負荷試験を可能にする組織的合意形成に至るまで、一連のプロセスを実例とともに解説します。特に実現するための技術的な実装詳細について、意思決定の際に考慮したことについて深く掘り下げます。 本番環境での負荷試験という取り組みは、単一イベントへの一時的な対応策ではなく、サービスの継続的な信頼性向上とデータに基づく精度の高いキャパシティプランニングの基盤として機能しています。ABEMAの実践事例を通して、SREチームが主導する「本番負荷試験」がいかにサービスの堅牢な成長に寄与するかを具体的に示します。 最後に、今回構築した仕組みは、カオスエンジニアリングやクローズドなリリース前テストなどへの活用できると考えており、今後の展望として紹介します。

株式会社AbemaTV SRE

宮﨑 大芽

2022年にサイバーエージェントに中途入社。 入社後、ABEMAにてバックエンドエンジニアとしてサービス開発に従事。 2024年よりABEMA の SREとして、サービスの信頼性向上を目指し、特に本番環境を用いた負荷試験や障害試験の領域を中心に活動しています。

Track B

アクセスピークを制するオートスケール再設計: 障害を乗り越えKEDAで実現したリソース管理の最適化

Masato Yamashita
Track B

7/12 11:30 - 12:00

アクセスピークを制するオートスケール再設計: 障害を乗り越えKEDAで実現したリソース管理の最適化

マネーフォワードでは、現在オンプレミス上にある各サービスをAWS環境に移行するプロジェクトが進行しています。昨年、私が担当しているサービスもオンプレミス環境からAWS環境に移行しました。この移行後の環境では、HPAを活用してCPU閾値を超過した際にオートスケールする設計を組み込んでいました。 しかしAWS移行後の初めてのアクセスピーク時、スローダウンによるレスポンス遅延が発生し5xxエラーが頻発する障害が発生しました。このときpodの状態として、HPAのCPU閾値に達することなくメモリ使用量が増加して高負荷になり、livenessProbeが失敗することでpodが減りさらにパフォーマンスが低下する悪循環に陥ってました。トラブル収束後に問題を調査したところ、このサービスではHPAだけではpodを効率的にオートスケールするには不十分であることが判明しました。 そこでHPAの代わりにKEDAを採用し、CPU閾値に加えてリクエスト数に応じてスケールできるように整備しました。これにより効率的なオートスケールを実現できました。さらに、オートスケールが問題なく動作することが確認できたため、Datadog上のCPUやメモリ使用率の推移を基に適切なレプリカ数を決定する取り組みを行い、minReplicaの値を当初の60%減まで削減することができました。 本セッションでは、オートスケールにおける過去データを基にした初期設計、障害発生後に判明した設計の問題点と改善点、KEDA活用における閾値の算出方法や適切なレプリカ数決定までの流れをお伝えします。

株式会社マネーフォワード

Masato Yamashita

2023年7月株式会社マネーフォワードに入社し、福岡拠点に所属。バックエンドエンジニアを経て、現在はクラウド経費/クラウド債務支払のSREを担当しています。プロダクトとSREの経験をもとに、信頼性と生産性の向上に取り組んでいます。

Track C

数万リソースのCI/CDを爆速に!Terraform・ArgoCD改善の全記録

石川 雲
Track C

7/12 11:30 - 12:00

数万リソースのCI/CDを爆速に!Terraform・ArgoCD改善の全記録

数万規模のリソースを扱う大規模なCI/CD基盤を長期にわたって運用する中で、Terraformの処理速度の低下や意図しない差分の適用、ArgoCDにおける同期遅延やデプロイの不安定化といった問題が顕在化してきました。さらに、標準的なGitOpsツールの枠組みでは、リソース単位での制御やPostSyncタイミングでの外部連携など、より高度で柔軟な要件への対応が困難になっていました。 こうした状況を踏まえ、私たちは単なるツール設定の見直しではなく、CI/CD全体のボトルネックを特定し、徹底的なチューニングを行うという方針でアプローチしました。 Terraformでは、Git差分に基づくスコープ限定実行を導入し、処理時間と実行信頼性の両立を実現しました。CDにおいては、ArgoCDとFluxCDの役割と適用範囲を再整理し、構成を最適化。さらに、KubeVelaを組み合わせることで、リソース単位での柔軟なPostSync制御を可能にし、従来の制約を解消しました。 この一連の改善により、CI処理時間は最大9割・平均でも7割の短縮を達成し、CDの安定性とパフォーマンスも大幅に向上。開発体験と運用効率の両立を現実のものとしました。 本セッションでは、Terraform・ArgoCD・FluxCD・KubeVelaといったツール群を活用して実施したCI/CD基盤の高密度なチューニングと、それにより得られた知見について、実践的な視点から紹介します。

株式会社サイバーエージェント

石川 雲

SWE、DevOpsなどを経て、2023年に株式会社サイバーエージェントへ入社。横断SRE組織の一員としてAmeba Platformに参画し、Kubernetesを中心とした基盤の運用・改善に従事。

7/12 12:00
-
13:00
Track A

休憩

Track BLunch Sponsor

マルチプロダクト環境におけるSREの役割 〜SmartHRの組織立ち上げから学ぶ実践知〜 (12:15 - 12:25)

sugamasao
Track BLunch Sponsor

7/12 12:00 - 13:00

マルチプロダクト環境におけるSREの役割 〜SmartHRの組織立ち上げから学ぶ実践知〜 (12:15 - 12:25)

SmartHRでは10数個のプロダクトを各チームが運用しています。マルチプロダクト環境において、各プロダクトの信頼性と自律性を高めることが重要です。本セッションでは、このような環境におけるSREの役割と、組織立ち上げの実践知について共有します。 SmartHRにおけるSREは各プロダクトの信頼性向上と自律性の確立を支援する重要な役割を担っています。そうした役割を実現できるようなSREの定義やロードマップの作成を通じて、各プロダクトチームとの協業体制を構築してきました。 SREではSLOの推進やアラートの仕組みの整備など、各プロダクトの信頼性向上に取り組んでいます。また、各プロダクトチームの自律性を高めることで、より効率の良い運用や高いレベルの信頼性を獲得することを目指しています。 本セッションでは、マルチプロダクト環境におけるSREの立ち上げから現在までの取り組みについて、具体的な事例を交えながら解説します。 このセッションを通じて、複数プロダクトを抱える組織でSREとして信頼性向上に向き合っている方や、これからSRE組織を立ち上げる予定の方にとって、各プロダクトの自立性や信頼性を高めるSREの実践的な知見を得られる機会になれば幸いです。

株式会社SmartHR エンジニアリングマネージャー

sugamasao

2020年5月SmartHR入社。入社後はSmartHRの基本機能と呼ばれるプロダクトの開発を行い、同プロダクトのプレイングマネージャー→マネージャーを経て、2024年からSRE/DPE/PSIRTユニットの立ち上げやマネジメントを行っています。また、 個人の活動としてパーフェクトRubyやパーフェクトRuby on RailsなどRuby/Railsに関する書籍の執筆も行っています。

Track CLunch Sponsor

“日本一のM&A企業”を支える、少人数SREの効率化戦略 (12:15 - 12:25)

木村 奈美
Track CLunch Sponsor

7/12 12:00 - 13:00

“日本一のM&A企業”を支える、少人数SREの効率化戦略 (12:15 - 12:25)

GENDAは「世界中の人々の人生をより楽しく」というAspiration(大志)を掲げ、世界一のエンタメ企業を目指して急成長中です。「2024年に最もM&Aした企業」に選出されるなど、事業規模は加速度的に拡大しています。それに伴い、組織(Org)やアカウント・メンバー、プロダクト、そしてトラフィックは日々増加の一途をたどり、変化のスピードはまさにベンチャー級。一方で、取り扱うプロダクトの数と規模は大企業並という、両極を併せ持つ環境が広がっています。 GENDAでは昨年7月、EM・SRE/インフラ・QAの3チームから成るPlatform Engineering Chapterを設立。「各プロダクトを横断的に支援する」という共通のミッションを持った組織として機能しています。中でもSRE/インフラチームは、グループインした企業のプロダクトのインフラ運用を担当します。社員ですら次にどんなプロダクトが増えるか予測できない状況で、少人数のチームがその運用を支えるには、グループ全体のインフラリソースを一元管理しつつも、各々のプロダクト開発チームの自走を促す必要があります。 本LTでは、急成長を続ける組織を私たちSREがどのように支え、「スピード感のある初期対応」と「長期運用を見据えた仕組み化」を両立しているかをご紹介します。

株式会社GENDA Platform Engineering部 SRE/インフラ

木村 奈美

2023年にGENDAに入社。最初はインフラエンジニアとして1プロダクトでの集中的なインフラ改善に取り組んだのち、現在はPlatform Engineering ChapterのSREとして複数プロダクトを横断的に支える体制・仕組み作りに取り組んでいる。

7/12 13:00
-
13:20
Track ADiamond Sponsor

アラート沼から脱却するために必要なトリアージの方法とは

山本 純
Track ADiamond Sponsor

7/12 13:00 - 13:20

アラート沼から脱却するために必要なトリアージの方法とは

SREやインフラエンジニアにとって、日々増え続けるセキュリティアラートへの対応は避けて通れない課題です。 特に、AWSをはじめとするクラウド環境においては、脅威の多様化によりアラートの数が膨大となり、どのアラートに優先的に対応すべきかを見極める「トリアージ」のスキルが不可欠です。 本セッションでは、SREの視点からAWSを例にセキュリティアラートの効果的なトリアージ手法とそのプロセスを解説し、優先順位付けに必要な判断基準をご紹介します。 さらに、インソース型フルマネージドセキュリティサービス「CloudFastener(クラウドファスナー)」を活用し、AWS環境下での対応業務を最適化する方法についてもご紹介します。

クラウドセキュリティサービス部 プロダクトスペシャリスト

山本 純

新卒で日系Sierへ入社し、外資系企業の国内拠点におけるITインフラ構築の提案営業に従事。 その後Citrix Systems Japan、Amazon Web Services Japanを経て、サイバーセキュリティクラウドへ入社。 現在は、新規セキュリティサービスに対する立ち上げ業務に日々奮闘。 好きなAWSサービスは「Security Hub」。

Track BPlatinum Sponsor

ロールが細分化された組織でSREは何をするか?

長内 則倫
Track BPlatinum Sponsor

7/12 13:00 - 13:20

ロールが細分化された組織でSREは何をするか?

KINTOテクノロジーズでは、SREをはじめ、クラウドインフラ、Platform Engineering、DBRE、CCoE、Security、QAなど、複数の横断組織が独立して活動しています。SREのプラクティスは多岐にわたるため、こうしたロールが細分化された環境では、SREの取り組みが他部署と重複しやすく、「SREならではの取り組みとは何か?」といった問いと日常的に向き合うことになります。 本セッションでは、重なり合う役割の中で「自分たちは何をすべきか?」「SREとしての価値はどこにあるのか?」といった問いにSREチームがどのように向き合ってきたのかをお話しします。あわせて、そうした問いに向き合う中で私たちが実際に行ってきた取り組みや、そこから見えてきた課題、そしてこれからの展望についてもご紹介します。

KINTOテクノロジーズ株式会社 SRE

長内 則倫

2020年5月に株式会社KINTOに入社。翌年9月にKINTOテクノロジーズ株式会社設立に伴い転籍。2021年のSREチーム発足時からIaC, CI/CD, Observabilityといった観点で社内のSRE文化の醸成に取り組んでいます。

Track CPlatinum Sponsor

伴走から自律へ:形式知へと導くSREイネーブリングによる、プロダクトチームの信頼性オーナーシップ向上

佐々木 康徳
Track CPlatinum Sponsor

7/12 13:00 - 13:20

伴走から自律へ:形式知へと導くSREイネーブリングによる、プロダクトチームの信頼性オーナーシップ向上

ビズリーチのSREグループは、目指す将来像の実現と組織の信頼性向上に向け、SREの専門性を高め、より広い価値を提供する鍵として「イネーブリング」を推進しています。 SREがプロダクトチームに伴走し、SREが持つ知識や経験などの暗黙知を、誰もが活用できる形式知へと導くことで、チームの自律性とオーナーシップを向上してきました。 本発表では、この具体的な実践例を通じ、SREの役割と価値、そして皆さんの組織で明日から活かせるヒントを共有します。

Visionalグループ 株式会社ビズリーチ プロダクト本部 プラットフォーム統括部 ビズリーチプラットフォーム部 SREグループ

佐々木 康徳

前職はSIerで様々なプロジェクトの開発を経験し、2024年に株式会社ビズリーチに入社。ビズリーチ事業のSRE Developerとして、プロダクトの信頼性維持や、イネーブリングに取り組んでいる。

7/12 13:20
-
13:30
Track ATrack BTrack C

休憩

7/12 13:30
-
13:50
Track BPlatinum Sponsor

150サービス連携を3人で運用する現場から ー 創業4ヶ月目におけるオブザーバビリティの実践

蒲生 廣人
Track BPlatinum Sponsor

7/12 13:30 - 13:50

150サービス連携を3人で運用する現場から ー 創業4ヶ月目におけるオブザーバビリティの実践

はじめに 弊社が提供する「DRESS CODE」は、人事・IT・総務・採用などの業務を横断的に支えるコンパウンドプロダクトです。 部門ごとの部分最適を、組織全体における全体最適へと昇華し、よりよい働き方の実現を目指しています。 その中で情シス業務を担うプロダクト「IT Force」は、わずか3人のエンジニアで開発・運用しています。 本プロダクトでは、企業が利用するSaaSアプリケーションとAPI連携し、ユーザー情報・利用状況・コストなどの情報を一元的に可視化しています。 課題 可視化の鍵となるAPI連携は、常にうまくいくとは限りません。 ユーザー操作ミス、認証切れ、外部サービスの仕様変更、不具合など、失敗の原因は多岐にわたります。 こうした中で、部分的に対応していたログやトレースだけでは「何が、どこで、なぜ」起きたのかを把握するには不十分という課題が浮かび上がりました。 計測しよう そこで、DatadogやRedashといった既存のツールを活用しつつ、「どのアプリで、どのような連携が、なぜ失敗したのか」を把握できる解像度の高いオブザーバビリティをチームで持とうと動き始めました。 今回は、そういったオブザーバビリティの強化の取り組みとそれによって得られた分析や知見をどう生かしたかについてお話しします。

Product & Technology

蒲生 廣人

2024年9月Dress Code株式会社入社。 前職から監視、クラウド運用中心にSRE活動を始める。 現職ではSRE活動もしながらプロダクト開発を進めている。 推測より計測が好きなエンジニア。

Track CPlatinum Sponsor

「Chatwork」のEKS環境を支えるhelmfileを使用したマニフェスト管理術

桝谷 花世
Track CPlatinum Sponsor

7/12 13:30 - 13:50

「Chatwork」のEKS環境を支えるhelmfileを使用したマニフェスト管理術

最大数千個のPodが稼働する「Chatwork」のSREとして、当社がEKS環境のマニフェスト管理にどのようにhelmfileを活用しているかをご紹介します。開発・ステージング・本番の3環境を効率的に管理するために、Helm Chartの標準機能とhelmfileの柔軟性をどう組み合わせているのか、そのアーキテクチャと実装の詳細に迫ります。特に、Chartでカバーできない部分への独自マニフェストの追加方法や、環境依存値の管理テクニックなど、実用的なノウハウを余すことなく共有します。

桝谷 花世

SIerにシステムエンジニアとして新卒入社。ERPシステム基盤のクラウド環境へのリプレイス、MaaSサービス開発などさまざまなプロジェクトにおいて、インフラ構築やシステム開発、運用保守を担当。2023年10月に株式会社kubell(旧Chatwork株式会社)に入社し、現在はSREグループにてKubernetes周辺の技術をメインで担当。

7/12 13:50
-
14:00
Track ATrack BTrack C

休憩

7/12 14:00
-
14:10
Track BGold Sponsor

SRE with AI:実践から学ぶ、運用課題解決と未来への展望

吉井 亮
Track BGold Sponsor

7/12 14:00 - 14:10

SRE with AI:実践から学ぶ、運用課題解決と未来への展望

近年、システム運用の複雑化とサービスの高信頼性への要求の高まりを受け、SREの重要性がさらに増しています。しかし、少人数で広範な運用領域をカバーする必要がある現場においては、日々の業務負荷が増大し、効率的なSRE活動の実現が課題となっています。 このような背景を踏まえ、私たちはSREチームにおける課題解決と運用効率化を目指し、積極的にAIおよびLLMの活用に取り組んでいます。本発表では、私たちがこれまでに試行錯誤してきた具体的なAI/LLM導入事例と、その効果、直面した課題について共有します。 具体的には、モニタリングにおける異常検知の自動化、CI/CDプロセスにおけるコードレビューの効率化、インシデント発生時の初動対応を支援するAIチャットボットの導入など、多岐にわたる領域での実践例をご紹介し、これらの取り組みを通じて、1人SREが負荷軽減、システム信頼性の向上、そしてより戦略的な業務への注力が可能になった事例をご説明いたします。また、AI/LLM導入における技術的な課題や運用上の注意点、今後の展望についても議論し、参加者の皆様が自身の現場でAIを活用したSREを推進するためのヒントとなる情報を提供できればと考えています。 本発表が、SREの実務に携わるエンジニアの皆様にとって、AIという新たなテクノロジーをSREに取り込むことで、どのように日々の運用が変わり、より高度なSREが実現できるのか、具体的なイメージを持っていただける機会となると幸いです。

開発本部CTO室SREグループ

吉井 亮

2023年7月より株式会社MIXIへ入社。社内横断的に各プロダクトの価値を高めるEmbedded SRE活動をしています。AI をプロダクトに導入することに喜びを感じます。

Track CGold Sponsor

サイバーエージェントグループのSRE10年の歩みとAI時代の生存戦略

柘植 翔太
Track CGold Sponsor

7/12 14:00 - 14:10

サイバーエージェントグループのSRE10年の歩みとAI時代の生存戦略

サイバーエージェントグループでは、約10年間にわたりサービスへのSREの推進に取り組んできました。本セッションでは、これまでのサイバーエージェントグループにおけるSREの歩みを紹介するとともに、最近のAI時代におけるSRE領域での取り組みや、SREとして今後どのように向き合っていくべきかについてもお話しします。

株式会社サイバーエージェント 事業責任者 兼 SRE

柘植 翔太

2014年新卒入社。インフラエンジニア、SREとして、Ameba、AWA、社内基盤など50以上のメディアサービス・システムへの技術支援、SRE推進、リスク改善、サービス立ち上げなどを経験。2022年より、横断SRE組織を事業化し、メディア事業外へのSRE支援も推進している。近年は、SRE領域のCyberAgent Developer Expertとして、SRE組織やプラクティスの開発、Enablement、人材育成などへも注力している。社外活動として、SRE NEXT 2024のCo-Chairを務めた。

7/12 14:10
-
14:20
Track BGold Sponsor

大量配信システムにおけるSLOの実践 :「見えない」信頼性をSLOで可視化

土谷 優五
Track BGold Sponsor

7/12 14:10 - 14:20

大量配信システムにおけるSLOの実践 :「見えない」信頼性をSLOで可視化

株式会社プレイドでは、CXプラットフォーム「KARTE」を提供しており、「KARTE Message」はその中でもMAツール領域の機能を提供しています。 本セッションでは月間で数億通規模の配信している大量配信サービスの信頼性の定義と、運用を開始した後に見えてくる課題、そしてそれらに対する継続的な改善について共有します。 サービスの健全性を測る「信頼性」は、単一の指標ではその実態を詳細に捉えきれません。私たちは、この信頼性の「解像度」を上げるため、大量配信サービスにおける信頼性を、配信の成功、配信にかかった時間、最終的なエンドユーザーへの到達、など、異なる複数の側面からサービスレベル指標(SLI)として定義しました。 そして、SLOの導入・運用を進める中で、様々な課題が明らかになり改善を繰り返してきました。本セッションでは、SLOを運用する上で見られた具体的な課題と、どのようにSLOや運用プロセスを見直し、改善していったかを実際の具体例を交えてお話しします。

株式会社プレイド KARTE Message Dev leader

土谷 優五

2023年11月 株式会社プレイド入社。前職ではバックエンドやSREを中心に経験。プレイドに入社後はテックリードとしてSREのキャリアを活かしチームでもSRE領域を中心に担当。システムの障害を減らし信頼性を高めるために日々活動中。

Track CGold Sponsor

Four Keysから始める信頼性の改善

尾崎 耕多
Track CGold Sponsor

7/12 14:10 - 14:20

Four Keysから始める信頼性の改善

みなさんのサービスでは、信頼性の改善はうまく進んでいますか? よく聞く課題として 「SLOを定義したが実際に運用できない」 「可視化はできたけど改善に繋がっていない」 「エラーバジェットはあるけど、超過してもデプロイを止められない」 といった話があります。 なぜSREはうまく回らないのでしょうか? 「class SRE implements DevOps」 本セッションではこのキーワードを元にまずDevOpsを回すことでFour Keysを改善し、SRE活動として信頼性を改善するための土台を作るために合同会社DMM.com 二次元開発本部で取り組んでいる活動についてお話しします。

二次元開発本部

尾崎 耕多

合同会社DMM.com 二次元開発本部 テックリード。Rustaceanだけど最近PHPが楽しくて仕方ない。

7/12 14:20
-
14:30
Track ATrack BTrack C

休憩

7/12 14:30
-
15:00
Track A

Kubernetes で管理する大規模 Edge クラスタ: 200台のEVチャージャーの安定稼働を支える技術

米倉 遼太
Track A

7/12 14:30 - 15:00

Kubernetes で管理する大規模 Edge クラスタ: 200台のEVチャージャーの安定稼働を支える技術

私たちは200台を超えるEVチャージャーを運用しており、その安定稼働はサービスにとって最重要課題となっています。多数のエッジデバイス上でのソフトウェア管理と信頼性維持は常にSREチームの大きな課題でした。特に、限られたリソースしか持たないデバイスが混在する環境では、一貫した運用を実現することが困難でした。この発表では、これらの課題に対して私たちが実践した解決策: Kubernetesを基盤とした大規模エッジ管理システムの構築についてお話しします。 - なぜ多くの選択肢の中からKubernetesを選び、さらにk0sを採用したのか? - クラウド(GKE)とエッジをつなぐハイブリッドクラスタをどのように設計したのか? - リソース制約のあるデバイスからどうやって効率的にメトリクスを収集し、OpenTelemetry の Push 型/ Pull 型アプローチを使い分けて Observability を確保しているのか? 本セッションでは、私たちが直面した「現実的な課題」とそれを「技術でどう解決したか」のプロセス、そして実運用から得た知見を共有します。 Kubernetes による大規模エッジデバイス管理の実例として、同様の課題を抱える皆さんのお役に立てれば幸いです。

株式会社パワーエックス Senior SRE/DevOps Engineer

米倉 遼太

SWE を経て、エッジデバイスを含むユニークなインフラ環境に惹かれ 2024年 PowerX に SRE/DevOps/Infra Engineer として入社。OpenTelemetry や Kubernetes に関わる改善、SLI / SLO の構築やデータパイプラインの開発に携わる。

Track B

ARR150億円、エンジニア140名、27チーム、17プロダクトから始めるSLO

佐藤沢彦
Track B

7/12 14:30 - 15:00

ARR150億円、エンジニア140名、27チーム、17プロダクトから始めるSLO

SmartHRは創業当初から、「とにかく顧客の要望を実現する機能を作る」ということをひたすらに続けた結果、SLOを導入しようとなったときには、ARRは150億円で、140名のエンジニアが27チームに別れ、17のプロダクトを作る巨大な開発組織になっていました。それに対してSREは1人しかいませんでした。 こんな状態からでも、はじめられるSLOがあるんでしょうか? この発表ではSmartHRの1人目のSREになったスピーカーがSmartHRにSLOを導入した経験をお話します。大きな開発組織にSLOを導入した際の挫折や失敗、うまく行った工夫や知見を共有します。

SmartHR SRE

佐藤沢彦

2020年にバックエンドエンジニアとして株式会社SmartHRに入社。2024年からは1人目のSREとしてSREユニットの立ち上げをやっています。

7/12 15:00
-
15:10
Track ATrack BTrack C

休憩

7/12 15:10
-
15:40
Track A

SREの次のキャリアの道しるべ 〜SREがマネジメントレイヤーに挑戦して、気づいたこととTips〜

川崎 雄太
Track A

7/12 15:10 - 15:40

SREの次のキャリアの道しるべ 〜SREがマネジメントレイヤーに挑戦して、気づいたこととTips〜

SREのロールを担っている方で次のキャリアに迷われる方も多いのではないでしょうか。 目指す先としては、EMやICなどさまざまありますが、そのキャリアパスをどう実現するか?を語られることは多くありません。 私はSRE → エンジニアリングマネージャー → マネジメントレイヤーのキャリアを歩んできており、その過程でSREのプラクティスを利活用していました。 ・エラーバジェットの運用 → 経営のリスク管理と意思決定 ・SLO/SLIの設定と管理 → 経営指標の達成に向けた精度向上 ・ポストモーテム → 失敗・ヒヤリハットの学習文化とフィードバック 本セッションでは、SREの次のキャリアに迷われている方、SREの次のキャリアパスが明確な方の両方に「次のキャリアの一歩を踏み出すためのTips」「それが実はSREのプラクティスだったという学び」を提供します。

株式会社ココナラ Head of Information

川崎 雄太

2020年にココナラへジョイン、Head of Informationとして、プロダクトインフラ・SREと社内情報システム / セキュリティを管掌している。 2024年からココナラテックの執行役員 情報基盤統括本部長を兼任。 2025年からココナラのDev Enabling室 室長を兼任し、技術広報を中心とした開発の進化を進めている。

Track B

顧客の画像データをテラバイト単位で配信する画像サーバを WebP にした際に起こった課題とその対応策 ~継続的な取り組みを添えて~

drumato / Yamato Sugawara
高橋 拓也
Track B

7/12 15:10 - 15:40

顧客の画像データをテラバイト単位で配信する画像サーバを WebP にした際に起こった課題とその対応策 ~継続的な取り組みを添えて~

講演者が所属するGMOペパボ株式会社では、「カラーミーショップ」というECカートサービスを運営しています。 カラーミーショップを構成するコンポーネントの一つに、商品画像などの、お客様のECサイトを構成する「画像」を配信するサーバが存在します。 品質向上、配信コスト最適化、SEO 対策など様々な観点から、全画像を WebP で配信する実装が行われました。 この変更は、ECサイトオーナーさんにとって大きな変更となります。 この発表では。一連の変更について、ショップ運営に影響なく進めるために導入した施策から、導入後に発生した技術的課題とその対応、導入後の効果の測定まで網羅した内容をお伝えいたします。 また、プロジェクト後に継続して行われている改善活動についてもお伝えいたします。

GMOペパボ株式会社

drumato / Yamato Sugawara

技術部 技術基盤グループ ソフトウェアエンジニアとして、GMOペパボ株式会社に2024年から従事。サービスの信頼性向上をミッションに活動し、特にKubernetesクラスタの運用改善について取り組んでいます。

GMO ペパボ株式会社 プリンシパルエンジニア

高橋 拓也

GMOペパボ株式会社所属のインフラエンジニア。主に社内プラットフォームの運用や、自社運営サービスの SREing を担当する。Kubernetes が好きで、自宅で Kubernetes クラスタの運用を始めてもうすぐ5年が経過する。真夏は書斎兼サーバルームの温度が40度を超えるのが悩みである。

Track C

Pullリクエストは証拠、Pull型Appが実行、DeviceFlowで認証:Githubを中心にPull型AppとDevice Flowでつくる安全なSQL実行と参照

竹田 舜
Track C

7/12 15:10 - 15:40

Pullリクエストは証拠、Pull型Appが実行、DeviceFlowで認証:Githubを中心にPull型AppとDevice Flowでつくる安全なSQL実行と参照

自動化をとりいれた属人化解消に取り組みたいといった要望が皆さんの開発現場でもあるのではないでしょうか? しかし、安全性や確実な実行の観点、費用の問題から日々の運用作業が人手に頼らざるを得ず、業務の属人化が避けられない状況があると思います。 従来の手法では、安全性を確保するために特定の人にしか操作を許可しない体制が取られ、属人化や業務のボトルネックを生みます。 また、依頼するためのブランチや依頼DBの権限管理、定型挨拶の手動依頼フローなど、効率を下げる業務が定常的に起きるでしょう。 今回は定常業務からSQLクエリの実行にフォーカスし解決を模索しました。 依頼フローの調査やヒアリングから - 依頼する上で手続きが面倒 - すぐに結果が得られない。 - 依頼回数を削減のため一度に大量の情報を取るような特大クエリ(及び業務時間外実行) これらを単純に自動化するならば簡単ですが、そのようにはいきません。 自動化の場合、注意点があります。 - 不正なSQLの実行の防止 - 証跡に残らないSQLの実行の防止 - 取得した情報への適切なアクセス制御 このように、自動化には現状の手動作業と以上のセキュリティが求められます。 本発表ではこの解決に至ったGithubとGitや複数のOSSを活用したセキュアなPull型のSQL自動実行アプリケーション・およびデータ取得者のアカウント管理不要をフリーにする手法について発表します。 この成果により、クエリレビュー後、人間の関与なく実行が行え、依頼が不要な状態になりました。 PRが残ることから、実行するSQL、作成者、レビュアー全てがGithubに集約された監査証跡として機能し管理が容易です。 Githubを活用することで、SQLのレビュー、監査証跡の管理、結果へのアクセス管理など自動化に必要な作業を大幅に簡略化しました。 アプリ側では、Pull型の仕組みの採用や許可されていない操作をブロックする安全なガードレールを構築によってセキュアなアプリを構築しました。 この手法に至るまでの変遷や考慮事項、技術的な詳細、SQL実行以外にも活かせるGitHubを活用した認証方法について話します。 - この発表を聞いてほしい人 属人化した業務の自動化をしてトイルの削減をしたい人 GitHub, Gitを使い倒したい人 アカウント管理に悩まされている人

株式会社ラクス

竹田 舜

2023年に株式会社ラクスに新卒入社、BEエンジニアを経てSREとして業務に従事

7/12 15:40
-
15:50
Track ATrack BTrack C

休憩

7/12 15:50
-
16:20
Track A

SREのためのeBPF活用ステップアップガイド

岩堀 草平
Track A

7/12 15:50 - 16:20

SREのためのeBPF活用ステップアップガイド

eBPFはとても強力な技術です。 カーネル内で動作しますがユーザー空間に動作するプログラムにもアタッチすることが可能で、低コストで、実行コードを変更することなくトレースを追加することができます。 ベンダー製品でも活用されているeBPFですが、SRE自身がeBPF技術を直接活用することで、障害調査、パフォーマンス問題解決のヒントを得ることができます。 とはいえeBPFプログラムそのものは制約も多く、いきなりコードを書いてトレースを実際に動かすところまで行くにはなかなかハードルがあります。 本セッションでは不可解なプロセスの終了原因調査、memcachedのパフォーマンス調査など実際のプロダクション環境での課題解決事例を引用しつつ - 既存のツール(eBPFベースのコマンド群)を利用する - bpftraceでオンデマンドの調査を行う - 簡単なeBPFプログラムを作成して利用する といったステップで、eBPFに馴染みがないSREでも課題解決に使っていける!というイメージを持てるようなガイドを提供します。

株式会社グリー シニアリードエンジニア

岩堀 草平

グリーグループ内のサービスに共通監視基盤を提供するチームをリードしています。 コミュニティ活動としてSRE NEXTスタッフ、eBPF Japan Meetup運営をやってます。

Track B

ポスト・コロナ時代の SaaS 企業におけるコスト削減の意義

izzii
Track B

7/12 15:50 - 16:20

ポスト・コロナ時代の SaaS 企業におけるコスト削減の意義

ポスト・コロナ時代においてSaaS企業では、「コスト削減」は重要な一つの経営戦略となっています。近年、事業価値の評価基準として売上マルチプルが減少し、利益率がより重視される傾向が強まっています。この背景には、投資家が持続可能な成長と安定した収益性を求めるようになったことがあります。SaaS企業は、サブスクリプションモデルを基盤とするため、安定した収入が見込まれる一方で、売上と利益率の向上が企業価値を高める鍵であることに変わりはありません。しかし売上と利益率の重要性に対する投資家の、社会の目が変わっていることはご存知でしょうか? 漫然と金額だけで語られがちな「コスト削減」について、上記の背景の中でテックタッチのSRE&Platform チームが何を目指してコスト削減に取り組んだのか、そしてどのような形で成果を出したのかというお話をさせていただこうと思います。

テックタッチ株式会社 SRE&Platform Mgr.

izzii

2022年からテックタッチ株式会社で SRE(※) として従事、2024年からマネージャーに就任。CSIRT の立ち上げ&運営やテックブログの編集長などもやってます。 趣味はボルダリング。 ※現在は SRE&Platform というチーム名へ変更しています。

Track C

オンコール入門〜ページャーが鳴る前に、あなたが備えられること〜

高橋 祐輝
Track C

7/12 15:50 - 16:20

オンコール入門〜ページャーが鳴る前に、あなたが備えられること〜

子どもの写真・動画共有アプリ「家族アルバム みてね」のSREとしてプロジェクトに参画した私は、3ヶ月後にオンコールシフトに入ってほしいことをマネージャーから伝えられました。 サービスは公開から10年近く経過しており、世界中で多くの方に利用されています。 複雑化した未知の環境において、新規着任者は何から取り組めばよいのでしょうか。 このセッションでは、ドキュメンテーション、学習方法の効率化、マインドセットの習得といった個人でも小さく始められる改善活動を通じて、既存のプロダクトや運用を理解し不安を払拭するための方法を紹介します。 また、新規着任者を受け入れる立場にある方に対しても、オンコールのオンボーディングをおこなうにあたって整備すべき運用や体制、文化について、気づきを得られる内容になることを目指します。

株式会社MIXI みてね事業本部 みてねプラットフォーム部 SREグループ

高橋 祐輝

2025年1月に株式会社MIXIへ入社。「家族アルバム みてね」のSREをしています。

7/12 16:20
-
16:30
Track ATrack BTrack C

休憩

7/12 16:30
-
17:10
Track AKeynote

システム障害対応のツマミになる話

木村 誠明
Track AKeynote

7/12 16:30 - 17:10

システム障害対応のツマミになる話

おかげさまで拙著『システム障害対応の教科書』は初版刊行から5年が経ち、多くの方に手に取っていただいています。微力ながら業界の一助となれたことを、大変うれしく思います。 実のところ、書籍ではさらりと触れている内容の中にも、執筆にあたっては多くの試行錯誤がありました。システム障害対応は非定型的で、暗黙知も多く含まれます。また、読者が置かれている運用現場の前提が大きく異なるため、汎用的・普遍的な言語化や体系化が難しいという側面もありました。 今回の登壇では、そうしたシステム障害対応を考える上で悩ましいポイントを“ツマミ”にしながら、障害対応の難しさや奥深さ、そしてその面白さをあらためて共有したいと考えています。これが参加される皆さまの視点を広げ、今後の現場改善の一助となれば幸いです。

木村 誠明

「システム障害対応の教科書」の著者。 株式会社野村総合研究所に所属するシステムコンサルタント。金融系業務システムの開発・保守運用に携わり多くの障害対応を経験。その後、システム運用高度化のための技術開発・サービス開発を実施。現在はITサービスマネジメントの専門家として、社内外のシステム運用の改善に携わるとともに、障害対応力向上のための研修講師も手掛ける。

Track BTrack C

トラックA:サテライト

7/12 17:10
-
17:30
Track A

Chairs Talk & 閉会式

Track BTrack C

トラックA:サテライト

7/12 18:00
-
20:00

懇親会