Schedule

タイムテーブル

DAY 1: 5/14

Track A

Track B

Track C

5/14 12:30
-
13:15
Track AKeynote

How We Foster "Reliability" in Diversity

Narimichi Takamura
Track AKeynote

5/14 12:30 - 13:15

How We Foster "Reliability" in Diversity

SRE において「信頼性」は最も重要な指標とされています。しかし、一言で「信頼性」といっても、会社の戦略やサービス、文化によって、計測方法や目指す値、その達成方法にいたる全てが同じになることはないでしょう。さらに、一度定義した信頼性が適切であり続けることはなく、会社や組織のフェーズによって、その時々で柔軟に変化していく必要がありそうです。 このように、サービスを取り巻く環境の変化に応じて適切な信頼性を定義し、またその信頼性を「育てて」いく方法として、サービスや組織の戦略と SRE チーム の方向性を揃えたり、SRE チームの垣根を超えて組織全体に SRE の文化を根付かせるための取り組みなどを紹介しながら、多様性とともに SRE がどのように歩んでいくかについてお話します。

Topotal, Inc. CEO / SRE

Narimichi Takamura

Topotal(トポタル) の CEO。SRE チームのエンジニア。大規模インフラ基盤の設計・構築・運用を経験し、エンジニアリングマネージャー、事業責任者、VPoE を経て、2020年に Topotal を創業。

5/14 13:15
-
14:00
Track AGuest Session

SREの歩き方・進め方

Ryota Yoshikawa
Takushi Nishikawa
Track AGuest Session

5/14 13:15 - 14:00

SREの歩き方・進め方

SRE NEXT2022では「SRE DIVERSITY」というテーマの下で、幅広い業種/領域でのSRE Practiceの実践例を集約し、より多様なSREの実践が普及していくきっかけの提供を目的にしています。 一方で、本セッションではSREのPracticeやそもそものSREの概念に対して、これから理解を深めていく方を対象に、SRE自体の説明やSLI/SLOなどのPracticeに関する説明を交えつつ、SREのPracticeを導入する上での考慮点についてSpeakerとのQ&A方式でお話します。SREに対する理解を深めて、「SRE DIVERSITY」に飛び込むことができる、SRE Next2022のコンテンツがより楽しめるような内容となっています。

Topotal, Inc. CTO

Ryota Yoshikawa

MSP 事業会社でインフラ構築・運用専門の会社で様々な条件・規模のシステム設計・構築・運用を 6 年間経験。2017 年からクックパッド株式会社の SRE として、アプリケーションチューニング・ソフトウェア開発・モニタリングシステムの改善などを経験。2021 年 6 月から Topotal の CTO として技術全般を担当。

株式会社ビザスク

Takushi Nishikawa

大手SIer子会社を経て、2020年8月に株式会社ビザスクに入社。 SREとしての業務を経て、現在はシステムリプレース専任チームにおいて主にインフラ周りの整備を担当。 SREのPracticeの導入や具体的な取り組みについて日々検討を重ねて取り組んでいる。

Track B

1,000万人以上が利用する「家族アルバム みてね」のSRE組織は4年間でどのように作られてきたのか

清水 勲
Track B

5/14 13:15 - 14:00

1,000万人以上が利用する「家族アルバム みてね」のSRE組織は4年間でどのように作られてきたのか

「家族アルバム みてね」は2015年4月にサービスが開始されました。一方でSRE組織は2018年2月に作られました。SRE組織が現在に至るまでに、組織の規模がどのように変化してきたのか、目標設定や日々のタスク管理はどのように行なってきたのか、SREロールの採用活動はどのように工夫してきたのか、この4年の間に起きたことを振り返ります。また、SRE組織を今後どのように進化させていきたいかの展望についてもお話しします。組織の課題に対する試行錯誤が何らかのヒントになれば幸いです。特にSREを新たに始めたい、立ち上げたいと考えている方に役立つ内容になればと思います。

株式会社ミクシィ Vantageスタジオ みてね事業部 SREグループ マネージャー

清水 勲

2011年に株式会社ミクシィへ入社。SNS「mixi」のインフラ運用、モンスターストライクのSREを経て、現在は「家族アルバム みてね」のSREグループマネージャー。 SRE NEXT 2020登壇。

Track C

KaaS桶狭間の戦い 〜Yahoo! JAPANのSLI/SLOを用いた統合監視〜

中村 昭太
Track C

5/14 13:15 - 14:00

KaaS桶狭間の戦い 〜Yahoo! JAPANのSLI/SLOを用いた統合監視〜

現在ヤフーのKubernetes as a Service(以下KaaS)では1000を超えるKubenetesクラスタを取り扱っており、Kubernetesクラスタの利用者が円滑に開発を行えるように、LoadBalancerの機能や社内の他プラットフォームとの連携機能といったクラスタのコアとなる機能をたった25名ほどのメンバーが管理と運用をしています。 少数のメンバーであろうと、Kubernetes上で障害が起きた時にプラットフォームを運用する側としては、何が?いつから?どの影響範囲で?を即座に判断できなければなりません。 この度、我々KaaS運用チームは、この膨大なクラスタが全部正常稼働しているかを即座に判断できる監視システムを作りました。SREの重要な概念であるSLI/SLOを武器に用いれば、43万ものコンテナを動かす1000を超えるKubernetesクラスタの軍勢に、たった25名で立ち向えるということを紹介いたします。

ヤフー株式会社

中村 昭太

ヤフー株式会社 2019年新卒入社。社内Kubernetes as a Serviceの運用チームのメンバーとして、利用者への利便性を高める機能の提供や、業務におけるトイルの削減など運用の改善を行っている。

5/14 14:15
-
14:45
Track APlatinum Sponsor

LINEのData Platform室が実践する大規模分散環境とキャパシティプランニング

茂木 高宏
Track APlatinum Sponsor

5/14 14:15 - 14:45

LINEのData Platform室が実践する大規模分散環境とキャパシティプランニング

LINEのData Platform室では、2000台を超える分散環境(Hadoop, Kafka, Trino)における高可用性・高性能の両立のため、システムの開発運用をしています。 キャパシティプランニングをどのように行っているのか、現時点での課題や今後の挑戦についてお話しいたします。

LINE株式会社 Data Engineeringセンター Data Platform室 Data Solutionsチーム

茂木 高宏

広告やメディア関連のシステムを開発/運用を経験し、2020年にLINEへ入社。現在はData Platform室でSite Reliability Engineerとして、データプラットフォーム全体の観点からインフラストラクチャに関するプランニングと運用改善をしています。

Track BGold Sponsor

事業の成長と共に歩む、ABEMA SRE探求の歴史

岩永 勇祐
Track BGold Sponsor

5/14 14:15 - 14:45

事業の成長と共に歩む、ABEMA SRE探求の歴史

ABEMA SREは横断的なインフラを担当していたメンバーを中心として始まり、約3年が経過しました。 SREプラクティスの導入は文化の変革を必要とすることも多く、組織の規模やサービスの状態に合わせてアプローチやチーム体制の変更など様々な試行錯誤を繰り返し、ABEMAのSREとしての形を追いかけてきました。 本セッションではSRE立ち上げから行ってきた活動の中から、サービスの中核的部分に対する取り組みを中心にご紹介出来ればと思います。

株式会社サイバーエージェント SRE

岩永 勇祐

2017年に株式会社サイバーエージェントに入社し、広告管理ツールの開発を担当。 2018年に株式会社AbemaTVに出向し、SREとして活動。

Track CGold Sponsor

TVerのサービスリニューアルにおける信頼性向上への取り組み

加我 貴志
Track CGold Sponsor

5/14 14:15 - 14:45

TVerのサービスリニューアルにおける信頼性向上への取り組み

弊社はテレビの見逃し配信やリアルタイム配信サービスであるTVerを提供しています。 TVerは今年の4月にサービスのリニューアルを行いました。「好きな番組を、好きな時に、好きな場所で、好きなデバイスで、自由に視聴する動画サービス」を実現するため、機能面の改修およびインフラ面での大胆な刷新を行い、ユーザー体験を大きく向上させることができました。 一番大きな変更点は認証基盤であるTVerIDの追加です。TVerIDを軸としたマイクロサービスの構成を取っており、管理するインフラリソース群が以前の数倍の数になりました。そのため、構成でも安心かつ安全にユーザーへのサービス提供の品質を担保するためNew Relicを導入しました。インフラの管理、監視はもちろんのこと、ユーザー体験に寄り添うためのアプリケーション側のモニタリングも可能となりました。 TVerリニューアルの裏側と信頼性向上への取り組み、そして今後取り組んでいきたい事についてお話します。

株式会社TVer 技術開発部 SRE

加我 貴志

2022年1月にSREとして入社。 NewRelicを活用し、主にTVerのモニタリング・オブザーバビリティ周りの実現や改善に着手しています。 最近勉強していることはGoとTypeScriptとCDK、趣味はカメラ・サウナ・ソシャゲ。

5/14 14:45
-
15:15
Track A

1年間のポストモーテム運用と、そこから生まれたツールsre-advisor

藤原 俊一郎
Track A

5/14 14:45 - 15:15

1年間のポストモーテム運用と、そこから生まれたツールsre-advisor

カヤックではSREが関わっている社内の複数プロダクトで、ポストモーテムを2020年末から運用してきました。 社内には多数のプロダクトがあるため、エンジニアは自分が関わっているもの以外の事故や事例に疎くなりがちでした。ポストモーテムの運用を通して、それがどう変わっていったかを紹介します。 ポストモーテムからは、普段は問題なく動いていても高負荷時や長期間の運用で問題になる、インフラやミドルウェアの設定が要因として見つかることもありました。その経験から、問題がある設定を自動で検出し、報告するsre-advisorというツールが生まれました。ツールの作成と、プロダクトに導入してからの運用についても紹介します。

面白法人カヤック SREチーム

藤原 俊一郎

2011年より面白法人カヤック。SREチーム所属。ISUCON優勝4回。最近の趣味はマネージドサービスの隙間を埋める隙間家具OSS作成。

Track B

Kubernetesの上に作る、統一されたマイクロサービス運用体験

tkuchiki
Track B

5/14 14:45 - 15:15

Kubernetesの上に作る、統一されたマイクロサービス運用体験

メルペイではKubernetes上で60以上のマイクロサービスが稼働しており、それらを開発者がオーナーシップを持って運用しています。 そのような環境で、SREチームはマイクロサービス開発者の運用体験向上にフォーカスし、普段のGitOpsの延長線上でKubernetesマニフェストを記述するだけで利用できる仕組みを提供しています。これにより、SREの手を借りることなくマイクロサービス開発者がオーナーとなって運用できるようになりました。 本セッションでは、マイクロサービス開発者の運用体験を向上するための取り組みとして、Kubernetes Custom Controllerを活用したパターンや、SREチームマネージドなコンテナイメージを利用するパターンなどを紹介します。

株式会社メルペイ

tkuchiki

株式会社メルペイSREチーム所属。主に Cloud Spanner 関連の業務を担当しています。Go でコマンドラインツールを作るのが好きです。

Track C

LegalForceの契約データを脅かすリスクの排除と開発速度の向上をどうやって両立したか

浜地 亮輔
Track C

5/14 14:45 - 15:15

LegalForceの契約データを脅かすリスクの排除と開発速度の向上をどうやって両立したか

LegalForceでは「契約書」というビジネス上非常に機密性の高いデータを扱っています。このデータが社外に漏洩することはインサイダー取引などの違法行為に発展するため、なんとしても防がなければなりません。一方で、無計画にセキュリティを厳しくしすぎると開発速度の低下につながってしまうため、顧客への価値提供の遅延や競合他社との競争で不利になる恐れがあります。これらの両立をとるべく、どういった考えのもと何を実施しているかについて発表します。

株式会社LegalForce

浜地 亮輔

株式会社LegalForceに所属し、AI契約審査プラットフォーム「LegalForce」のインフラエンジニアとして従事している。権限管理について強い関心を持っている。

5/14 15:30
-
16:00
Track APlatinum Sponsor

SRE チーム立ち上げから1年。気づいたら SRE っぽくない仕事まで貢献しちゃってる説

Jun Kitamura
Track APlatinum Sponsor

5/14 15:30 - 16:00

SRE チーム立ち上げから1年。気づいたら SRE っぽくない仕事まで貢献しちゃってる説

ビットキー SRE チームは、2021/7 に発足しました。ビットキーでは、いわゆる Web サービス、スマホアプリからスマートロックやビルの制御等のエッジデバイスまで様々なソフト・ハードウェアの開発を行っており、極めて高い信頼性、セキュリティが求められます。 とはいえ、まだまだビットキーはスタートアップで、変化が激しい環境です。SRE チームとしては、その変化をポジティブに捉え「プロダクト開発速度を向上させつつ、信頼性・セキュリティの向上させるか」が重要であると考えています。この価値観を基準として、いわゆる SRE に関する著書等に含まれるプラクティスにはあまり表現されていない(SRE っぽくない)様々な取り組みを実施し、プロダクトや組織に貢献してきました。 本講演では 1. 立ち上げ期の1年目に、どのような取り組みを実施してきたのか? 2. 2年目以降は""実践期""と捉えて、何に挑戦していきたいのか? について、ご紹介できればと考えております。

株式会社ビットキー SRE Team Manager

Jun Kitamura

株式会社ビットキーのSRE Team Manager。2019年4月に入社し、認証・認可プラットフォームのサーバサイドエンジニア、顔認証のiOSアプリ開発、クラウド・オンプレのインフラ設計・構築に従事。2021年7月よりSREチームの立ち上げをやってます。

Track BGold Sponsor

6年で売上40億に成長したサービスのSREチーム結成〜運営

磯崎 勢
Track BGold Sponsor

5/14 15:30 - 16:00

6年で売上40億に成長したサービスのSREチーム結成〜運営

転職サービス「ミイダス」は立ち上げから6年になりますが、着実は成長を続け、エンジニア組織で70名が活躍しています。 サービスの立ち上げから成長の段階ごとのsreについての考え方の変化を追いつつ、チームの立ち上げに至る試行錯誤や、結成後の状況を紹介するセッションです。

ミイダス株式会社 開発チームリーダー

磯崎 勢

2000年、SI企業に就職。証券会社、電子マネー、大手保険会社などのシステムを経験。新規のサービス立ち上げに惹かれて、2015年よりミイダスに参画。バックエンドエンジニアとしてサービスを支えつつ、ここ最近は開発チーム全体の編成 なども担当。

Track CGold Sponsor

ニフティでSRE推進活動を始めて取り組んできたこと

浅見 則彦
Track CGold Sponsor

5/14 15:30 - 16:00

ニフティでSRE推進活動を始めて取り組んできたこと

ニフティ株式会社はISPを主な事業としてますが、Webサービスも提供しています。 Webサービス群をAWSに移行した後に、パフォーマンスが安定しない、障害対応に時間がかかるといった課題が発生しました。 SREの必要性を感じ、SRE本で学びながら、SLI/SLOの設定を始め、ポストモーテムなど行い、改善に取り組んできました。 最初は小さく始めたSREの活動を、最近は全社的に広げようとしています。 その取り組みについて共有したいと思います。 これから始める方の参考になれば幸いです。 ・ SLI/SLOの設定 ・ 障害対応のロールプレイング ・ Toilを洗い出して削減する ・ パフォーマンス・ポストモーテム共有会 ・ SRE本の輪読会

ニフティ株式会社 SRE

浅見 則彦

ニフティには2009年に新卒入社。 Webサービスの開発・運用を担当していましたが AWS移行を機にDevOpsを実践していく中でSREのすばらしさを知り、 現在は全社に広めようと推進活動をしています。

5/14 16:00
-
16:30
Track A

一人から始めるプロダクトSRE

VTRyo
Track A

5/14 16:00 - 16:30

一人から始めるプロダクトSRE

「このチームの最初のSREとして、SRE組織を作ってくれないか」と言われたとき、あなたならどこからアプローチしますか? SRE本に記載された多くのプラクティスのすべてをすぐに導入するのは容易くありません。なぜならSREの役割を果たせるのは現状あなたしかおらず、さらに通常、本に記載されている環境とは前提も異なるからです。 では、どこから始めればいいのでしょうか。 本セッションでは、実際にSRE組織の立ち上げ時に実施した内容を紹介しつつ、どのようにアプローチし意思決定したかをお話します。 キーワード: ・ 発足したては、現場の運用ペインから潰そう ・ まずはソフトウェアエンジニアを安心させよう ・ 「SREがいればサービスは安定するんですよね!」の期待値をすり合わせる ・ SRE原則に関連する作業背景は積極的に伝えよう ・ Core SRE? Embedded SRE? ・ 開発者の日常行動に隠れた""SRE精神""を自覚してもらおう

株式会社マネーフォワード SRE

VTRyo

2021年より株式会社マネーフォワードにて、クラウド勤怠/クラウド給与のSREを担当。SWEが自律的にSRE活動を行える組織を作っています。著書に『ITエンジニアのための偶然から始めるキャリアプラン -好奇心が導く予想しない未来-』

Track B

Steps toward self-service operations in eureka

wapper
Track B

5/14 16:00 - 16:30

Steps toward self-service operations in eureka

私たちeurekaは、登録者数1500万人を突破した恋愛・婚活マッチングサービス「Pairs」を10年弱開発・運用を続け、その中で韓国・台湾へのリリース展開・オンライン結婚相談所「Pairs engage」をローンチなど順調に顧客に提供するサービスをグロースさせ展開してきました。しかしその裏側では、私が入社した2020年当時において、多種多様なオペレーションの依頼対応に少人数で奔走し疲弊するSREチームの姿がありました。この状況に対し、私は今に至るまで2年間セルフサービス戦略を打ち出し、200stateを超えるTerraform基盤・100種類を超えるタスクを抱えるバッチ基盤・Incident Response基盤・他チームからの様々なオペレーション依頼などに関して開発者、デザイナー、非開発者を巻き込んで依頼者自らが実行できる形へ移行・改善を続けてSREチームのボトルネック化を防ぎ信頼性とアジリティとスケーラビリティを担保してきました。今回はそんな事例を共有しながら、良いセルフサービスなオペレーション設計とはどんなものであるか、他チームとのハレーションが起きないオペレーション移行とはという話をしたいと思います。

Eureka, inc. SRE

wapper

Virtual SWE/SRE at Eureka, inc. 最近はSREをData/ML領域で実践することにも興味。サウナ/VR/音楽/スケートボードが好き。

Track C

成長を続ける組織でのSRE戦略:プレモーテムによる信頼性の認識共有

丹羽 健
Track C

5/14 16:00 - 16:30

成長を続ける組織でのSRE戦略:プレモーテムによる信頼性の認識共有

プロダクト・事業の成長フェーズによって求められる信頼性の度合いは変わり、SLOは過剰達成するものではなく信頼性への適切な認識を持って戦略的にSRE活動を進める必要があります。特にスタートアップにおいては求められる信頼性は事業の成長に伴って徐々に高まるものであり認識を定期的に更新することが求められます。 弊社アセンド株式会社においても、障害後にポストモーテムを進める中でチームで信頼性への認識を正しく醸成できていないことに気がつきました。そこでアセンドではプレモーテムというワークショップ形式をとり、想定される障害群を元に具体的に議論することで信頼性への認識を高い解像度で共有するアプローチを取りました。またSREsに閉じず他のエンジニアやカスタマーサクセスといったステークホルダーを巻き込み議論することで信頼性へのコンテキストが揃った組織作りを進めています。 本セッションでは、信頼性への認識の定期的な更新が必要なスタートアップだからこそ作れたプレモーテムという手法について、どのエンジニア組織でも手軽でありつつも1度は実践する価値のある形へ汎化して紹介いたします。

アセンド株式会社 CTO

丹羽 健

物流業界向けSaaSをLogiXを開発するアセンド株式会社にてCTOを務める。PdM,EMの知見を活かして社会課題を解決するエンジニア組織作りを目指しています。特技は料理のリバースエンジニアリング。

5/14 16:45
-
17:15
Track APlatinum Sponsor

AWS/GCPにおけるセキュリティ監視の取り組み

skaru
Track APlatinum Sponsor

5/14 16:45 - 17:15

AWS/GCPにおけるセキュリティ監視の取り組み

ミクシィでは多数のAWS/GCPのアカウントを運用しており、日々増え続けています。 これらのクラウドサービスでは一つの設定ミスで深刻なセキュリティ事故が起きてしまうため、セキュリティ監視は必要不可欠です。 本セッションでは我々がどのように多数のアカウントについてセキュリティ監視を行なっているか、またどのように効率化しているかについてお話しいたします。

株式会社ミクシィ 開発本部 セキュリティ室 ソフトウェアエンジニア

skaru

2018年株式会社ミクシィに中途入社しセキュリティ業務を担当。2020年4月よりSREを兼務し、サーバー/インフラ周りの開発も行っています。

Track BGold Sponsor

heyにおけるSREの大切さ。マルチプロダクト運用の「楽しさ」と「難しさ」および今後の展望

藤原 涼馬
Track BGold Sponsor

5/14 16:45 - 17:15

heyにおけるSREの大切さ。マルチプロダクト運用の「楽しさ」と「難しさ」および今後の展望

heyは、ネットショップ開設、POSレジ、キャッシュレス決済、オンライン予約システムなど、お商売のデジタル化を支援する「STORESプラットフォーム」の展開を通じて、中小事業者のお商売にまつわる課題を解決し、こだわりや情熱、たのしみによって駆動される経済の発展を目指しています。 デジタル化の加速に伴い、STORES プラットフォームにおいて複数のプロダクトを横断して活用いただくオーナーさんが増えてきており、プロダクトを横断した取り組みも重要になっています。本セッションでは、SREの視点から急速に成長するプロダクト群および組織における課題と今後いかに対応していくかの展望を解説します。

ヘイ株式会社 プロダクト基盤本部 SRE

藤原 涼馬

SIerの研究員、株式会社リクルートを経て、2021年6月ヘイ株式会社に入社。STORES 決済、ID基盤、および、プロダクト横断でのインフラアーキテクチャ、運用改善に従事。

Track CGold Sponsor

より意味のある監視を目指して、外形監視の有効活用

青木 亮磨
Track CGold Sponsor

5/14 16:45 - 17:15

より意味のある監視を目指して、外形監視の有効活用

みなさん外形監視はどのように活用してますか? 近年、マイクロサービスアーキテクチャといった分散アーキテクチャを採用するシステムが増え、システムの複雑性は増してきています。そのような複雑なシステムを健全に保つためには、システムの状態を把握できるようにする監視というのは非常に重要な要素です。 監視は多くの開発組織が行っていると思いますが、それらの多くはシステム目線の監視が中心で、サービス影響はないアラートを大量に発生させてしまい、アラート疲れを起こしたり、本当に重要なアラートを見落としてしまったり、サービスとしての状態が把握しづらかったりと様々な課題があると感じています。そこで、本セッションでは外形監視に着目し、外形監視によるユーザ目線での監視も行うことで、より効果的な監視設計を目指すお話をします。

株式会社スリーシェイク Sreake事業部SRE

青木 亮磨

バックエンドエンジニアとしてECモールのシステムリプレイスや運用を経験した後、株式会社スリーシェイクに入社。現在は、主に AWS / Google Cloud / Kubernetes を用いた SRE 支援と、自社の新規プロダクト開発に携わっています。

5/14 17:15
-
17:45
Track A

ヤプリのSREにおけるセキュリティ強化の取り組みを公開する 〜上場前後の変化〜

望月 真仁
Track A

5/14 17:15 - 17:45

ヤプリのSREにおけるセキュリティ強化の取り組みを公開する 〜上場前後の変化〜

直近でヤプリのSREが取り組んでいるセキュリティ強化について紹介します。 ヤプリは2020年12月に東京証券取引所マザーズへ上場をしており、その前後でセキュリティ領域において様々な変化がありました。従来から取り組んでいたAWS/Google Cloudにおける基本的なセキュリティ対策に加えて、監査対応やインシデント検知やセキュアなデータを含む各情報の取扱ルール整備など、サービス・事業全体を俯瞰して取り組みを進めています。 既に運用されているサービスにおいてセキュリティ対策を推進してきた背景や、効果的だった取り組みやこれから取り組んでいきたい課題など、SRE目線で上場1年が経過した現在を振り返ってヤプリのセキュリティ状況についてお話しします。 初期からセキュリティ設計・構築していることが望ましい一方、サービスファーストでセキュリティが後回しになるケースはあると思います。散発的に対応していたセキュリティを体制構築含めて推進したヤプリの経緯を紹介することで、セキュリティへ関心があるものの何をしたら良いか迷っている方などが一歩先に進むヒントになればと考えています。

株式会社ヤプリ SREグループ マネージャー

望月 真仁

株式会社ヤプリのSRE、当初はQAエンジニアとしてジョインした後にSREに転向、現在はSRE/IT(情シス)の運営を行いながらインフラセキュリティ・社内情報セキュリティ両面の強化を推進中。

Track B

Adopting Kafka for the #1 job site in the world

宮崎 勇輔
Track B

5/14 17:15 - 17:45

Adopting Kafka for the #1 job site in the world

世界 No. 1 の求人検索エンジンである Indeed の求人検索のバックエンドにおいて Apache Kafka を採用した事例を紹介します。Kafka はオープンソースの分散イベントストリーミングのためのプラットフォームで、世界中の多くの企業によって採用されています。Indeed でも様々な用途で Kafka が活躍していますが、本発表では求人情報のストリーム処理とデータセンター間のレプリケーションのために利用していたレガシーなシステムを、段階的に Kafka ベースの新しいシステムに移行した事例について紹介します。 レガシーなシステムが抱えていた信頼性・プロダクト上の課題といった背景、どのように Kafka を適用しシステムの移行・検証を行ったのかという技術的な内容、ソフトウェアエンジニアやプロダクトマネージャーを含む職能横断的 (cross-functional) プロダクトチームに埋め込まれた SRE がどのようにプロジェクトを始動し、チームと共にプロジェクトを実行したのかなどをお話しする予定です。

Indeed Japan 株式会社 Site Reliability Engineer

宮崎 勇輔

Indeed の求人検索チームの「Embedded SRE」。プロダクトチームとともに日々大規模システムの信頼性の向上に取り組んでいます。

Track C

LINEスタンプの実例紹介:小さく始める障害検知・対応・振り返りの改善プラクティス

KATO TOSHIYA
Track C

5/14 17:15 - 17:45

LINEスタンプの実例紹介:小さく始める障害検知・対応・振り返りの改善プラクティス

『LINE』のスタンプシステムは、25名程度のサーバー開発エンジニアと2名のEmbedded SREで開発されています。オンコールもこの25名強のメンバーで輪番対応しています。 本システムでは、2021年に障害対応の品質向上のために、下記のような取り組みをEmbedded SRE中心に実施しました。 1. アラートを受けてから行っていたReactiveな障害対応から、アラートには至らないメトリクス変化を確認して行うProactiveな対応へ移行 2. 障害時の初動対応を成熟させるための障害訓練 3. 障害後のポストモーテムの品質改善 これらは、技術的な変更を伴わないプラクティスとして実行でき、すぐに効果を実感できるものでした。 LINEスタンプチームで行った実例を紹介すると共に、今後行いたいことも共有したいと思います。

LINE株式会社 SRE, TechLead

KATO TOSHIYA

2020年12月にLINE株式会社に入社。LINEアプリのスタンプ、着せかえ、絵文字、ホームタブ、ウォレットタブのSREを担当。

5/14 17:45
-
17:50
Track A

Day1クロージング

北野 勝久
Track A

5/14 17:45 - 17:50

Day1クロージング

Day1のクロージングセッションとなります

株式会社スタディスト 執行役員 VP of Engineering, SRE NEXT Founder/2020 Chair

北野 勝久

SRE NEXT Founder。株式会社スタディストにて自社プロダクト Teachme Biz の新規機能開発等を担当した後、SREグループマネージャーとして信頼性に関わる業務を担当。2021年3月より執行役員VPoE。

DAY 2: 5/15

Track A

Track B

Track C

5/15 12:30
-
13:15
Track AKeynote

SRE bridge the gap: Feature development to Core API / 機能開発チームとコアAPIチームの架け橋としてのSRE

Yuta Miyama
Track AKeynote

5/15 12:30 - 13:15

SRE bridge the gap: Feature development to Core API / 機能開発チームとコアAPIチームの架け橋としてのSRE

Shopifyという世界規模で成長している会社で、SRE、Production Engineeringのプラクティスがどのように育ってきたか、二つの観点でお話しします。 一つ目は会社全体の歴史として。どういったタイミングでProduction Engineeringモデルが導入され、その中で現在私が所属するResiliencyというSREチームが何を担っているか。 二つ目は、一ソフトウェアエンジニアのキャリア展開として。会社が成長する際に、いかに「分野を超えた積極的なポジション替え」が組織と個人、双方の成長に役立つのかをお話しします。 会社が大きくなるにつれて役割分担と新陳代謝が進み、元々一つのチームがもっていた「システム全体の知識と知恵」が細分化されていきます。SREがそれに対するアンチテーゼだとすると、一個人はどのように振る舞うことでこれを上手に活かし、レベルアップできるのでしょうか。 新参者のSREですが、みなさんと一緒に考えてみたいと思います。

Shopify Senior Developer / Production Engineer

Yuta Miyama

慶應SFC在学中に起業。独学でプログラミングを学び、ベルリンでソフトウェアエンジニアとして転職。チームリード、テックリードを経験する。 その後トロントに移住し、Shopifyカナダ法人にてSenior Developerとして勤務。2022年3月に社内でSREに転向。「お互いの気持ちがわかるエンジニア」を目指して精進中。

5/15 13:15
-
14:00
Track A

AIOps研究録―SREのためのシステム障害の自動原因診断

yuuk1
Track A

5/15 13:15 - 14:00

AIOps研究録―SREのためのシステム障害の自動原因診断

コンテナ型仮想化やマイクロサービスアーキテクチャなどの採用により、クラウド上に展開されるアプリケーションが複雑化しています。オペレーターが複雑なシステムの状態変化を観測可能とするために、システムからメトリクス、ログ、トレース、イベントなどに代表される様々な運用データが常時収集されます。システムが複雑化するほどに、運用データの量が増加するため、システム障害の予防・予測・検知・原因診断・回復のために、オペレーターの認知負荷が高まります。この認知負荷を低減するために、統計解析・機械学習の技術により、運用データを活用して、運用タスクを効率的に自動化するAIOpsが注目されています。しかし、日本国内では、AIOpsの研究や現場での活用がまだ少なく、現段階ではAIOpsは広く認知されていません。 AIOps認知の一環として、本発表では、AIOps領域のうち、システム障害の原因を診断するタスクに着目し、先行研究、時系列解析・因果関係推定のためのモデルの構築、モデルの評価、運用データ生成システムの開発、MLOpsツールを用いた実験管理を、発表者の試行錯誤の過程での失敗も含めて、紹介します。

さくらインターネット株式会社・京都大学大学院情報学研究科 研究員・博士課程学生

yuuk1

SREの研究者。はてなでソフトウェアエンジニアを5年経験した後に、現在はさくらインターネットで研究開発をしながら、博士課程に在籍。TopotalでSREプロダクトのアドバイザーも務める。

Track B

Who owns the Service Level?

Takeshi Kondo
Track B

5/15 13:15 - 14:00

Who owns the Service Level?

SRE の Core Practice である SLI/SLO、実際に活用している組織が増えてきました。私が所属する組織でも2年前から運用を開始、現在も継続して活用しています。 一方で、SLI/SLO を定めることが SRE を組織で実現することの本当のゴールか、というとそうではありません。真のゴールはは信頼性に関する Controlability を組織が獲得することです。 本発表では、「SRE を組織で実現する」ことの意味を、私が所属する組織のこれまでの歴史から考察し、得た知見を紹介します。2年前の SRE NEXT での発表「SLO Review」を振り返り、よかった点とうまくいかなかった点を分析し、まなびを紹介します。 また、Error Budget Policy の運用のために、開発組織の技術戦略との関係についても考察します。開発組織が信頼性に対する投資をどのように考えればいいのかについても実例とともに紹介します。 その Serivice Level が誰のものか、一緒に考えてみましょう。

Recruit Co., Ltd. Engineering Manager

Takeshi Kondo

2018年6月にQuipperに入社。増えていく Product Team に Producton Readiness Check や SLO を導入をリード。2021年より同 SRE Team の EM 任用。開発者が幸せになれる世界を作っていきたい。

Track C

増大を続けるYahoo! JAPAN Kubernetesクラスタ群キャパシティ管理のモダン化

水落 啓太
Track C

5/15 13:15 - 14:00

増大を続けるYahoo! JAPAN Kubernetesクラスタ群キャパシティ管理のモダン化

増大を続けているヤフーKubernetesクラスタ群(1,000+クラスタ, 400,000+コンテナ)のキャパシティ管理をシステム化し、キャパシティプラニングなどキャパシティに関する運用業務健全化に取り組んだ事例を紹介します。 私たちは、ヤフーの各種サービスを支えるプラットフォームとしてKubernetesクラスタを簡単に利用可能とするKaaS (Kubernetes as a Service) を運用するチームです。 旧来システムのシステム刷新や、ビジネスの伸びやキャンペーンに伴うシステム拡張といったイベントに応じて、ヤフーKaaSには、Kubernetesクラスタ利用の需要が絶えず生じています。私たちは、KaaS利用者の需要に答え続けるために、RDB, Go, Grafanaを活用し、Kubernetesクラスタ提供に必要なキャパシティ情報を的確に把握し、キャパシティに関する各業務を迅速・的確に推進するための仕組みを整えました。 SREの一分野であるキャパシティ管理の課題に、SREチームとして取り組む中で得られた知見を交えながら、SREの幅広さ・面白さに迫ります。

ヤフー株式会社 KaaS SRE

水落 啓太

ヤフー株式会社所属。広告システム開発、Private PaaS開発及びPOを経て、現在はKaaS (Kubernetes as a Service) のSRE。KaaSの運用課題改善に努めている。

5/15 14:15
-
15:00
Track A

非ITの事業会社にSREと言わずにSREを持ち込んだ

馬場 俊彰
Track A

5/15 14:15 - 15:00

非ITの事業会社にSREと言わずにSREを持ち込んだ

発表者は取締役・CTO・コンサルタント・エンジニアなどの立場でさまざまな会社・組織・システムの運用や運営に携わってきました。組織もシステムも発足して時間が経つと煮詰まって困りごとが多くなり、いままでのやりかたではどうしようもなくなることがしばしばあります。現場が努力して、いままでのやり方で、パンパンになって崩壊するまで支え続ける、というのがよくある光景です。 発表者は、いよいよ運用が崩壊しそう・崩壊した、というタイミングで専門家として招聘されることがままあります。最初は課題が山積みなので、まず目先の課題を解消し余力を作っていきます。課題解決・改善を進めていく中で適切な解法を選択していくと、自然とコンピュータ・ソフトウェアの力を活用しましょうということになります。SREのポイントを絞りに絞ると「ソフトウェアエンジニアリング」「継続的な学びと改善」の2点になると考えているので、これはSREと言っても過言ではないのでは。 というわけで、本発表では非IT事業会社、IT事業会社、SIer、MSPなど多くの組織でSREを実現・実践してきた体験談と、そこから得た学びや知見を共有します。

株式会社X-Tech 5 取締役CTO

馬場 俊彰

レイヤ高め中心のSRE。コンサルティング・アセスメント、メンタリング・伴走、設計、実装などなど、なんでもやります。株式会社X-Tech 5取締役CTO、株式会社iCARE技術顧問

Track B

Sensible Incident Management for Software Startups

Takayuki Watanabe
Track B

5/15 14:15 - 15:00

Sensible Incident Management for Software Startups

一般的にスタートアップは使えるエンジニアの稼働やお金は非常に限られている。そのためインシデントマネジメント(以下IM)で著名な企業 (e.g. PagerDuty)や Google SRE 本が謳っているような重厚なIMをそのまま導入するとプロダクト開発の鈍化やエンジニアのオーバワークに繋がる。 これはIMが実際のインシデント発生時以外でも様々なプロセスを伴う活動だということに起因する。また、インシデントは頻繁に発生するものではない。そのため IM のルールの策定、決定したIMのプロセスの改善、ドキュメントのメンテナンスはよほど意識していない限り行われることはない。他方で発生時の重要度は極めて高いという特徴を持つ。 IM のこのような性質を踏まえ、発表者はこれらのプロセスやドキュメントは人間が覚えたり整備するものではなく、ソフトウェアの力で強制するべきだと考えている。 本セッションではスタートアップに""必要十分なインシデントハンドリング""の仕組みをロジックを含めて説明し、それらを SaaS、OSS、in-house tool にて無理なく実現する方法を共有する。

Launchable, Inc. Software Engineer

Takayuki Watanabe

Software Engineer for Site Reliability and Developer Productivity

Track C

ZOZOTOWNのProduction Readiness Checklistと信頼性向上の取り組み

小林 明斗
Track C

5/15 14:15 - 15:00

ZOZOTOWNのProduction Readiness Checklistと信頼性向上の取り組み

私たちZOZOTOWN Platform SREチームはZOZOTOWNの成長を加速させることをミッションとしています。2020年4月の発足以来2年間、ZOZOTOWNのリプレイスとマイクロサービス化を推し進め、それらマイクロサービスやそのプラットフォームの信頼性に責任を持っています。 SREチームではZOZOTOWNの信頼性向上の取り組みとしてProduction Readiness Checklistを策定しています。このChecklistはサービスが本番稼働に耐えうる信頼性を満たすことを判定するための基準です。SREチームではサービスリリース前にこのChecklistを基にレビューを行い、リリース判断をしています。 ただし、Production Readiness Checklistは1度策定したら終わりというものではありません。実際にZOZOTOWNではSREチームが遭遇した課題やアーキテクチャ変更に基づきフィードバックを繰り返し、ブラッシュアップし続けています。本発表では、このChecklistを活用した私たちのチームの継続的な信頼性向上の活動を紹介します。

ZOZO, Inc. SRE Team Lead

小林 明斗

2020年7月にZOZOテクノロジーズ(現ZOZO)に入社し、ZOZOTOWNリプレイスPJにSREとして参画。現在はZOZOTOWN Microservices PlatformのSREリードを務める。

5/15 15:15
-
15:45
Track APlatinum Sponsor

組織にSREを実装していくまでの道のり(エウレカにおけるSREの取り組みの歴史)

山本 真嗣
Track APlatinum Sponsor

5/15 15:15 - 15:45

組織にSREを実装していくまでの道のり(エウレカにおけるSREの取り組みの歴史)

エウレカの代表プロダクトであるPairsは順調にサービスが成長し続けており、サービス開始から10年以上が経過した今も、サービスの機能やインフラにほぼ毎日変更や改善が加えられ続けています。 エウレカのSREチームは発足してから4年以上が経ちますが、発足から今日にいたるまでサービスの成長に負けずにむしろ変更速度を加速できるような改善や移行を続けてきました。他にもパフォーマンス改善やセキュリティ強化、モニタリングの構築などなどシステムを支える重要な取り組みを少ない人数でいくつも行なう事で企業とプロダクトに価値を提供してきました。反面でSREという役割の伝播はできておらず、本当に少ないメンバーで広がり続ける責務や組織と相対してきた結果、移譲や関心ごとの共有がうまく行われず、ボトルネックになるような場面も出てきました。 今回のセッションでは、単純にSREの人数を増やすという事だけでなく、組織やサービスのスケールに対して私たちがどのように役割や考え方を変化させていったか、どのように組織にSREを実装しようとしているかを、紆余曲折の部分も交えつつ、お話ししていけたらと思います。

Eureka, inc. SREチーム マネージャー

山本 真嗣

2015年5月に株式会社エウレカに入社。Pairs海外版、国内版の機能開発を担当した後、SREチームでパフォーマンス改善・インフラ全般業務・モニタリングなどの業務を実施。2020年〜SREチームのMgrを担当。好きなものは猫・自転車

Track BPlatinum Sponsor

プルリク作ったらデプロイされる仕組み on ECS

大渡 裕太
Track BPlatinum Sponsor

5/15 15:15 - 15:45

プルリク作ったらデプロイされる仕組み on ECS

CARTA HOLDINGSで広告配信プラットフォームを提供しているfluctでは、広告配信のオペレーションを行なう管理画面の開発において、featureブランチ毎に自動デプロイされる環境を用意しています。 オンプレからクラウド、コンテナへと環境は変化し、現在ではAWSのコンテナ実行環境であるECSを使って実現しています。 また、1日10回以上デプロイされるワークフローを支える仕組みや開発者の手による改善、ARM環境対応を行ってきました。 これらについてどのように実現しているかをお話します。 ・ featureブランチ毎のルーティングを実現するECSサービスディスカバリ ・ GitHub Actions によるデプロイワークフロー ・ ecspresso を使ったECSサービスのデプロイ ・ BuildKitによるキャッシュ利用とマルチアーキテクチャイメージ作成

CARTA HD (旧VOYAGE GROUP, CCI) fluct 開発本部

大渡 裕太

2015年にVOYAGE GROUP(現CARTA HOLDINGS)に新卒で入社し、広告配信プラットフォームを提供する株式会社fluctでエンジニアとして従事。 また同社が主催する、高トラフィックを捌くインフラ構築が体験できるインターンシップ『Sunrise』にて講師を務めている。

Track CGold Sponsor

モダンとレガシーが混在するDMMブックスで培ったSRE Practices

小野 博志
Track CGold Sponsor

5/15 15:15 - 15:45

モダンとレガシーが混在するDMMブックスで培ったSRE Practices

DMMブックスは20年以上の歴史を持つ国内有数の電子書籍サービスです。2019年からオンプレからAWSへの移行を行い、今ではほとんどの機能をAWS上で開発・運用しています。 AWSへの移行によりモダンな構成を取り入れられた部分もありましたが、長い歴史を持つサービスのため、まだまだレガシーな部分も残る部分も多々あります。DMMブックスのSREチームはその課題に取り組むためのチームですが、機能開発・売上向上の責務も一部になっており、モダン化やSREの役割でもある可用性、信頼性の担保に注力できない環境でもあります。そういったDMMブックスのSREチームがどういった風に捉え、解決してきたかをご紹介をしたいと思います。

合同会社DMM.com SRE部 エンジニアマネージャー

小野 博志

新卒でSIerに15年勤務。 その後、2020年より合同会社DMM.comに参画、主にDMMブックスのサービスをSREとして担当している。 2021年よりSRE部のEngineering Managerと活動している。

5/15 15:45
-
16:15
Track A

SLO決定のためのArt of SLO

山口 能迪
Track A

5/15 15:45 - 16:15

SLO決定のためのArt of SLO

SREの実践において、SLIとSLOはまず何よりも重要な要素です。そしてSLOの決定はエンジニア組織だけではなく、サービスに関わるあらゆる組織の参加が肝心です。本セッションではSLOの決定になぜ様々な組織が関わってくるのかを解説し、その上でSLIとSLOの決定プロセスとはどのようなものであるか、Art of SLOというGoogleが公開するワークショップのコンテンツに沿って解説します。

グーグル合同会社 デベロッパーアドボケイト

山口 能迪

グーグル合同会社デベロッパーアドボケイト。クラウド製品の普及と技術支援を担当し、特にオブザーバビリティ領域とSite Reliability Engineering領域を担当。

Track B

プロダクション環境の信頼性を損ねず観測する技術

岩堀 草平
Track B

5/15 15:45 - 16:15

プロダクション環境の信頼性を損ねず観測する技術

SREが担うロールの一つとしてプロダクションのワークロードに対してObservabilityを実装するというものがあります。 一般に観測に要するリソース(CPU/メモリ/ネットワーク)コストは低く、エージェントをデフォルト設定でインストールし動作させていても問題ないことがほとんどでしょう。 しかしながら、思わぬきっかけでこうしたシステムの観測を助け、信頼性を担保するためのエージェントがかえって大量のリソースを消費してしまい、プロダクションの信頼性そのもの影響を与えてしまうということも起こりえます。 本セッションでは実際に発生したこうした事例を元に、有効な対応方法や考え方を紹介します。

グリー株式会社 リードエンジニア

岩堀 草平

2014年よりグリー株式会社、インフラストラクチャ部所属。 主にゲームまわりのインフラ担当とサーバ監視チームのリード的なお仕事をしています。

Track C

長年運用されてきたモノリシックアプリケーションをコンテナ化しようとするとどんな問題に遭遇するか?

吉澤 政洋 (Muzi)
Track C

5/15 15:45 - 16:15

長年運用されてきたモノリシックアプリケーションをコンテナ化しようとするとどんな問題に遭遇するか?

ヌーラボのプロジェクト管理ツール“Backlog”のWebアプリケーション部分は、モノリシックアプリケーションとして開発されてきました。Backlog SREは、開発効率の改善などを目的として、このアプリをAmazon EKSに移行するためのコンテナ化を進めています。 10年以上開発されてきたモノリシックアプリケーションをコンテナ化するにあたり、運用を考慮すると、アプリ自体を改修しなければ解決できない問題がいくつも見つかりました。 この講演では、自社アプリのコンテナ化を検討している方に向けた事例情報として、このコンテナ化プロジェクトで私達が遭遇した問題とその解決方法をご紹介します。また、コンテナ化の完了に向けた今後の計画と、コンテナ化の先に見据える理想像についてもお話しします。

株式会社ヌーラボ SRE

吉澤 政洋 (Muzi)

2017年より現職にてBacklogのSREを担当。SREになる以前はサービス運用監視の研究者、ソフトウェア開発者としての経歴を持ち、SREのシステムと組織の両面に強い関心がある。趣味はボルダリング。

5/15 16:30
-
17:00
Track APlatinum Sponsor

メルカリグループにおけるSREs

@deeeet
@foostan
Track APlatinum Sponsor

5/15 16:30 - 17:00

メルカリグループにおけるSREs

前回のSRE NEXT2020では「絶え間なく変化するメルカリ・メルペイにおけるSREの組織と成長」というタイトルで発表しました。 そこから約2年半が経過して、今回のSRE NEXT 2022ではどのようにメルカリグループが進化したかを踏まえ、複数存在しているSREチームの紹介をいたします。

株式会社メルカリ JP Development Engineering Mgmt

@deeeet

Taichi Nakashima (@deeeet) is an engineering head of Developer Productivity Engineering division at Mercari. Working on Platform engineering and SRE.

株式会社メルペイ JP Development Engineering Mgmt

@foostan

2019年にメルペイに入社、SLOをベースにしたモニタリング基盤の整備や、Enginnering Managerをしています。キーボードは趣味です。

Track BGold Sponsor

Poolにおける開発の足を止めないシステム基盤構築

菅原 元気
Track BGold Sponsor

5/15 16:30 - 17:00

Poolにおける開発の足を止めないシステム基盤構築

カンムの新しいサービスPoolでは、いままでのEC2で運用されているサービスとは異なりECSを採用しました。ECSではインフラストラクチャーの管理にいままでと異なるアプローチが必要になります。開発者がいままでのサービス開発と同様の開発速度を維持するために、どのようにインフラストラクチャーの管理・デプロイ・モニタリング・オペレーションを行っているのか、システムの構成や利用している技術・ツールを踏まえて紹介します。

株式会社カンム インフラエンジニア

菅原 元気

2021年に株式会社カンムにインフラエンジニアとして入社。カンムの新しいサービス Poolの開発にインフラエンジニアとして携わっています

Track CGold Sponsor

組織に対してSREを適用するとはどういうことか

國井 匡生
Track CGold Sponsor

5/15 16:30 - 17:00

組織に対してSREを適用するとはどういうことか

Site Reliability Engineeringには原則があり、今日では様々なプラクティスや事例が紹介されています。しかし、最初のSRE本にも書いてあるにもかかわらず、SREを実践する人々の人間的側面についてはあまり語られません。どのようなシステムもそれを作るのも運用するのも人であり(SREが目指すのが運用をなくすことだとしても)、大抵の場合、一人ではなく組織としてシステムを作っています。信頼性の低い組織からは信頼性の高いシステムは生まれることは考えにくく、組織に対してSREを適用すると考えると見えてくることがあります。 このセッションでは組織がどうやって信頼性を保つことができるかを、チーム発足から5年間の教訓をもとに紹介します。

Visional(株式会社ビズリーチ) HRMOSプロダクト本部 SREグループ Manager

國井 匡生

HRMOS採用のSREは様々なバックグラウンドのエンジニアが集まるチームです。No Opsの世界を目指しており、運用がなくなるようアプリケーション、システム、組織を改善し、持続的に運用可能なサービスにすることで、ユーザーへの価値提供を最大化できると信じています。

5/15 17:00
-
17:30
Track A

街じゅうを"駅前化"する電動マイクロモビリティのシェアサービス「LUUP」のIoTとSRE

0gm (@ktykogm)
Track A

5/15 17:00 - 17:30

街じゅうを"駅前化"する電動マイクロモビリティのシェアサービス「LUUP」のIoTとSRE

Luupでは電動アシスト自転車や電動キックボードなどの電動マイクロモビリティのシェア事業を展開しています。 事業拡大に向けてSREチームが昨年発足されました。 IoTの部分は従来のSREの設計や方法がそのままでは踏襲できない部分があったため、IoTに特化したSREを設計することにしました。 IoTとWeb、アプリではどのようにSREが変わるのか、そしてどのようにSREチームを立ち上げていったかの事例を紹介します。

株式会社メルカリ Reliability Engineer

0gm (@ktykogm)

2017年12月メルカリ入社。JP, US, UKのSREを経て現在はマイクロサービスのEmbedded SREとして複数の開発チームに参加。SRE NEXT立ち上げ。Luup社のSREをお手伝い。

Track B

新規ゲームのリリース(開発)前からのSRE活動

小池 知裕
Track B

5/15 17:00 - 17:30

新規ゲームのリリース(開発)前からのSRE活動

SREといえば稼働中のサービスやWebアプリの可用性の向上を支える・目指すエンジニアとして知られています。 それでは、リリース(開発)前ではSRE として積極的にプロダクトに関わることはないのでしょうか? 私はそうではないと考えます。リリース(開発)前であってもリリース後を見据えた可用性の高いサービスを目指す活動を通して可用性の向上を目指すことはできると考えています。 筆者が今まで新規ゲーム・サービスを設計・開発・運用をしてきた経験をもとに開発時にあらかじめ考慮するべきポイントを解説します。

株式会社ミクシィ 開発本部 CTO室 SRE グループ マネージャー

小池 知裕

2008年1月株式会社ミクシィ入社。SNS mixiでのインフラ、システム運用などを経験後、現在はモンスターストライクをはじめとしたゲームアプリや注力事業の支援、全社的なプロジェクト等々を横断的に幅広く従事している。また若手エンジニアメンバーの育成にも力を入れている。

Track C

よりUXに近いSLI・SLOの運用による可用性の再設計

永野 一馬
Track C

5/15 17:00 - 17:30

よりUXに近いSLI・SLOの運用による可用性の再設計

私たち「タップル」は2018年からAPIのレイテンシや成功率を中心にサービスの可用性を定義し、SLI/SLOの運用をしてきました。 しかし、バックエンドの計測値を中心とした運用では、モバイルアプリケーション側のクラッシュや外部サービス側のインシデント等、ユーザーや事業が期待する信頼性を全てカバー、担保することが難しいという課題がありました。 そこで、タップルではモバイルアプリケーション側で計測されるログを中心に、よりユーザのUXに近いSLI/SLOを再設計しました。これにより、事業側がサービスの信頼性の把握とコントロールをしやすい状態を作りました。SLI/SLOをビジネスサイドのメンバーも含めて事業判断や優先度のコミュニケーション材料として説得力のある指標として利用できるようになりました。 本発表では再設計した実際の指標や、再設計するにあたって考慮した問題、採用技術について具体的にお話しします。また、SLI/SLOをどのように事業側とのコミュニケーションに役立てているかについても合わせてご紹介します。

株式会社タップル SRE for Mobile

永野 一馬

2019年より株式会社サイバーエージェントに入社。もともとiOSエンジニアとして活動していましたが、2021年よりSREチームにジョインし、現在はサービスの信頼性を高めるミッションに取り組んでいます。

5/15 17:45
-
18:10
Track ACo-Chair Talk Session

SRE NEXT 2020 → 2022 Conference Chair トーク

北野 勝久
Takashi Narikawa
Track ACo-Chair Talk Session

5/15 17:45 - 18:10

SRE NEXT 2020 → 2022 Conference Chair トーク

SRE NEXT2022 2日目の最終盤であるこの時間帯は、前回のSRE NEXT 2020 にて Conference Chairを務めた @katsuhisa さん、今回 SRE NEXT 2022 でConference Chairを務めている @nari さんのお二人にて、SRE NEXT 2022の感想戦を行います。 また、直近の数年間でSRE分野に対する話題性や注目度が大きく変化した期間を経て、SRE NEXTとしてどのような変化やDiversityを感じたのか、SREコミュニティについて今後どのように変化していくかについて、ざっくばらんに語っていただきます。

株式会社スタディスト 執行役員 VP of Engineering, SRE NEXT Founder/2020 Chair

北野 勝久

SRE NEXT Founder。株式会社スタディストにて自社プロダクト Teachme Biz の新規機能開発等を担当した後、SREグループマネージャーとして信頼性に関わる業務を担当。2021年3月より執行役員VPoE。

Eureka, inc. SRE NEXT 2022 Chair

Takashi Narikawa

SRE NEXT 2022 Chair。 SREプラクティスをより民主化・一般化し、様々な領域で語られる一助となればと今回のSRE NEXTを企画した人。 VR/サウナ/音楽が好き。