SRE

SRE (Site Reliability Engineering)からPE (Platform Engineering)へ

Platform Engineeringチームの加藤です。PEチームが昨年後半から提供を始めたプラットフォームに1つ目のプロダクトの乗り入れが完了し、PE活動の一つの節目を迎えたため、オプティムにおけるPlatform Engineering活動を紹介します。 PE活動は元SREチームのメ…

オプティム提供サービスの「早い」「安い」「安心」を目指して(SREチームでの2年間の取り組み紹介)

SRE

こんにちは、3月までSREチームのマネージャーをしていた和田です。今回は、私がSREチームを担当した2年間で考えてきたことをご紹介します。 背景 取り組みテーマ Production Ready活動 コスト最適化活動 ふりかえり さいごに 背景 SREチームは2019年度まで…

IT研修で作ったアプリをEKSにデプロイしました

自己紹介 初めまして。21新卒で入社いたしました、技術統括本部SREユニットの岡田です。 大学院在籍時にPythonを使用した機械学習でのデータ解析を行っていましたが、入社まで運用はもちろん開発も未経験でした。社内でのIT人財教育プログラム(IT研修)ののち…

新鮮なアクセストークンを求めて(k6編)

こんにちは、SREの福谷です。 毎月投稿を目標にしようと考えていたのですが、早くもネタ切れの気配に怯えています。 あらすじ OAuth 2.0のトークンリフレッシュに非対応なツールがある 特にアクセストークンの有効期限が短い場合、アクセスできなくなる問題…

Docker HubのRate Limitにやられた話

はじめまして、SREに所属している福谷といいます。 普段はKubernetes, Terraform, CI/CD等インフラに近いモノと格闘していることが多いです。 よろしくおねがいします。 ところで皆様、Docker Hubはお使いでしょうか。 かなり時間が経ってしまいましたが、Do…

AWS上の開発/検証環境を利用時間外に停止することでインフラコストを削減した話

はじめに こんにちは、プラットフォーム技術戦略室SREチームの山田です。 今回はOPTiM Cloud IoT OSを運用する上で問題になってきたインフラコスト肥大化に対する最適化の対応の一つとして 開発/検証環境を利用時間外に停止し、インフラコストを削減した内容…

Production Readyと開発プロセス改善

SRE

こんにちは。プラットフォーム技術戦略室SREチームの津田(@grim0h)です。 昨年の6月以来の投稿になります。 今回は、Cloud IoT OSに対して行なっているProduction Ready活動について紹介します。 ( この記事はInfra Study Meetup #3のLTで話した内容を詳細化…

Kubernetesを用いたMongoDBクラスタの構築と運用

はじめまして。プラットフォーム事業本部の栗原です。 業務では、主にCloud IoT OS チームにてSRE活動を行っています。 今回は、Cloud IoT OS(以下CIOSと記載します)で利用しているMongoDBクラスタの構築と運用についてお話をします。 構築に至った経緯 自前…

Load Impact/k6 を使用した負荷試験の実施

はじめまして。オプティムのプラットフォーム事業本部 Cloud IoT OSチームの津田です。 普段は、Cloud IoT OSのSREチームとして、キャパシティプランニング・パフォーマンスチューニングを主に行なっています。 さて、今回はキャパシティプランニングの中で…