BIGLOBEの「はたらく人」と「トガッた技術」

データセンター系インフラエンジニアがクラウド化する道のり

こんにちは。石下です。BIGLOBEでインフラエンジニアのグループリーダーを務めています。

私はNEC(BIGLOBEは元々NECの一部門でした)からBIGLOBEに移籍後、サーバ構築/Apache/Mail/DNSを経て、DB/APサーバ/Storageとオンプレのインフラ中心にやってきました。

現在は、Amazon Web Services(AWS)ファーストを推進すべく、自身の、そしてチームのクラウド化を推進しています。

石下 隆一

石下 隆一(いしげ りゅういち)

基盤本部 クラウド技術部 クラウドプラットフォームグループ グループリーダー

※撮影時のみマスクを外しています。

 

クラウド技術部について

 

今回は、私が所属する基盤本部 クラウド技術部とその仕事内容についてご紹介します。この部のミッションはAWSファーストによる持たざる経営の実現、そしてクラウドを活用して開発スピードを向上させ、事業課題解決に取り組むこと。そして、私がグループリーダーを担うグループのミッションは、オンプレ・AWSに関わらず、「速い、安い、旨い」をBIGLOBE内部に実感させることです。

そんななかで、オンプレのシステム設計、サーバ構築、設定変更、サーバ・ストレージの維持・管理に加えて、AWS関連の予算・移行管理、オンプレ・AWSのノウハウ蓄積と展開を行っています。

BIGLOBEではインフラ起点でクラウド活用を広めてきました。そのため、サービス開発やシステム開発といった視点がまだ弱いかなという感じですが、中にはサーバレスでサービス・システム開発を行っているチームもあります。このようなチームからもノウハウを蓄積し、展開を図っています。

そして、特に困っているのがクラウドの利用費管理です。日々リリースされる新サービスや新機能、我々では管理できないさまざまな割引プラン。これらをどう活用すれば最適な利用費になり、かつ将来の予測精度をどこまで上げられるか。システムアーキテクチャーの変更を伴う場合、どうすれば安価で安全なのかなどなど悩みどころはいっぱいです。

当グループでは、このような課題を一緒に解決に向けてチャレンジしてくれる仲間を募集しています。クラウドがどういうものかを理解した上で、従来のさまざまな制約にどう合わせるか、どう変えるべきかを自ら考え、チームとして実行していける方、他チームを導いてあげられる方と一緒に働くことができればと思っています。

 

クラウド化の一例

 

クラウド化を推進するなか、ストレージ管理者として最大の驚きだったのが、オンプレNASのバックアップをクラウド化したことで、保守切れ対応、相見積、発注、検収、構築、障害対応と言った、ビジネスに直結しない仕事から解放されたこと。さらに、需要増だけでなく、需要減にも対応できるようになったことです。

実は、このおかげで某ベンダーから「国内最大のクラウド〇〇利用者はBIGLOBEさんです」と言われたのもちょこっと嬉しかったです。

クラウドなので、やってみてダメだったら消して、何度でも最初からやり直せる、誰かにお願いせず自分でできるというのが大きなポイントです。

この経験を活かして、オンプレDBのバックアップもクラウド化しています。

オンプレ時代にはコスト重視によるサービス方針の転換で、膨大な在庫を抱え、処理に困ったことがありました。クラウドだったら、消して使わないようにしてしまえば何も困りませんが、オンプレではそうはいきません。また、消してしまってやり直せないという状況も経験しました。これもリソースの制限によって、バックアップが取れないとか、既存環境に手をいれなければいけないというオンプレの制約にも一因がありました。クラウドなら、同じものを作ってから試してみる、バックアップしてから、別の環境で試してみるということが簡単に、安価にできます。

ただ、どちらも組織間、メンバー間の意識や認識のズレも一因だと考えています。このようなズレがないことを確認することで、一歩ずつ改善を図っています。これはクラウドでも同じで、こういうことをやりたいという想いが、一緒にやっている人に正しく伝わっているか確認することが必要だと考えています。

f:id:yoshitomotomo:20220307131832j:plain

 

オンプレミスの制約

 

BIGLOBEでは数千台のサーバ、PBクラスのストレージのほか、各種ネットワーク機器、外部と接続するバックボーンネットワークの機器などがデータセンタに存在しています。

このようなオンプレを支えるにあたって、どうしても必要になることは大きく以下の5点です。誰しも経験し、誰もがこれって会社の利益にどう繋がっているのだろうと疑問に思っている点かもしれません。

・新装置の導入(選定、検証、相見積、稟議、発注)
・維持業務(保守契約、更新、金額交渉、保守切れ対応)
・キャパシティ管理(性能、容量、使用率など)
・在庫管理(所要確認、保守部材確保、不良在庫削減)
・故障対応

オンプレでは一度モノを買うと、償却期間は5年間。その間、無事に稼働させつつ、需要増減に対応、3~5年でHWやSWの保守切れがあるので入替の準備、そして実際の入替作業が発生し続けます。

どれ一つとっても、1日で終わるレベルの業務ではなく、1人でこなせるレベルでもありません。また、既存サービスの維持でしかなく、ビジネスへの貢献をなかなか実感できません。その代わり、個人・チームで沢山のノウハウを蓄積できて、専門性はどんどん高まります。

 

クラウドのメリット

 

オンプレで蓄えたノウハウや専門性はクラウドでもかなり活かせる部分があります。
例えば、どんな評価をすれば安全に使えるのか、こんな機能を組み合わせたらもっと楽に運用できるかも、などです。
今までは自分たちで作らないといけなかったものが、時間単位の利用費で簡単に使えます。

オンプレからクラウドに移行してみると上記の業務がどうなるかと言いますと、

・新装置の導入
 検証すれば新機能を即利用可能
・維持
 保守はクラウドベンダーが実施するので検証のみ実施
・キャパシティ管理
 使うなら増やせば良い、使わないなら減らせばいい、オンプレでは減らせなかった
・在庫管理
 そもそも在庫を抱える必要なし
・故障対応
 クラウドベンダーが実施するので、完全に開放

このように今まで、1つの装置の導入だけで6人/月位かかっていたところ、1人で、しかも2,3日でできるようになります。そして、維持にかけていた膨大な工数を、システムの変更による品質向上やコスト削減、もしくは新しいサービスの創出に振り向けることが可能になります。

ちょっとしたアイデアやクラウドベンダーが提供しているサービスを活用して、自身の業務を楽にすることがクラウドエンジニア化への最初の一歩になると考えています。

現在、AWSとはエンタープライズサポート契約を締結しており、AWSの優秀なソリューションアーキテクトと月1で利用状況や新しい技術情報の共有をしています。また、サービス単位でソリューションアーキテクトとシステムアーキテクチャーの検討をしたり、プロフェッショナルサポートサービスから移行の支援を受けたりして、新しい技術に触れる機会に満ちています。

 

目指すところ

 

オンプレからクラウドへの移行で持たざる経営を実現します。これで需要変動に柔軟に対応できるようになりますが、ゴールではありません。クラウドへの移行はアーキテクチャーをほとんど変更しない、いわゆるLiftで行っています。次にやるべきはネイティブ化です。アーキテクチャーを見直し、クラウドのメリットをフル活用できるようにしていきます。更にその先として、クラウドベンダーが提供するサービスやシステムの組み合わせを考えて、将来維持しなければならない開発を最小限に抑えた上で、誰が作っても同じ、何度でもやり直しできる、どこにでも展開できるサービス・システムを構築していけるようになっていきたいです。

最終的なゴールは、エンジニアが自分の、チームの、他チームのスキルを活用して、エンジニア視点でお客さまが便利だ、快適だと感じられるサービスそのものを産み出している姿です。

 

働く環境

 

まずは、品質・セキュリティ面について。良い点なのか悪い点なのかは意見が割れるところですが、品質・セキュリティに非常に重きが置かれています。作業工程でいろいろな審査をクリアする必要があり大変ですが、品質を保つために避けては通れません。

また、どんな働き方をしているのかについても触れておきます。
今もなおコロナ禍ということもあり、リモートワーク継続中です。そんななか、出社していたときには感じていなかった不便さがいろいろ見えてきました。
なかでも、コミュニケーションロスは大きな問題です。Web会議ツールを使っても、直接顔を合わせていた時と比べると、やはり不便さを感じてしまいます。
そのため、まん延防止等重点措置や緊急事態宣言が解除されている期間は週1日以上出社し、以前のようなコミュニケーションの場を確保しています。

当グループは社員が少ないこともあり、派遣社員や委託先パートナーの方々の協力を得て、共にどう前に進んで行こうかということを常に考えています。特に、社員しか知りえない社内組織の関係性をメンバーと共有し、メンバーが動きやすくする点にこだわっているためコミュニケーションは不可欠なのです。

リモートワークでも、出社でもコミュニケーション良く、チーム、部、他部門と連携を取って業務を進められるところを目指していますが、2年経った今でも100%ではありません。それでも、仮想デスクトップを導入するなど、改善を図ってくれているメンバーもいます。

f:id:yoshitomotomo:20220310091119p:plain

また、社員の行動指針であるビッグローブマインドについてもご紹介します。技術屋なのでその中でも「トガる」、「すばやく判断する」の2つが具現化されており、非常に大事なマインドだと考えています。

一方、基盤を預かる身としては「プロフェッショナルになる」、「変化に挑む」、「幸せを支える存在になる」とのバランスを取ることも大切です。ひたすら安全に重きをおき、変化に取り残されてしまえば、プロとしては失格ですし、幸せもやってきません。しかし、危険を顧みずトガって、エイヤで新しいものを使い始めても、やっぱり不幸を呼び込みます。どう両立させていくか、どう目利きとしての力を活かしていくかがポイントだと考えています。

BIGLOBEは常に新しいものに触れることができます。当然チャレンジして失敗したケースも多々あります。ですが、次の成功に繋げられるチャンスを与えてくれる会社なので、ビッグローブマインドを体現する機会がたくさんあるのも魅力のひとつです。

そのため、「やりがい」は自分次第でいくらでも広げられます。私自身はというと、障害が起きてしまった時にとにかく解決しようと必死に向き合うのですが、姿を見て周りからは障害ジャンキーと呼ばれることがあります。誤解がないように言うと、そこには「これまでに培った自分の技術を生かせる場だ」という認識があるからです。誰にも負けない技術を身につけて、障害対応に限らず仕事に活かしていくことにとてもやりがいを感じています。

 

まとめ

 

クラウドを活用して、お客さまに直接提供するサービスをエンジニアが創っていく。そんな世界を目指しています。

オンプレとは比べ物にならない幅の広さ、変化の速さに対応しなければなりません。日々勉強し、スキルを磨き続けていきたいという希望を持った方と是非一緒に仕事をさせていただきたいと思います。

 

www.biglobe.co.jp

 

※ Amazon Web Servicesは、米国その他の諸国における、Amazon.com, Inc. またはその関連会社の商標です。
※ 記載している団体、製品名、サービス名称は各社またはその関連会社の商標または登録商標です。