First to Try, First to Fail, First to Recover
「誰ガ為のアルケミスト」では、サーバーサイド言語としてNode.jsが採用されている。Node.jsはサーバーサイドで動くJavaScript環境だ。シングルスレッド、ノンブロッキングI/Oによるデータ送受信、イベントループによる動作などの特徴を持つ。
「今から3年ほど前、gumiにおけるNode.jsでの開発実績はゼロでした。当社のサーバーサイドのコア言語はもともとPythonだったんです。ではなぜNode.jsが採用されたかというと、『Node.jsはイケてそうな言語だから』『話題になっているから取り入れてみよう』といった安直な理由でした(笑)」
こうした理由でも導入できたのは、同社の行動指針である「First to Try, First to Fail, First to Recover(誰よりも早く挑戦し、失敗し、そして復活する)」に起因している。つまり、新しい分野にチャレンジすることや、その経験から何かを学び取る姿勢が重要視されるということだ。
「とはいえ初期の頃は、Node.jsを用いて適切な開発ができていたとは言い難い状況でした。実装について振り返ると、まずデータベース周りについてはモデル化されていませんでした。ORMがなかったんです。また、XAトランザクション(分散トランザクション)も、マイグレーション関係の機能も未実装でした。当時のスクリプトを見ると、頑張ってALTER TABLE文を書いていた形跡がたくさん残っています」
さらに、サーバー周りについても当時はまだまだ多くの課題があったという。
「デプロイはファイルをSCP転送して、手動でプロセスをリスタートしていました。さらにNode.jsのデーモン化もできておらず、もしもプロセスが落ちたらそのまま死にっぱなし。Logに関しても、収集方法が実装されていませんでした」
こうした数多くの課題を、3年間の歩みのなかで改善し続けてきたのだという。この経験をもとに、的野氏は大規模システム開発における教訓を語った。
「たとえ最初はエンジニアの人数が少なかったとしても、開発が長期間になるにつれてどんどん増えていきます。コードの品質を安定化するため、早めにコーディング規約などを定めておいた方がいいでしょう。また、賛否両論はあるかもしれませんが、ORMを導入しておいて損はないと思います」
また、負荷分散について考えておくことは重要だという。当然ながら、アクセス量が多くなると1つのデータベースでは絶対に耐えられない。最初からスケールアウトやトランザクション整合性などを考慮したつくりにしておくべきだ。
「長期にわたって運用し続けることを念頭に置き、デプロイやマイグレーションの方法についても最適化しておきましょう」