業務フローの見直しが正解への近道
体制を立て直すこと2回。改善フェーズに入り、あとはリリースを待つのみとなった2022年11月。加藤氏たちの前に再び課題が立ちはだかった。CUEBiC Analyticsの停止とtrocco✕Redshiftへの切り替えについて、関係者向けに説明会を行った際に、CUEBiC Analytics停止反対の声が多数上がったのだ。ヒアリングしたところ、業務フローの中で使いたい機能があるというのが大半だった。
そこで加藤氏たちは、CUEBiC Analyticsを並行稼働しながら、出そろった要望を対応可能なものと対応できないものとに分類。全体最適のための優先度を説明しつつ、調整を重ねた。
併せて、過去に挙がっていた要望のうち、業務フローを改善することで解決でき、しかも改善することでメリットが得られるものを整理。たとえば、BIツールに出力したあとはチームごとに独自集計するといった非効率な業務フローを改善できないか検討した。
こうしてようやくアーキテクチャの方向性が固まり、アップデートが実施された。運用者からの要望を受けて、CUEBiC Analyticsで慣れ親しんだユーザーインターフェイスでデータ設定部分を新基盤に追加。また、Tableau Server REST APIからGoogleスプレッドシートに必要なデータをインポートするツールを作成し、運用者の学習コストを低く抑えながら新しい環境への移行を進めた。
業務フローを意識した改善は、業務効率の改善にもつながった。エンジニアは運用保守および開発に、DX推進チームは業務設計運用サポートに、事業部はデータの設定・更新・分析により注力できるようになったと尾﨑氏は述べる。
「要望は尽きることなく、すべてを新アーキテクチャで網羅することは不可能だ」。そう話す尾﨑氏は、アーキテクチャ改善で気付いたポイントを2つ挙げた。
1つは、業務フローの見直しが正解への近道という点だ。「実は当初、ASPもtroccoとのAPI連携でデータ取得を自動化するなど、アーキテクチャ側の改善にばかり目を向けていた。しかし実際は、ASPのAPI数が想定よりも少なく、そもそもASP周りのデータがデータベースに保持されておらず、むしろ変更によって業務側のスピードが低下する恐れが出てきた」。尾﨑氏はそう説明しながら、ASPに関してはAPI連携をやめてGoogleドライブに成果データなどを格納したあとのフローを自動化する方向に切り替えたという。
2つめは、運用ミスを救済する仕組みを実装することだ。「既存のRDSでは運用ミスでデータが再取り込みされる不具合があった。こうした不具合を解消することも重要だが、暫定的な対策をすぐに実行できる体制を設けておくことも大切だ」。この不具合については、任意の期間のデータが再度取り込まれた場合は、Redshiftの本番テーブルのデータを削除し、その後に中間テーブルのデータを挿入するという処理で対応できるようにしたという。
本格的なデータ基盤を目指して
現在、新生データウェアハウスは精度の高い売上高フォーキャストを提供するキュービックの新たな基幹システムとして活用されている。
「まだCUEBIC Analyticsが並行稼働している状態。今後は7月をめどに、運用者からの要望などに対処しながら切り替えを進めていく」(加藤氏)
もちろん、それだけではない。加藤氏たちは新生データウェアハウスを本格的なデータ利活用の基盤へ進化させるつもりと明かす。
「今は広告成果の集計にとどまっているが、今後は弊社サービスでのユーザー体験を向上させる、機械学習を活用したカスタマー分析ができるようにしたい」(加藤氏)
取り組みは着々と進行中だ。機会があれば、機械学習基盤の構築におけるアンチパターンも紹介していきたいと加藤氏。「本講演が少しでも役に立てたら幸いだ」と語り、セッションを終えた。