ディー・エヌ・エーは29日、技術セミナー「DeNA Technology Seminar #2」を開催した。ソーシャルプラットフォームの裏側にフォーカスして3月に開催されたセミナーに続き、2回目の開催となる。今回のテーマは「MySQL」。社外の講師も交え、モバゲータウンの膨大なトラフィックを支えるディー・エヌ・エーならではの実践的なチューニングネタ、ハックネタが紹介された。
アプリに変更を加えずにDBの分散管理を実現する
「Spiderストレージエンジン」
MySQLの特徴の一つに、「ストレージエンジン」(SQLパーサーと分離されたデータ管理部分の実装)を自由に選べることがある。斯波健徳氏はその実装の一つ、「Spiderストレージエンジン」について紹介した。
Spiderストレージエンジンは、大規模データベースを細かく分散管理する「Database Sharding」を可能にするストレージエンジン。複数のデータベースサーバーに分散したテーブルを束ね、1つのテーブルとして利用できるようにし、トランザクションもサポートする。アプリケーションの変更が不要なため、導入も容易。
導入事例として、動画検索サイトの「sagool.tv」や、角川グループのコンテンツを横断検索できるサービス「KADOKAWord.jp」、行動ターゲティング広告配信技術の「マイクロアド」を紹介した。いずれもレコード数やトラフィックの増加に伴うデータベース参照性能の低下を改善させた例だ。
今後の予定については、MySQLのフォークの一つである「MariaDB」へのバンドル、MariaDB 5.3で利用可能なBKA(テーブルのJOINを高速化する機能)への対応、レプリケーションのエラー発生時にリトライを行うパッチなどを挙げた。
SQLをショートカットして
パフォーマンスを向上させるプラグイン
株式会社ディー・エヌ・エー システム統括本部 IT基盤部の樋口証氏は、非SQL処理でMySQLのパフォーマンス最適化を行うプラグイン「MySQL handlersocket plugin」を紹介した。MySQLサーバーのSQLパーサーを介さずに、独自プロトコルでストレージエンジンを直接たたくことで、単純なCRUD処理の高速実行を実現するもので、クライアントライブラリはC++とPerlの2つが用意されている。
単純な参照クエリでの検証では、数倍~10倍程度の差が出たという。高速化の要因としては、「SQLパース処理をしていないこと」「リクエストを集約実行していること」「独自プロトコルで通信すること」の3点を挙げた。中でも独自プロトコルについては、もともとの結果セットのメタデータが大きいため、想定より効果があったと述べている。
今後の課題としては、ビルド時にmysqlのソースコードが必要なため導入が多少面倒なこと、バージョンやビルドオプションの違いによる互換性の問題、InnoDB以外での検証、部分的なread-modify-write操作のサポート、クライアントライブラリの整備などを挙げた。
テスト運用中のため一般公開はしていないが、今後BSDライセンスでの公開を予定しているという。公開の際には、ディー・エヌ・エーの技術者ブログで告知されるようだ。
MySQL 5.5の新機能
最後に、「漢のコンピューター道」の奥野幹也氏が、現在マイルストーンリリース(ベータ版)で提供されているMySQL 5.5の新機能を紹介した。
InnoDB Plugin 1.1によるInnoDBの性能改善や、4バイトUTF-8対応、準同期のレプリケーション、より柔軟になったパーティショニングといった機能詳細を順次解説しつつ、総評として「性能が向上しつつ利便性も向上したMySQL 5.5は正しい進歩を遂げた」とまとめた。詳細については、slideshareで公開されている発表資料を参照するとよいだろう。
また、安定性を重視して設計されているMySQLにおいても、レプリケーションまわりを初めとするトラブルは避けられないと述べ、トラブルシューティングの心構えとして、トラブルは想定外の事象のため決まったセオリーはなく、「仕様を理解する」「自分で再現してみる」「ソースコードを読む」「OSに詳しくなる」といったMySQLに詳しくなる努力が肝要だと述べた。
今回のセミナーは発表から4日ほどで満席になる人気セミナーだったようだ。当日の様子はUstream(の録画番組)や#denatechでも確認できる。
ディー・エヌ・エーでは、今後も2か月に1回程度のペースで継続的に開催していきたいとしている。興味を持った方はブログやtwitterをチェックしておくとよいだろう。