はじめに
計算機用言語の処理には決まった方法があります。文字列で与えられた言語は、字句解析によってトークンに分けられ、構文解析によってトークン同士が結びつけられ、意味解析によって解釈されます。
字句解析を行うプログラムが字句解析器(lexer)、構文解析と意味解析を行うのが構文解析器(parser)です。字句解析器としてはlexあるいはflex、構文解析器としてはyaccあるいはbisonが有名で、資料も豊富にありますが、いずれもC言語で利用することを想定したソフトウェアです。
PHPで利用できる字句解析器としてはPHP_LexerGeneratorが、構文解析器としてはPHP_ParserGeneratorがあります。本稿では、簡易電卓を実装するという例を通じてPHP_LexerGeneratorとPHP_ParserGeneratorの使い方を紹介します。
必要な環境
XAMPP for Windows 1.6.4に含まれるPHP 5.2.4で動作を確認しました。利用したPearのパッケージは次のとおりです。
- PHP_ParserGenerator 0.1.5
- PHP_LexerGenerator 0.3.4
準備
必要なパッケージを次のようにダウンロード・インストールします(コマンドの実行前に、c:\xampp\php\pear.iniの「"\xampp」を「"C:\xampp」に修正。ディレクトリはインストール先に応じて適宜読み替えてください)。アルファ版のためドキュメントに不備がありますが、パッケージ(.tgz)に含まれるサンプルでそれを補えるでしょう。
c: cd \xampp\php pear download PHP_ParserGenerator-alpha pear install PHP_ParserGenerator-0.1.5.tgz pear download PHP_LexerGenerator-alpha pear install PHP_LexerGenerator-0.3.4.tgz
実装する言語
本稿で実装するのは簡易電卓のための言語です。「10 + 2.1 * ( 3 + 1 )」という文字列が与えられたときに、これを正しく解釈して計算するのが目標です。
インタプリタ型言語であるPHPは、実行中にインタプリタを利用することができますから、先述の文字列を変数$str
に格納して、eval("echo $str")
などとすれば目的は達せられますが、これが可能なのは、たまたまここで考えている言語がPHPの一部であるからです。言語を実装するというのはこういうことではありません。本稿で紹介する方法を応用すれば、PHPとまったく異なる言語であっても、PHP上で処理できるようになります。
先に述べたように、独自の言語の処理にはlexerとparserを利用するのが一般的ですが、自分で一から処理系を書くことももちろん可能です。Lexerとpaeserを使うという汎用的な方法に比べれば実行時の性能は高くなりますが、実装自体がかなり大変です。本稿で考えているような簡易電卓でさえも、かなり複雑なプログラムになります(参考文献(1)にそのようなプログラムの例が掲載されています)。