はじめに
Curlでは、Curl開発者向けに技術情報サイト「Curlデベロッパーセンター」を公開しています。前編では、このサイトの「逆引きリファレンス」で紹介している記事の中から、Webアプリケーションに必要な機能の1つであるデータ操作に着目して「バリデーションチェック」と「ActiveXを使用したExcelデータ操作」を紹介しました。
後編となる今回は、XMLフォーマットの利用方法として「SAXパーサー」と「DOMパーサー」を使った解析方法について紹介していきます。
Curlアプリケーションは、クライアントサイドに特化したWebテクノロジーです。従来Webサーバが行う画面の制御やデータ分析などの処理をクライアントに分散させ、サーバとの通信は必要に応じてXMLなどのデータのみとすることで、サーバ負荷を軽減し、レスポンスの向上を図ります。
Curlアプリケーションの実行環境Curl RTEでは、このデータ形式であるXMLデータを解析するXMLパーサーを標準装備しています。このXMLパーサーを用いれば、サーバから返されたXMLデータをCurlのオブジェクトに変換し、Curlアプリケーションで使用できます。
必要環境
- Curl RTE 5.0以上
XMLフォーマットの利用(SAXパーサー)
Curlでは、標準APIとしてSAX機能が用意されています。SAXはXML文書を先頭から順番に解析し、発生したイベントをアプリケーションでキャッチして処理するAPIです。次項で紹介するDOMに比べ、解析速度が速く、メモリの消費量が少量で済むというメリットがあります。ノードの追加、削除など、XML文書を更新する機能はありません。
ここでは、SAXパーサーを利用したXML解析方法について、下記サンプルXMLを用いて紹介します。
<RecordSet> <Record name="AAA"> <Value>"123"</Value> <Value>"456"</Value> </Record> <Record name="BBB"> <Value>"xyz"</Value> </Record> </RecordSet>
SAXパーサーを使用するためには、まずDefaultHandlerクラスを継承したイベントハンドラを作成します。このクラスのstart-document、end-document、start-element、end-element、charactersメソッドを実装します。下記サンプルは、それぞれのメソッドで取得したXMLの値などの結果を、outputプロシージャにて表示させています。
{define-class public MySAXApp {inherits DefaultHandler} {constructor public {default } {construct-super} } {method public {start-document}:void {output "#start-document"} } {method public {end-document}:void {output "#end-document"} } {method public {start-element uri:String, name:String, qname:String, atts:Attributes }:void {output "#start-element"} {output " タグ = " & name} {output " 属性名 = " & {atts.get-local-name 0}} {output " 属性 = " & {atts.get-value 0}} } {method public {end-element uri:String, name:String, qname:String }:void {output "#end-element"} {output " タグ = " & name} } {method public {characters ch:StringBuf, start:int, length:int }:void {output "#characters"} {output " 要素 = " & ch} } }
各XML構文解析イベントを受け取り、呼び出されるメソッドの説明は下表の通りです。
メソッド | 説明 |
start-document | ドキュメント開始の通知を受け取ります |
end-document | ドキュメント終了の通知を受け取ります |
start-element | 要素の開始の通知を受け取ります。XMLドキュメント内の各要素の開始時にこのメソッドを起動します |
end-element | 要素の終了の通知を受け取ります。XMLドキュメント内の各要素の最後にこのメソッドを起動します |
characters | 文字データの通知を受け取ります |
XML構文解析イベントの流れとしては、まずstart-documentメソッドが実行されます。ノードを読み込むとstart-elementメソッドが実行され、タグ名や属性などを取得できます。次に、start-elementメソッドが終了すると、charactersメソッドが実行され、テキストを取得できます。最後に終了タグを読み込むため、end-elementメソッドの中身が実行されます。
これらのハンドラの呼び出し方法は、以下のようにSAXパーサーを作成し、set-content-handlerを使用して、上記で作成したイベントハンドラを登録します。
{let xr:XMLReader = {SAXParser}} {let handler:MySAXApp = {MySAXAppt}} {xr.set-content-handler handler}
そして、SAXパーサーのparseメソッドを使用してXMLデータを解析します。
{xr.parse {InputSource system-id = XMLデータのURL}}
#start-document #start-element タグ = RecordSet 属性名 = <null> 属性 = <null> #characters 要素 = #start-element タグ = Record 属性名 = name 属性 = AAA #characters 要素 = #start-element タグ = Value 属性名 = <null> 属性 = <null> #characters 要素 = "123" #end-element タグ = Value #characters 要素 = #start-element タグ = Value 属性名 = <null> 属性 = <null> #characters 要素 = "456" #end-element タグ = Value #characters 要素 = #end-element タグ = Record #characters 要素 = #start-element タグ = Record 属性名 = name 属性 = BBB #characters 要素 = #start-element タグ = Value 属性名 = <null> 属性 = <null> #characters 要素 = "xyz" #end-element タグ = Value #characters 要素 = #end-element タグ = Record #characters 要素 = #end-element タグ = RecordSet #end-document
XMLフォーマットの利用(DOMパーサー)
続いて、SAX機能のほかにも、XMLフォーマットを扱うために、Curlでは拡張コンポーネントのWSDKにDOM(Document Object Model)機能が用意されています。
DOMパーサーを使用するためには、まずWSDKをインストール及びデリゲートする必要があります。
DOMは、XMLをツリー構造として扱うため「DOMツリー」と呼ばれています。XML全体を解析してDOMツリーとしてメモリ上に保存するため、データの多いXMLを解析する場合は多くのメモリ領域が必要になります。
ここでは、DOMパーサーを利用したXML解析方法について、下記サンプルXMLを用いて紹介します。サンプルは、XMLから取得した値の結果をoutputプロシージャにて表示させています。
<RecordSet> <Record name="AAA"> <Value>"123"</Value> <Value>"456"</Value> </Record> <Record name="BBB"> <Value>"xyz"</Value> </Record> </RecordSet>
XMLの読取り
XMLフォーマットをデータモデルに変換する場合、build-xmlプロシージャを使用します。build-xmlプロシージャの戻り値はXDMDocumentオブジェクトになります。build-xmlプロシージャで解析可能なデータはUrl、StringInterface、TextInputStream、ByteInputStreamです。
let xml:XDMElement = {build-xml preserve-whitespace? = true, XMLデータ}
XMLの解析
XMLを解析するために、まずXDMElementのrootでルートの要素を取得します。また、各子要素を取得するにはget-elementsメソッドを実行します。取得した要素から属性を取得するにはattributes、テキストを取得するにはget-textを利用します。以下に、コメント入りでサンプルを掲載します。
||build-xmlプロシージャを用いて、XMLをのCurlのXML構造体オブジェクトに変換します。 ||更に、build-xmlの戻り値であるXDMDocumentから、そのXMLのルートとなるエレメントを取得します。 let root:XDMElement = {build-xml preserve-whitespace? = false, XMLデータのURL}.root ||以下XMLの解析 ||get-elementsメソッドで、エレメントを取得します。 let record-elements:{Array-of XDMElement} = {root.get-elements} {for record-element:XDMElement in record-elements do ||attributesアクセッサで、属性を取得します。 {output "Record attribute = " & record-element.attributes["name"]} let value-elements:{Array-of XDMElement} = {record-element.get-elements} {for value-element in value-elements do ||get-textメソッドでテキストを取得します。 {output " Value text = " & {value-element.get-text}} } }
Record attribute = AAA Value text = "123" Value text = "456" Record attribute = BBB Value text = "xyz"
まとめ
今回は、前後編にわたりCurlのデータ操作に着目して紹介してきました。これらはCurlのAPIのほんの一部分にすぎませんが、そのほかにもCurlデベロッパーセンターの「Curl開発者ガイド」では、Curlが提供する豊富なAPIの解説やサンプルなどを掲載しています。業務系のWebアプリケーションをより効率的に開発するために、APIを活用してみてはいかがでしょうか。
参考資料
- Curl開発者ガイド:SAX XML インターフェイスの使用
- XML Data
- Transforming XML
- Using XPath(Curlプログラムのダウンロード)