米Apacheソフトウェア財団の、高性能アプリケーション構築のためのソフトウェア開発プラットフォームであるApache Arrow開発チームは、最新版となる「Apache Arrow 3.0.0」を1月25日(現地時間)にリリースした。
Apache Arrowは、分析アルゴリズムのパフォーマンスと、あるシステムまたはプログラミング言語から別のシステムまたはプログラミング言語へのデータ移動の効率を向上させるよう設計されている。インメモリ列形式を採用しており、計算ルーチンと実行エンジンはデータの大きなチャンクをスキャンして反復する際に、効率を最大化できる。
最新版となる「Apache Arrow 3.0.0」では、Arrow列形式ですでにサポートされていた、Decimal256形式のデータ型が、C++およびJavaで実装されるようになった。
また、FlightについてはC++/Java/Pythonでの認証を見直し、より柔軟な認証方式と標準ヘッダの使用が可能になっており、Cookieのサポートも追加されている。なお、C++/Javaにおける実装は、他のFlight実装との相互運用性を高めるべく、メッセージ解析をより寛容にした。
そのほか、C++においてデフォルトのメモリプールが実行時にARROW_DEFAULT_MEMORY_POOLを使用して変更できるようになり、C#では.NETパッケージにおいてFlightクライアントとサーバの初期サポートが追加され、Pythonでは「Python 3.9」サポートの追加、および「Python 3.5」サポートが削除されるなど、数多くの変更が行われている。また、バージョン4.0.0の共有コミュニティロードマップの作成も開始された。
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です