米Microsoftは、AIを利用したデータ分析環境「Data Formulator」の新版を公開した。Data FormulatorはMITライセンスで公開しているオープンソースソフトウェア。
Data FormulatorはMicrosoftの研究開発部門であるMicrosoft Researchが開発し、2023年10月に初めて発表したものだ。分析対象のデータを投入すると、データの項目などをドラッグアンドドロップで操作できる環境を提供する。さらに、「上位10件だけに限定」など、自然言語による指示にも対応する。
ただし、当初公開したバージョンは、ユーザーの指示を受けてグラフなどの形で結果を提示するときに、2通りの結果を提示して、ユーザーがどちらかを選ぶ形になっていた。今回公開したバージョンでは、ユーザーインターフェイスを見直したほか、ユーザーの指示を受けて生成した結果として1つだけを提示するようにした。
Data Formulatorは3段階の手順で、結果を生成する。まず、データ視覚化に向けた標準フォーマットである「Vega-Lite」のスクリプトを生成し、続いて大規模言語モデル(LLM)にデータの集計の方法などを指示する。その結果、LLMがユーザーの指定通りのグラフなどを提示する。
Microsoftは、Data Formulatorの試用環境をGitHub Codespaceで提供しており、OpenAIのAPIキーを取得すれば簡単に試用できる。試用の際には、LLMとしてGPT-4oを使うことを推奨している。
Microsoftはデータ分析の作業について、見方を色々と変えるなど、複雑な考え方が必要であり、グラフの作成などの作業では同じようなコードを何度も繰り返し書かなければならないと表現している。AIで大幅な省力化ができれば、今後のデータ分析作業は大きく変化していくと考えられる。Microsoftは今後、構造化できてないデータから、重要なデータを損失することなく、データを整理する方法や、ユーザーが曖昧な目的しか持っていないとしても、ユーザーを支援してデータ分析の明確なゴールに導く方法などについて研究しているという。
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です