GoogleのAIを活用したファイル形式検出システム「Magika」が、11月6日、オープンソースとして正式にリリースされた。
Magikaは、数ミリ秒以内にバイナリファイルとテキストファイルを正確に識別する、AIを活用したファイルタイプ識別システム。Magikaのアルファ版は昨年初めにリリースされ、オープンソースコミュニティで広く採用されてきた。
今回、サポートするファイルタイプが100種から200種以上に拡大したほか、Rustによって書き直された高性能エンジンによって、毎秒数百のファイルを安全にスキャンできるパフォーマンスを実現した。
新たに検出可能になったファイルの種類には、データサイエンスやML向けのJupyter Notebook(ipynb)、Numpy 配列(npy、npz)といったファイル、Swift、Kotlin、TypeScriptといった数十の言語とフレームワーク、さらにDockerfilesなどのインフラストラクチャ・ビルドファイルなどが含まれている。
Magikaの利用を開始するには、コマンドラインを入力してダウンロードするか、Webブラウザ上のデモを試すことができる。詳細はブログポストを参照のこと。
- 関連リンク
この記事は参考になりましたか?
- この記事の著者
-
CodeZine編集部(コードジンヘンシュウブ)
CodeZineは、株式会社翔泳社が運営するソフトウェア開発者向けのWebメディアです。「デベロッパーの成長と課題解決に貢献するメディア」をコンセプトに、現場で役立つ最新情報を日々お届けします。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
