データ分析に関する記事とニュース
-
-
2020/12/18
ディープラーニングによる時系列データ予測モデルの問題点を解消する
本稿では、NTTテクノクロスでAIエンジニアとして活躍する筆者が、実際にどのようなことを行っていて、どのような苦労があるのかを、実際に動かして試せる「時系列データの予測モデル作成」の題材を通して、4回にわたってお伝えします。最終回となる今回は、これまでに作成した予測モデルを振り返り、時系列データを用いた予測モデルを作成する際に起きやすい問題とその対応方法をお伝えいたします。(編集部)
-
2020/12/17
Microsoft、データをビジネスの戦略的資産とするための分析プラットフォームを発表
2020年12月3日(日本時間 12月4日)、Microsoftはオンラインイベント「Shape Your Future with Azure Data and Analytics」を配信し、Azure Synapse AnalyticsやAzure Purviewなどデータ分析に関する新しいAzureのサービスを紹介した。
-
2020/10/29
データ分析コンペ「Kaggle」でスキル習得! 初心者がPythonで挑戦できる入門書
10万人以上のデータサイエンティストが参加するデータ分析コンペの「Kaggle」。データ分析の初学者にはやや敷居が高いように思われますが、チュートリアル用のコンペも用意されており、実力を問わず挑戦できるのが魅力です。CodeZineを運営する翔泳社では、データ分析やKaggleに興味がある方のために、参加方法からデータ分析の手法まで解説している入門書『Pythonで動かして学ぶ!Kaggleデータ分析入門』を発売中。今回は本書から、著者の篠田裕之さんがデータ分析の力とKaggleの魅力を語った...
-
2020/06/01
ディープラーニングによる時系列データ予測モデル――精度を高める2つの方法とは?
本稿では、NTTテクノクロスでAIエンジニアとして活躍する筆者が、実際にどのようなことを行っていて、どのような苦労があるのかを、実際に動かして試せる「時系列データの予測モデル作成」の題材を通して、4回にわたってお伝えします。第3回では、予測モデルの精度を向上させる2つの方法をお伝えいたします。(編集部)
-
2020/05/26
IRISのインターオペラビリティ機能を使いこなそう(後編)~OpenAPIを利用したRESTサーバの構築
この連載では、InterSystems IRIS Data Platform(以下IRIS)を使って車載器から発生するデータを扱うIoTアプリケーションの構築方法を紹介しています。これまでの連載をまだご覧いただいていない方は、ぜひこの機会にお試しください。
-
2020/03/31
IRISのインターオペラビリティ機能を使いこなそう(前編)
この連載では、InterSystems IRIS Data Platform(以下IRIS)を使って車載器から発生するデータを扱うIoTアプリケーションの構築方法を紹介しています。これまでの連載をまだご覧いただいていない方は、是非この機会にお試しください。
-
2020/02/14
AIサービスの開発に求められる予測性能以外のこととは?データ粒度の詳細化を例に学ぶ
本稿では、NTTテクノクロスでAIエンジニアとして活躍する筆者が、実際にどのようなことを行っていて、どのような苦労があるのかを、実際に動かして試せる「時系列データの予測モデル作成」の題材を通して、4回にわたってお伝えします。第2回では、PoC(概念実証)進行中にサービス性向上のため、当初の目標スコープからの追加・変更があった場合、どのようなことが起こるのかをお伝えします。(編集部)
-
2020/02/03
Visual Studio Codeを使ってIRISのクラスを定義してみよう
連載の前回では、InterSystems IRIS Data Platform(以下IRIS)のインターオペラビリティ機能を使ってMQTTブローカに接続する方法をご紹介しました。これまでの連載をまだご覧いただいていない方は、ぜひこの機会にお試しください。今回は、Visual Studio Codeを使ってIRISのクラス定義を行う方法をご紹介したいと思います。
-
2019/12/24
データサイエンスとは何か? 『事例で学ぶ!あたらしいデータサイエンスの教科書』から第1章を公開
様々な領域のデータを収集できるようになった今、データサイエンスに基づく意思決定や社会課題の解決に期待が寄せられています。その手法を学ぶにあたっては、そもそもデータサイエンスがどういうものなのかを知っておかなければなりません。横浜市立大学データサイエンス学部の初代学部長である岩崎学さんが解説する『事例で学ぶ!あたらしいデータサイエンスの教科書』(翔泳社)から、「第1章 データサイエンスとは」を抜粋して紹介します。
-
2019/12/20
ディープラーニングを用いた時系列データの予測モデルの作り方
本稿では、NTTテクノクロスでAIエンジニアとして活躍する筆者が、実際にどのようなことを行っていて、どのような苦労があるのかを、実際に動かして試せる「時系列データの予測モデル作成」の題材を通して、4回にわたってお伝えします。第1回では、プロトタイプで想定するサービスが作れるかを検証するPoC(概念実証)の辺りをお伝えします。(編集部)
-
2019/12/06
データプラットフォーム「IRIS」からMQTTプロトコルを利用してみる
前回は「まずは動かしてみよう!」と題してInterSystems IRIS Data Platform(以下IRIS)を使ったIoTアプリケーションを紹介しました。まだ試していない方は、ぜひ前回の記事をご覧ください。以降の連載では、そのアプリケーションの開発手順を解説しながら、IRISのさまざまな機能を体験していただきたいと思います。今回は、IoTアプリケーションで使用されることの多いMQTTプロトコルを、IRISから利用する方法について解説します。
-
2019/10/15
データプラットフォーム「IRIS」を、まずは動かしてみよう!
前回は、InterSystems IRIS Data Platform(以下IRIS)が誕生した背景やIRISの設計思想などについて説明しました。その中でも述べましたが、IoTの拡がりなどに伴い大量のデータが発生する時代になり、機械学習/AIを活用してデータを分析するニーズが高まっています。真に価値ある成果を引き出すには、データを収集・統合し、高いパフォーマンスでアクセスできるデータプラットフォームが求められます。また、アプリケーションを迅速に開発できることも、データプラットフォームに必要な要...
-
2019/09/19
複雑化するソフトウェア開発環境にどう対応するのか―RPA、AI時代のデータ活用、データプラットフォームを考える
AI/機械学習が全盛の時代、急速に変化するIT環境の中で、日々刻々生成される膨大なデータを扱うアプリケーション開発にも、大きな変化が求められます。この連載では、大きく変革するIT環境の中、多種多様で膨大なデータを扱うアプリケーション開発の一つのアプローチとして、インターシステムズ製品を使ったシンプルなアプローチをご紹介します。
-
2019/07/25
GCPでリアルタイムデータ基盤を内製――ユーザー体験を向上させる事例の紹介
スキマ時間で情報を収集できるスマートフォンの普及に伴い、Web上でリアルタイムに接客するニーズは高まる一方です。本連載ではその流れに対応するべく、リアルタイムなストリームデータ活用を実現する基盤(hacci:ハッチ)を内製した事例を紹介します。第1回では基盤に用いられた技術やアーキテクチャについて解説しました。第2回となる本稿ではリアルタイムデータ基盤の実際の導入事例や、今後の展望をお伝えします。
-
2019/06/12
何のためにデータを分析するのか? 『スケーラブルデータサイエンス』が教えるデータエンジニアの役割
データ分析の目的はレポートやグラフの作成ではありません。翔泳社から発売した『スケーラブルデータサイエンス』では、その目的を「ビジネスで成果を出すためのより良い意思決定」としています。今回、データサイエンスのノウハウを詳細に解説した本書から、データ分析の目的やデータエンジニアの役割について説明した第1章の一部を紹介します。
-
-
2018/12/12
定番のPython機械学習ライブラリ「scikit-learn」ではじめての学習モデル作成から改善まで
本連載ではプログラミングの基本は理解しているが、より実践的なデータ解析に取り組みたい方を対象に、スクリプト言語によるデータ解析の実践を解説します。スクリプト言語の中でも特にデータ解析環境が整っているPythonをとりあげ、対話型解析ツールやライブラリによるデータ解析の実行・可視化の方法をを解説します。第4回となる本稿ではPythonによる機械学習を解説します。まず機械学習の概観について確認し、Jupyter Notebookとライブラリscikit-learn使った機械学習の手順を解説します。...
-
2018/11/30
国内最大規模のデータで「社会の課題」を解決できるよろこび――現役データサイエンティストが語る“仕事の魅力”
データの利活用ニーズの急増とともに、日本でも注目度が高まっている「データサイエンティスト」。エンジニアとの接点も増える中、実際にどのような仕事をしているのか、気になる方も多いだろう。そこで、国内最大規模のデータと最先端のデータ処理・分析技術をもつデータサイエンティスト集団「ARISE analytics」で、実際に活躍中の2人に登場いただき、その仕事の内容ややりがい、スキル習得、職場環境などについてうかがった。
-
2018/11/15
Pythonではじめての統計~基本情報の確認から検定まで
本稿ではプログラミングの基本は理解しているがより実践的なデータ解析に取り組みたい方を対象に、スクリプト言語によるデータ解析の実践を解説します。スクリプト言語の中でも特にデータ解析に役立つライブラリや環境が整っているPythonをとりあげ、対話型解析ツールやライブラリについて導入から解析の実行・可視化までを解説します。本稿ではPythonによる統計データ解析を解説します。まず統計の概観について確認し、Jupyter Notebookを使った基本統計量の確認・相関・検定の手順を解説します。