「データテクノロジー」記事一覧
-
2022/04/22
未来はここにある ほぼすべての業界で応用される機械学習をマスターするための『なっとく!機械学習』
「未来はここにあります。そしてその未来には「機械学習」という名前が付いています」と、『なっとく!機械学習』(翔泳社)の著者であるLuis G.Serranoさんは言います。本書は予測型の機械学習モデルとその応用方法を解説しており、これから機械学習を学んで使いたいエンジニアのための1冊です。今回は「まえがき」など本書で何が学べるのかが語られたパートを紹介します。
-
2022/04/18
データサイロ化とコストの課題を克服してノバセルが迅速にデータ基盤を構築できた理由【デブサミ2022】
運用型テレビCM「ノバセル」を提供しているノバセル社は、ビジョンとして「マーケティングの民主化」を掲げ、マーケティングのプランニングを民主化し、広告効果を民主化することを進めている。このビジョンを達成するためにノバセルは、データドリブンな意思決定を加速している。デブサミ2022では、「ノバセルの急成長を支えるために、爆速でデータ基盤を構築した話」というタイトルで、ノバセルがどのようにデータサイロ化やコストの課題を克服し、迅速にデータ基盤を実現できたのかを、ノバセル株式会社CTOの戸辺淳一郎氏が...
-
2022/04/14
レコメンドアルゴリズム「BPR」による推薦システムの実装と、SVD・WARP手法との比較【推薦システム入門】
データをもとに、ユーザーが気に入りそうなアイテムを推薦する推薦システムは、通販サイトや求人サイトなど、生活のいたるところで利用されています。本連載では推薦システムについて学びたい開発者やデータサイエンティスト、およびプロダクトのユーザー体験を向上させたいと考えている方向けに、接触履歴情報のみを用いる「暗黙的フィードバック」を使った推薦システムの概要と代表的なアルゴリズム、およびそれらの長所と短所を解説します。第2回と第3回は、行列分解の手法のうち、最も基本的なアルゴリズムである特異値分解(SV...
-
2022/03/31
MySQL互換のスケーラブルなデータベース「TiDB」とは? リアルタイム分析にも最適【デブサミ2022】
クラウドネイティブなアプリ開発において、スケーラブルなデータベースとして普及が進むNewSQL。本セッションでは、PingCAPが開発するNewSQLのオープンソースデータベース「TiDB」の特徴やメリットについて、PingCAPでCTOを務める林正記氏が解説した。
-
2022/02/28
ヤフーのデータサイエンスそして研究開発のトップが語る、AIのサービス導入から最先端の研究まで
2022年2月3~4日、ヤフー主催の技術イベント「Yahoo! JAPAN Tech Conference 2022」がオンラインで開催された。2日目のキーノートでは、ヤフー社内でデータと機械学習をどのように活用してサービスの改善につなげているのか、Zホールディングス全体でAIを社会実装していく上で、どのような準備をしているのかについて、キーパーソンの二人が語った。
-
2022/02/25
NASAやNetflixも利用するデータ分析・活用基盤「Elastic Stack」とは? 環境構築からデータ投入方法まで解説
データサイエンス・デジタルトランスフォーメーション(DX)が注目されている昨今、多種多様なデータ活用が求められています。本連載では、データ活用プラットフォームとしてさまざまな方面で進化を続けているElastic Stackの活用法を、実際に手を動かしながらユースケース別に紹介します。既に別のツールを使われている方の2つ目の選択肢としてももちろん、まだ使い慣れているツールがないデータ活用初学者の方の1つ目のツールとして、Elastic Stackが使えるようになることを目指していきます。第1回と...
-
2022/02/21
「AIテックカンパニー」を目指すヤフー。目指す世界像や、その実現に向けて不可欠な要素・戦略とは?
2022年2月3日より、ヤフー主催の技術イベント「Yahoo! JAPAN Tech Conference 2022」がオンラインで二日間に渡り開催された。初日のキーノートでは、「AIテックカンパニー」を目指すヤフーが、目指す世界の実現に向け、それを成し遂げるために必要な要素や戦略について、キーパーソンの二人が語った。
-
2021/12/14
自然言語処理とPythonで「群馬」と「栃木」の違いをコンピューターに見分けさせるには?
自然言語処理の面白さを知ってほしい、と執筆された『コピペで簡単実行!キテレツおもしろ自然言語処理』(翔泳社)。著者のyouwhtさんが取り上げるのは「メロスの激おこ具合を冷静に可視化する」や「もしAIが三国志を読んだら。孔明や関羽のライバルは誰なのか?」など、遊べるテーマばかり。今回は本書から、コンピューターに「群馬」と「栃木」の違いを見分けさせる方法を解説したパートを紹介します。
-
2021/12/13
どうして機械が学習できる?入門書で挫折した人でも図解で機械学習を学べる『Python3年生』
機械学習はその名のとおり「機械」が「学習」する仕組みです。しかし、なぜそんなことができるのでしょうか。その基本をしっかり理解し、仕組みや構造をイメージできるようになる学習書が『Python3年生 機械学習のしくみ』(翔泳社、森巧尚)。今回は本書から、「人工知能ってどうやって作るの?」と疑問を持つフタバちゃんに、ヤギ博士が機械学習の初歩から解説するパートを紹介します。人工知能や機械学習に興味があるけれど、入門書でもコードや数式が難しくて挫折してしまった人におすすめです。
-
2021/11/22
『データサイエンスの無駄遣い』著者が解き明かすデータ分析の面白さ――「人間にとってのわかりやすさを超越する」ということ
「データサイエンス」と聞くと、難しそうな印象を持つ人は多いだろう。そんな人に読んでいただきたいのが、この1冊、博報堂DYメディアパートナーズの篠田裕之さん著『データサイエンスの無駄遣い 日常の些細な出来事を真面目に分析する』である。現役のデータサイエンティストが分析するのは、「飲み会での孤立」「LINEの既読スルー」など、日常生活において起きそうな事象ばかり。読み終えた頃にはデータサイエンスがぐっと身近に感じられるに違いない。果たしてエンジニアに「データ分析」という視点が加わったらどうなるの...
-
2021/11/04
漫画のキャラに強制的に感情移入できる電子デバイスを開発!『データサイエンスの無駄遣い』
研究やビジネスなど様々な用途で活用されるデータサイエンスを無駄遣いするとしたら? データサイエンティストの篠田裕之さんが作ってしまったのが、漫画のキャラに強制的に感情移入できる電子デバイス。その開発方法が解説された『データサイエンスの無駄遣い』(翔泳社)から、デバイスがどのような仕組みで動くのかを紹介します。
-
2021/10/28
ストラテジーゲームの人工知能がタスクをこなすための技術「階層型タスクネットワーク」とは?
ゲームAIの研究・開発において第一線で活躍されている三宅陽一郎さんの著書『戦略ゲームAI 解体新書』(翔泳社)。本書ではストラテジーゲームやシミュレーションゲームに利用されている人工知能のモデルの1つとして「指揮官としての人工知能」が取り上げられています。後編となる今回は、大きなタスクをより小さなタスクへ分割して接続する意思決定の方法である「階層型タスクネットワーク」(時間の階層化)について解説されたパートを抜粋。なお、前編では「チームと空間の階層化」を紹介しています。
-
2021/10/21
ストラテジーゲームにおける指揮官としての人工知能、制御の要となる「チームと空間の階層化」を解説
ゲームに不可欠となった人工知能について、多くの作品に携わってきた三宅陽一郎さんが解説した『戦略ゲームAI 解体新書』(翔泳社)。本書ではストラテジーゲームとシミュレーションゲームに利用されている人工知能の技術に焦点が当てられ、3種類のゲームの人工知能が紹介されています。この記事ではその中から「指揮官としての人工知能」を取り上げ、前編として人工知能を制御するために重要な「チームと空間の階層化」について抜粋します(例として『HALO』と『KILLZONE 2』が登場)。後編では「空間の階層化」を取...
-
2021/09/15
Google ColaboratoryとPythonでAI技術の基礎を学ぶ~『あたらしい人工知能技術の教科書』より
Udemyの人気講座「AIパーフェクトマスター講座」が、CodeZineを運営する翔泳社より書籍化。『Google Colaboratoryで学ぶ!あたらしい人工知能技術の教科書』として発売中です。今回はブラウザとPythonでAI技術の基礎を学ぶ本書から、その概要とAIの活用例について紹介します。
-
2021/09/09
Insight Edgeの事例で学ぶ、現場に寄り添うデータ分析&活用の進め方【デブサミ2021夏】
金属や建機、インフラ、メディア、不動産、資源など幅広い分野で事業を手がけ、81か国に1,000社近くの連結対象会社を展開する総合商社の住友商事。そんな同社のビジネス課題をアジャイル開発やデータ分析などを通じて解決し、DXの推進や価値創造を支援するのが、内製エンジニア集団のInsight Edgeだ。幅広い分野でさまざまな案件を手がけてきた同社が目指すのは、信頼できるパートナーとして現場に寄り添いながら、現場自らがデータ分析できるソリューションを提供すること。同社が実際に手がけた不動産価格予測モ...
-
2021/09/08
行列分解を用いた推薦システムを実装してみよう!【推薦システム入門】
データをもとに、ユーザーが気に入りそうなアイテムを推薦する推薦システムは、通販サイトや求人サイトなど、生活のいたるところで利用されています。本連載では推薦システムについて学びたい開発者やデータサイエンティスト、およびプロダクトのユーザー体験を向上させたいと考えている方向けに、接触履歴情報のみを用いる「暗黙的フィードバック」を使った推薦システムの概要と代表的なアルゴリズム、およびそれらの長所と短所を解説します。前回は、接触履歴情報のみのデータである「暗黙的フィードバック」を用いた推薦システムのう...
-
2021/06/28
推薦システム初心者におすすめの手法「行列分解」とは? ~特異値分解からCB2CF法によるコールドスタート問題解決まで~
データをもとに、ユーザーが気に入りそうなアイテムを推薦する推薦システムは、通販サイトや求人サイトなど、生活のいたるところで利用されています。本連載では推薦システムについて学びたい開発者やデータサイエンティスト、およびプロダクトのユーザー体験を向上させたいと考えている方向けに、接触履歴情報のみを用いる「暗黙的フィードバック」を用いた推薦システムの概要と代表的なアルゴリズム、およびそれらの長所と短所を解説します。前回は、推薦システムの概要と、実装に必要なリソースを解説しました。今回は、推薦システム...
-
2021/06/23
未来を創るための人工知能を利用する倫理的責任とは?『なっとく!AIアルゴリズム』より
人工知能(AI)の利用は現実に倫理面の問題を引き起こしており、開発者・利用者は責任を伴った意思決定をしなければなりません。AIを形成するアルゴリズムを解説した書籍『なっとく!AIアルゴリズム』(翔泳社)では、最新のテクノロジーを利用する際の倫理や法律に関する問題が「まえがき」で語られています。
-
2021/05/31
AIやIoTなどで高まるデータの重要性。今、データベース技術の「学び」が重要に! NTTデータのデータベーススペシャリストに聞く
現在、IT技術が幅広い領域で使われ、IoTの進展などにより膨大なデータが生まれています。データ活用の形もさまざまで、従来は定型的なデータ処理が多かったものの、今ではAIなど多種多様な方法で利用されており、新たな価値、サービスを生み出しています。こういったデータ中心の時代にあって、いかにしてデータを効率的に保存し、さまざまな形で柔軟に取り出せるようにしていくのかが重要になっています。そこで今回、NTTデータ 技術革新統括本部 技術開発本部のデータベーススペシャリストである藤井雅雄氏に話を聞きまし...
-
2021/05/24
機械学習モデルを実用化してビジネス価値を生み出す「機械学習システム」とMLOpsとは
機械学習をシステムに組み込んで運用するMLOpsに2015年頃から取り組んでいる澁井雄介さんが執筆した『AIエンジニアのための機械学習システムデザインパターン』(翔泳社)。機械学習システムの設計や運用の手法をまとめたデザインパターンを解説した本書から、機械学習システムとMLOpsについて書かれたパートを抜粋して紹介します。