メニュー
閉じる

リレーコラム データサイエンスの新地平
~オルタナティブデータ活用最前線~
第12回 オルタナティブデータ推進協議会の人材育成に向けての取り組み

2022年11月21日
北山朝也 / AlpacaJapan株式会社 Chief Product Officer

「オルタナティブデータ」と呼ばれる非伝統的な情報を用いた資産運用の最新動向について、認知拡大や業界ルール整備などの活動を展開する、オルタナティブデータ推進協議会(JADAA)関係者によるリレーコラム。

12回はJADAAの人材育成委員会における取り組みについて同委員会メンバーでAlpacaJapan株式会社 CPOの北山朝也氏に解説いただいた。

11回「オルタナティブデータを活用したトップダウンアプローチ」【後編】はこちら


オルタナティブデータとは、金融機関が投資判断にデータを活用する中で、従来から使われている金融向けの定型的なデータ(例として株式の注文情報や企業の財務情報など)以外の、非金融のデータや非定型のデータのことを言います。

JADAAは2021年2月5日にオルタナティブデータの活用を推進することを目的として設立された団体で、その活動は主に理解醸成、レギュレーション、人材育成、企画の4つの委員会の活動から構成されています。

本稿では、人材育成委員会を務める私がその活動の目標と実施してきた事項について報告いたします。オルタナティブデータの活用を検討されているアセットオーナーやオルタナティブデータ分野の人材育成を行う企業の参考になれば幸いです。

スキルセットの定義と事例集の作成

まず、人材育成委員会が結成された当初、スキルセットの定義づけにトライしました。これは、どのようなスキルセットがオルタナティブデータの活用に必要かを定義することで、今後の方向性を明確にしようとしていたためです。

結果的に、このスキルセットは100以上に細分化されたのですが、実際にスキル定義をしてみると、各社が実際のプロジェクトで利用したスキルの集合体になってしまいました。しかし、本来のオルタナティブデータのプロジェクトは、ビジネススキルとテクニカルスキルが密接に絡み合い、テクニカルスキルだけでは推進できないことが指摘され、テクニカルスキルにフォーカスするのではなく、ビジネススキルのための題材をまずはリリースするべきという議論が行われました。

そこで、次に活動として実施したのが事例集の作成です。こちらは最終的に16個の事例を集めることができ、「オルタナティブデータ活用事例集 2021」としてリリースすることができました。この事例集は以下のURLから無料でダウンロード可能です。各事例には、利用したデータ、分析対象、期待効果、分析した手法、利用したツール、モデル構築や運用面での苦労、考慮点等実務上のノウハウが詰まっています。ぜひご覧ください。
https://alternativedata.or.jp/wp-content/uploads/2021/12/f19fbffdb81dc86b5c9566c6fd88915d.pdf 

通番

会社名

事例

1

AlpacaJapan株式会社

AlpacaFlow – 為替ブローカー向け収益最大化AIソリューション

2

株式会社東京証券取引所

銘柄別信用取引週末残高の日次推計

3

リフィニティブ・ジャパン株式会社

サステナブルファイナンス/ESG領域におけるオルタナデータ活用

4

リフィニティブ・ジャパン株式会社

テキスト(ニュース&SNS)分析を為替売買シグナル生成に応用

5

リフィニティブ・ジャパン株式会社

新型コロナ感染症対策の医療体制維持を支援

6

株式会社Deep Data Research

全上場企業の全開示データ(開示時刻/URL/ヘッドライン/分類等)

7

株式会社Deep Data Research

上場企業約500社の月次データベース

8

株式会社Deep Data Research

月次企業保有特許価値評価データ(ESG関連タグ含む)

9

株式会社ナウキャスト

日経POSデータ

10

株式会社ナウキャスト

日経記事データ

11

株式会社ナウキャスト

JCB消費NOW

12

株式会社ナウキャスト

BCN POSデータ

13

株式会社ナウキャスト

KDDI位置情報データ

14

ニッセイ基礎研究所

オフィス出社率指数

15

株式会社電通国際情報サービス

AIによる自動審査

16

株式会社エムデータ

TOPIX Core30 × テレビデータ 検証結果

この事例集を利用して、どのようなオルタナティブデータがビジネスになっているかの事例を示すことができました。これらを眺めてみると、各社が時系列データだけではなく、ニュースやSNSのテキストデータ、POSデータや位置情報など、多くの非定形データを活用していることがわかると思います。これはまとまった事例の情報がリリースされた日本でも初めてのドキュメントであったため、非常に好評でした。

オルタナティブデータ活用チュートリアル

事例集で紹介したような取り組みをビジネスで実践するには人材の厚みが重要となります。委員会の議論の結果、次は企業・大学などの実務で利用可能なテクニカルスキルを学べるチュートリアルをリリースするという目標が立てられました。

このチュートリアルを作成する上でわれわれは以下の3つの壁に遭遇しました。

・データの壁: そもそも、金融データ自体が高価なので、自由にチュートリアルで使える環境に置けるのか

・実行環境の壁: データを自由に使えても、データを外に持ち出したりダウンロードしたりすることはできない環境が必要

・作成の壁: 有意義なチュートリアルを作るのは非常に大変。本当に実務的なノウハウを公開できるのか

これら3つの壁をそれぞれ協議会の参加メンバーの力で克服しました。

まずデータの壁は、日本取引所グループ(JPX)が提供する「JPXデータサンドボックスプログラム」という枠組みを活用しました。こちらは、JPXが推進する証券データを用いた新たなサービス創出を業界横断的に支援するための新たな枠組みであり、QUICK社がJADAAの趣旨に賛同しデータを提供。JADAAがデータを活用するという枠組みでデータの壁を突破しました。



次に、実行環境の壁はSINGNATE社のSIGNATE Questという教育プラットフォームを利用することで克服しました。この環境はブラウザ上でPython(パイソン)というプログラミング言語を利用してデータ分析を行うことができ、かつデータを外に持ち出せない仕様になっています。



最後に、作成の壁は私の所属企業であるAlpacaJapan社がデータ分析のノウハウを提供することになりました。当社は、2021年にJPX総研が主催した株式データ分析コンペ「J-Quants」に技術協力を行っています。このコンペは、延べ1500人を超えるデータサイエンティストが参加し、株式データ分析においては日本最大のものですが、そこにもチュートリアルを提供しノウハウを培っていたことも、非常に役立ちました。

結果的に高品質なチュートリアルを作成することができ、現在このチュートリアルはJADAAの各企業に提供するとともに、慶應義塾大学の教育プログラムでも活用が開始されようとしています。

その内容は、「オルタナティブデータとは」から始まり、データセットの読み込み、データセットの可視化、オルタナティブデータの基礎分析、目的関数の設計、特徴量設計、データの評価、モデルの構築までをカバーする非常に広範囲なものです。すべてPythonのソースコード付きで提供されており、実務的なノウハウをブラウザ環境だけで学習することができます。

現在、複数の大学から活用の問い合わせも寄せられており、このようなチュートリアルを活用して学生がオルタナティブデータの分析方法を学習し、その活用が広がっていくことを期待しています。チュートリアルの活用に興味がある方はぜひJADAA人材育成委員会(jinzai@alternativedata.or.jp )までメールをいただければ幸いです。

北山朝也

AlpacaJapan株式会社 Chief Product Officer

10年間ソニーに在籍し、PlayStationのサポートチームのマネージャーとしてゲームタイトル開発者とPlayStation開発チームの橋渡しを行う。2015年よりAlpacaに参画し、金融機関とのさまざまな金融 x AIのプロジェクトを企画・実施。現在はChief Product OfficerとしてAlpacaJapanの証券プラットフォームの開発を統括。慶應義塾大学・慶應義塾大学大学院卒、2008年度IPA未踏スーパークリエータ。

よく見られている記事ランキング