データ市場 代替データ・オルタナティブデータ

「日経オルタナティブデータカンファレンス Autumn 2019」に参加した感想

先日「オルタナティブデータカンファレンス Autumn 2019」という日経主催のイベントに行ってきました。このイベントは前回もされていて100人MAXで今回は250人MAXという非常に人気のあるイベントです。抽選制でダメ元で興味範囲で応募したところ、なんと奇跡的に抽選受かりました。正直150%無理だと思っていたので驚きです。

結論から言うと、オルタナティブデータは主に3つのテーマに絞られていたような気がします(独断と偏見)。そのテーマとは:

今回のイベントのポイント

  • オルタナティブデータはまだ発展途上
  • データの価格設定
  • データ分析は長期的

その他にも様々な事が議論・プレゼンテーションされていたのですが、あまりにも情報量が多すぎたので、またの機会に書ければと思います。
日経主催という事で、最近では非常にオルタナティブデータ関連のニュース記事が出ていたので、3つほど探してきたので興味があれば読んでみてください。

 

オルタナティブデータはまだ発展途上

まず最初は海外のオルタナティブデータの使用状況をAlternatinvedata.orgからのデータを元にプレゼンされていました。そして、メインの使用者というのはクオンツ、ヘッジファンド とのことです。

前の記事でも書きましたが、ヘッジファンドとかクオンツとか知りたい人はNetflixの「ビリオンズ」をみてください。堅っ苦しい本読むよりどんなものか分かります。過去記事は下記を参考にしてください。

オルタナティブ(代替)データって何?

2019/12/9

このブログのテーマでもあるオルタナティブデータですが、まだまだ世の中では浸透していないように思えます。インターネットが浸透し、さらに個人用のパソコンである程度のタスクはできるこの世の中で「データ」はそ ...

そして、オルタナティブデータというのはまだ彼らのような運用資金が潤沢にあって、数億円するデータチームとインフラを持っているような所が試しているようなアーリーステージなんですね。ここで出てきていたのが非常に面白いわけなのですが、彼らの期待としては10倍のリターンを求めているとの事でした。例でいうと、100万円のデータセットを買った場合は1000万円のリターンがないと期待に答えられないというのものです。

ではクオンツでもヘッジファンドでもない普通の金融機関はどうなんでしょう?ここで、問題が出てくるわけです。鶏が先か卵が先かというような議論になるのですが、簡単にいうとこんな感じです。

お金ない普通の金融機関問題

  • 【金融機関】お金ないし、オルタナティブデータ使ってもどれくらい儲かるか分からないから、データ買えない。。。
  • 【データ企業】データ実際に使ってもらわないと正直わかんないけど、ユースケースも少ないから金融機関の力なしにはバックテストのしようがない。。。

 

と、ぐるぐる回っている状態ではないでしょうか。

ここで現時点での解決策としては3つほど挙げられます。

ポイント

  • データ活用専門のコンサルを最初に入れ、データ活用したレポートまで一手に引き受ける。(System2のプレゼンテーションから)
  • データセットのサンプルを無料、もしくは安い値段か研究の目的で使用させてお客さんに使ってもらう。(日本証券取引所とNOWCASTの例
  • データ企業が分析用のプラットフォームを買収、もしくは作りデータチームを持つコストを低くする。(AppAnnieOrbital Insight

という形で試行錯誤しているような状態です。当然ポテンシャルは増えていくのですが、暗中模索しているというのが現在の状態です。しかし、この状態で見つける事ができれば金融機関は確実に設けられるモデルを構築するのではないでしょうか。しかし、彼らは絶対にそのユースケースを公開しないとは思いますが。。。

データの価格設定

すでにややこしい問題をさらにややこしくするのが、お金の問題なんですね。上にも書きましたが、とにかく高い。めちゃ高い。

じゃあ、なんでそんなに高いのよ?と思う方もいらっしゃると思うので解説します。

このオルタナティブデータは企業が元々持っていた独自のログデータだったり、パートナー企業から提供してもらっているデータです。このデータは他から買ったりニュースのようにウェブをクロールすれば取れるのとは違うのです。独自しか持ってないものなのだから稀少価値が非常に高い、故にデータ企業が強気に出ているのもその通りなのですね。

では、データが元々データ企業のものではない場合はどうするかと言うと、独自のアルゴリズムや他のデータセットを組み合わせて独自のデータにしてしまう事で稀少価値をあげるわけですね。(これをインサイトとか言ったりしてるのを聞いた事があります。)

ここに注意

  • 企業が元々内部分析の為だったデータは高い(社内ETLプロセスの産物)
  • 公のデータを加工したり、アルゴを使ったり、他のデータセットと組み合わせたのも高い

まだこう見ていると、需要と供給がうまくマッチしていないのかなぁ、と思いました。やはり、本来の価値が分からない場合一度バブルのように流行って本来の価格に落ち着くような気がしますが、私は神ではないので未来のことは知りません。

データ分析は長期的

データを分析する方はわかると思うのですが、データ分析はプログラミングは違いますね。どちらかと言うと化学の実験に近いかもしれません。と言うのも基本的なアプローチが似ているからなんです。

分析の流れ

  • その分野に詳しくなる(ドメインエキスパート)
  • 経験から仮説を立て、データを選んでいく
  • データを使ってみて実際に予想通りの動きや数値ができるか確認する
  • 動いた場合でも動かない場合でも、相関なのか・因果なのか調べる
  • また試す…以下無限ループ

なのでSystem2のプレゼンテーションでも言われていましたが、データ分析には時間が掛かって尚且つ慎重でなければいけないのです。

運用に使用される場合、結果がダイレクトに数字に現れるので使い方もシビアになってきます。そして、データサイエンス、機械学習系のプロジェクトは大体早くて半年〜9ヶ月ほどなので、分析したらすぐに全てわかると言う幻想は捨てましょう。ただ、目的が運用とかでなくメディアとかの場合は比較的早い分析を行うのはありかもしれません。(田端さんがシェアしていた@u874072eさんのこの記事は面白かったですね。)

確かにデータはまだ赤ちゃんのステージかもしれませんが、5GだのIoTだのSociety5.0だの色々言われている世の中なので先に知っておいて損はないと思います。これからはデータを製したものが世界を制す世界になってくると思います。小さなデータでもいいので、自分なりに行動してみましょう。将来の自分に投資です。

拙い文章でしたが、これが私が興味深いなと思った事でした。また、追加があれば記事を加工と思います。

-データ市場, 代替データ・オルタナティブデータ
-, , , , , , , ,

Copyright© チキゾーブログ , 2020 All Rights Reserved.