データ市場 代替データ・オルタナティブデータ

オルタナティブデータシリーズ2:Apptopia

今回のオルタナティブデータシリーズ2では、アプリ(iOS、アンドロイド)のデータの提供会社であるApptopiaをご紹介したいと思います。

Apptopiaって?

Apptopiaは2011年に設立されたアメリカのボストンに本社があるアプリ(Android・iOS)アプリのデータを売っている会社になります。現時点で50人ほどの従業員がいるようで、会社の規模としては比較的小さめです。Crunchbaseによると、シリーズA(成長し始めまで、初期の投資)までで$8.2M(約9.2億円)を調達しています。ホームページ上で紹介されている投資家の中でShark Tank(アメリカ版マネーの虎)で有名なMark Cubanもいました。

一つ興味深いのはこの企業はウクライナにエンジニアのオフィスがあるんです。

ウクライナはIT大国のエストニアの南に位置しています。国の大きさも比較的大きく、ドイツやフランスより少し大きいくらいでしょうか。ウクライナが何故IT産業に注目されているかと言うと、3点ほど利点があるからです。

なぜウクライナはITが注目されているの?

  • 理数系の教育が充実していて、物理学や数学のPhD(博士号)を持った人材(年200万から400万円ほど)
  • Wifi環境やコワーキングスペースの充実(日本より充実している)と英語のコミュニケーションが取りやすい
  • ITエンジニアの特殊な税制(基本個人事業主でその税は5%)

この事を詳しく知りたい方は是非下記のリンクでウクライナについて読んでみてください。

さらに詳しく

さらに詳しく

アプリデータって何?

Apptopiaがどのようなデータを提供しているかと言うとこのようになります。(1部)

 

データポイント

  • ダウンロード数
  • アプリ内課金
  • 使用状況(MAU, DAU)
  • SDKのインストール数
  • 広告収入
  • 人口統計
  • 維持率
  • 会社の問い合わせ情報
  • 本社の場所
  • 他アプリ使用状況
  • セッションの長さ
  • セッションの頻度
  • 現在使用している広告のネットワーク
  • クリエイティブタイプの種類
  • クリエイティブタイプの産業の基準
  • 過去30日の新しいクリエイティブ数
  • 過去7日間のクリエイティブ使用数
  • 平均のビデオの長さ
  • 新しい広告のリーダーボード
  • 一番長い広告のリーダーボード
  • ベストパフォーマンスの広告のリーダーボード
  • 一番初めに見られた日
  • アプリ総計時間
  • 広告主のインプレッションの共有

アプリのデータと言えど、情報はかなり多くメタデータの多さに驚かされます。そして、おそらく人口統計はさらに細かく種類ごとに分かれていると思います。データポイントはこれくらいになるのですが、そのほかにもApptopiaはアプリのレポートやカテゴリーごとのレポートそして、シグナルをすぐ出せるようにアラートも設定できる機能も提供しているようです。

価格は以下になります。

値段帯

  • 月999ドル(約10万円)
  • 月1250ドル(約13万円)
  • 月3000ドル(約30万円)
  • 月5000ドル(約50万円)
  • 金融情報提供会社のBloombergからもデータを取れるようです。ただ価格は記載されておりませんでした。

やはりデータっていい値段しますね。。基本的にはバイサイドが顧客になるので価格的には問題なさそうですが。そして、彼らはAPIも実装しているので、Pythonなどでデータを引っ張って来てデータフレームか何かにいれて分析が可能になっているのでインフラに組み込まれる事を想定していますね。

使用方法、例など

Bloombergが公開している資料によりますと、データの使用方法には3つのステップがあるようです。

step
1
アプリのデータ×国別・地域別情報×企業データを組み合わせる

アプリデータ

  • ダウンロード数
  • アプリ課金
  • DAU,MAU
  • セッション

国別・地域別情報

  • 国で分ける
  • 地域で分ける(アジア、南アメリカ、ヨーロッパなど)
  • 全て含めて全世界

企業データ

  • 四半期ごとの利益
  • 終日株価
  • 会社が有価証券報告書などで報告しているデータポイント

 

step
2
4つの分析方法を使う

全ての分析手法については彼らはPearson's Correlation Coefficient (PCC)と言う方法を使っています。日本語では「相関分析」言います。詳しくはここでは説明しませんが、こちらのウェブサイトを興味があればご参考ください。この分析をすると−1から1までの数字でどれほど2つのものが相関しているか見ることができます。0は「相関がない」で1が「相関が強い」−1が「負の相関が強い」と言う感じです。

  1. Actuals(現物・実際の数字)
  2. QoQ(前四半期比)
  3. YoY(前年比)
  4. 株価との相関

step
3
分析を手動・自動にしていく

こうすると、各データポイントを各国や地域ごとに分けることで数十個のデータポイントの組み合わせが数百個数千個まで増えていきます。そして、各時系列データをPCCにて計算することで近いものを自動的・手動でも見つけることができると言うことです。書類の中で紹介されているのは45から75の分析ができるそうなので非常に多角的かと思います。

しかし、データにはデータセットごとの落とし穴や気をつけなければいけない事があります。今回はアプリのデータを使用する上での注意事項をご紹介します。

注意ポイント

  • アプリデータは急上昇や急降下が激しいデータセットだ!
    • 広告や話題になる事で急に数が急に増える
    • アプリのエラーやバグでもすぐに数が減る
  • 過去データには気をつけろ!
    • 2015年以前、今のアプリは56%も少なかった為今のデータと完全に異なる
    • 2016年頃にはいくつかのアプリは広告を多く出して、スパイク(データの急上昇)を引き起こした
  • メインのアプリは重要!
    • 一つの会社から多くのアプリを出している場合があるが、メインのアプリがほとんどの収益をあげている場合が多い
  • 全てのデータの組み合わせを試せ!
    • オルタナティブデータはまだ未開の地です。全ての組み合わせを試し、自分なりの相関を発見することに労力を使おう

例については、下記のリンクから見てみてください。ちなみにチキゾーのおすすめはマクドナルドのデータの例(株価とMAU:月間アクティブユーザーの相関)は非常に面白いので、20ページを見てみて下さい。

-データ市場, 代替データ・オルタナティブデータ
-, , , , ,

Copyright© チキゾーブログ , 2020 All Rights Reserved.