競馬データの取得先まとめ

中央競馬のデータ分析を進めるうえで分析するデータを集めることが最初のステップとなります。

今回は中央競馬のデータの取得先はどのようなものがあるか、それぞれのメリット/デメリットなどを考えていきたいと思います。

データの取得先として、主に以下4つに分けられると思います。

  • JRA-VAN データラボ
  • JRDB
  • 競馬道データ会員
  • スクレイピング

それぞれについて整理してみます。


JRA-VANデータラボ

JRAの公式なデータ配信サービスです。リンクはこちらです。

利用料金は毎月2,090円となります。

このデータがなければ中央競馬のデータ分析が始まらないというほどの基本的なデータ配信サービスです。本サービスのメリット/デメリットは以下です。

メリット

【1986年からのデータを利用可能】

1986年から競馬新聞の馬柱に載っているようなデータを利用することが可能です。またオッズもリアルタイムオッズや時系列オッズも取得することができます。以上より、過去レース分析・タイム分析・血統分析・オッズ分析も可能です。中央競馬に必要な基本的なデータがそろっているので、JRA-VANデータラボはデータ分析では最低限に必要なものと思います。

【さまざまなソフトを利用可能】

JRA-VANデータラボのデータを利用してさまざまなソフト(200本以上の対応ソフト)を利用することが可能です。例えば、以下のソフトを利用可能です。

  • TARGET frontier JV
  • 馬王Z
  • 馬トモEX
  • SUPER当馬君

馬王Z以外は無料(データラボの費用のみかかります)でダウンロードすることができます。この中のTARGET frontier JV(以降、ターゲット)はさまざまな角度から競馬データを分析することができるソフトとして多くのファンに愛用されています。私も長年愛用しています。ソフトの使い方(ターゲット・馬王Z)は別の記事でTipsなどを紹介していければと思っています。

【JRA-VANが提供する指数を利用可能】

JRA-VANが提供する指数(JRA-VANデータマイニング)が利用することができます。この指数を利用することで初心者の方でも簡単に指数を使って予想することができます。

デメリット

【取得できないデータもあり】

競馬新聞に載っているようでも以下のデータは取得することができません。

  • 坂路調教を除く調教データ
  • 厩舎、騎手コメント
  • 記者の予想印

調教のデータは坂路調教のデータは取得することができますが、それ以外は取得することができないので、調教データの分析をする場合は別のサービスを利用する必要があります。

また、競馬新聞に載っている厩舎、騎手のコメントも提供されていないため、別のサービスを利用する必要があります。

当然のことながら記者の予想印も提供されません。


JRDB

JRA-VANでは取得できないデータを取得することができるサービスです。リンクはこちらです。

利用料金は毎月2,480円となります。(コメント直前・有で毎月自動引き落としの場合です。1年一括払いなど複数支払プランあります。詳細はJRDBのホームページをご確認ください。)

本サービスのメリット/デメリットは以下です。

メリット

【JRA-VANにはないデータ・指数を取得可能】

JRA-VANには無い、以下のようなデータ・指数を取得することが可能です。

  • IDM(競走馬個々の能力指数)
  • 激走指数
  • パドック指数
  • 調教指数
  • 厩舎指数
  • 展開予想
  • パドック指数
  • パドック/返し馬コメント
  • 馬具(ハミなどの情報)
  • 脚元(バンテージ巻いているなどの情報)
  • 外厩情報

これはほんの一部のデータとなります。

パドック指数や返し馬コメントは各馬の直前の調子を知るために便利です。また、主流になっている外厩(ノーザンファーム天栄など)の情報も載っています。

以上のように、JRDB独自の指数、データを取得できるため、さまざまな角度からデータ分析・競馬予想を行うことができるためおすすめです。

【JRDBのデータを使った競馬新聞も見ることが可能】

JRDBのデータを利用した競馬新聞も見ることができます。PDFでも見ることができるため、iPadなどで利用することで紙の競馬新聞を購入せずに予想することも可能です。

PDFで見ることができることがかなりプラスだと思います。普段販売している競馬新聞(専門紙)では、bookend方式を採用していることから、書き込みが出来ずに正直使いづらいです。(赤ペンで色を塗ったりということが出来ません。)

毎週競馬をやるという人は、競馬新聞代の節約になるかもしれません。

例:競馬新聞土日 1,000円✖️4週=4,000円/月ですので、毎月1,500円の節約になるかと思います。

デメリット

【ファクターが多すぎてどれを見れば良いのかわからない】

メリットとしていろいろなデータを取得できるとしましたが、データがありすぎて、慣れるまでにどのデータを採用すれば良いのかということがわからなくなるということがデメリットとしてあげられます。私自身もデータがありすぎて全然分析しきれていません。(それくらいJRDBのデータは多いです。)

いろいろなファクターを分析するのは面白いので、分析した結果はこのブログで報告できればと思います。


競馬道データ会員

競馬ブックと連携しているため、競馬ブックのデータを取得することができるサービスです。リンクはこちらです。

利用料金は毎月1,650円となります。(2年契約の場合です。1年契約など複数支払プランあります。詳細は競馬道データ会員のホームページをご確認ください。)

本サービスのメリット/デメリットは以下です。

メリット

【競馬ブックのデータが利用可能】

競馬ブックと連携しているため競馬ブックのデータを利用することができます。

  • 調教データ
  • 厩舎、騎手のレース後のコメント
  • 次走のコメント
  • レイティング(競走馬の能力指数)
  • 競馬ブック本紙の印

調教データはJRA-VANでは坂路調教のみでしたが、坂路以外の調教のデータも利用することができます。調教分析するなら競馬道オンラインの利用をすると良いかと思います。

厩舎、騎手のレース後のコメントと次走のコメントは週刊競馬ブックの競馬成績表にあるコメントを利用することができます。このコメント利用して競走馬の適性などを分析することができると思います。(私は未分析です。こちらも分析したいと思っており、分析しましたら結果を報告できたら良いかなと思っています。)

レイティングは競馬ブック独自の競走馬の能力指数になります。

競馬ブック本紙の印は、競馬ブックの本紙の予想印を取得することができます。本紙の予想以外にも、もう1人の記者の予想も取得できます。(記者の印はレースごとに異なります。)

デメリット

【競馬ブックでも取得できないデータもあり】

競馬ブックと連携しても、新聞にあるのに取得できないデータもあります。例えば、直前の厩舎関係者のコメントです。また、本紙の予想コメント・展開予想コメント(展開は取得できます。)・コンピュータ予想も取得することができません。ですので、新聞よりは取得できるデータが少ないといえます。


スクレイピング

スクレイピングはJRA・Netkeiba・競馬ブックなどのWebサイトから情報を自動的に取得して加工することを言います。

利用料金は、スクレイピングする対象のWebサイトによって異なります。例えば、JRAのWebサイトの出馬表から情報を取得するので有れば、無料で実施することができます。

スクレイピングのメリット/デメリットは以下です。

メリット

【自分の希望するデータを取得・加工することが可能】

Webサイトにある情報であるならば(かつ体系だったWebサイトの構造であるならば)、情報を取得することができ、それを加工(独自の指数などを作ったり)することができます。ただし、Web・プログラミングの基礎的な知識は必要となります。

私は、競馬ブックのサイトから本紙の予想コメント・展開予想コメント・コンピュータ予想・パドック情報・直前の厩舎情報を取得しています。スクレイピングの方法についても本ブログで紹介できたらと思っています。

デメリット

【専門的な知識が必要になる】

メリットのところでも少し記載しましたが、スクレイピングを行うにあたり、Web(HTML)やプログラミングの基礎的な知識が必要になってきます。ただ、専門的と言ってもそこまで難しくないので、初心者の方でも1週間あれば習得することができると思います。慣れている人なら、半日くらいあればできると思います。


まとめ

各データの取得を上げてきましたがいかがでしたでしょうか。私としては、JRA-VANデータラボは必須でその他必用に応じてその他のサービスを利用するイメージでしょうか。まず、はじめはJRA-VANデータラボを利用して見ることをおすすめします。

各ソフトの使い方やデータ分析の結果をこのブログに載せる予定ですので、今後ともよろしくお願いします。

その他データ取得サービスなどありましたら、twitterまで寄せてもらえると幸いです。

データ分析

Posted by phi