皆さんはスクレイピングというものをご存知でしょうか?
スクレイピングとは、簡単に言えばネット上にある情報やデータを分析し、新たな情報として生成する方法になります。
実際に、競馬以外の分野で利用されており、商品を売る時のマーケティングなどにも活用されている方法でもあります。
最近、このスクレイピングを利用して競馬の予想を行っている人が非常に増えてきており、実際に見事馬券を的中している人も少なくないのです。
そこで、この記事では実際に競馬情報をスクレイピングし、予想をしているサイトをご紹介していきたいと思います。スクレイピングに興味がある方もそうじゃ無い方もきっと参考になると思うので、是非チェックしてみて下さいね!
目次
スクレイピングとは?
冒頭でも簡単にご紹介しましたが、スクレイピングとはネット上に存在しているサイトから情報取得し、その情報を独自に加工、分析をして新たな情報を生み出すという方法です。簡単に言えば自作のAIのようなものですね。
スクレイピングは、ウェブサイトから情報を取得し、その情報を加工して新たな情報を生成することです。Webスクレイピングとも呼ばれ、スクレイピングを行うプログラムをスクレイパーと呼びます。
情報を取得するところまではクローリングと同じですが、スクレイピングでは取得した情報を加工する工程も含まれます。ただ、明確な定義があるわけではないので、クローリングとスクレイピングを同じような意味で使っている場合もあります。
スクレイピングの例としては、様々なニュースサイトを巡回して見出しを抜き出して一覧にしたり、商品のデータを集めて価格表を生成したりするといったものが挙げられます。
引用元:https://tech-camp.in/note/technology/48812/
一昔前では、このような取り組みを行える人はごく一部だと思われており、高い技術が必要でした。しかし、最近のデジタルの進化により、知識がそこまでない人でも気軽に行うことが出来るようになりました。
このスクレイピングの大きなメリットは、すでに誰かが、どこかのサイトがまとめている情報を利用するので、自分で新たにデータを集める必要が無いという点です。
競馬では、大量のデータを扱っているサイトが無数に存在しており、その情報を使って簡単にAIのように予想を行うことが可能となっているのです。
スクレイピングの実績は?
スクレイピングを利用した競馬の予想はまだまだ歴史が浅く、流行し始めたのは2019になってからなので、これからに期待できる予想方法です。しかし、Twitterでスクレイピングを利用し高額な配当をゲットしたというツイートが話題になり、スクレイピングの存在が広く浸透し始めています。
2019年の有馬記念と言えば、 ダントツの1番人気だったアーモンドアイがまさかの大敗となったレースで、記憶残っている人も多いのではないでしょうか?アーモンドアイが飛んだことにより、オッズはそれなり高くなりました。
実はこのレースを自作のAI、つまりスクレイピングにより予想をし、100万円以上の配当をゲットした人がいたのです。
有馬記念、自作AIに予想させたら買い目めっちゃ変やけど、118万2500円当たった!
(3連複6-7-10 107.5倍×11000円)来年はバイトしません!! pic.twitter.com/39dDDr1AkL
— おおにし (@oyuma1234567) December 22, 2019
6リスグラシュー、10サートゥルナーリア、7ワールドプレミアで決着しましたが、見事6-10-7の三連複を的中しているのです。しかも11000円も…。
オッズは107.5倍だったので、100万円を超える配当をゲットしているのが分かると思います。これは流石に凄いですね…。
このツイートをきっかけにスクレイピングを始めた人も多いのではないでしょうか?
実際にスクレイピングで予想をしている3つの記事
それでは、ここからは実際にスクレイピングで予想をしている記事をご紹介していきたいと思います。毎レース予想をしているという訳ではなく、スクレイピングで予想をやってみた系の記事が多くなっているので、参考になると思いますよ。
競馬サイトをクローリング&スクレイピングしてみた その1
まず最初にご紹介するのは「競馬サイトをクローリング&スクレイピングしてみた その1」です。Pythonを利用したスクレイピングを行っていますが、このPythonというのはスクレイピングをする時のメジャーなソフトになります。
かなり細かくスクレイピングの方法や実践した方法について説明されていますね。
利用している競馬サイトは、皆さんお馴染みのnetkeiba.comです。膨大な量の情報、データを扱っており、JRAに登録されたことのあるすべての競走馬の情報、過去のレース結果などが非常に細かく記載されているので、スクレイピングをするサイトとしては最適ですね。他のスクレイピングを実践しているサイトでも、netkeiba.comを利用している人が多くいらっしゃいます。
「やること」「実装した機能」「実際のコードと実行結果」「苦労した点」などで、分かりやすくまとめられているので、是非参考にしてみて下さい。
⇒競馬サイトをクローリング&スクレイピングしてみた その1のサイトに行く
競馬のデータ分析をプログラミング(スクレイピング)でやってみたお話
この記事では、ITエンジニアの方がPythonを使ってスクレイピングでデータ分析を行っています。
いきなり2019年の有馬記念で100円で三連単を的中する話から始まりますが、これはスクレイピングはあまり関係ないようです。
実際に何をしたのかというと、過去のレースの結果をスクレイピングで収集し、統計の高いものを算出し予想をしています。
- 2年分のレースの結果を収集。
- あえて中山競馬場のみのデータとした。
- 着目点は人気(オッズ)のみ。
- 1-3位までの予想に絞った。
上記の4つのデータを分析しており、世間の人気度がどの程度信用できる値なのか?また、どの人気度の組み合わせが勝ち取りやすいのか?というのを統計で算出しています。
かなり分かりやすくスクレイピングの方法や結果についてまとめられている記事だと思うので、スクレイピングをやってみたい!と思っている方は必見ですよ。
⇒競馬のデータ分析をプログラミング(スクレイピング)でやってみたお話のサイトに行く
pythonで競馬のデータをスクレイピング【AIで競馬予測】
最後に紹介する記事はpythonで競馬のデータをスクレイピング【AIで競馬予測】です。
2018年とちょっと前の記事ではありますが、当時の方法も知っておくと便利だと思うのでご紹介していきたいと思います。
上記の2つの記事と同じようにPythonが使用されていますね。この記事自体は内容は少ないですが、プログラミングを始めてから10日くらいの方が行っており、パソコンの知識が乏しい方でもできるという例になると思います。
他にも多くの記事が投稿されているので、プログラミングのことはよく分からないけど、スクレイピングをやってみたいと思っている方におすすめの記事となっています。
⇒pythonで競馬のデータをスクレイピング【AIで競馬予測】のサイトに行く
まとめ
今回の記事では、競馬の予想をスクレイピングで行う方法や、実践している方の記事などをまとめてご紹介させていただきました。
競馬やデータや前例だけでは完全に予想することは難しいと思いますが、スクレイピングでの予想を行うことで、信用できる軸馬を探しやすくなると思います。
まだまだ発展途上の方法ではありますが、今後予想の主流になっていく可能性があるので、注目していきたいと思います!