顯示廣告
隱藏 ✕
※ 本文為 dinos 轉寄自 ptt.cc 更新時間: 2015-05-11 00:53:31
看板 MLB
作者 pikachu123 (pika)
標題 Re: [問題] 數據整理
時間 Wed May  7 11:59:52 2014


※ 引述《wyob (Go Dolphins)》之銘言:
: 小弟爬了精華區
: 也去了一些網站找可是都沒找到我目前的需求
: 所以想來這裡詢問一下
: 有沒有網站是整理好
: 〝每場〞幾隻一壘安打,幾隻二壘安打,幾支三壘安打,幾支全壘打這類的
: 精華區裡有些網站有,但大多都不是整理在一起的
: 我希望能找到能夠列出每場的結果
: 這樣我比較好用程式把數據抓下來
: 主要是要做一些與隨機過程的研究有關
: 所以還想麻煩一下大大的幫忙
: 感謝

雖然我不知道你想問甚麼 明明FG就有了阿

想抓資料我還是建議你寫程式自己抓

http://gd2.mlb.com/components/ <---MLB Pitch F/X 官方DATA網站

裡面有所有你要的資料 格式是XML檔

像是今天比賽


http://gd2.mlb.com/components/game/mlb/year_2014/month_05/
day_06/gid_2014_05_06_arimlb_milmlb_1/bis_boxscore.xml

<batter id="460576" name="Gomez, C" pos="CF" bo="100" ab="5" po="2" r="0"
a="0" bb="0" sac="0" t="0" sf="0" h="0" e="0" d="0" hbp="0" so="2" hr="0"
rbi="0" lob="2" fldg="1.000" avg=".281" go="2" ao="1"/>

資料像是這樣 你用XML Parser抓出來把 Double Triple 加一加就有了
大部分MLB網站也都是這樣做的

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.161.102.109
※ 文章網址: http://www.ptt.cc/bbs/MLB/M.1399435198.A.737.html
EEERRIICC:想學...該怎麼入門呢  每次抓數據都弄得好辛苦QQ1F 05/07 12:05
※ 編輯: pikachu123 (118.161.102.109), 05/07/2014 12:12:01
ccpz:找個script語言, 用他的 xml, http library 抓下 raw code2F 05/07 12:27
ccpz:打錯, raw data, 再丟進 excel 或是 mysql 再分析
ccpz:https://github.com/ccpz/Box2Txet
ccpz/Box2Txet ·  GitHub
[圖]
Box2Txet - convert MLB box data to text data ...

 
ccpz:之前寫過產生純文字 box 的工具5F 05/07 12:30
EEERRIICC:太棒了><6F 05/07 12:31
ohb:基本上gameday有的這裡都有  我以前也有自己寫東西parse過7F 05/07 13:56
wyob:先感謝,雖然不是我要的,不過至少知道分布在哪裡,這樣就8F 05/07 14:24
wyob:可以寫程式抓了,新手還請多包含:)
wilson200106:PHP 可以用 xmltoarray10F 05/08 01:12

--
※ 看板: dinos 文章推薦值: 0 目前人氣: 0 累積人氣: 163 
分享網址: 複製 已複製
guest
x)推文 r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇