Disp BBS guest 註冊 登入(i) 線上人數: 94
※ 本文為 zbali.bbs. 轉寄自 ptt.cc 更新時間: 2017-11-21 18:16:52
看板 Gossiping
作者 pooznn (我~~~是來被打臉滴!!!)
標題 [新聞] 研究:GitHub上高達7成的檔案是複製品!
時間 Tue Nov 21 17:42:57 2017


研究:GitHub上高達7成的檔案是複製品!

微軟研究院、美國東北大學及加州大學、捷克技術大學的共同研究人員對GitHub上450萬
個非分叉專案,逾4.82億個檔案進行分析,發現只有8500萬個為原創的獨特檔案,顯示複
製檔案的比例相當高。


iThome 文/陳曉莉 | 2017-11-21發表

微軟研究院、美國東北大學、捷克技術大學及美國加州大學歐文分校的8名研究人員在近
日發表的研究報告中指出,GitHub上所代管的檔案中,只有17.6%是獨特的,有70%的檔案
是複製品,其他則是稍有變動或無關緊要的檔案。


這群研究人員原本是要調查各種複製品的粒度,以協助其他研究挑選GitHub上的隨機樣本
,他們分析了GitHub的450萬個非分叉專案,涵蓋逾4.82億個檔案,卻意外發現當中只有
8500萬個獨特檔案,而讓研究方向轉了個彎。


該研究排除了各種分叉專案,因為這些專案原本就會含有複製內容,而不同語言的複製比
例則各不相同,例如JavaScript生態體系的複製檔案比例高達94%,C++為73%,Python為
71%,而Java則是40%。

不過,上述結果包含了許多無關緊要的複製內容,例如大小為0的空白檔案就被重複建立
了220萬次,還有一些重複檔案只鍵入了一個空行。即便扣除這些內容,上述語言的複製
檔案比例依舊高達93%、73%、69%與40%。


開源碼觀察家Adrian Colyer認為,從該報告可看出GitHub有許多專案雖未採用分叉機制
,卻仍然複製了大量的檔案,且隨著現代的軟體專案多半仰賴其他開源專案,再加上許多
自動產生的程式碼,在未來專案中由開發人員自行撰寫的程式很可能都只佔專案的很小一
部份。


https://www.ithome.com.tw/news/118465
研究:GitHub上高達7成的檔案是複製品! | iThome
[圖]
微軟研究院、美國東北大學及加州大學、捷克技術大學的共同研究人員對GitHub上450萬個非分叉專案,逾4.82億個檔案進行分析,發現只有8500萬個為原創的獨特檔案,顯示複製檔案的比例相當高。 ...

 

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.163.112.102
※ 文章代碼(AID): #1Q4_Ka65 (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1511257380.A.185.html
s111228s: 意外嗎1F 11/21 17:43
MonkeyCL: pornhub表示2F 11/21 17:43
peter308: 根本foxy3F 11/21 17:43
darkMood: 當然,剪貼才是王道。4F 11/21 17:43
arrenwu: 很合理啊 大家都愛 copy + paste5F 11/21 17:44
sobiNOva: 廢話 難道農夫種菜還要自己培育種籽嗎(疑)6F 11/21 17:44
mikemagic88: 本來就是了xD7F 11/21 17:44
KGarnett05: 拼湊比較有效率8F 11/21 17:44
LFD: 怎麼可能自己撰寫 當然是拿別人寫好的來改阿9F 11/21 17:44
ams9: 可見理組也愛複製貼上10F 11/21 17:44
NTULioner: 世界一大抄11F 11/21 17:44
NTULioner: 看過有人專門載別人的project來改一些無關緊要的東西
NTULioner: 再自己新推一個 藉此營造出很活躍的感覺
notmine: 理組不意外14F 11/21 17:45
liquidbox: 理組人格就這樣了15F 11/21 17:46
weido: 理組ㄏ16F 11/21 17:49
mouse07: 至少有70%的問題是複製貼上就能解決17F 11/21 17:53
gotfree: 不是每個人都是神18F 11/21 17:55
guest8888: 大家都自己寫 科技怎麼進步19F 11/21 17:59
nekoares: 不然設計fork來幹嘛?而且為什麼隨機,而不是選active的20F 11/21 18:03
nanashi07: 研究人員不懂 fork?21F 11/21 18:05
GABA: 有類似的拿來用22F 11/21 18:05
molsmopuim: 我以為這網站就是備份網站用的XD23F 11/21 18:06
bitcch: 不會把fork出來的專案都算進去吧24F 11/21 18:15

--
※ 看板: ott 文章推薦值: 0 目前人氣: 0 累積人氣: 98 
分享網址: 複製 已複製
guest
x)推文 r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇