作者 SkankHunt42 (凱子爸)標題 Re: [情報] 推特將強制所有圖文無償用於AI訓練時間 Thu Oct 17 16:34:46 2024
※ 引述《wvookevp (ushiromiya)》之銘言:
: 忽然想到
: 如果改天
: PTT將強制所有推文無償用於AI訓練
: 最後訓練出來的帳號推文會是什麼模樣?
: 有沒有希洽?
中國有人試過類似的事情了
不過他們拿來訓練的 是一個叫弱智吧的貼吧(討論板)
https://www.youtube.com/watch?v=ghLCJRTAlMA
相關的研究方法後來還被發表成了論文 可以搜尋ruozhiba
總之弱智吧不管初衷為何 後來逐漸演變成一種幽默的笑話板
但前提是你電波能對得上
如果要拿PTT的資料來做訓練 實際上是會有雜訊的
因為PTT的呈現方式 你要能夠辨識出是哪些板友在底下討論
這種前後文的關係梳理 本來就需要繁雜的預處理
弱智吧本身的灌水量不低 所以就算是資料集也是透過指標篩選或人為推薦的
PTT的狀況是 一篇爆文底下可能80%的推文都是一樣的
這樣的訓練資料並沒有太大意義
除非你今天是要訓練專門推噓文的空軍
那針對特定議題或關鍵字直接膝反射推噓 那是沒問題
而且我相信 已經有人在這麼幹了
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 89.187.161.5 (日本)
※ 作者: SkankHunt42 2024-10-17 16:34:46
※ 文章代碼(AID): #1d4CmefL (C_Chat)
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1729154088.A.A55.html
推 a123444556: 你最後一段不要講這麼隱晦 勇敢說出來4-111F 10/17 16:36
推 Ardve: PTT可以直接一個滾一個噓結束推文,那種討論版回文得有點意義,所以偶爾能看到觸發關鍵字跑出來亂噴東西的迷途AI w2F 10/17 16:36
→ dklash: 針對關鍵字的話 訓練模型根本浪費錢 給幾個推文範本
排列組合一下 觸發關鍵字就隨機套用一個去推文就好4F 10/17 16:41
--