顯示廣告
隱藏 ✕
※ 本文為 MindOcean 轉寄自 ptt.cc 更新時間: 2018-01-25 03:10:56
看板 Gossiping
作者 purplvampire (阿修雷)
標題 [新聞] 鍵盤記者小心!PTT大神團隊打造臺版AI記
時間 Wed Jan 24 23:34:35 2018


1.媒體來源:

iThome

2.完整新聞標題:

鍵盤記者小心!PTT大神團隊打造臺版AI記者,一天自動寫出500篇熱門鄉民新聞

3.完整新聞內文:

臺灣人工智慧實驗室創造的記者快抄預覽版第一版上線了!透過AI技術將PTT版上的熱門
文章,重新撰寫為新聞,一天就可以自動產生大約500篇文章,還能透過文章內容找新聞
配圖


文/何維涓 | 2018-01-24發表

鍵盤記者恐怕面臨危機,PTT創辦人杜奕瑾23日於個人臉書中發布一項消息,由他領軍的
臺灣人工智慧實驗室創造的記者快抄預覽版第一版上線了,杜奕瑾也表示希望大家給予意
見,記者快抄是透過AI技術將PTT版上的熱門文章,重新撰寫為新聞,記者快抄在去年7月
就已經悄悄上線,上線後仍不斷地在修改,目前記者快抄每天可以從PTT熱門文章中,自
動產出大約500篇文章,還能透過文章內容找新聞配圖,臺灣人工智慧實驗室也將記者快
抄的成果於GitHub上開源釋出,包含網頁生成、前端與UI、爬蟲、AI演算法與文章生成。

臺灣人工智慧實驗室也在部落格中的一篇貼文介紹記者快抄,記者快抄原本只是個小專案
,但是,後來發現許多人開始關注AI記者寫出來的文章,臺灣人工智慧實驗室也開始投入
更多的心力來改善系統,直到現在,AI記者都還持續在精進中。


臺灣人工智慧實驗室認為,對媒體產而言,如何吸引讀者眼光是產出文章的重要考量因素
之一,因此,記者需要快速且大量地產出有趣文章,來吸引讀者,而AI記者則可以根據臺
灣討論度最高的論壇PTT,來創造文章。


PTT是個獨立運行且開源的線上論壇平臺,目前有超過150萬個用戶,擁有15萬用戶的流量
,總共有超過2萬個版在談論不同的話題,一天就能湧入約50萬則回覆。

記者快抄每30分鐘從PTT上擷取重要的文章,將文章拆解成句子,透過自然語言處理技術
和深度學習演算法,撰寫成新聞,此外,AI記者還會收集每一篇文章的所有的回覆,包含
「推」和「噓」的回覆,來了解大眾對於該篇貼文的反應。


AI記者產生文章大約分成3步驟,第一是摘要文章,也就是要用幾句話來描述文章的大意
,首先,將文章的內容拆解為句子,透過自然語言處理中的word embedding,用向量表示
每個單詞,將文字轉成數值化的資料來計算,並給予每個句子與其他句子相關連程度的分
數。


接著,台灣人工智慧實驗室廣泛地收集了新聞的模板,再從這些候選的句子清單中,透過
演算法挑選和編輯這些句子,在加入PTT文章中重要的句子,將這些句子組合成一篇新聞
,產生新聞的模型收集了來自多個媒體超過10萬篇新聞,當作訓練資料


最後,為了確保文章的可讀性,AI記者生成新聞後還需要經過潤飾,因為PTT的貼文通常
有作者自己的風格和格式,每篇貼文的換行和空格都不太一樣,造成機器不容易判讀,為
了解決這個問題,臺灣人工智慧實驗室從新聞文字中,建立了一套文法矯正器模型,來教
導記者快抄的系統學習如何寫出正確的文章


解決完文章的內容後,現在的新聞都必須搭配圖片,臺灣人工智慧實驗室也認為,光是只
有文字是不夠的,新聞文章應該要有圖片,而PTT的貼文中,通常會有一些圖片連結,這
些圖片連結看似個不錯的資源,不過,許多圖片連結跟貼文的內容卻沒有關聯。


因此,臺灣人工智慧實驗室為了能夠讓AI記者也像人類記者一樣搜尋圖片,他們訓練了圖
片搜尋引擎的RNN模型,這個模型會比對文章和圖片描述的文字相似度,來擷取與文章內
容較相近的圖片,作為新聞圖片,AI記者不但可以用原文的圖片,還能自行搜尋相關的新
聞圖片。


未來,臺灣人工智慧實驗室認為,PTT版上原本的分類和AI記者萃取出來的主題,這些標
示(Tags)對於搜尋相關新聞,都會有非常大的幫助,且導入人臉和語音辨識後,AI記者
可以從網路上的影片中,搜尋名人對特定議題的評論,臺灣人工智慧實驗室認為,這項資
訊也能夠幫助記者。


臺灣人工智慧實驗室也強調,AI記者對記者不會是威脅,而是輔助,AI記者自動挑選主題
和產生文章,可以協助記者將更多心力放在撰寫內文和更深入的報導,進而產出更高品質
的新聞。


4.完整新聞連結 (或短網址):

https://www.ithome.com.tw/news/120896
鍵盤記者小心!PTT大神團隊打造臺版AI記者,一天自動寫出500篇熱門鄉民新聞 | iThome
[圖]
臺灣人工智慧實驗室創造的記者快抄預覽版第一版上線了!透過AI技術將PTT版上的熱門文章,重新撰寫為新聞,一天就可以自動產生大約500篇文章,還能透過文章內容找新聞配圖 ...

 

5.備註:

大神的意思就是,記者別只會抄抄抄,寫點有深度有意義的報導文章如何?對了,只會
Python能寫出這樣的AI嗎?

--
 作者  a000000000 (工口芒果老師)                              看板  Gossiping
 標題  Re: [問卦] 覺青做錯什麼事                                              
 時間  Sun Nov 19 12:20:37 2017                                              
───────────────────────────────────────
智障在那邊嗆智力測驗  這大概只有台灣看的到八

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.32.132.173
※ 文章代碼(AID): #1QQAUGWc (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1516808080.A.826.html
walkdog0603 
walkdog0603: 記者崩潰1F 01/24 23:35
monok: 小時不讀書,長大當___2F 01/24 23:35
liujd: 送啦 廢物記者再抄阿3F 01/24 23:36
XiaoFatZhai: 記者:幹4F 01/24 23:36
osan 
osan: 沒差,繼續抄5F 01/24 23:36
dioradio: 哪會崩潰?都幫記者整理好了6F 01/24 23:36
monok: 連這篇也抄,還放頭版7F 01/24 23:36
lin315040: 連這篇都要抄www8F 01/24 23:37
a94037501: 記者失業惹9F 01/24 23:37
july15250: 好猛喔10F 01/24 23:38
soria: ……我還以為錢哥會再現江湖咧11F 01/24 23:38
charliechao: 笑死 這也抄XDD12F 01/24 23:38
cureHAPPY: 先消滅發錢文再說13F 01/24 23:38
DodiFed: 這樣以後黨工就更多了14F 01/24 23:38
minicoke: 這算洗錢嗎15F 01/24 23:38
MarXXXX: 記者抄好抄滿16F 01/24 23:39
Tenging: loh姐呢17F 01/24 23:39
losel: 遇到反串關鍵字 AI要怎麼判斷?18F 01/24 23:39
mij: 你沒聽過記者會互抄嗎19F 01/24 23:40
Xhocer: 馬的廢文互抄,到最後抄出大怪物怎麼辦20F 01/24 23:41
lorrainfu: 都不用加班了,ai送上門做功德,1天工作3小時,複製貼21F 01/24 23:42
lorrainfu: 上完收工
lppal: 記者會更開心吧~都直接幫你寫好了23F 01/24 23:43
Laotoe: 記者快抄都多久以前的東西了,記者一定是看今天的爆卦才抄24F 01/24 23:43
Laotoe: 的
Lari: 屌!26F 01/24 23:46
rapnose: 這樣記者的薪水會不會被調降啊?如果慣老闆知道這AI的話27F 01/24 23:47
TaiwanShan: 記者開心都來不及了28F 01/24 23:48
higameboy: 不用出門也有新聞的記者表示:29F 01/24 23:48
Cecicly: 爽30F 01/24 23:49
glad850: ott表示:幹,那我算什麼!?31F 01/24 23:49
brad84622: 記者:更好抄惹 爽32F 01/24 23:52
isaa: 記者就給你示範一下有AI更好抄,改個句型就好了33F 01/24 23:52
loveapple33: 只知道用抄的,這下慘了吧!笑這些垃圾記者34F 01/24 23:54
douCai: 記者寫給記者的新聞35F 01/24 23:56
lesterc: 笑死 記者 自己酸自己36F 01/24 23:56
s58565254: 以後當記者更輕鬆複製貼上37F 01/25 00:01
David0620: 爽38F 01/25 00:03
asyousaid: 哈哈哈哈哈39F 01/25 00:04
asyousaid: AI有著作權嗎
alomar2000: 以後留一個人潤稿就好,其他人裁掉41F 01/25 00:05
rayonwu: 廢物記者要失業了嗎?42F 01/25 00:05
princeguitar: 記者快出門挖獨家啦 幹 想養老不會去當國民黨工喔43F 01/25 00:06
johnny3: 原來是ptt自己做的44F 01/25 00:06
hijkxyzuw: 覺得還是很糟45F 01/25 00:07
cloudpart2: 記者 改一下繼續抄46F 01/25 00:07
LYS5566: 可不可以反向寫一個科普廢文AI 救救PTT47F 01/25 00:08
diarrhea995: 滿久了現在才抄48F 01/25 00:12
iruka521: 記者要被取代了嗎??XD49F 01/25 00:33
lulocke: 新聞配圖 這部份難道不會被告侵權 ?50F 01/25 00:36
lulocke: 喔 沒有營利的話 可能沒事 ?
zzzzaaaa: 以後帶風向或轉移焦點更便利了52F 01/25 00:40
TarikBlack: 記者上街頭53F 01/25 01:04
jeff52: 很多職業都一樣,如果自己只會做電腦也能做的事情,那就54F 01/25 01:15
jeff52: 等著失業了
rumirumi: 記者:幹!照抄!56F 01/25 01:21
darkangel119: 心機肥婆表示57F 01/25 01:23
uland26922: 連這個都要抄xDDDD  果然記者已經沒有內容寫了58F 01/25 01:29
jerrylin: 批踢踢有兩萬個版?!?!59F 01/25 01:40
atinod1: 能不能把這套功能拿到國際性網站?台灣淨是沒營養新聞60F 01/25 01:49
jilluck: 廢文.唬爛文分辨得出來嗎?61F 01/25 02:05
godtnmai: 一個技術馬上釣中一位鍵盤記者發新聞62F 01/25 02:17
yuinghoooo: 等一下這篇抄來的新聞會再被抄一遍63F 01/25 02:47

--
※ 看板: Gossiping 文章推薦值: 1 目前人氣: 0 累積人氣: 1029 
※ 本文也出現在看板: terievv
作者 purplvampire 的最新發文:
點此顯示更多發文記錄
分享網址: 複製 已複製
( ̄︶ ̄)b ryukt 說讚!
1樓 時間: 2018-01-25 09:17:14 (台灣)
  01-25 09:17 TW
記者:這樣要我如何製造假新聞?
2樓 時間: 2018-01-25 10:12:37 (台灣)
  01-25 10:12 TW
假新聞天敵
r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇