※ 本文為 MindOcean 轉寄自 ptt.cc 更新時間: 2018-03-15 20:39:13
看板 Gossiping
作者 標題 [新聞] 機器翻譯大突破!微軟加入新方法AI中翻英
時間 Thu Mar 15 10:32:52 2018
1.媒體來源:
iThome
2.完整新聞標題:
機器翻譯大突破!微軟加入新方法,AI中翻英程度達人類專業水準
3.完整新聞內文:
微軟AI研究團隊近日於官方的部落格中表示,微軟的AI機器翻譯系統可以將中文的新聞文章翻譯成英文,透過雙語專業人員評估,AI機器翻譯系統的表現與人類相當,微軟表示,中文和英文有較充足的詞彙資料庫,透過新聞的常見詞彙搭配深度學習演算法,再加入新方法模仿人類翻譯的流程,不斷地調整,讓機器翻譯系統產出的結果更加準確。
特別的是,微軟的研究團隊在AI機器翻譯系統中,加入雙重學習(Dual learning)的機制,也就是說,系統將中文的新聞文章翻成英文後,會再將英文的翻譯結果翻成中文,重新比對兩者的相似性,並讓系統從錯誤中學習。除此之外,該AI機器翻譯系統還加入了審議網路(Deliberation network),系統會學習研究員翻譯句子的過程,模擬人類一次次編修文字的過程。
而為了確保翻譯結果的準確性,微軟加入聯合訓練方法(Joint training),透過中翻英和英翻中2個系統交互學習,英翻中的系統可以提供新的中文句子,與原文的中文句子形成一組資料集,增加訓練集的資料量,中翻英也是如此,將2個系統互相學習時,即可以改善各自的準確率。
另外,微軟也嘗試採用一致性正規化(Agreement regularization)的方法來加強翻譯結果的準確性,簡單來說,AI機器翻譯系統從左到右,或是從右到左閱讀語句,翻譯出來的結果必須一致,微軟相信,系統若產生相同的翻譯結果,是比較準確的。
在微軟負責語音、自然語言和機器翻譯的技術團隊成員Xuedong Huang表示,這項成果是自然語言處理任務中,非常重要的里程碑,機器翻譯達到人類的水準一直是團隊的目標,他表示,沒想到這麼快就能實現。
過去幾十年來,機器翻譯一直是研究員想要解決的問題之一,許多語言專家也認為機器翻譯不可能達到人類的水準,這項成果雖然是重要的里程碑,但是不代表機器翻譯的問題已經解決,微軟亞洲研究院副院長周明表示,還有許多挑戰和問題,像是在即時新聞上測試機器翻譯系統,他期待,這項成果可以應用在不同的語言,甚至是不同的AI研究領域中。
4.完整新聞連結 (或短網址):
https://www.ithome.com.tw/news/121818
機器翻譯大突破!微軟加入新方法,AI中翻英程度達人類專業水準 | iThome
微軟AI研究團隊近日於官方的部落格公布AI機器翻譯系統的一大進展,微軟加入新的訓練方法,AI系統的中翻英能力已經達到專業翻譯的水準 ...
微軟AI研究團隊近日於官方的部落格公布AI機器翻譯系統的一大進展,微軟加入新的訓練方法,AI系統的中翻英能力已經達到專業翻譯的水準 ...
5.備註:
翻譯人員是否要失業了?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 60.251.62.253
※ 文章代碼(AID): #1QgTjNbW (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1521081175.A.960.html
※ 同主題文章:
● 03-15 10:32 ■ [新聞] 機器翻譯大突破!微軟加入新方法AI中翻英
03-15 19:03 ■ Re: [新聞] 機器翻譯大突破!微軟加入新方法AI中翻英
03-15 20:16 ■ Re: [新聞] 機器翻譯大突破!微軟加入新方法AI中翻英
推 : may1F 03/15 10:33
推 : 簡體中文會不會很多翻譯不了的語詞2F 03/15 10:33
推 : Skype不是有支援3F 03/15 10:34
→ : 大概10年後會有一般對話能用的口語翻譯機出現4F 03/15 10:34
推 : 上一個會學習的AI後來被調教成酸民5F 03/15 10:34
推 : 文組QQ6F 03/15 10:34
推 : 所以可以不用學英文了嗎7F 03/15 10:34
推 : 太好了8F 03/15 10:34
噓 : 笑死理組弄出來的冰冷冷的東西翻出來能看?9F 03/15 10:34
推 : 翻譯年糕10F 03/15 10:35
推 : 不用讀英文囉~11F 03/15 10:35
→ : 這技術的用處就是解決死板的翻譯阿12F 03/15 10:35
推 : 微軟的AI翻譯真的很猛13F 03/15 10:35
Bing Microsoft Translator
Translation ...
Translation ...
推 : 文書翻譯QQ16F 03/15 10:36
推 : 文組唯一的淨土被理組攻陷了17F 03/15 10:37
推 : 翻譯跟駕駛絕對會被取代18F 03/15 10:37
推 : 是已經可以用了嗎 還是還在研發19F 03/15 10:38
推 : 這只是遲早的事啊20F 03/15 10:38
→ : vvvi 人家這還在實驗室 你用bing是在搞笑嗎21F 03/15 10:39
推 : 翻翻看習包子22F 03/15 10:39
推 : 翻譯不用想了...不可能取代的 語言本身就沒標準23F 03/15 10:39
推 : 不會翻譯成水平跟質量這兩個中國用語,讚24F 03/15 10:39
→ : 沒標準的東西 你怎麼確定做出來的東西可以用25F 03/15 10:39
推 : 就算取代也不是這幾十年的事 還早26F 03/15 10:40
推 : 希望人類以後不需要再為了語言不通所煩惱27F 03/15 10:40
→ : 機器學習要有規則 問題是你找不到規則XD28F 03/15 10:40
→ : 可以不用在書店洪蘭翻譯的東西是好事啊29F 03/15 10:40
推 : 整句翻譯一直是AI的天缺 我覺得甚至可以當圖靈測驗XD30F 03/15 10:41
推 : 合理 本來語言翻譯就可以大程度被科技取代 但有限就是31F 03/15 10:41
推 : 原本就已經比google翻譯好了32F 03/15 10:42
推 : 文組要崩潰ㄌ33F 03/15 10:42
推 : 不管啦! 口譯不會被取代!34F 03/15 10:42
推 : 太好啦文組終於要被取代了35F 03/15 10:43
推 : 可以翻金庸小說再來說嘴36F 03/15 10:43
推 : 比google好多了 我剛剛試高堂明鏡悲白髮 朝如青絲暮成雪37F 03/15 10:43
→ : 未來學外文會被笑嗎 直接買翻譯器就好38F 03/15 10:44
噓 : 新聞和廣告年年看到,實品卻神龍見首不見尾39F 03/15 10:44
推 : 好了 鄉民不用煩惱官方語言改英文了40F 03/15 10:46
推 : 又要蓋通天塔了41F 03/15 10:48
推 : 叫它翻譯 send lee tree pay42F 03/15 10:49
推 : 雖然太深的無法翻譯但基本文章都可以翻的話也很夠用了43F 03/15 10:52
→ : 至少英文不行的人來說是救星阿
→ : 至少英文不行的人來說是救星阿
推 : 文組QQ45F 03/15 10:53
推 : 應該還沒有實際放到他們的翻譯服務裡面46F 03/15 10:55
推 : 翻譯個大概 還是可以由人來做修正啊47F 03/15 10:57
→ : 圖靈試驗的最後考驗 -- 翻譯48F 03/15 10:59
推 : 來翻布袋戲裡面講三小 我就服49F 03/15 11:00
推 : 還是需要人工修稿啦50F 03/15 11:01
→ : 去年Google的品質超越BING
→ : 去年Google的品質超越BING
噓 : 豪洨的成分比較大,就算google也是翻的226652F 03/15 11:03
→ : 歐語之間取代性很高 詞序一樣的對譯 但最終還是需要人工修53F 03/15 11:03
→ : Google去年發表的成果真的很強 二層關係詞子句 很不錯
→ : 三層還常常正確
→ : Google去年發表的成果真的很強 二層關係詞子句 很不錯
→ : 三層還常常正確
推 : 可以直接放棄學習各國語言嗎56F 03/15 11:04
→ : 但細微之處還是得人工修57F 03/15 11:04
噓 : 光網路這個詞都無法正確翻譯成繁體中文= =58F 03/15 11:04
推 : 不可能吧、人都翻譯不好了,機器的話也就幾句還能看59F 03/15 11:05
推 : 不過這種工具真的能大幅加速譯者的流程 光一整段查單字就.60F 03/15 11:07
推 : 人類只需要一種語言61F 03/15 11:07
推 : 英文、中文都是 SVO 且不分陰陽,比起歐語算蛋糕了。62F 03/15 11:20
噓 : 說那麼多 結果翻譯網站打上台灣三字經翻出來是什麼63F 03/15 11:25
→ : 鬼玩意
→ : 鬼玩意
推 : 文組崩潰65F 03/15 11:27
推 : 中英文邏輯差太多了,其實很難翻66F 03/15 11:29
推 : 翻單詞誤差很大 但是翻整句意思還滿準的67F 03/15 11:32
推 : 翻幾篇ptt廢文來看看68F 03/15 11:39
推 : google翻譯表示69F 03/15 11:49
推 : 在還不能隨時隨地的即席翻譯 口譯就不會失業70F 03/15 11:55
推 : 說個笑話 文組教CS機器學習71F 03/15 11:57
→ : 文組 QQ 快來學程式轉職當碼農吧72F 03/15 12:19
推 : youtube自動翻譯英文 就讓很多翻譯失業了吧73F 03/15 12:37
推 : 沒標準沒規則xddd 想嗆你文組 但看來連文組都不如 看來應74F 03/15 12:46
→ : 該是管院的
→ : 該是管院的
推 : 我不信76F 03/15 12:49
推 : 文組QQ77F 03/15 12:57
噓 : 文組崩潰wwwwwww78F 03/15 13:03
推 : 某些簡體字的字詞AI有辦法分辨嗎?79F 03/15 13:33
→ : 還有幾集可以逃?80F 03/15 13:35
推 : 翻譯蒟蒻81F 03/15 19:06
推 : 以前也有人說電腦圍棋贏不了人 ...反正文組一定要看到自82F 03/15 19:17
推 : 翻譯米糕大概再20年出現83F 03/15 19:17
→ : 己被科技打臉才敢承認84F 03/15 19:17
推 : 文組悲歌85F 03/15 19:19
推 : 水喔不用學英文了86F 03/15 19:29
推 : 有些文組還在糾結在沒規則沒規律XDD87F 03/15 19:36
→ : 這些語感的問題只是不容易寫成規則,不是完全沒規則
→ : 真的完全沒規則的東西,人腦也是學不起來的
→ : 傳統機械翻譯會失敗就是想要把所有語法規則都寫成程式
→ : 現在機械學習就是不跟電腦講了,你自己用大數據去學
→ : 這些語感的問題只是不容易寫成規則,不是完全沒規則
→ : 真的完全沒規則的東西,人腦也是學不起來的
→ : 傳統機械翻譯會失敗就是想要把所有語法規則都寫成程式
→ : 現在機械學習就是不跟電腦講了,你自己用大數據去學
推 : 九樓要不是反串就是真的很可憐92F 03/15 19:49
推 : 能日翻中才是最強的,翻譯出來沒一句像人話93F 03/15 20:18
→ : deep learning又在虐人類了94F 03/15 20:31
推 : 中英暫時不會95F 03/15 20:31
→ : 母語簡單的就要小心了
→ : 母語簡單的就要小心了
推 : 我自己會一些程設 有些程式的專用巨集都會寫 英譯中97F 03/15 20:32
→ : 規則沒那麼容易定義完全
→ : 不信把這篇的web版丟Google翻譯看看
→ : 規則沒那麼容易定義完全
→ : 不信把這篇的web版丟Google翻譯看看
--
4樓 時間: 2018-03-15 15:17:36 (台灣)
→
03-15 15:17 TW
測試:某些簡體字的字詞有辦法分辨嗎? 股溝:Is there a way to distinguish certain simplified word words? 萎軟:Is there any way to distinguish some words in simplified characters?雖然有點小錯,但是好像的確是萎軟略勝一點點的感覺?有點意外
回列表(←)
分享