※ 本文為 BruceX 轉寄自 ptt.cc 更新時間: 2013-09-17 11:22:18
看板 Gossiping
作者 標題 Re: [新聞] Google下一場世紀創舉:消除人類語言隔閡
時間 Tue Sep 17 05:37:11 2013
※ 引述《chevalierxd (獨孤求噓-風青羊)》之銘言:
: 這基本上就是作夢啊 我們平常說的話夾雜一堆方言
: 更不用說每個人腔調大異其趣 之前外國記者用過估狗的系統英翻日
: 結果記者必須要講得十分標準+緩慢才有辦法翻譯
這方面應該比較屬於語音的部分,如何去萃取不同腔調間具有的共同特徵,或是去辨認
腔調所屬的語言,我想這部分應該蠻成熟?或是已經有實際可以解決的方法了?另外要提
升辨認的精準度可以利用個人化的訓練(市場已經有產品了,世貿每次電腦展都在DEMO)
這部分是用聲音來轉文字的部分,中英文在這方面的技術都蠻成熟了。
升辨認的精準度可以利用個人化的訓練(市場已經有產品了,世貿每次電腦展都在DEMO)
這部分是用聲音來轉文字的部分,中英文在這方面的技術都蠻成熟了。
: 而且只能翻譯簡單的句子 稍微有點難度的文法就gg
: 而且他只是翻成日文 不是中文...
: 估狗大概現在的文字翻譯就是翻譯軟體的極限了 頂多稍微再潤飾一下 但是差別不大
google翻譯 現在的結果以單字來說,應該是很高的準確度,畢竟google應該是擁有世界
最大的語料庫的公司,所以對於各個單字的意思蒐集自然是最完整的。
最大的語料庫的公司,所以對於各個單字的意思蒐集自然是最完整的。
但是從結果看來,他在歐盟相關語系的翻譯很傑出,但是在翻譯成如中文和日文時,可能
就會出現很大的落差,裡面當然遇到很多的問題,一詞多義、詞性變化、句型結構重組。
因為平行(雙語)語料建構困難:要把中文和英文的句子拆開,標記詞性,單詞間互相匹
配.句型結構配對..說不定google壓根不做這事,可能只是用機率統計式的模型在配上簡單
文法規則來做 英文=>其他非印歐語系。(當然可能不只,只是我太膚淺...)
就會出現很大的落差,裡面當然遇到很多的問題,一詞多義、詞性變化、句型結構重組。
因為平行(雙語)語料建構困難:要把中文和英文的句子拆開,標記詞性,單詞間互相匹
配.句型結構配對..說不定google壓根不做這事,可能只是用機率統計式的模型在配上簡單
文法規則來做 英文=>其他非印歐語系。(當然可能不只,只是我太膚淺...)
: 語言翻譯極限大概也差不多 但效果只會更差
: 書面翻譯大家拿來看看笑笑還可以
若不要求當前google translate 那樣的速度,他應該有能力讓你看得更舒服但是如果翻
一句要等2~3秒,翻譯一個網頁要1分鐘以上那你大概還是會乖乖地看原文或是使用當
前翻譯的水準拉!
一句要等2~3秒,翻譯一個網頁要1分鐘以上那你大概還是會乖乖地看原文或是使用當
前翻譯的水準拉!
: 但是語言翻譯實際要跟外國人對話的時候我想應該很難笑得出來
其實從兩個接受過訓練的翻譯,翻譯出來的文字可以非常相近的結果來看,跨語翻譯應該
存在一定的規律和規則,才能在相同的源句,翻譯出具有共同特徵的結果,要達成近乎
存在一定的規律和規則,才能在相同的源句,翻譯出具有共同特徵的結果,要達成近乎
完美的翻譯應該是可能的。
: 要消除語言隔閡其實也不用麻煩 全世界都學手語就好啦...
所以理想就是大家都學同文(英文),那這個問題消失了,但是實務上就是難以達成,所
以才會想要用翻譯來解決。
以才會想要用翻譯來解決。
: 又沒腔調 也沒方言 完全通用 又安靜 根本是最佳語言...
: 如果真的要考慮消除語言隔閡 倒不如往腦科學那領域發展
: 看看語言和腦波的關聯性有沒辦法具現化出來之類的...
腦科學的發展真的很緩慢,現有的觀測技術,只能觀測磁場、電場、標記血流來觀察動態
的腦活動,而對於腦生理大都停留在微觀(神經元)和巨觀(腦區)的理解,真的要研究
神經之間的交互作用,意識、記憶、判斷等等的形成,這些現階段都沒有明顯的突破。
的腦活動,而對於腦生理大都停留在微觀(神經元)和巨觀(腦區)的理解,真的要研究
神經之間的交互作用,意識、記憶、判斷等等的形成,這些現階段都沒有明顯的突破。
上面我說的可能有誤,台大成大都有NLP(自然語言處理)的實驗室,修過相關
課程或題目在這領域的人應該可以把這些講得更清楚,小的不才無法做更佳的陳述。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 123.192.0.119
推 :唉 以後大家都說中國話1F 09/17 06:13
推 :專業推2F 09/17 06:16
推 :內行3F 09/17 06:33
推 :google就難講了 如果真能做到無差別翻譯 那真是一大創舉4F 09/17 06:33
推 :等一分鐘沒什麼,開十幾個網頁各跑一次看完前面也夠翻完了5F 09/17 06:39
→ :手語啊...據說手語也是有很多版本的(?)
→ :手語啊...據說手語也是有很多版本的(?)
→ :語音轉文字每個使用者要花點時間train 完成後就會很準7F 09/17 07:21
→ :印歐語系互翻應該是比較會先達成的 中日文各是不同語系
→ :再給研究人員幾年時間一定又會差很多
→ :印歐語系互翻應該是比較會先達成的 中日文各是不同語系
→ :再給研究人員幾年時間一定又會差很多
推 :以使用者角度來看,期待這不然學英文,但若以整個世界文化10F 09/17 07:36
→ :的角度來看,辜狗翻譯似乎有搞頭喔!
→ :的角度來看,辜狗翻譯似乎有搞頭喔!
推 :一大早就專業!12F 09/17 07:49
推 :以前NLP是神經語言學的縮寫,在其他領域也很紅很賺錢,怎麼13F 09/17 08:18
→ :被自然語言處理幹掉了......
→ :被自然語言處理幹掉了......
→ :樓上才是對的 NLP用的比較多視神經語言學 QQ15F 09/17 08:32
--
※ 看板: NEWS 文章推薦值: 0 目前人氣: 0 累積人氣: 268
回列表(←)
分享