Re: [新聞] 國慶日變10/1！中研院認了「AI語言模型」 - Gossiping板

作者 areses (areses)
標題 Re: [新聞] 國慶日變10/1！中研院認了「AI語言模型」
時間 Mon Oct 9 21:59:07 2023

不知道這個話題有什麼好延燒的，一個數據庫而已。

在中文環境，台灣本就貢獻有限，要研究，就必不可少用到對岸資料，重要的是語言模型的
表現怎麼樣。

至少從實際來看，回答邏輯通順，條例分明，也能準確理解提問的意涵並給出準確的答案，
這不就夠了嗎？

大模型就是需要大數據，大數據是所有人一起貢獻的，而不是中研院能決定的。台灣人能貢
獻的數據有限，那就慢慢來，只要技術在，隨著數據集的擴大，自然會訓練出適合台灣的語
言大模型。

※ 引述《armorblocks (package)》之銘言：
: 　
: 　
: 中央研究院詞庫小組日前發布的繁體中文大型語言模型CKIP-LlaMa-2-7b，今（9）日遭踢
: 爆使用中國資料庫，詢問「國慶日是何時」會回答「10月1日」。中研院坦言，訓練資料
: 有來自中國開源的任務資料集（COIG），今日中午已將測試版先行下架。
: 　
: 網友發現詢問該語言模型「國慶日是何時？」，其會回答中國國慶日「10月1日」；詢問
: 「中華民國國歌為何？」，它會回答中華人民共和國的國歌「義勇軍進行曲」；詢問我國
: 憲法，則會回答「中華人民共和國憲法」。外界質疑中研院使用中國資料庫訓練，僅簡轉
: 繁後就公開。
: 　
: 中研院資訊所表示，CKIP-LlaMa-2-7b的研究目標之一是讓meta開發的Llama2大型語言模
: 型具備更好的繁體中文處理能力。這項小型研究僅用約30萬元的經費，將明清人物的生平
: 進行自動化分析，建構自動化的歷史人物、事件、時間、地點等事理圖譜，因此訓練資料
: 除了繁體中文的維基百科，另也包含台灣的碩博士論文摘要、來自中國開源的任務資料集
: COIG、詩詞創作、文言文和白話文互相翻譯等閱讀理解問答。
: 　
: 資訊所強調，這是一項個人小型研究，各界對該模型進行的提問測試，並未在原始研究範
: 疇。該研究人員表示，由於生成式AI易產生「幻覺」（hallucination），導致模型產生
: 內容出乎預期，未來將努力改善。目前已將測試版先行下架，未來相關研究及成果釋出，
: 會更加謹慎。
: 　

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 185.244.208.150 (香港)
※ 作者: areses 2023-10-09 21:59:07
※ 文章代碼(AID): #1b90Sjld (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1696859949.A.BE7.html

→ Ilat: 就承認都買中國的東西很難？1F 114.36.224.100 台灣 10/09 22:00

→ ziso: 好了拉今天KMT執政 DPP會這樣說???2F 111.240.138.53 台灣 10/09 22:00

推 SpectreMan: https://i.imgur.com/BVNguNd.jpg3F 49.158.78.6 台灣 10/09 22:01

→ ghchen1978: 不符合塔綠班去中國化的標準阿4F 218.173.167.171 台灣 10/09 22:01

→ dovepacket: 中研院隸屬總統府你看這些科學家領國家的錢卻拿對岸軟體騙了多少錢5F 111.253.153.158 台灣 10/09 22:01

噓 CREA: 綠能你不能7F 104.28.232.15 台灣 10/09 22:02

噓 salix: 這時候又沒有國安問題了蒸蚌8F 150.117.136.207 台灣 10/09 22:08

推 lianpig5566: 推這篇9F 125.229.142.121 台灣 10/09 22:20

推 tonyian: 那我們跟中國共用總統就好了啊10F 218.35.163.91 台灣 10/09 22:31

噓 kaman999: 人謀不臧11F 223.138.50.45 台灣 10/09 22:35

作者 areses 的最新發文:

Re: [爆卦] 澤倫斯基認錯願意停火 - Gossiping 板

作者: areses 91.229.133.94 (香港) 2025-03-05 00:55:00

27F 5推 5噓
+5 Re: [爆卦] 民進黨幫沈伯洋和台灣民主實驗室闢謠澄清 - Gossiping 板

作者: areses 91.199.84.102 (香港) 2025-02-26 21:08:22

22F 7推 2噓
+6 Re: [問卦] 還會有白癡相信美國嗎 - Gossiping 板

作者: areses 185.14.47.188 (香港) 2025-02-20 00:19:14

74F 11推 5噓
Re: [新聞] 中國這1領域正重塑世界！最新自然指數：前10名他們占據8席，美國連麻省理工也只排13 - Stock 板

作者: areses 2025-02-14 20:15:14

44F 6推 8噓
Re: [問卦] 中國deepseek美國openAi，台灣？ - Gossiping 板

作者: areses 185.14.47.188 (香港) 2025-02-12 00:37:18

21F 4推 4噓

點此顯示更多發文記錄