Re: [討論] 大家會擔心 ai 寫 code 讓工程師飯碗不 - Soft_Job板

作者 DrTech (竹科管理處網軍研發人員)
標題 Re: [討論] 大家會擔心 ai 寫 code 讓工程師飯碗不
時間 Sun Nov 3 16:09:00 2024

※ 引述《angus850503 (安格斯)》之銘言：
: 借版問
: 小弟目前為前端工程師受益於 Copilot 跟 ChatGPT
: 開發上真的輕鬆非常非常多已經把按 tab 當作開發的一環了XD
: 不過之前就一直對生成式 AI 有個疑問
: 就是"幻覺"到底有沒有根本上的解決方法?
: 我的理解目前的 AI 還是靠大數據去堆疊資料量用以訓練模型
: 現階段也是不斷堆硬體去撐這塊
: (如果理解有誤請小力鞭QQ)
: 但幻覺的問題不論是餵更多資料或是透過 RAG 感覺都是治標不治本
: 還是沒辦法完全預防與解決
: 對我來說這樣可以稱得上是 AI 嗎? 還是充其量只是進階版的機器學習?
: 請各位軟工大神解惑了QQ
: 附上這個議題 ChatGPT 自己的回答:
: https://i.meee.com.tw/Gk7IjRH.png
: https://i.meee.com.tw/EVQCczh.png

解決幻覺，不一定要從LLM解，
而是靠系統架構解。

例如，做一個問答系統，很多人減少幻覺是這樣做的：

0. 預先整理好QA問答資料集
(人工整理，或機器輔助整理)

1. 使用者輸入Query。
2. 搜尋top-k個相似的問題。
3. 將 k個最相似的問題與答案輸入至LLM，
要求LLM生成最適合的答案。
4. 將LLM生成的答案輸出。(可能有幻覺，可能沒幻覺，難以控制)

幾乎所有的網路上範例程式都告訴你這樣做。
這套系統架構稱為：LLM生成答案。

實際上，你只要改個系統架構，就可以得到完全沒幻覺，又同樣準確率又同樣等級的問答系統：

流程如下：

0. 整理QA資料集
1. 使用者輸入Query
2. 搜尋top-k相似的問題
3. 要求LLM在K個問題與答案，弄成K個選項
要求LLM選擇一個最適合的問題與答案。
LLM只輸出1, 2, 3, 4。
(如有必要，可用outlines 或 guidance，控制 next token 只做這四個選擇)

4. 根據LLM選擇的選項，
系統只輸出選項1,2,3,4 對應的答案A。

由於A不是LLM生成的，所以永遠不會有幻覺問題。

這套系統架構稱為：LLM選擇答案。(而不是生成答案)

也就是說，同樣一個系統，LLM原本是靠生成產生最後結果，轉換成LLM只能從多個沒幻覺的事實間，選擇一個事實。永遠不會有幻覺。

以上只是舉例。

任何一個AI功能，只要掌握一個訣竅，
LLM或AI的輸出結果，不要用在最後階段的輸出
而是轉化問題，系統設計成LLM用在中間某任務，在事實間做分類選擇，輸出的就永遠是事實。

根據實驗與經驗，答對答錯的機會也不會
因為改變了系統設計架構而有影響。

做AI應用，真的不是無腦套模型，套別人流程。
LLM也不是只能用在生成文字，傳統的，分類，選擇，NER，排序最佳化，…都可以靠LLM 做。
把LLM當成系統中間工具，而不是最終輸出，可以大幅提升AI能力，又完全不會產生幻覺。

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.72.189.178 (臺灣)
※ 作者: DrTech 2024-11-03 16:09:00
※ 文章代碼(AID): #1d9o-U5c (Soft_Job)
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1730621342.A.166.html

※ 同主題文章:

[討論] 大家會擔心 ai 寫 code 讓工程師飯碗不

10-27 21:31 keev

Re: [討論] 大家會擔心 ai 寫 code 讓工程師飯碗不

10-29 16:19 davidsmoon6

Re: [討論] 大家會擔心 ai 寫 code 讓工程師飯碗不

11-03 16:09 DrTech

→ neo5277: 樓上這個有專有名詞叫做rerank 我開發系統時有設計1F 11/03 16:33

→ DrTech: 重點是系統架構設計。rerank完，該怎麼輸出？如果用rerank完，LLM生成輸出結果，還是永遠有幻覺。如果rerank完，用top-k個答案事實輸出，就不會有幻覺。
而且當答案只有一個的情況，何必用到複雜的rerank。直接轉換成搜尋結果 k選一的classification任務，還比較適合。2F 11/03 16:44

推 neo5277: 嗯合理同意，下週來玩看看7F 11/03 18:40

推 prag222: 你可以一個問題問三次,覺得答案不對的就打臉chatGpt
多否定幾次可能就會給你正確答案了,(笑8F 11/03 20:57

→ labbat: 微軟大老建議過了唄10F 11/03 21:04

推 j0958322080: 重點是這個還要靠人整理啊11F 11/03 23:26

→ DrTech: 我只是說最簡單的例子，也可做到不用靠人整理，或不要整理QA。方法就是跟常見的RAG一樣，不整理QA，直接把文章切成chunk 段落。一樣搜最接近top-K段落，給LLM生成答案，但是生成答案後，"不要"信任LLM的生成文字直接輸出，使用傳統的NLP去糾錯(spell correct ion)，糾錯的候選只能是chunk事實中的連續句子。最後輸出糾正到事實的句子。這樣可做到不整理QA但整個系統只會輸出最正確的事實句子。
方法變形很多啦，但原則就是：LLM只是選擇或決策的工具，非最後的答案生成輸出。這樣就會有同樣聰明，又永遠是事實輸出的AI。12F 11/03 23:38

推 viper9709: 原來是從問答題變成選擇題22F 11/04 00:44

作者 DrTech 的最新發文:

+5 [心得] 青埔對旅居各國經驗的人，有不同價值 - home-sale 板

作者: DrTech 42.73.22.146 (台灣) 2024-11-18 00:55:28

137F 34推 29噓
+4 Re: [討論] 大家會擔心 ai 寫 code 讓工程師飯碗不 - Soft_Job 板

作者: DrTech 42.72.189.178 (台灣) 2024-11-03 16:09:00

22F 4推
+19 Re: [新聞] 桃園房市新一級戰區青埔下一站A20重劃 - home-sale 板

作者: DrTech 114.137.163.206 (台灣) 2024-10-26 11:39:08

39F 19推
+90 Re: [閒聊] 青埔的機能比想像中的還好 - home-sale 板

作者: DrTech 42.72.247.13 (台灣) 2024-10-21 02:54:29

看google maps 是很難體會一個地方的生活機能與品質的所謂的機能差，不是有沒有開店賣日用品，或飲食多不多。而是你能不能買到合理價錢，時間，品質完成生活需求。目前青埔就是店看起來多 …

276F 101推 11噓
+25 Re: Fw: [爆卦] 群創八廠發生霸凌致死 - Tech_Job 板

作者: DrTech 42.72.247.13 (台灣) 2024-10-18 15:06:53

看了一下靠北群創，霸凌的副組長，在把人霸凌哭後，還笑著談剛才怎麼樣讓受害者哭的。有夠變態。整理一下群創光電文化： 2019年 - 員工穿無塵衣打架 2020 -群創女副理詐欺 2020-群創男 …

39F 27推 2噓

點此顯示更多發文記錄