作者 netsphere (Ruby&Waku)標題 [新聞] OpenAI 開始逐步推出其「先進語音助理」時間 Wed Jul 31 09:49:03 2024
OpenAI 開始逐步推出其「先進語音助理」
OpenAI 已經開始逐步推出其「先進語音助理」,從今日起少數付費 ChatGPT 用戶就能夠嘗
試與 AI 聊天機器人進行交談。
OpenAI 預計將緩緩開放語音助理的適用範圍,預計所有的 ChatGPT Plus 會員將於今年秋
季前玩到這個新功能了。
該公司在 X 上宣布,這個進階版的語音模式將提供「更自然、實時的對話,允許你隨時打
斷,並能感應並回應你的情緒」。
ChatGPT 其實在去年 9 月就已經推出對語音對話的支援,但當時的解決方案需要串接三個
獨立的模型,
一個將你的語音轉成文字、一個分析並生成文字回覆、而另一個再將文字回覆轉成語言。
這中間難免會有些串接不順暢之處,也不太可能將聽到的語氣和情感反應出來。
今年 5 月時 OpenAI 演示了新的 GPT-4o 模型,它使用單一多模態來實現語音功能,
也就是一個模型中包括所有語音分析、回覆及語音輸出的功能。
這除了能產生更適當、更有情感的回應外,也減少了與聊天機器人對話的延遲。
OpenAI 在 5 月的演示中出現一個插曲,就是示範的語音聽起來非常像電影《她》中為 AI
角色薩曼莎配音的演員 Scarlett Johansson 的聲音,
而受到大量批評。在遭到反彈後,OpenAI 儘管堅稱配音演員並未刻意模仿 Johansson,但
進階語音模式的發布日期依然被推遲,相似發音的聲音也已被剔除。
新聞來源:
https://tinyurl.com/ympa2uy2
----
首批推送AVM(Advanced Voice Mode)使用者的Demo
https://youtube.com/@gnksk
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.136.61.148 (臺灣)
※ 作者: netsphere 2024-07-31 09:49:03
※ 文章代碼(AID): #1cgPWI6M (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1722390546.A.196.html
→ vowpool: 付費試用當實驗品 笑死1F 125.227.40.62 台灣 07/31 09:50
※ 編輯: netsphere (223.136.61.148 臺灣), 07/31/2024 09:50:32
→ leoqqqoel: 又要賺錢囉 雷聲大雨點小2F 101.137.80.232 台灣 07/31 09:50
※ 編輯: netsphere (223.136.61.148 臺灣), 07/31/2024 09:51:15
推 tim1112: 可以輸出色色的語音嗎3F 111.80.211.114 台灣 07/31 09:54
推 genius0716: 0204要上線了嗎5F 42.70.181.157 台灣 07/31 10:00
推 SpectreMan: 語音早就可以用啊,這個是改善並新增視訊等功能6F 103.197.174.116 台灣 07/31 10:09
--