作者 WOGEchidna (艾姬多娜)標題 [新聞] 挑戰 OpenAI 關鍵利器終現身!Google 發時間 Thu Dec 7 11:53:08 2023
1.原文連結:
連結過長者請使用短網址。
https://technews.tw/2023/12/07/google-introducing-gemini/
2.原文標題:
標題須完整寫出且須符合內文(否則依板規刪除並水桶)。
挑戰 OpenAI 關鍵利器終現身!Google 發表 Gemini 模型,Bard、Pixel 8 Pro 率先導入
3.原文來源(媒體/作者):
例:蘋果日報/王大明(若無署名作者則不須)
TechNews科技新報/陳冠榮
4.原文內容:
請刊登完整全文(否則依板規刪除並水桶)。
近 10 年來,Google 稱自家一直是 AI 優先的公司。當 ChatGPT 開啟 AI 時代經過一年後
,Google 藉由全新 Gemini 模型大步向前,期望能超越 OpenAI 及其 GPT-4 模型。
Google I/O 2023 開發者大會即預告的 Gemini 模型,並未等到 2024 年第一季才現身,6
日由 Google 執行長皮蔡(Sundar Pichai)和 Google DeepMind 執行長哈薩比斯(Demis
Hassabis)向世人介紹 Google 目前最強大、最通用的模型,第一版 Gemini 1.0 能夠理解
和操作包括文字、圖像、音訊、視訊、程式碼在內不同類型資訊。
Gemini 原生設計成多模態模型,一開始就在不同模態上預訓練,接著透過額外的多模態資
料進行微調、提升效能。Gemini 1.0 所受的訓練是同時辨識和理解文字、圖像、音訊等不
同資訊,並回答涉及複雜主題的問題,這也讓 Gemini 在解釋、推理如數學和物理這樣複雜
的問題時表現出色。
不只如此,Gemini 1.0 能夠理解和解釋世界上常用的程式語言如 Python、Java、C++ 和 G
o,並且產生高品質的程式碼。值得一提的是,Google DeepMind 2 年前推出 AI 程式碼生
成系統 AlphaCode,現在透過一個專門版本的 Gemini,建立更進階的 AlphaCode 2,不僅
擅長程式設計,還能處理與數學、理論電腦科學相關的競技程式設計問題。
Google DeepMind 團隊使用 Google 自行研發、用於加速機器學習的 TPU v4 和 v5e(Tens
or Processing Unit),有規模地訓練 Gemini 1.0。依照模型大小有 Ultra、Pro、Nano
三種,其中 Gemini Ultra 為規模最大、功能最強大的模型,專為高度複雜任務所設計,Ge
mini Nano 則是處理裝置上任務最有效率的模型。
Google DeepMind 團隊不斷對 Gemini 模型進行嚴格測試,從理解自然圖像、音訊、視訊再
到數學推理,其中發現 Gemini Ultra 在大型語言模型研究和開發廣泛採用的 32 項學術基
準測試中,有 30 個取得領先成績。其中 Gemini Ultra 以 90% 的高得分成為第一個在 MM
LU(massive multitask language understanding,大規模多任務語言理解)測試裡超越人
類專家的模型,而在新的 MMMU 基準測試裡也得到 59.4% 領先分數,兩項測試皆超越 Open
AI 所開發的 GPT-4 模型。
截至目前 Google 所有 AI 模型中,Gemini 在偏誤、資料毒性(toxicity)等方面都接受
最全面的安全性評估。在網路攻擊、說服能力、自主性等可能存在風險的領域,Google Dee
pMind 團隊都進行最新研究,也運用 Google Research 的對抗測試技巧,在部署 Gemini
前率先找出關鍵的安全問題。
Google 將在多項產品中導入 Gemini,包括軟體方面的 Bard、以及有關硬體 Pixel 8 Pro
。從 12 月 13 日起,開發者和企業客戶可以透過 Google AI Studio 或 Google Cloud Ve
rtex AI 的 Gemini API 使用 Gemini Pro。Android 開發者也能透過 AICore,在開發作業
中運用 Gemini Nano。
在 ChatGPT 推出後 Google 內部宣布「紅色警戒」,從那時起被認為在 AI 競賽急起直追
。Gemini 可說是 Google 多年來一直苦心建立的模型,也被外界視為能一舉挑戰 OpenAI
的關鍵利器,我們將在越來越多 Google 產品看見 Gemini 身影,及其驅動的強大功能。
5.心得/評論:
內容須超過繁體中文30字(不含標點符號)。
我對Google還是很有信心的,搜尋引擎自己的、Android自己的、Google Play自己的、Pixe
l自己的、2025 SOC也要換成自己的拉古納架構,接下來還要收入自己的AI技術Gemini,雖
然目前還不曉得手機搭載的Gemini Nano具體能夠做到什麼事情,但是隨著硬體迭代,支援
項目肯定也會越來越多。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.71.82.128 (臺灣)
※ 作者: WOGEchidna 2023-12-07 11:53:08
※ 文章代碼(AID): #1bSK6ckA (MobileComm)
※ 文章網址: https://www.ptt.cc/bbs/MobileComm/M.1701921190.A.B8A.html
推 ftank183: 蠻期待會發展成怎麼樣子
*什麼樣子3F 12/07 12:01
→ JuiFu617: 我以為agi只是夢 看來10年內可能誕生5F 12/07 12:02
推 doranako: 有AI不需要那麼多員工了,裡面的可以領便當6F 12/07 12:16
推 cevs: Google真的很變態7F 12/07 12:42
推 kikooo: bard跟gpt4相比超廢,一直忘記指令8F 12/07 12:55
推 guogu: 所以bard什麼時候更新?9F 12/07 13:08
推 mc2834: 等他ˊ真的開放一般民眾使用再說…開發者會議每次都很美好11F 12/07 13:31
→ newline: 吹的總是很好聽 GPT4都放出多久了更不用說仍持續在學習14F 12/07 16:16
推 jior: 手機什麼時候才會全面使用傑米乃?16F 12/07 16:32
推 xylophone135: Bard不會同情我跟它說的悲慘遭遇就先扣分
更何況Google作惡多端個人不挺17F 12/07 16:45
→ rogergon: 你看他的天蛇就知道吹牛居多吧19F 12/07 16:52
推 GTR34: 看起來跟SKYNET有87%像20F 12/07 16:55
→ speed7022: 有人能解釋強的點嗎?這不是之前那個quick draw的衍伸嗎?21F 12/07 17:39
推 avans: google以前被gpt打個措手不及,之前的bard體驗也不太好,不曉得這次新AI的表現是否真的如文中描述一致23F 12/07 18:13
推 theevilM: 他可以總結錄音逐字稿了,雖然只有英文25F 12/07 18:14
推 Andosinjo: Google的東西就是充滿工程師思維,不是這麼容易走入「簡單易用」26F 12/07 18:35
→ square4: 看來ram至少要12GB,大概像pc端要吃顯存28F 12/07 18:41
→ kaltu: Google的project喔,三年內收掉或換掉30F 12/07 20:50
推 JeffreyCorn: bard的體驗開始在改善了,但是文字處理的能力還是輸GPT一大截,請它做一份語言課程的教學講義或考題就有很明顯的差異了。bard最大的優勢在搜尋知識性內容比起GPT可靠很多,因為還能立刻在回應上比對網站上的來源是否可信31F 12/08 00:45
推 wujet09100: bard 網頁版無障礙比chatGPT網頁版無障礙還好 Chat GPT有許多沒有文字的圖像按鈕 Google的產品基本就不會出現沒有文字標籤的按鈕 bard 還可以用標題在同一個對話串裡不同的問題跳轉 chat GPT不行36F 12/08 01:13
--