※ 本文為 terievv 轉寄自 ptt.cc 更新時間: 2017-02-09 23:36:23
看板 Soft_Job
作者 標題 Re: [請益] 深度學習的實際應用
時間 Sat Jan 28 14:03:41 2017
原文恕刪
我進入職場後才發現
還是真的有些資訊人對機器學習或資料探勘認識不多
而且原po文底下對text領域的推文好像比較少
所以我簡單分享一下我的領域還有實際應用
我研究所是做text mining, word embedding, topic model(LDA), NLP
(拜託公司有缺人做這塊的請聯絡我XDD)
e.g. 1 LDA->推薦系統
LDA簡單來講就是分群 業界最常用的就是推薦系統
某家新創電商用LDA做推薦系統 在原本的計算能力下
推薦的命中率從原本的10%提升到45%~50%之間
e.g. 2 LDA+social network -> 熱門議題發掘
這是小魯做的研究之一
我們那時候跟某公司合作 挖掘社群網站內重要的議題
會依照不同人在社群內的領導性 迭代計算熱門程度及重要性
後來實際運用是新產品推廣和輿情分析 儘早發現對公司不利的言論以利後續滅火
e.g. 3 NLP -> 聊天問答機器人
這個是我現在主要做的領域
要處理的是對特定項目進行了解 還有給予使用者建議
這個其實蠻實際的 對組織來說 如何完整記載資訊還有提供給需要的人使用
這件事情一直都是人工處理
有這套系統後 員工遇到問題可以直接向機器人尋求協助
這可以降低溝通成本及加快開發效率
e.g. 4 word embedding -> 機器翻譯
傳統上對文字的處理大多是用one-hot的方式做輸入
不過很容易遇到維度太大 而且罕見詞浪費空間等問題
word embedding簡單來說就是可以把所有文字轉成固定大小的矩陣來處理
例如 queen = [0.1,0.5,0.2] king = [0.4,0.1,0.7] .....
那他神奇的地方在於 轉完的矩陣有關聯性
例如
queen - woman + man ~ king
I am starving ~ I am hungry (這個要額外做處理)對不同文字間 可以再用NN做轉換就變成
I am starving ~ 我肚子餓了
不過這套目前還有一些問題還沒被解決
以上這四個例子其實都很常見
而且很難用非機器學習(可能不是NN)的方式得到更好的結果
簡單來說 機器學習在"無法簡單定義流程"的地方 通常可以獲得更好的成效
以上是我在這領域待3年左右的分享
不過我剛上班沒多久 看的可能比較狹隘
其他還請強者補充XD
--
Sent from my CASIO fx-991es .
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.227.49.28
※ 文章代碼(AID): #1OZ3H0Lp (Soft_Job)
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1485583424.A.573.html
推 : 推1F 01/28 15:06
推 : 推 最近在嘗試弄推薦系統2F 01/28 15:07
推 : 推3F 01/28 15:15
推 : 推,也想往這個方向走4F 01/28 15:54
推 : 推5F 01/28 15:54
推 : 1的難度是如何在資料量大時做出來 不然只是gensim6F 01/28 16:10
→ : 整篇只有seq2seq 那段比較偏深度學習吧,其他根本跟深度7F 01/28 16:16
→ : 學習沒什麼關係。
→ : 學習沒什麼關係。
→ : word2vec 應該也算啦,前面幾個就不4了9F 01/28 16:22
推 : 台灣需要 NLP 的公司好少阿,還需要大家一起推廣10F 01/28 16:32
→ : 市場原罪呀,樓上大大不4要發文(擦眼睛11F 01/28 16:33
推 : 現在放假,只有手機阿,打字不方便。等我有電腦時再來分12F 01/28 16:36
→ : 享最近的市場狀況喔,感謝
→ : 享最近的市場狀況喔,感謝
→ : 期待!14F 01/28 16:52
推 : 原文根本是不查資料上來發文偷學別人整理的,認真給推。15F 01/28 17:08
推 : 台灣慣老闆:半年要做出像Siri的APP16F 01/28 17:27
推 : 推17F 01/28 17:39
推 : 原文深度釣魚18F 01/28 18:11
推 : 自己用過LDA+NLP來產生摘要,真的好用19F 01/28 18:14
推 : 推20F 01/28 18:47
推 : 推,做過判例text mining,覺得有趣+121F 01/28 18:49
→ : 推22F 01/28 20:59
推 : 台灣做ai太難了 市場風向不愛23F 01/28 22:28
→ : 在台灣老闆根本不愛 因為這東西很難馬上有成效 而且24F 01/28 22:53
→ : 我之前聽一家做機器人客服的 程式判斷文字永遠卡在6-7成
→ : 老闆也是做了 然後放在那邊=_="
→ : 我之前聽一家做機器人客服的 程式判斷文字永遠卡在6-7成
→ : 老闆也是做了 然後放在那邊=_="
推 : 深度學習=神經網路?27F 01/29 11:13
推 : 推 可惜現在台灣做NLP的還是不多 QQ28F 01/29 11:33
推 : Siri, Google Assistant這麼難用,大家還是覺得AI很厲害嗎29F 01/30 01:13
推 : 推樓上,不要把ai神話,但這領域很有趣30F 01/31 17:32
--
※ 看板: terievv 文章推薦值: 0 目前人氣: 0 累積人氣: 227
回列表(←)
分享