顯示廣告
隱藏 ✕
※ 本文為 terievv 轉寄自 ptt.cc 更新時間: 2019-03-10 10:46:43
看板 Soft_Job
作者 aacs0130 (嘻嘻莉亞)
標題 [心得] 資料科學家工作分享與 AI 產業觀察
時間 Thu Mar  7 16:05:02 2019


最近版上好像很多人對 AI, ML, Data mining 的工作有興趣

也想知道自學, 唸碩士, AIA 或其他方式怎麼能夠進入 AI 產業

我自己就是資料科學家

想跟大家分享一下我的工作內容跟對 AI 產業的觀察


=== 先說結論 ===

1. 非CS背景想轉職 AI => 念四大碩,主修 AI

2. 不想念碩士,想自學
        => 證明你比四大碩強 => 去社群給 Talk or Kaggle 比到前三
           社群有 ML/DM Monday, Taipei.py, Py data 等等
           有個聽眾覺得『哎唷不錯喔』,機會就來了

3. 已經是資工碩了
        => 去社群給 Talk or 發top conference paper ex: AAAI, NAACL


=== 我的背景 ===

台大資工學碩

主修NLP, 熟AI, ML, SVM, 不熟DL

待過趨勢,華碩,新創

六年工作經驗  四年DS經驗, 英語流利


=== 資料相關工作內容 ===

資料分析師 : 有產業, 統計知識, 了解問題, 把問題變成數學問題

資料科學家: 把問題變成數學問題, 抽feature, 訂evaluation

             設計數學演算法, 寫prototype

資料工程師:data clean, data storage, big data, cloud computing

機器學習工程師:設計數學演算法, 實作演算法, 挑ML模型, tune 參數

                把prototype 改成 production code

通常在台灣就是四種都要做...統稱資料科學家



根據背景知識, data type還會細分成

影像CV, 語音, 語言NLP, 產線資料, signal, 地理資訊等等

影像現在在台灣最紅,約有60家新創

NLP 約20家

語音約3家, google/apple/ms 太強,很難跟他們競爭

後面三種data 我沒有研究....



=== AI 產業現況 ===

2012 - 2017 爆紅 超火

2018 冷靜重整期,很多 AI 新創倒閉

2019 假AI新創很多, Junior 飽和, Senior 超缺

Senior 假設台灣有 N 個,可是缺有 4N

大家都要即戰力,有經驗的,可以馬上做專案

但是Sr. 不是去美國,就是不想換工作

如果你是即戰力,我手上有10個缺可以介紹


Junior 有 N 個,缺大概也有 1.2N 個

不過台灣每年生產1000個 AI碩士吧,所以也不缺人


假 AI 新創就是 『口號出得去  人進得來  大家大發財』

去面試就知道老闆不懂 AI ,問一下雷公司八卦都很多

另外開了2, 3年沒有產品也沒有賺錢的大概也怪怪的



=== 關於訓練新人 ===

公司訓練 Jr 是需要花錢花時間的

而且我的經驗是專案都做不完,哪有時間訓練新人?

讓Sr. 花 20% 的時間訓練新人,少做 20% 專案老闆願意媽?

Sr. 願意犧牲看八卦版呵呵笑的時間訓練新人,是我佛心來著

但是很多新人訓練好又去美國或念博班


我也很無奈呀...

去美國的工作環境, 工時, 薪水, 技術都好很多

念博班的說他想做世界第一,不想做客戶願意付錢的東西



=== 結論 ===

我覺得不鼓勵大家轉職 AI

好公司大概都飽和了,只收 AI 碩

2017年前 AI 景氣很好,但是現在冷了

假AI新創又多,有70%吧,如果你沒有能力分辨就是當砲灰

AIOT 現在 90% 是假新創

另外當資料科學家

背景知識,工程,數學,英文都是基本能力唷

很多人說數學很重要...是因為他們工程跟英文都很好了

Pycon Taiwan 徵稿中 3/18截止,當過講者求職大加分喔!



--
Q:為什麼aacs叫小西呢??
A:1.因為aacs的英文名字叫Cicilia Segeliin
  2.因為西是最好寫的C
  3.西是由一條拋物線+一組雙曲線+一個橢圓組成的


--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.134.185.153
※ 文章代碼(AID): #1SWD2pzP (Soft_Job)
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1551945907.A.F59.html
bab7171: 推1F 03/07 16:11
MOONY135: 我覺得學校跟課程開出來差不多就等於冷了2F 03/07 16:13
MOONY135: 2014那時候的BIG DATA都還很潮
cloud computing, AI, IOT, 區塊鏈, FinTech, Deep learning, AIOT
一波炒過一波
當菜市場阿嬤都知道AI,股市都有AI概念股,就代表潮水要退了
robler: AI和大數據就是一個熱潮,過一陣就冷了很正常4F 03/07 16:18
robler: 這種題材靠喊口號騙投資的公司超多,真的要小心
aacs0130: AI 新創去年倒一堆,美國,中國跟台灣一起倒6F 03/07 16:19
w0005151: AI工作不等於AI公司,我覺得這要搞清楚,科技業沒有不7F 03/07 16:19
w0005151: 需要數學和英文的,就算不碰AI也是
w0005151: 這篇跟前端文一起看結論是果然大家都不希望轉職者來自己
w0005151: 產業XD
aacs0130: 不是不希望大家做AI,是進來的半吊子難民太多,勸退了很11F 03/07 16:22
aacs0130: 多人,履歷收到不想收,但是他們還是找不到工作
補充說明:
轉職難民太多,但是他們都沒有作品跟成果...
每個都說我很便宜,請訓練我。
但是我有時間為什麼不去訓練台大碩,要訓練你呢?
tataTangQQ: 我這剛跨考上CS的廢物這下不知道要去哪了(原本想說會13F 03/07 16:27
tataTangQQ: 上中央AI組)
ice80712: 推 AI只有少數幾家會活下來15F 03/07 16:27
w0005151: 半吊子在任何領域都會碰壁的, 看上面前端文就知道16F 03/07 16:30
w0005151: 但還是推分享
aacs0130: 應該說轉職難民太多,但是他們都沒有作品跟成果.....18F 03/07 16:33
MOONY135: 我最近聊了幾家 也開始覺得我是難民...19F 03/07 16:45
現在景氣不好,多聊十家吧!
cia1099: 台大純血還在華碩糟踏20F 03/07 16:58
華碩不錯啊,學習到很多東西。
我知道自己要什麼,缺什麼就好囉~~~
台大純血沒去美國就會一直被罵耶~~~
a126sam01: 有大神出沒,給推~21F 03/07 16:58
Transfat: 轉職又非即戰力,是不是沒希望了22F 03/07 17:03
ckp4131025: 大家都只要即戰力,市場當然很缺senior囉23F 03/07 17:33
老實說我覺得這是台灣 AI 圈的困境
一來 AI 圈也才紅5年,Sr. 本來就不多
二來 很多 Sr. 都跑去美國了
三來 Jr. 沒人帶也沒有自學能力就不能變Sr.,只會變成Super Junior
四來 老闆都希望Sr. 免費加班帶Jr. 還要加班做專案
MOONY135: 現在風口感覺消失的時間點越來越快24F 03/07 17:34
aacs0130: 所以熱情興趣比較重要,熱潮是很快消退的25F 03/07 17:37
LinuxKernel: 要開示一下哪些是假AI新創嗎26F 03/07 17:49
會被告耶
descent: 感謝分享27F 03/07 17:56
SmallpTsai: 推這篇28F 03/07 18:01
cplusplus426: 根本沒那麼多即戰力啊 別的領域做久了  誰想跳出舒29F 03/07 18:02
cplusplus426: 適圈
cplusplus426: 你背景也太強
freepenguin: 推32F 03/07 18:23
chiu1505: 推 謝謝學長33F 03/07 18:45
人家4女森...森77...7pupu
Morphee: 你的Senior缺年薪範圍是?34F 03/07 18:47
1.2N - 2N,N等於現職薪水
BaGaJohn5566: 推35F 03/07 18:49
drajan: super junior有梗 是說人多的地方不要走 老祖宗說過了36F 03/07 19:46
chocopie: 推分享37F 03/07 19:51
vincentman: super junior。感覺很悲哀XD38F 03/07 19:55
kutkin: super  junior39F 03/07 19:58
TacoBell: 想知道大大現在在哪高就40F 03/07 20:04
zackl852l: 推~41F 03/07 20:50
rereterry: super jubior 笑了,然後哭了42F 03/07 21:03
apley:   推super junior~有梗~43F 03/07 22:41
littlethe: 我想請教你對資安的看法如何?因為我進修有資安和資科可44F 03/07 23:04
littlethe: 選,我原本想走資科,但看到一堆人走資科就怕怕的
看你對什麼有興趣跟熱情囉...熱潮退得很快...
我碩班念AI的時候根本沒人想念,大家都在做遊戲跟CV, embedded
littlethe: 我是對資科興趣大一些,因為我以前也喜歡統計,但看到現46F 03/07 23:54
littlethe: 在瘋成這樣,感覺只有很頂尖的人走資科才有用
不會呀,人人有功練
畢竟每年還是有幾百個 Junior 入行
當然數學,工程,英文,溝通都要努力鑽研才能頂尖
scan33scan33: Thank you 學姐48F 03/08 00:09
Hi 強者學弟,你學長都在亂叫我學長...
Wush978: 想走資料的新鮮人,我推我公司辦的 https://d4sg.org/49F 03/08 00:09
Wush978: 有作品、有mentor、又因為公益性質容易上媒體50F 03/08 00:10
Wush978: 話說AI, 資料科學目前還是幫有錢人比較多,幫窮人較少...
推...幫高調喔
sxy67230: 難民之一,想跳槽公司但是目前都沒遇到合意的52F 03/08 00:18
littlethe: 幫助窮人比較少?怎麼說?53F 03/08 00:20
fansia: 推推 作相關工作約6-8年 前年登出了 還是賺錢糊糊口重要54F 03/08 00:25
DS很多人轉行做backend。ML技術, paper更新太快,學得很累
mirror0227: 正在唸AI碩 怕爆55F 03/08 00:35
不會啦!AI碩 未來五年內不會缺工作
gravity067: super junior 這個讚XD     感謝大大提供真實現況56F 03/08 00:41
sxy67230: 推樓上 現在潮水退了 真的想入坑除非有愛要不然真的不要57F 03/08 00:43
sxy67230: 進來 本人在金融壽險業做NLP領域 銀行業很多主管不瞭解
sxy67230: 這塊領域有過分的幻想 導致他們覺得ai就只有這樣
sss81521: 請問唸AI碩去IC廠做AI相關容易嗎?60F 03/08 00:45
aacs0130: IC廠不熟61F 03/08 00:48
ice80712: 做影像相關容易去IC廠 做NLP或數據類的...難62F 03/08 00:52
dwaydwaydway: 感覺nlp工作好像少很多(?63F 03/08 01:29
yes
y800122155: 所以junior的合理薪資範圍是?64F 03/08 01:35
有多少能力拿多少錢
有22K也有人100K
vn509942: 這幾年很多金主對AI題材有莫名的期待65F 03/08 01:40
真的
lukelove: 純推純血66F 03/08 01:50
※ 編輯: aacs0130 (123.193.91.113), 03/08/2019 02:40:53
drajan: 我們新的CTOㄧ進會議室就問 你們怎麼不用deep learning?67F 03/08 06:28
drajan: 暈倒....DL又不是萬靈丹
我也遇過客戶給我200筆資料,卻說怎麼不用deep learning?
你給我10000筆以上再提DL吧...
shiauji: 感謝69F 03/08 07:05
kriswu8021: AAAI不是top conference70F 03/08 08:26
vincentman: @drajan,CTO意思可能是問有沒試著study或評估?也就是71F 03/08 09:16
vincentman: 要聽不使用的理由,應該沒有說一定要用,總要有個說法
vincentman: ,不然他跟別人很難交代XD
andyliu42: AI碩不能光是投AAAI吧,領域沒有符合公司需求也不好找74F 03/08 09:20
andyliu42: 把 CV or NLP 點一點也蠻重要的
ap954212: CVPR ICCV ECCV吧76F 03/08 09:37
sean50301: ACL EMNLP ㄋ77F 03/08 10:36
當然都是,NLP還有 COLING, IJCIR, SIGIR, ICML, IJCAI
sean50301: NIPS78F 03/08 10:38
Ouranos: 請問在台灣找Data Engineer會比找AI/ML還好找嗎?79F 03/08 12:02
Ouranos: 我是指做data pipeline, 用Spark/Cassandra/Airflow這類
Ouranos: distributed system類的工作  謝謝分享! :)
我覺得不會,我很少聽到big data的data engineer 工作
大部分都是 data clean 的工作
而且是data scientist 兼任 data eng., data analyse, ML eng.
thefattiger: 學歷很好用但不代表非四大碩什麼都做不了,你的結論82F 03/08 12:40
thefattiger: 有點偏頗,還有很多在做AI的公司並不是AI公司
thefattiger: 很多是本身有其他運作很久的業務,只是成立個AI部門
我的意思說只看學歷
但是如果非資工本科又沒有亮眼學歷
你就必須有亮眼作品
不然你會找不到Senior帶,學習成長很有限

另外你說得對,很多傳產最近都成立的AI部門
但是資工碩通常不喜歡去傳產,除非高薪又早下班。
所以我聽說裡面都很少資工碩
physheepy: 樓上說的這種公司其實是做ML的大宗 但是這些公司大多85F 03/08 14:03
physheepy: 早已在四五年前開始佈局招人或者訓練內部人員投入AI
physheepy: 研發 運作得好的話 現在應該沒位置了才對
Gaogaigar: 樓上 其實不只ai 熱門的新玩意都是先找四大碩再說88F 03/08 14:05
thefattiger: 非四大碩就是面試多間一點,大不了就薪水低一點89F 03/08 14:18
thefattiger: 最近幾篇文看下來就是大家都把自己領域的門檻講的很
thefattiger: 高,但每個領域學到深都馬很難,要這樣講講不完啦
tipsofwarren: 可以請問,為什麼GAN 中的generator 不是generative92F 03/08 18:46
tipsofwarren:  model?
sxy67230: gan 的genetor 本身就是一個generative model啊,原始94F 03/08 19:25
sxy67230: 的goodfellow論文完全沒強調他一定是個自編碼器的decode
sxy67230: ,他可以是任意的generative model,只是用自編碼你不
sxy67230: 用像傳統HMM一樣考慮你的joint probability而已
DrTech: 台灣好像稱乎科學家的門檻很低。98F 03/09 00:15
DrTech: 人人做個兩年都號稱自己是科學家了。離開台灣,科學家可是
DrTech: 職級很高的職缺耶
frouscy: 大公司是這樣啦, 不過一堆SV中小公司的DS根本都在做DA做101F 03/09 00:20
frouscy: 的事, 根本連model都碰不到...
DrTech: 原po應該是沒問題,但是現在市場人人喊自己是高手的情形太103F 03/09 00:31
DrTech: 氾濫。浮誇氣氛太濃。
我不是高手啦,但是台灣都是一個人包DS, DA, Data Eng, ML Eng
但是名稱掛資料科學家
每次講自己的職稱都覺得很心虛,只有使用者經驗研究員聽起來更威
thefattiger: 我還是建議想轉職的人,基本的看一看趕快找工作105F 03/09 00:33
thefattiger: 就算是很賽的小公司也好,真的開始做才知道
thefattiger: 自己缺的是啥,實務上需要的是啥
thefattiger: 聽人一直說數學要好英文要好根本也不知道要學甚麼
thefattiger: 然後DS絕對絕對不適合轉職者
drajan: 一堆DS都是非資工系畢業的 樓上在胡說八道什麼?110F 03/09 00:48
ice80712: 現在ds職缺本來就很多 門檻也低 哪需要資工系畢業111F 03/09 00:58
thefattiger: 你們講的真的是data "scientist"嗎...112F 03/09 01:29
littlethe: 我反而覺得DS很適合統計數學的轉來資訊,而一般工程師113F 03/09 02:05
littlethe: 不太適合走DS,數學比重大於工程
littlethe: 所以我也不推胖虎的說法,不挑工作做的話,就只是工程師
drajan: 非資工系畢業代表門檻低 這邏輯....沒看過數學 物理 電機116F 03/09 02:21
drajan: 博士跑去當DS?
thefattiger: 一般工程師當然是轉ML工程師容易啊,職缺多門檻低118F 03/09 02:28
thefattiger: 剛換領域哪有那多工作給你挑,先入門再慢慢提升實力
樓上大大們有的說的是美國大公司的純資料科學家

有的說的是台灣包山包海的資料科學家,很多沒有設計模型跟演算法

美國大公司的純資料科學家有個配合的工程師

幫忙把prototype 改寫成 production code

所以不必資工本科,很多統計,數學,工科博士背景

不過台灣prototype直接要上線的就很需要軟體工程背景了

因為上線交給客戶後有 bug 超麻煩
ice80712: 104上一堆ds缺 大學畢業就能去了 我講的是國內120F 03/09 02:51
ice80712: 台灣哪有什麼純科學家 都馬要會工程 所以工程絕對比數學
ice80712: 重要
ice80712: 連兩年碩都不用讀就能找一堆工作了 門檻還不低?
※ 編輯: aacs0130 (123.193.91.113), 03/09/2019 03:08:13
drajan: 能激起討論蠻令我意外的 記得2014年時談到資料科學時我看124F 03/09 04:45
drajan: 版上大部分都沒聽過那玩意
fig498: 感謝各位大神分享126F 03/09 07:11
sxy67230: 2014左右那個時候確實台灣沒什麼DS職缺,再早以前你想127F 03/09 08:06
sxy67230: 玩ML,就去當個algorithm,但台灣公司根本沒要什麼高深
sxy67230: 很屌的algorithm,所以algorithm很常就是做雜工。
gbd37: 猛130F 03/09 08:17
goldflower: 2015那時出來最爽 到現在應該都小主管了131F 03/09 13:13
goldflower: 更早沒缺 更晚人太多 每年自稱修過台大李宏毅的課的
goldflower: 就不知道有多少人了 飽和到不行
fusen80: 專業分析!!134F 03/09 14:22
g12288: 中肯135F 03/09 23:44

--
※ 看板: terievv 文章推薦值: 0 目前人氣: 0 累積人氣: 1809 
分享網址: 複製 已複製
r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇