※ 本文為 ryanlei 轉寄自 ptt.cc 更新時間: 2014-07-26 23:12:04
看板 Soft_Job
作者 標題 Re: [請益] 如何踏入Data Mining/Engineers領域
時間 Sat Jul 26 11:15:32 2014
※ 引述《DrTech (科技博士)》之銘言:
: 最近我注意到相關職缺的公司有:
: 廣告分析: Vpon、Appier
: 電信業: 遠傳、台灣大哥大
: 電子業: 台達電、中強光電、和碩聯合
: 財團法人: III、ITRI
: 資訊服務: Trend、HTC
: 其他: 藍科數位、新蛋
本魯務農,CS背景,每天經手的資料,其實也不到PB等級,T等級還是有
但是在台灣,算是資料有真正落地的少數
在農場一開始是負責做ETL,資料清整
後期才幫忙做資料分析,資料模型
雲端在初期,只是為了拿來疊資料(因為比起一台上億的DB,真的很便宜)
還有用hadoop hive做一些資料彙整,分擔DB的工作量
後來還上了一些報導,說加快xx處理速度xx倍...
後期有開始拿來做一些data model, data mining
後期有開始拿來做一些data model, data mining
常用的工具有:HBASE, MR, MAHOUT, OOZIE, Hive, STORM, IMPALA
也有接觸過nutch, solr, 跟一些text mining工具
不過雲端技術,還是以彙整資料為主
等資料較小量之後,會再用R, WEKA之類的工具做資料分析
Visualization也有導入一些
以下為我對一些產業的了解...
台達他們IOT在新事業部門,所以資料也還在空中
不過資料分析的需求是有的
但是主要的工作,還是以資料如何縱向串接為主
(不過有關新事業部門的資訊,可以去科技版爬文一下)
另外Vpon分析資料,因為只以行動資料為主
其實等到後期,模型成長會有限,因為資料屬性變化不大
到時候"可能"公司只需維運人員即可
但去練練功應該滿好玩的
Trend 有朋友的朋友在裡面,聽說是以HBase為主
但資料也還在空中,還沒落地
要如何透過分析獲利,也還在摸索
至於本農場,最近可能會開缺
但在發明家上任之後,裡面的人都想走
雖然穿不暖,至少吃得飽,是唯一的好處
假如要真的分析到PB等級的資料
國外(包含中國)會比較有機會
我覺得分析久了,工具都是其次,最重要反而是domain knowhow
所以不用太追求,一定要掛big data,還是cloud
先有一些實際分析經驗比較重要
以我們農場來說,資料分析出來,還是要跟前端行銷人員討論
最後也是由他們決定一先方案,我們只是輔助的性質
至於CS底重不重要,我自己會因為open source許多功能還不完全
這時候就需要用java寫user define function
或者是某些運算sql語法不支援,還是mahout沒有,就只好寫MR
所以還是要看工作上會運用到什麼為主
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.166.78.187
※ 文章網址: http://www.ptt.cc/bbs/Soft_Job/M.1406344537.A.C9C.html
→ :求大腿阿...1F 07/26 11:22
推 :先進農業2F 07/26 12:17
推 :太先進了!3F 07/26 13:27
推 :農場給掱阿 (認真4F 07/26 14:14
推 :推 工具都是其次5F 07/26 14:51
推 :請問大大在哪個農場呢?6F 07/26 17:41
→ :種花的?7F 07/26 20:05
--
※ 看板: ryanlei 文章推薦值: 0 目前人氣: 0 累積人氣: 44
回列表(←)
分享