顯示廣告
隱藏 ✕
※ 本文為 dinos 轉寄自 ptt.cc 更新時間: 2013-04-25 10:37:38
看板 Soft_Job
作者 chucheng (時間太少事情太多)
標題 Re: [請益] 外商面試題目
時間 Thu Apr 25 05:02:03 2013


※ 引述《pologuy (購物慾好強)》之銘言:
: ex:
: 甲買商品A 同時會購買BC
: 乙買商品A 同時會購買CD
: 因此A和C的關聯性較高
: 那麼要如何將A商品的關聯性商品記錄下來,並且將較高關聯性的商品(如上述C)推薦給
: \
: 消費者?
: 這是小弟之前面試的題目,想不到好的方法,想請教各位!

如果是面試,簡單的作法是把甲和乙(或其它user 假設是相同一個人)
並假設ABC與時間無關(想成賣永久,不會下架)

這樣問題可以簡化成frequent itemset/ Association rule learning 的問題
看這裡:http://en.wikipedia.org/wiki/Association_rule_learning
Association rule learning - Wikipedia, the free encyclopedia
[圖]
Following the original definition by Agrawal et al.[2] the problem of association rule mining is defined as: Let  be a set of  binary attributes called items. Let  be a set of transactions called the database. Each transaction in  has a unique transaction ID and contains a subset of the items in . A ...
 
其中最簡單的解法是aprior: http://en.wikipedia.org/wiki/Apriori_algorithm
Apriori algorithm - Wikipedia, the free encyclopedia
Apriori[1] is a classic algorithm for frequent itemset mining and association rule learning over transactional databases. It proceeds by identifying the frequent individual items in the database and extending them to larger and larger item sets as long as those item sets appear sufficiently often in ...
 
每一本資料探碪的書一定都會教這個演算法,本身很簡單,這裡就略過

面試要求現場寫出apriori的code挺合理的,基本上就是算confidence和support
這算是Data Mining 101,寫不出來/講不出來,很有可能被面試者
根本沒學/修過這門課,如果應徵data engineer/ data scientist
大概可以直接fail掉他



那…如果甲乙丙(user有不同偏好)不是同一個人,且東西有時效性(想成電影)
這幾年最經典的2010 KDD Best paper的
BellKor's Pragmatic Chaos 演算法
Paper下載點:http://dl.acm.org/citation.cfm?id=1721677

後者那個鬼東西要看懂(不要講實作)都要好幾天
不可能現場寫得出來


相關的面試問題還有很多,基本上這是在考
Recommendation System Design或是Collaborative Filtering

有時候還會被加問如果資料很大(超大,大到放不到一台電腦如何解決)
正解是map-reduce over hadoop,配上Apache Mahout
裡面有現成的Collaborative Filtering 函式庫可以使用



--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 131.179.64.104
※ 編輯: chucheng        來自: 131.179.64.104       (04/25 05:05)

--
※ 看板: dinos 文章推薦值: 0 目前人氣: 0 累積人氣: 577 
作者 chucheng 的最新發文:
  • +9 Re: [請益]出國工作規劃 - Oversea_Job 板
    作者: 67.164.30.216 (美國) 2014-12-27 09:56:48
    看板 Oversea_Job作者 chucheng (時間太少事情太多)標題 Re: [請益]出國工作規劃時間 Sat Dec 27 09:56:48 2014 如果已有CS碩士學位,很多學校是不會再 …
    9F 9推
  • +3 Re: [北美] 請問CS PhD在工作上的好處 - Oversea_Job 板
    作者: 216.113.160.77 (美國) 2014-11-13 07:07:38
    下面寫的很主觀,二條路都有人走的很好,也有走的很不好 PhD (pros) - 綠卡:自辦EB2-NIW 或 進公司後可能可走EB1(對大陸/印度) - 起薪:大公司來說,通常博士比碩士高一級(bas …
    10F 3推
  • +5 Re: [請益] 請問菜鳥要怎麼估時間比較妥當? - Soft_Job 板
    作者: 67.164.30.216 (美國) 2014-10-20 08:52:10
    純就這點分享一點建議 (1) 定Deadline的時候,把一個大目標切成可行的Task 一個Task可以小到0.5hr,大到4hr,儘量不要超過8hr 因為超過8hr就再切小一點,不然其實就是目標不明 …
    10F 5推
  • +4 Re: [問題] 老闆要求跟他讀博後 - PhD 板
    作者: 67.164.30.216 (美國) 2014-09-30 10:44:29
    原文恕刪 博後沒有什麼不好,通常你畢業前都非常的忙,沒時間找工作 能騎驢找馬有什麼不好?最好還能凹到老師讓你早一點點畢業(反正要博後嘛) 到了博後,當然就開始找工作,萬年博後是不會有好結果的… 找到工 …
    5F 4推
  • +5 Re: [北美]念CS在美國工作的難易度疑問 - Oversea_Job 板
    作者: 216.113.168.141 (美國) 2014-09-24 04:53:13
    : : 恕刪原文 對你來說,只要到美國,就可以使用OPT工作 CS或ME都是STEM,所以本質上OPT沒太大差別(都可以拿29個月) 假設找得到工作的話,再送H1B 以碩士學歷來說,最長可以抽三次,要 …
    18F 5推
點此顯示更多發文記錄
guest
x)推文 r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇