作者 EvilSD (星塵遠征君)標題 Re: [新聞] 還原王義川說法! 手機訊號就可以比對人時間 Fri May 31 02:31:28 2024
分段來分析一下,如果是去識別化的資料哪些是可行跟不可行,以及哪些沒有識別化根本
沒辦法比對
: 還原王義川說法,他27日在三立《新台灣加油》節目上說,立法院外的集會,大部分都是
: 一般的公民,「按照這一個分析的資料看起來,其實這一次活動,我跟各位講一個數字,
: 20歲到40歲,就是有些是小草,有些當然太陽花的,佔了整個活動的6成。」
年齡跟人流數量是可行的
但小草? 太陽花? 資料哪來?怎麼標記?怎麼比對
更別說太陽花是十年以前了
: 王義川接著說,「我們用手機去看他的年齡,差不多6成,20歲以下的,大概佔了1成2,
: 所以大概有7成2是70歲以下的(應為40歲以下),那這些人不是政黨那麼容易動員,民進
: 黨如果有辦法,有本事就對了,網路找一找,再跟大家說,(台中市議員)周永鴻你找小
: 弟來,跟年輕人說,不能說是周永鴻找的,如果有辦法這樣,就有辦法叫這麼多人來,民
: 進黨這次就不會在立法院沒過半了。」
年齡可行
: 王義川說,「那些臉孔,民進黨很久沒看到,就是那一些,那些在場年輕人的臉孔,民進
: 黨很久沒看到,第二個,這些人跟原來的小草,我們有去比對過,他跟原來這個517、在
: 民進黨樓下的、那些小草的訊號比起來,也不同人,就是說,小草也沒跑,但是這一批人
: ,跟上次我們選舉,1月13之前的選前之夜的人比對,也沒關係。」
臉孔沒見到(希望不是連人臉都建檔比對了)
517,民進黨樓下(地點不同,如何建檔標記?)
小草的訊號(所以是小草都被標記了?不然怎麼知道是小草)
1月13選前之夜(所以那晚的人都被標記了?)
: 主持人許貴雅還驚訝問,「現在時代進步到可以這樣比?」王義川說,「因為你去對他的
: 什麼那個基地台訊號,對得到。所以你就可以知道,這純粹是一批全新的人。」
: 民進黨發言人吳崢幫忙解釋,以相關資料與報導來看,民進黨選前之夜輪廓「年齡層偏大
: 、男性居多」;民眾黨519輪廓「年齡層偏年輕,男性居多」;立法院524輪廓「各年齡層
: 分佈均勻,女性略多於男性」。參與者的輪廓明顯顯示出524的群眾與519、民進黨選前之
性別,年齡層可以被識別分析
然後最好別都鬼扯AI,AI在學習前也是需要標記資料的,沒資料哪知道誰是小草誰是覺青
但更簡單來說,假設可以拿到識別化的資料,做出這個系統基本不難
畢竟疫情期間,中華電信都做好疫情流向追蹤了
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.251.225.144 (臺灣)
※ 作者: EvilSD 2024-05-31 02:31:28
※ 文章代碼(AID): #1cMCO3KC (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1717093891.A.50C.html
※ 同主題文章:
Re: [新聞] 還原王義川說法! 手機訊號就可以比對人
05-31 02:31 EvilSD
推 FrancoFF: 哈哈1F 1.171.234.130 台灣 05/31 02:38
推 imgkiller: 中華電信 年齡跟性別地點都標示了,這個有啥好不能標的,去519的就標成小草錯5%有差嗎
對應的年齡性別等特徵,就可反推是不是小草,這不是就最簡單的ML
知道微軟之前出一款圖形識別,把黑人錯2F 1.170.99.212 台灣 05/31 02:42
給你年齡性別,你做一套ML告訴我怎麼區分小草跟覺青
※ 編輯: EvilSD (111.251.225.144 臺灣), 05/31/2024 02:46:33
→ imgkiller: 認爲猩猩,你管人家怎麽標記的。本來就求一個大概而已。40%20%分析報告隨便寫我願意標記20嵗年輕人就是小草呢
買家願意買單就好
你以爲這種大數據分析,要精確到哪
這個是走量的,當數量夠大,一些判斷錯誤根本不影響結論8F 1.170.99.212 台灣 05/31 02:45
越來越弔詭了,之所以要大數據分析,就是要避免母群體數量過少
導致overfitting,沒有正確標記的資料,又要如何做模型呢?
假設今天只有年齡跟性別,根本無從分析誰是小草誰是覺青
能夠有辦法分析的只有識別化資料,直接進行標記
※ 編輯: EvilSD (111.251.225.144 臺灣), 05/31/2024 02:52:00
推 greenpeter: 有沒有一種可能,他們早就透過資料庫,透過演算法把每個使用者都做了政黨傾向的標記?因為這樣才能解釋的通,王義川提到的小草與其他年輕人的族群特徵。如果是這樣,那麼這個資料庫顯然已經變成政黨操弄非我族類最強的傳播工具…15F 27.51.152.148 台灣 05/31 02:49
→ imgkiller: 那樣要中華電信配合,我不覺得中華電信有這個動機去為民進黨搞22F 1.170.99.212 台灣 05/31 02:51
如果要達成王義川說的事情,就是每一次的群體活動,就進行標記並且存入資料庫
不然根本不可能連十年前的太陽花,都能夠清楚的知道是不是同一群人
※ 編輯: EvilSD (111.251.225.144 臺灣), 05/31/2024 02:53:52
→ imgkiller: 我把當天去519都標記為小草,其實能誤差到哪?5%?有小草會帶女友去?24F 1.170.99.212 台灣 05/31 02:53
問題來了你要怎麼標記
你只有性別跟年齡,這點資料怎麼區分?
※ 編輯: EvilSD (111.251.225.144 臺灣), 05/31/2024 02:55:40
→ imgkiller: 大數據説穿了,其實充斥很多垃圾報告很多是亂寫亂下結論的,要對上級或買家交代。
那些模型也只是個預估,既然是預估,就有些是準的,有些差很多26F 1.170.99.212 台灣 05/31 02:55
能夠區分太陽花跟這次青島的人不一樣
這點應該不是亂做或是隨便預估得出來的
※ 編輯: EvilSD (111.251.225.144 臺灣), 05/31/2024 02:58:28
→ imgkiller: 519過去的為小草,而那邊年齡20~25男佔大比例,那就把524的20~25的男當作小草也許就得出524去的小草很少的推論
這種分析報告,只要寫出邏輯,買家願意買單就行
統計太多方法可以區分了 兩個群體相似31F 1.170.99.212 台灣 05/31 02:58
太好了,明天我就來實作一下到底有沒有可能,而且精準度多少
就從最簡單的統計到機器學習深度學習都跑一輪
而且別忘了王義川說的不是AI或是統計比對
他說的是訊號比對
※ 編輯: EvilSD (111.251.225.144 臺灣), 05/31/2024 03:03:54
→ imgkiller: 度,特徵abcde,你做不到嗎
現在最實用的大數據商業模式是 推測買家可能喜歡什麽樣的商品,推這些給他們這個不必政黨傾向難得多?37F 1.170.99.212 台灣 05/31 03:01
這個是透過搜尋紀錄來丟廣告,除非他們能夠過這個來分析政黨
那就難上更多了,這可就是美國稜鏡計畫等級了
推 aeug2005: 製造恐慌41F 223.138.228.124 台灣 05/31 03:04
※ 編輯: EvilSD (111.251.225.144 臺灣), 05/31/2024 03:06:04
→ gawoolala: 台電都能為党洗地了種花會配合不意外42F 42.72.113.42 台灣 05/31 03:05
推 ininder30cm: 應該不少大學生門號名子都還是父母43F 36.237.142.76 台灣 05/31 03:06
推 chyou2003: 其實我覺得,他分析是想當然耳亂做,但要解釋就會被看破之前都是唬爛…44F 223.138.121.40 台灣 05/31 03:15
→ imgkiller: 很多推廣就不是靠搜索記錄啊
搜索記錄是最直接的沒錯
最典型的是 專門賣衣服的網站,你怎麽推他們可能買的衣服類型46F 1.170.99.212 台灣 05/31 03:16
推 gueswmi: 不是阿 哪家電信承認有撈資料了
反正大家都說合法,其他人也可以買了吧50F 125.224.130.246 台灣 05/31 03:22
→ monitor: 三大電信業者都沒有和王義川合作,
顯然資料是竊取來的,既然是竊取而
來的個資,當然是要拿具有識別化的
完整個資才有價值。52F 114.137.169.207 台灣 05/31 03:25
推 allyourshit: 看起來就是中華電信這狗東西流出去的56F 1.34.92.164 台灣 05/31 03:34
→ monitor: 用含識別化的完整個資去餵AI,那一
切不就合理了嗎57F 114.137.169.207 台灣 05/31 03:35
推 tortoise1017: 樓上不用噓? 原PO是用假設 來證明 去識別化的數據無法導出王在節目上的分析. 又不是在討論數據出處59F 123.192.157.95 台灣 05/31 03:49
推 friends29: 要洗地之前也先做點功課行不行 哈哈
只有年齡跟性別 到底要怎麼在不同時間點區分政治傾向62F 118.167.130.62 台灣 05/31 03:52
→ monitor: 所以王在節目上的說法,前提自然是
已取得具識別化的完整個資,那如果
三大電信業者都沒有提供任何大數據
的資料給王義川,那顯然資料的取得
自然是用偷的了
如果有了民眾的門號,自然也可以用
門號來比對之前所有手機民調的政黨
傾向65F 114.137.169.207 台灣 05/31 03:59
--