※ 本文為 MindOcean 轉寄自 ptt.cc 更新時間: 2020-10-08 16:47:29
看板 Gossiping
作者 標題 [新聞] Excel漏數據之亂 英國1萬6,000名COVID-19
時間 Wed Oct 7 19:23:10 2020
1.媒體來源:DQ地球圖輯隊
2.記者署名:徽徽
3.完整新聞標題:
Excel漏數據之亂 英國1萬6,000名COVID-19患者沒追蹤到
4.完整新聞內文:
為什麼不要用Excel紀錄確診病例?這個答案或許問英國公共衛生部最知道。
https://fpscdn.yam.com/world/202010/96/47/5f7c235839647.jpg
漏了將近1萬6,000人
周一(5),在COVID-19(武漢肺炎)確診病例飆破 51萬8,000人的英國,傳出在 9月25日到
10月2日這 8天內,有將近 1萬6,000起新的確診病例沒有追蹤到,這代表原本應該接受隔
離治療的患者依舊在外頭,加劇疫情蔓延的風險。
10月2日這 8天內,有將近 1萬6,000起新的確診病例沒有追蹤到,這代表原本應該接受隔
離治療的患者依舊在外頭,加劇疫情蔓延的風險。
將Excel當作大型資料庫
而這 1萬5,841起確診病例之所以被英國公共衛生部(Public Health England)漏掉,原因
就出在英國公共衛生部將微軟推出的Excel試算軟體當作大型資料庫使用,沒有注意到
Excel並不適合拿來紀錄和追蹤每天增幅調整的確診病例數據。
https://fpscdn.yam.com/world/202010/e3/7f/5f7c2360ce37f.jpg
為什麼會漏數據?
如果要還原整起漏數據事件,必須先從英國公共衛生部如何記錄COVID-19(武漢肺炎)確診
病例說起。
每天,英國各地的公私立檢測中心會將確診病例和檢測人數等數據以CSV檔寄給英國公共
衛生部,英國公共衛生部再將收到的數據匯入在Excel建立的資料庫。
雖然CSV的檔案大小沒有限制,但英國公共衛生部使用的舊版Excel呈現的檔案格式XLS只
能呈現 65,536列,這代表多出來的數據會自動被刪除,這也是為什麼確診病例數會被遺
漏的原因。
能呈現 65,536列,這代表多出來的數據會自動被刪除,這也是為什麼確診病例數會被遺
漏的原因。
如果是新版的Excel,呈現的檔案格式XLSX可以容納 1,048,576列,能夠紀錄的檢測數據
量是前者的 16倍,相對來說就不容易發生數據遺漏的問題。
要存大數據 Excel不適合
不過,IT專家指出,不管是 1987年推出的Excel XLS檔案格式,還是 2007年更新的XLSX
檔案格式,這些都不適合拿來存放COVID-19(武漢肺炎)的檢測數據,箇中道理連中學生都
知道。
檔案格式,這些都不適合拿來存放COVID-19(武漢肺炎)的檢測數據,箇中道理連中學生都
知道。
英國劍橋大學計算機實驗室通訊系統教授克羅克洛夫(Jon Crowcroft)說:「一直以來,
Excel都是專門給小型公司處理數據,並且大致看看數據長相的軟體。」
「當你要做某些比較嚴肅的正事時,你會用為那些正事量身打造處理數據的方式,你有很
多其他的選擇,但你不會用Excel,沒人會用這個起頭。」
https://fpscdn.yam.com/world/202010/c9/e3/5f7c220a6c9e3.jpg
英國公衛部:「技術問題」已解決
回到Excel漏數據事件,在發現漏了 1萬5,841起確診病例沒有追蹤後,英國公共衛生部表
示他們立刻回溯追蹤,並且在 3號凌晨 1點已經大致補完,這項「技術問題」已經被解決
。
示他們立刻回溯追蹤,並且在 3號凌晨 1點已經大致補完,這項「技術問題」已經被解決
。
衛生大臣:這起意外根本不該發生
周一,當英國衛生大臣韓考克(Matt Hancock)在下議院接受質詢時,也提到了Excel漏數
據事件,他坦言整起事件肇因於英國公共衛生部使用「老舊系統」統計確診和檢測數據,
兩個月前當局就已經決定要更換這套系統。
據事件,他坦言整起事件肇因於英國公共衛生部使用「老舊系統」統計確診和檢測數據,
兩個月前當局就已經決定要更換這套系統。
「這起意外根本不應該發生,」韓考克承諾當局除了會深入調查該意外,也會立刻升級過
時的電腦系統。
比一團亂糟多了
對於這起意外,來自工黨的影子衛生大臣阿什沃斯(Jonathan Ashworth)表示,就算英國
公共衛生部事後力挽狂瀾,人民的生命安全照樣因為延遲追蹤而陷於危險。
阿什沃斯說:「成千上萬的人根本不知道他們曝露在染疫的風險中,在住院人數不斷增加
的情況下,這種致命的病毒很有可能散播。」
「這起事件不僅僅是一團亂,這比一團亂還要更糟。」
除了漏數據 還有很多地方做不好
蘇格蘭愛丁堡大學全球衛生治理學程主任斯里達(Devi Sridhar)說:「這起事件發生的時
機不能更糟了,隨著時序準備進入冬季,我們早就知道到時病例數會增加,現在正是需要
當局『檢測和追蹤系統』(test-and-trace system)好好發揮功用的時候。」
機不能更糟了,隨著時序準備進入冬季,我們早就知道到時病例數會增加,現在正是需要
當局『檢測和追蹤系統』(test-and-trace system)好好發揮功用的時候。」
沒想到,英國公共衛生部的檢測和追蹤系統卻出了這樣的大包。斯里達繼續提到,除了漏
數據一事,當局在防疫上還有許多地方做不好,像是把人送去離家好幾百公里遠的地方做
檢測、實驗室的檢測效率太慢、累積大量民眾沒有檢測等等。
數據一事,當局在防疫上還有許多地方做不好,像是把人送去離家好幾百公里遠的地方做
檢測、實驗室的檢測效率太慢、累積大量民眾沒有檢測等等。
https://fpscdn.yam.com/world/202010/ba/8a/5f7c22755ba8a.jpg
解決之道:拆成小檔案匯入Excel
面對各方撻伐,發生Excel漏數據事件的英國公共衛生部表示,他們現在將檢測數據拆分
成小堆匯入能容納大量數據的Excel模板內,如此一來就不會發生數據量超過上限、數據
被自動刪除的情況。
成小堆匯入能容納大量數據的Excel模板內,如此一來就不會發生數據量超過上限、數據
被自動刪除的情況。
然而,IT專家表示,英國公共衛生部該做的是尋找更適合的資料庫軟體來取代Excel,而
不是繼續使用Excel。
其實,Excel不是萬用
根據《衛報》的報導,Excel雖然是全世界最受歡迎的商業工具,但在某些情況下並不適
合使用Excel來記錄數據,過去也有不少企業使用Excel出錯,結果付出高昂代價的例子。
合使用Excel來記錄數據,過去也有不少企業使用Excel出錯,結果付出高昂代價的例子。
舉例來說,2013年,摩根大通集團(JPMorgan)使用Excel出錯,讓他們損失將近 60億美元
(折台幣約 1,741億5,000萬元)。當時,Excel試算表中的單元格錯誤地除以兩種利率的總
和,而不是除以利率平均值。這個錯誤也讓美國康乃狄克大學法律系教授柯克(James
(折台幣約 1,741億5,000萬元)。當時,Excel試算表中的單元格錯誤地除以兩種利率的總
和,而不是除以利率平均值。這個錯誤也讓美國康乃狄克大學法律系教授柯克(James
Kwak)警告大眾,Excel其實「非常脆弱」。
人人都能做 但不一定做得好
柯克說:「對初學者來說,Excel沒有辦法追蹤你的數據從哪裡來,Excel也沒有審計追蹤
的功能,所以你有可能不小心重複打了某些數字,但你自己不知道。此外,Excel也沒有
簡單的方式可以測試試算表。」
的功能,所以你有可能不小心重複打了某些數字,但你自己不知道。此外,Excel也沒有
簡單的方式可以測試試算表。」
「Excel最大的問題在人人都能生出Excel試算表,但可能做得並不好,因為Excel的操作
太簡單,人們在製作重要試算表時並沒有侷限於一定要給了解程式設計的人去做。在製作
時,也沒有以系統性、能夠追蹤製作紀錄的方式製作。」
太簡單,人們在製作重要試算表時並沒有侷限於一定要給了解程式設計的人去做。在製作
時,也沒有以系統性、能夠追蹤製作紀錄的方式製作。」
5.完整新聞連結 (或短網址):https://dq.yam.com/post.php?id=13062
6.備註:看來英國公家機關是不會放棄用Excel的...
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 211.20.88.252 (臺灣)
※ 文章代碼(AID): #1VVQKafM (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1602069796.A.A56.html
推 : 您可能已經成為1F 10/07 19:24
→ : 這腦子有洞吧 試算表當資料庫用2F 10/07 19:24
推 : 沒有存檔ㄇ3F 10/07 19:25
→ : 下去吧 上個時代的輸家 ==4F 10/07 19:25
→ : 英國用excel...5F 10/07 19:25
推 : 公務員肯用excel就要偷笑了 還想要他們學別的?6F 10/07 19:25
→ : 把excel當資料庫我遇過很多,而且檔案都超大7F 10/07 19:26
推 : 我也有這個困擾 有個資料有9千多萬筆-.-要分很多檔案8F 10/07 19:26
推 : 再吵就學日本用紙筆和傳真機了9F 10/07 19:27
推 : 他excel用舊版的 能容納的資料量差太多10F 10/07 19:27
→ : 而且每次買電腦後都會靠杯excel開超慢11F 10/07 19:27
推 : 這怎麼看起來像頁配文12F 10/07 19:28
→ : 不過他們怎麼會還在用那麼舊的東西XDDDD
→ : 不過他們怎麼會還在用那麼舊的東西XDDDD
推 : postgresql:14F 10/07 19:29
推 : 不然要用acess,myaql¿15F 10/07 19:30
推 : 沒救了16F 10/07 19:30
→ : sql大部分介面都要另外寫 緊急時也無法17F 10/07 19:30
→ : 能用excel開 就不算大阿 真的大的會被咔掉18F 10/07 19:30
推 : 國家級數據用消費級產品…真有你的英國…19F 10/07 19:31
→ : 顧著笑英國,台灣要不要查一下公務員多少資料也是用exce20F 10/07 19:31
→ : l
→ : l
推 : 從這案例看起來,如果他們用 xlsx 倒還暫時不會有問題XD22F 10/07 19:31
→ : 這世上有已經寫好介面的sql可以用嗎?23F 10/07 19:32
→ : 資料用 Excel 不是問題,是怎麼用24F 10/07 19:32
推 : 已知用Access25F 10/07 19:33
→ : 北七啊不會用SQL嗎?26F 10/07 19:33
→ : 用mysql都好一點27F 10/07 19:33
推 : 米國:好險我們早破百萬了 咦?28F 10/07 19:33
→ : excel他媽的不是資料庫而是資料處理軟體29F 10/07 19:33
→ : @@30F 10/07 19:34
推 : MS Access 這情況能不能用啊? 我不熟這軟體就是了31F 10/07 19:34
推 : 台灣搞不好也是在做一樣的事…32F 10/07 19:34
→ : 爛一點的用access 有點底的可以用phpmyadmin33F 10/07 19:34
推 : 白人是不是有點蠢?34F 10/07 19:35
→ : 全球公務員都一個樣 笑死35F 10/07 19:36
→ : 果然各國的公務員都是一樣 sql爛語法也不是藝術就是36F 10/07 19:36
推 : 一定是先換新版的Excel啊 現在哪來時間去找新軟體 然後再37F 10/07 19:37
推 : 政府機關可能很難懂apache server + mysql +php花個百萬38F 10/07 19:37
→ :
→ :
→ : 去訓練相關人員40F 10/07 19:37
推 : 如果MS Access可以解決的話其實可以用吧?41F 10/07 19:37
推 : 用個MSSQL是有多難…42F 10/07 19:38
推 : 公務員,不意外。43F 10/07 19:39
→ : 他們有付錢的話 應該可以找微軟提供協助44F 10/07 19:39
→ : 雖然我覺得他們過分依賴Excel也不意外
→ : 雖然我覺得他們過分依賴Excel也不意外
推 : 不升級office....46F 10/07 19:40
推 : 2樓瞬間突破盲點47F 10/07 19:40
→ : Access就好了48F 10/07 19:40
推 : 聽起來像日本人會犯的蠢 沒想到英國人先搞笑49F 10/07 19:42
推 : 台灣公務員會用word50F 10/07 19:43
推 : 還在用2003版?51F 10/07 19:44
推 : access很卡耶...52F 10/07 19:44
推 : 去問製程 一定一堆用excel53F 10/07 19:47
噓 : 根本就是想黑英國 英國人這麼聰明 垃圾YAM酸三小54F 10/07 19:47
推 : 那要用什麼啊?55F 10/07 19:47
推 : 隨便一個SQL資料庫都行吧56F 10/07 19:49
推 : 用個SQL不好嗎 又不用錢57F 10/07 19:50
→ : 再懶用個sqlite都比excel好ㄅ58F 10/07 19:51
推 : 建個資料庫很難 沒有資訊人員也可以委外阿59F 10/07 19:51
推 : 微軟背黑鍋?60F 10/07 19:54
推 : 快笑死 excel XD61F 10/07 19:55
噓 : 是把資料庫專業當成韭菜喔 電腦白癡不意外62F 10/07 19:58
推 : excel就微軟買來的63F 10/07 19:59
→ : 錢 不是每個人都會下sql到資料庫 要買軟體64F 10/07 20:00
噓 : ??? 分頁很難?65F 10/07 20:04
推 : sharepoint+Access就解決的東西66F 10/07 20:05
→ : XLS是還在用2003嗎?67F 10/07 20:06
推 : 推地球圖輯隊68F 10/07 20:10
→ : 國家單位數據用Excel管理...石器時代啊==69F 10/07 20:13
→ : Matlab都還比較好吧70F 10/07 20:20
推 : Excel用來做小量資料呈現處理很好用 我都拿來當db的view71F 10/07 20:21
→ : 它這幾百萬筆欸72F 10/07 20:22
推 : 不會用linked list嗎.......73F 10/07 20:22
→ : 說實在話 要只會excel的人去學access也是不容易74F 10/07 20:23
推 : SQL對一般人的門檻還是過高 EXCEL養活多少人啊75F 10/07 20:27
推 : 日本人用傳真機+人工統計 沒有筆數限制 XD76F 10/07 20:28
→ : 強森是不是有抗體了?77F 10/07 20:37
推 : 一定不常作實驗 作實驗都會遇到數據太多的問題78F 10/07 20:45
→ : 像是示波器匯出的csv或自己寫高取樣率的東西
→ : 像是示波器匯出的csv或自己寫高取樣率的東西
推 : 比日本用傳真先進多了80F 10/07 20:46
推 : 笑死,65536,熟悉的數字81F 10/07 20:47
推 : Access+VBA就很萬用了,能叫用Excel讀資料庫跑報表82F 10/07 21:04
→ : 同樣也能叫用Word跑套印,搞不懂硬要把Excel當資料
→ : 庫用的人在想什麼
→ : 同樣也能叫用Word跑套印,搞不懂硬要把Excel當資料
→ : 庫用的人在想什麼
→ : email來email去 死定85F 10/07 21:13
推 : 瞧不起excel喔86F 10/07 21:33
推 : 那個白癡高層決定的...巨量資料不用db用excel87F 10/07 21:42
→ : 我比較好奇的是樓上在用Excel處理實驗data88F 10/07 21:46
推 : 65535wwwww一發傷害上限嗎89F 10/07 21:57
推 : 確診太多了...90F 10/07 22:03
→ : 呵呵91F 10/07 22:06
推 : 正義值滿了啦92F 10/07 22:10
→ : 廢到笑93F 10/07 22:13
→ : 國家編列上億的預算不是給政府這樣省的94F 10/07 22:38
推 : 這用MySQL就能解決不是嗎..?95F 10/07 22:53
推 : 英國公務員這麼厲害居然會用excel!96F 10/07 23:01
噓 : execl萬用,超好用的啊,只是大量資料不適合而已啊97F 10/08 01:37
推 : 這種要用Access啦98F 10/08 04:01
推 : 推文都錯了,用了SQL軟體,結果伺服器沒人維護當機99F 10/08 04:24
→ : 然後keyin界面一用就是十幾年,理由是沒經費...
→ : 還是excel好用,又可做圖報,又可程式加總,檔案usb帶著跑
→ : 然後keyin界面一用就是十幾年,理由是沒經費...
→ : 還是excel好用,又可做圖報,又可程式加總,檔案usb帶著跑
噓 : 英國查的出原因,台灣就跟你擺爛102F 10/08 04:31
→ : 文組ㄅ ㄏㄏ103F 10/08 04:54
推 : 很多人不知道Excel的列數是有上限的, 都以為無限多XDDD104F 10/08 09:25
推 : 解決方式為拆成更多小檔匯入Excel是三小105F 10/08 11:27
--
※ 看板: Gossiping 文章推薦值: 0 目前人氣: 0 累積人氣: 460
回列表(←)
分享