Ragic 博客
企业电子化的专家 Ragic 教你如何利用各种软件、
云服务让公司快速升级!
加入 Ragic 企业电子化的行列!
云工作术
各类应用演示
案例故事
逃离恶梦
关于 Ragic
Facebook X YouTube
云数据库
博客
关于Ragic
云工作术
各类应用演示
案例故事
逃离恶梦
关于 Ragic

英国少算 1.6 万新冠肺炎确诊者,Excel 惹祸

作者:Lillian Huang

关于“把 Excel 当企业数据库用”造成的各种灾难,我们过去已经说了许多,不过今天又有一个新出炉的血淋淋案例:英国政府误用 Excel ,导致漏报高达 1.6 万笔新型冠状肺炎(Covid-19)确诊数、造成疫情被低估甚至延误相关措施。事关现在全世界最重要的疫情管控议题,值得好好来讨论一下。

先摘要一下:

  • 这次的苦主:英格兰公共卫生部(Public Health England,简称PHE),英国卫生部下设置的政府疾病防治机构,也是英国此次因应疫情的重要机构。
  • 发生了什么事:PHE 误用 Excel 导致英国大幅度漏报新冠肺炎确诊数。PHE 周日(10/4)承认因为“技术问题”导致先前少算了整整一周总计约 1.6 万的确诊病例,而包括 BBC、卫报在内的多家媒体直指元凶就是 PHE 用来统整确诊数据的 Excel ——数据总数超过 Excel 数据笔数上限后就没有被存入、也没马上被发现,导致数据误判。
  • 两大后果:① 英国整整一周低估了确诊数,原先看似趋缓的疫情数字其实仍在上升。这样的错误严重起来会误判情势。② 因为政府 Excel 檔中的数据漏失,延误通知了应隔离者,被在野党政治人物痛批“置人民性命于险境”。
  • 事情是怎么发生的?

    我们在各大媒体或 WHO 等官方管道看到的每日疫情统计,主要是由各国政府官方通报而来。英国政府确诊数据来源主要是英格兰公共卫生局(PHE)。根据 BBC 的报导,由于检查工作交给外部机构进行,外部机构会将大量的检查结果以 CSV 文件的格式交给 PHE,此时数据并没有问题。

    但 PHE 拿到源数据之后,无法直接原封不动发出数据,需要经过一些统整——得汇整不同检查机构的数据、集成格式等等。在公司、组织里曾经负责统整过数据的人,应该很能懂这情境。

    此时,他们选择了最常见、大家最熟悉,在此情境中其实也最危险的工具 -- Excel,写了一些自动化流程,让他们收到的 CSV 檔自动被统整到 Excel 工作表中,然后再将此份统整 Excel 的数据上载到内部系统中。

    问题就出在 Excel 这一关:尽管有自动化流程省去纯手工拷贝贴上造成的痛苦、麻烦与贴错的机会,但最终仍然出错了,因为 PHE 用的是 Office 2007 以前版本、 xls 格式的 Excel,这个旧版格式单一工作表的数据上限是六万多列(65,536列),当工作表里保存的数据超过此列数时,下方就无法再存数据,而外部检查机构不断汇入的检查信息超出这个数字,造成了最终统计确诊数的漏失,而且问题显然没能马上被发现。

    PHE 在 10 月 2 日发现这个问题,此时他们已经漏算了 9/25 到 10/2 整整一周的确诊数字,总计足足少算了 15,841 个确诊数。从这篇报导中的图表可以看到,原本这一周公布的新确诊人数约在每日六、七千人之间,且看似曲线趋缓,现在把漏算数据加回来,原来 9/28 之后单日新确诊数突破八千大关,十月之后甚至破万,这是疫情以来新高。在大家每天看数据评估疫情的时候,错误的数据可能会引来怎样的误判,需要注意。

    与此同时,漏失数据的问题也不只于数据误判,因为这份数据也用于其他政府机构跟踪关联者,而综合各家报导,虽然 PHE 强调没有因为漏数据延误通知确诊病患,但有公卫官员说,许多“确诊者的接触者”被延误通知,代表许多原本该即刻进行的隔离等措施没有落实,这使得英国在野党工党政治人物、影子卫生大臣 Jonathan Ashworth 痛批政府致人民性命于险境

    用 Excel 错在哪?

    以这件事情来说,很多人第一时间讲到的是 PHE 用的 Excel 版本问题:旧版 xls 格式 Excel 檔的数据列数上限只有六万多笔,如果用的是 2007 年之后的新版 xlsx,单一工作表的数据列数上限约百万笔(1,048,576 列),可能“暂时”就没问题了。

    PHE 在事发后迅速宣称已解决“技术问题”,据报导方式是马上拆解原本的 Excel 檔,来避免数据量超出负荷的问题。

    但其实,更根源的问题是:PHE 需要的其实明明是“数据库”,不是吗?他们没有使用正规的数据库系统来处理,反而用了“常常被硬当成数据库来用,但真的不是数据库”的 Excel。

    Excel 是个很好用的电子表格软件、很好用的文字处理工具,但它天生不是用来当“数据库”的工具,当数据不断增加、复杂化,Excel 迟早会超出它的负荷,不管是文件开不了、动不了、数据笔数/单元格总数超过限制(Ragic 有许多客户就是感觉到自己的 Excel 或 Google Sheet 跑不动、快超过限制后,赶快找上我们的)、或是其他超出原先设计的使用方法,都可能让它从好用工具变地雷。

    如何离开 Excel?

    反过来说,我们其实能理解为什么IT 专家不断提醒直接把 Excel 当数据库、处理大量数据的坏处,许多企业(包括全球知名企业)甚至政府组织却对 Excel 无法放手,很多时候是因为跟其他冷冰冰的商用软件、“数据库方案”比起来,Excel 实在太亲切、太方便、也太容易开始了!

    但时代其实已经改变了,像 Ragic 企业云数据库这样“外表看起来像 Excel、实际运作起来是个数据库(存放/查询数百万笔数据不是问题!)”的解决方案,就是希望提供 Excel 和传统数据库方案之外的第三条路,让你兼顾低门槛、高弹性、数据库特性。

    额外提醒:

    即使讲了很多“Excel 恐怖故事”,我们其实从未抵赖 Excel 有它的优点,也不会不负责任的说“不用 Excel 就不会出任何错”。

    得强调的是,不管是使用 Excel 这样的传统电子表格工具,还是 Ragic 这样的数据库工具,重点是“用对工具”,让文字软件做文字软件该做的事、数据库做数据库该做的事。

    (当然,良好的使用习惯、正确观念和上线前测试,也都很重要 :P)

    标签: Excel

    归类: 逃离恶梦, 逃离 Excel 灾难

    博客背后使用 Ragic! : 最强大的 No Code 企业电子化工具
    把数据放在Excel上不只是拖累团队的行政效率,他也很容易出错并且无法进行任何内控。
    当您的团队成长时,使用Excel管理数据就会越来越痛苦。
    创建你们的第一个云数据库!

    马上登记
    免费试用 Ragic!

    用 Google 帐号登记

    立即科技 Ragic, Inc.
    02-7728-8692
    info@ragic.com
    台北市中正区南昌路二段81号9楼