• 主页 > 星空体育·Excel教程 > 全民学Excel
  • Excel可以有多坑?害英国漏报近16万新冠病例专家表示高中生都知道更好的工具

      继遗传学家被 Excel 逼到给基因改名之后,又一个项目被 Excel“坑”惨了。近日,英国卫生部发现因为 Excel 行数限制,大约 16000 个新冠肺炎病例未能及时纳入统计。但数据专家吐槽:为什么要用 Excel?

      近日,英国新冠肺炎确诊病例数量暴增 16000 例。这并非是因为哪里出现了疫情暴发,而是因为一个失误:Excel 行数爆表了。

      由于英国卫生部使用了过时的 Excel 文件格式,统计数量很快超过了行数上限,当地时间 9 月 28 日到 10 月 5 日的新增病例没有被列入统计。公共卫生专家担心,统计延迟会影响接触者追踪,对疫情防控造成不利影响。而数据统计专家们纷纷表示,对于这样的项目根本不该使用 Excel。

      这个统计错误已经被手动修复。英国卫生部新的统计系统已经在开发中,不过目前的解决办法是:把统计表拆分成更多的 Excel 表格,以扩大总的数据统计上限。

      据 BBC、《卫报》报道,英国新冠病毒检测的流程是由商业公司雇用实验室进行检测,检测结果以csv格式发送给卫生部,卫生部用程序将数据输入 Excel 表格,随后这些表格被发送到多个政府部门共享的系统。并且,他们使用的还是一种古早文件格式:xls。

      实验室提交的 csv 格式是文本形式的表格,数字之间用逗号分割,理论上可以有无限行。而在 xls 文件中,一个模板(template)最多有 65,536 行。在进行文件格式转换的时候,超出行数的部分会被系统直接删除。每个病例的检测结果要占好几行,那么一个模板大约能容纳 1400 个病例的数据。

      事件曝光后,许多人批评英国卫生部居然使用了如此过时的文件:xls 诞生于 1987 年。2007 年发布的 xlsx 文件格式能够容纳 1,048,576 行,是 xls 格式的 16 倍。所以,如果使用更新版本的文件,冲破行数上限的问题就能来得晚一些,但那也只是时间问题。

      谢菲尔德大学搜索和分析教授 Paul Clough 也在 the Conversation发文评论了这一事件。他指出,虽然 Excel 很受欢迎,经常被用于数据分析,但它并不适合处理数据量太大的情况,或比较复杂的分析任务。

      Clough 肯定了英国政府和公共卫生工作者这段时间的辛勤工作,但是,“这样的错误是可以避免的。我们生活在一个大数据的世界,人工智能和机器学习正在影响我们生活的方方面面。我们有智能工厂、智能城市,我们有自动驾驶汽车和自动机器,它们展现了人的智能。然而,英国卫生部还在用 Microsoft Excel 作为处理大量敏感信息的媒介。这就是问题。”他写道。

      剑桥大学计算机实验室通信系统教授 Jon Crowcroft 则更加直白地指出,连一个修过计算机课的高中生都知道,有更好的替代选择。他在接受 BBC 采访时评论:“Excel 的作用是让小公司的人糊弄少量的数据,看看大致情况……如果你要完成一个更加严肃的任务,就该去找一个专用工具,有十几个这样的专用工具。但你不会用 xls。没人用 xls。”

      英国卫生大臣 Matt Hancock 说,这个问题在于卫生部使用了一个“遗留系统”,他们两个月前已经决定替换掉这个系统。但 BBC 报道指出,卫生部应该没有预见这个问题,否则他们就该意识到,在新系统升级完成之前他们就会撞上 Excel 的统计极限。还有人要求 Hancock 公布其他的数据处理图表,以便发现其中潜在的缺陷。

      据 BBC 报道,目前新的系统还未就位。英国卫生部的解决办法是将统计数据拆分,列入多个 Excel 表格,确保每个表格不会再出现行数溢出的情况。知情者承认,目前的老古董系统需要尽快被替换成 Excel 之外的专业工具。

      谢菲尔德大学的 Clough 教授评论:“这是个很糟糕的补救工作,没有根本上解决问题——问题是缺乏一个稳固的数据管理系统。”

      由于 Excel 的广泛流行,被它“坑”过的项目实在数不胜数。就在两个月前,国际人类基因命名委员会(Human Gene Nomenclature Committee,HGNC)修改了 27 个人类基因的命名,因为 Excel 会将一些基因名称误读为日期格式,并直接修改成默认格式。

      一个更惨烈的案例发生在 2013 年:摩根大通交易员 Excel 操作失误,公司直接损失 20 亿美元,累计损失达 60 亿美元。一名绰号“伦敦鲸”(London Whale)的交易员在计算风险价值(VaR)的时候,错误地将数字除以两个利率的和(而不是平均值),这可能导致他低估了操作的风险。

      美国康涅狄格大学法学教授 James Kwak 评论此事件 指出:“(Excel 中)无法追踪数据来源,没有审计追踪(audit trail,所以它无法检测重复输入),也没有初学者能够掌握的检验方法。最大的问题在于,每个人都会用 Excel。因为它太容易上手,一些重要的表格变得谁都能做,而这本该由理解编程、懂得使用规范方法的人去完成。”看起来, 这条评论放到这次的事件背景下仍不过时。

      不靠谱的Excel表格,看起来年纪比你还大的操作系统……在学习和研究中,你遇到过这类问题吗?最后是怎么处理的?

      特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

      重庆一对夫妻赴泰“谈生意”失联后称被困缅甸 家人:孩子将中考,老人生病,盼其尽快回国

      管钥匙却辜负信任!两在日中国男子从供应商仓库偷走价值约1800万日元的1000双名牌运动鞋!

      华为Nova13系列已整装待发:新麒麟+1.5K直曲屏,Ultra版也会来袭

      铁威马发布 F2-424 双盘位 NAS:赛扬 N95 处理器、双 2.5G 网口

    版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 88888888@qq.com 举报,一经查实,本站将立刻删除。如若转载,请注明出处:https://starfield-sports.com/Exceljiaocheng/quanminxueExcel/185.html

    加载中~

    相关推荐

    加载中~