发件人是系统后台,收件人是陈冉。
陈冉的视线直接略过了前面的格式化文字,落在了中间的几个数字上。
TOp-1正确率:59.8%。
TOp-5正确率:76.3%。
陈冉手里的咖啡杯停在了半空。
他盯着屏幕看了足足十秒钟。
然后他把咖啡杯放回桌面上,发出“砰”的一声闷响。
陈冉的第一反应是后台的计算脚本出了BUg。
这种事情以前不是没发生过,某个队伍提交的文件格式不对,导致PythOn脚本在读取数组的时候发生了错位,直接算出了一个99%的离谱数据。
59.8%,这个数字已经完全超出了陈冉对当前人类计算机视觉技术水平的认知。
把29%直接翻一倍还多,这就好比大家都在骑自行车比赛,突然有个人开着跑车冲进了赛道。
陈冉立刻关掉邮件,打开浏览器,直接登入ImageNet的后台管理系统。
他熟练地敲击键盘,调出了原始的提交记录。
页面刷新。
提交时间:下午四点十二分。
提交ID:玉泉路扛把子。
陈冉看着这个充满中国互联网浓厚中二气息的ID名字,嘴角抽搐了一下。
他点开计算日志,从头到尾看了一遍。
没有数组错位。
没有格式错误。
所有的预测标签和测试集图片编号一一对应,严丝合缝。
陈冉不信邪,他打开终端,直接连上服务器,找到那个队伍提交的EXCel文件。
他调出自己写的备用验证脚本,在命令行里输入参数,按下回车。
屏幕上开始疯狂滚动进度条。
陈冉双手离开键盘,死死盯着屏幕最后一行即将弹出的结果。
五秒钟后,脚本运行结束。
TOp-1:59.82%。
TOp-5:76.31%。
陈冉站了起来,椅子往后滑动,撞到了后面的文件柜。
他没有按流程先更新排行榜,而是直接拔下笔记本电脑的电源线,单手托着电脑,快步走出自己的工位。
他穿过走廊,径直走向李飞飞的办公室。
办公室的门虚掩着。
陈冉连门都没敲,直接推门走了进去。
李飞飞正坐在办公桌前,手里拿着一支红笔,正在审阅一篇顶级期刊的论文审稿意见。
听到推门声,她抬起头。
陈冉平时是个很讲究学术礼仪的人,今天这种莽撞的举动让李飞飞感到有些意外。
“李老师。”陈冉的声音有些发紧。
李飞飞看着陈冉有些僵硬的表情,放下了手里的红笔。
“出什么事了?”李飞飞问。
“您需要看一下这个。”陈冉快步走到办公桌前,把笔记本电脑放在桌面上,屏幕转向李飞飞。
屏幕上正是那份提交记录的完整页面。
李飞飞的目光落在屏幕上。
她先是看到了TOp-1正确率那一栏。
59.8%。
然后视线右移,看到了TOp-5正确率。
76.3%。
最后,她的目光向上,停在了那个名为“玉泉路扛把子”的队伍名称上。
办公室里安静得只能听到笔记本电脑散热风扇转动的声音。
李飞飞盯着屏幕看了将近半分钟,没有说话。
陈冉站在一旁,连呼吸都放轻了。
“你重新跑过验证脚本了吗?”李飞飞终于开口,声音很平静。
“跑过了,用的我本地独立的脚本,避开了系统原本的缓存。”陈冉立刻回答。
“结果一样?”
“对。”陈冉说。
李飞飞沉默了几秒钟。
“你现在把原始的提交数据发到我的邮箱。”李飞飞站起身,“然后去把约翰和大卫叫到会议室来。”
“好的。”陈冉拿起电脑,转身就往外走。
五分钟后,李飞飞办公室旁边的小会议室里。
四个人围坐在椭圆形的会议桌前。
面前各有一台打开的笔记本电脑。
约翰是斯坦福大学人工智能实验室的资深研究人员,平时主要负责算法优化。
大卫则是数据架构方面的专家,主要参与图片分类数据集的底层构建。
两个人被陈冉火急火燎地叫过来,还没搞清楚状况。
“看看你们邮箱里刚收到的邮件。”李飞飞说。
约翰点开邮件,下载了附件,打开。
大卫也做着同样的动作。
“这是一个预测结果的表格?”约翰看着满屏幕的数字和标签,“谁提交的?”
“一个叫‘玉泉路扛把子’的队伍。”陈冉在旁边解释。
约翰看了看表格右侧的汇总数据。
“TOp-1,59.8%?”约翰笑了一声,“陈,你们后台的评测脚本又崩了?上次那个算出99%的队伍也是这么搞的吧。”
“没崩。”陈冉语气严肃,“我刚才用备用脚本跑过了,数据是真的。”
约翰脸上的笑容消失了。
他转过头,看着陈冉。
“你在开玩笑吗?”约翰问,“现在的榜首才29%。你告诉我有人直接干到了接近60%?”
“所以我把你们叫来。”李飞飞看着两人,“我们需要进行彻底的排查。这个数字如果在榜单上公布出去,整个学术界都会炸锅。在确认它无懈可击之前,我们不能轻举妄动。”
“大卫,你去检查测试集文件的校验值。”李飞飞开始分配任务,“确认服务器上的测试集数据没有被替换过,或者被植入了后门。”
大卫点头,立刻在终端里输入SSH连接命令。
“约翰,你负责用本地最新的脚本,一行一行地重新跑一遍正确率验证。不要用任何现成的封装库,自己写底层逻辑跑。”李飞飞继续说。
约翰拉过键盘,打开了一个新的代码编辑器窗口。
“陈冉,你去查后台。”李飞飞看向自己的博士生,“我要知道这个ID的注册信息、登录IP、提交日志,任何能查到的痕迹都给我挖出来。”
会议室里只剩下噼里啪啦的键盘敲击声。
每个人都在全神贯注地盯着自己的屏幕。
时间一分一秒地过去。
十分钟后,大卫第一个停下手里的动作。
“测试集文件没有任何问题。”大卫看着终端输出的结果。
李飞飞微微点头,看向约翰。
约翰还在盯着屏幕上不断跳动的代码输出。
又过了五分钟,约翰长出一口气,靠在了椅背上。
“算出来了。”约翰揉了揉脖子。
“结果?”大卫问。
“完全一致。”约翰把屏幕转过来,“这就是一份实打实的预测结果。”
李飞飞的视线转向陈冉。
陈冉看着后台调出来的数据报表,脸色有些古怪。
“查到了什么?”李飞飞问。
“注册邮箱是一个QQ邮箱账号。”陈冉说。
“QQ邮箱?”约翰愣了一下,“中国那边的?”
“对,腾讯公司的邮箱服务。”陈冉解释,“注册时间就在ImageNet比赛开始前三天。除此之外,后台没有任何其他信息。连队伍所属机构那一栏都空着。”
陈冉的视线直接略过了前面的格式化文字,落在了中间的几个数字上。
TOp-1正确率:59.8%。
TOp-5正确率:76.3%。
陈冉手里的咖啡杯停在了半空。
他盯着屏幕看了足足十秒钟。
然后他把咖啡杯放回桌面上,发出“砰”的一声闷响。
陈冉的第一反应是后台的计算脚本出了BUg。
这种事情以前不是没发生过,某个队伍提交的文件格式不对,导致PythOn脚本在读取数组的时候发生了错位,直接算出了一个99%的离谱数据。
59.8%,这个数字已经完全超出了陈冉对当前人类计算机视觉技术水平的认知。
把29%直接翻一倍还多,这就好比大家都在骑自行车比赛,突然有个人开着跑车冲进了赛道。
陈冉立刻关掉邮件,打开浏览器,直接登入ImageNet的后台管理系统。
他熟练地敲击键盘,调出了原始的提交记录。
页面刷新。
提交时间:下午四点十二分。
提交ID:玉泉路扛把子。
陈冉看着这个充满中国互联网浓厚中二气息的ID名字,嘴角抽搐了一下。
他点开计算日志,从头到尾看了一遍。
没有数组错位。
没有格式错误。
所有的预测标签和测试集图片编号一一对应,严丝合缝。
陈冉不信邪,他打开终端,直接连上服务器,找到那个队伍提交的EXCel文件。
他调出自己写的备用验证脚本,在命令行里输入参数,按下回车。
屏幕上开始疯狂滚动进度条。
陈冉双手离开键盘,死死盯着屏幕最后一行即将弹出的结果。
五秒钟后,脚本运行结束。
TOp-1:59.82%。
TOp-5:76.31%。
陈冉站了起来,椅子往后滑动,撞到了后面的文件柜。
他没有按流程先更新排行榜,而是直接拔下笔记本电脑的电源线,单手托着电脑,快步走出自己的工位。
他穿过走廊,径直走向李飞飞的办公室。
办公室的门虚掩着。
陈冉连门都没敲,直接推门走了进去。
李飞飞正坐在办公桌前,手里拿着一支红笔,正在审阅一篇顶级期刊的论文审稿意见。
听到推门声,她抬起头。
陈冉平时是个很讲究学术礼仪的人,今天这种莽撞的举动让李飞飞感到有些意外。
“李老师。”陈冉的声音有些发紧。
李飞飞看着陈冉有些僵硬的表情,放下了手里的红笔。
“出什么事了?”李飞飞问。
“您需要看一下这个。”陈冉快步走到办公桌前,把笔记本电脑放在桌面上,屏幕转向李飞飞。
屏幕上正是那份提交记录的完整页面。
李飞飞的目光落在屏幕上。
她先是看到了TOp-1正确率那一栏。
59.8%。
然后视线右移,看到了TOp-5正确率。
76.3%。
最后,她的目光向上,停在了那个名为“玉泉路扛把子”的队伍名称上。
办公室里安静得只能听到笔记本电脑散热风扇转动的声音。
李飞飞盯着屏幕看了将近半分钟,没有说话。
陈冉站在一旁,连呼吸都放轻了。
“你重新跑过验证脚本了吗?”李飞飞终于开口,声音很平静。
“跑过了,用的我本地独立的脚本,避开了系统原本的缓存。”陈冉立刻回答。
“结果一样?”
“对。”陈冉说。
李飞飞沉默了几秒钟。
“你现在把原始的提交数据发到我的邮箱。”李飞飞站起身,“然后去把约翰和大卫叫到会议室来。”
“好的。”陈冉拿起电脑,转身就往外走。
五分钟后,李飞飞办公室旁边的小会议室里。
四个人围坐在椭圆形的会议桌前。
面前各有一台打开的笔记本电脑。
约翰是斯坦福大学人工智能实验室的资深研究人员,平时主要负责算法优化。
大卫则是数据架构方面的专家,主要参与图片分类数据集的底层构建。
两个人被陈冉火急火燎地叫过来,还没搞清楚状况。
“看看你们邮箱里刚收到的邮件。”李飞飞说。
约翰点开邮件,下载了附件,打开。
大卫也做着同样的动作。
“这是一个预测结果的表格?”约翰看着满屏幕的数字和标签,“谁提交的?”
“一个叫‘玉泉路扛把子’的队伍。”陈冉在旁边解释。
约翰看了看表格右侧的汇总数据。
“TOp-1,59.8%?”约翰笑了一声,“陈,你们后台的评测脚本又崩了?上次那个算出99%的队伍也是这么搞的吧。”
“没崩。”陈冉语气严肃,“我刚才用备用脚本跑过了,数据是真的。”
约翰脸上的笑容消失了。
他转过头,看着陈冉。
“你在开玩笑吗?”约翰问,“现在的榜首才29%。你告诉我有人直接干到了接近60%?”
“所以我把你们叫来。”李飞飞看着两人,“我们需要进行彻底的排查。这个数字如果在榜单上公布出去,整个学术界都会炸锅。在确认它无懈可击之前,我们不能轻举妄动。”
“大卫,你去检查测试集文件的校验值。”李飞飞开始分配任务,“确认服务器上的测试集数据没有被替换过,或者被植入了后门。”
大卫点头,立刻在终端里输入SSH连接命令。
“约翰,你负责用本地最新的脚本,一行一行地重新跑一遍正确率验证。不要用任何现成的封装库,自己写底层逻辑跑。”李飞飞继续说。
约翰拉过键盘,打开了一个新的代码编辑器窗口。
“陈冉,你去查后台。”李飞飞看向自己的博士生,“我要知道这个ID的注册信息、登录IP、提交日志,任何能查到的痕迹都给我挖出来。”
会议室里只剩下噼里啪啦的键盘敲击声。
每个人都在全神贯注地盯着自己的屏幕。
时间一分一秒地过去。
十分钟后,大卫第一个停下手里的动作。
“测试集文件没有任何问题。”大卫看着终端输出的结果。
李飞飞微微点头,看向约翰。
约翰还在盯着屏幕上不断跳动的代码输出。
又过了五分钟,约翰长出一口气,靠在了椅背上。
“算出来了。”约翰揉了揉脖子。
“结果?”大卫问。
“完全一致。”约翰把屏幕转过来,“这就是一份实打实的预测结果。”
李飞飞的视线转向陈冉。
陈冉看着后台调出来的数据报表,脸色有些古怪。
“查到了什么?”李飞飞问。
“注册邮箱是一个QQ邮箱账号。”陈冉说。
“QQ邮箱?”约翰愣了一下,“中国那边的?”
“对,腾讯公司的邮箱服务。”陈冉解释,“注册时间就在ImageNet比赛开始前三天。除此之外,后台没有任何其他信息。连队伍所属机构那一栏都空着。”
为更好的阅读体验,本站章节内容基于百度转码进行转码展示,如有问题请您到源站阅读, 转码声明。
八零电子书邀请您进入最专业的小说搜索网站阅读带着手机重生,目标科技教父,带着手机重生,目标科技教父最新章节,带着手机重生,目标科技教父 平板电子书!
八零电子书邀请您进入最专业的小说搜索网站阅读带着手机重生,目标科技教父,带着手机重生,目标科技教父最新章节,带着手机重生,目标科技教父 平板电子书!
