郭长征一惊,转头看向窗外。
虽然此时没有阳光直射进来,但外面的天色已经明显泛白。
“这……居然快天亮了?”郭长征觉得一阵恍惚。
两人这大半个晚上,连水都没怎么顾得上喝。
完全沉浸在那种发现新大陆的极度亢奋之中,根本没有察觉到时间的流逝。
“效率太高了。”郭长征看着满屏整洁的代码。
“如果按照我以前的计划,把这个复杂的网络架构用底层代码实现,起码得两个月。”
“而现在,一晚上,全搞定了。”
楚一航摸了摸肚子,感觉胃里空空如也,饿得有点难受。
“郭老师,模型搭好了,咱们现在就让它跑起来吧?”
“跑!必须跑!”郭长征此刻也顾不上疲惫。
楚一航打开浏览器,登录了ImageNet的官方网站。
由于完整的数据集高达上千万张图片,庞大,全部下载不仅耗时,楚一航硬盘也装不下。
于是,他们只勾选了其中一个非常小的数据子集,大概几万张图片,涵盖了猫、狗、汽车等常见的十几个分类。
点击下载。
趁着下载的间隙,楚一航写了一个简单的数据预处理脚本,把图片统一缩放并转化为框架能读懂的张量格式。
下载完成,数据加载完毕。
楚一航深吸了一口气,敲出了运行命令,按下回车。
工作站机箱里的几块顶配AMD显卡风扇,瞬间开始加速旋转,发出低沉的轰鸣声。
屏幕的终端上,开始一行一行地跳出训练进度的提示。
进度条开始缓慢地向前推移。
郭长征和楚一航盯着那个进度条看了足足五分钟。
“一航,这速度,大概要跑多久?”郭长征估算了一下时间。
楚一航看着系统给出的剩余时间预估。
“郭老师,虽然咱们这是最顶配的显卡,算力已经很强了。”
“但咱们这个网络层数不少,哪怕只是几万张图片的子集,跑完这50轮训练,预估也得好几个小时。”
此时,通宵过后的后遗症开始疯狂反扑。
两人都感觉到了那种又累、又困、又饿的虚脱感。
大脑已经开始有点不转了。
楚一航站起身,活动了一下僵硬的关节。
“郭老师,你这也累坏了,再熬下去身体吃不消的。”
“我这房子正好是两居室,咱正好一人一间房。”
楚一航指了指走廊。
“咱们先去休息一下,踏踏实实睡一觉。”
“机器就在这儿自己跑着,等结果出来了咱们再回来看。”
郭长征在脑子里过了一下日期。
今天是周六,周末不用去学校上课,也没有行政会议。
而且,他心里也极度期待,这个折腾了一晚上的全新架构,到底能跑出什么样的结果。
如果不看到最后的结果,他觉得自己就算回家也根本无法安心。
“行,一航,那我就厚着脸皮在你这儿叨扰一下了。”郭长征答应下来。
两人各自进了一间卧室,关上门。
楚一航连衣服都没脱,倒在床上就闭上了眼睛。
但他发现,自己的大脑皮层极度活跃。
一闭上眼,满脑子全是代码、张量、矩阵和各种报错信息。
他翻来覆去地换了好几个姿势,好不容易才迷迷糊糊地陷入了浅睡眠。
大概过了三个多小时。
楚一航猛地睁开眼睛,看了一眼手机上的时间。
上午九点十分。
他觉得自己好像睡了,又好像根本没睡。
那种对实验结果的强烈期待,就像一个小钩子一样,不断地挠着他的神经。
他翻身下床,穿上拖鞋,走出卧室。
刚走到客厅,楚一航就愣住了。
郭长征已经坐在了工作站前面,眼睛死死地盯着屏幕。
“郭老师?”楚一航走过去打了个招呼。
“你这……怎么就睡了这么一会儿?不多休息一下?”
郭长征回过头,眼睛里布满了红血丝,但精神状态却异常亢奋。
“一航,我根本就没睡着。”郭长征指了指自己。
“我在床上躺了两个小时,脑子里全在推演这个模型的结果。”
“因为太期待了,实在躺不住,就起来盯着了。”
楚一航拉开椅子坐下,看向屏幕。
终端上的提示显示,训练已经进行到了最后一轮的最后几分钟。
机箱风扇的转速依旧很高。
两人谁都没有说话,客厅里安静,只有机器的运转声。
终于,进度条走到了100%。
接着,程序开始在验证集上进行最终的测试评估。
几秒钟后,两行关键的评估数据打印在了屏幕上。
TOp-1准确率:50.23%。
TOp-5准确率:70.81%。
郭长征愣了几秒,随后猛地从椅子上站了起来。
楚一航也是一脸震惊,直接爆了句粗口:“卧槽!牛逼!”
两人兴奋地在半空中重重地击了个掌。
两声清脆的巴掌声在客厅里回荡。
他们太清楚这两行数字所代表的含金量了。
激动得脸都红了。
在普通人眼里,这只是两个干巴巴的百分比。
但在懂行的科研人员眼里,这就是炸裂的神迹。
所谓的TOp-1准确率达到50%,究竟是个什么概念?
简单来说,随便给这个刚搭好几小时的AI模型扔一张它从来没见过的图片,比如一张猫的照片。
模型经过计算后给出的第一个判定答案,有足足一半的概率,会精准无误地指出这是一只“猫”。
虽然它也有一半的概率会猜成狗或者别的什么东西,但这个首选命中率,在当时的技术背景下已经高得吓人。
而TOp-5准确率高达70%,则更加恐怖。
这意味着,哪怕模型偶尔犯迷糊,没把正确答案排在头名。
只要它给出的前五个最有可能的猜测名单里,比如依次写着“老虎”、“小狗”、“猫”、“狐狸”、“越野车”。
由于“猫”这个正确选项出现在了前五名的列表里,在测试标准中就算它预测成功。
这种极具包容度的准确率,达到了惊人的百分之七十。
两人之所以激动得有些失态,甚至在半夜的客厅里大喊大叫,是因为这个成绩放在当下,完全是不可思议的。
要知道,他们今晚使用的资源极其寒酸。
为了图快,他们根本没有去下载ImageNet那多达一千五百万张图片的完整数据集。