第624章 一夜完工,模型跑出炸裂成绩!(1 / 1)

郭长征一惊,转头看向窗外。

虽然此时没有阳光直射进来,但外面的天色已经明显泛白。

“这……居然快天亮了?”郭长征觉得一阵恍惚。

两人这大半个晚上,连水都没怎么顾得上喝。

完全沉浸在那种发现新大陆的极度亢奋之中,根本没有察觉到时间的流逝。

“效率太高了。”郭长征看着满屏整洁的代码。

“如果按照我以前的计划,把这个复杂的网络架构用底层代码实现,起码得两个月。”

“而现在,一晚上,全搞定了。”

楚一航摸了摸肚子,感觉胃里空空如也,饿得有点难受。

“郭老师,模型搭好了,咱们现在就让它跑起来吧?”

“跑!必须跑!”郭长征此刻也顾不上疲惫。

楚一航打开浏览器,登录了ImageNet的官方网站。

由于完整的数据集高达上千万张图片,庞大,全部下载不仅耗时,楚一航硬盘也装不下。

于是,他们只勾选了其中一个非常小的数据子集,大概几万张图片,涵盖了猫、狗、汽车等常见的十几个分类。

点击下载。

趁着下载的间隙,楚一航写了一个简单的数据预处理脚本,把图片统一缩放并转化为框架能读懂的张量格式。

下载完成,数据加载完毕。

楚一航深吸了一口气,敲出了运行命令,按下回车。

工作站机箱里的几块顶配AMD显卡风扇,瞬间开始加速旋转,发出低沉的轰鸣声。

屏幕的终端上,开始一行一行地跳出训练进度的提示。

进度条开始缓慢地向前推移。

郭长征和楚一航盯着那个进度条看了足足五分钟。

“一航,这速度,大概要跑多久?”郭长征估算了一下时间。

楚一航看着系统给出的剩余时间预估。

“郭老师,虽然咱们这是最顶配的显卡,算力已经很强了。”

“但咱们这个网络层数不少,哪怕只是几万张图片的子集,跑完这50轮训练,预估也得好几个小时。”

此时,通宵过后的后遗症开始疯狂反扑。

两人都感觉到了那种又累、又困、又饿的虚脱感。

大脑已经开始有点不转了。

楚一航站起身,活动了一下僵硬的关节。

“郭老师,你这也累坏了,再熬下去身体吃不消的。”

“我这房子正好是两居室,咱正好一人一间房。”

楚一航指了指走廊。

“咱们先去休息一下,踏踏实实睡一觉。”

“机器就在这儿自己跑着,等结果出来了咱们再回来看。”

郭长征在脑子里过了一下日期。

今天是周六,周末不用去学校上课,也没有行政会议。

而且,他心里也极度期待,这个折腾了一晚上的全新架构,到底能跑出什么样的结果。

如果不看到最后的结果,他觉得自己就算回家也根本无法安心。

“行,一航,那我就厚着脸皮在你这儿叨扰一下了。”郭长征答应下来。

两人各自进了一间卧室,关上门。

楚一航连衣服都没脱,倒在床上就闭上了眼睛。

但他发现,自己的大脑皮层极度活跃。

一闭上眼,满脑子全是代码、张量、矩阵和各种报错信息。

他翻来覆去地换了好几个姿势,好不容易才迷迷糊糊地陷入了浅睡眠。

大概过了三个多小时。

楚一航猛地睁开眼睛,看了一眼手机上的时间。

上午九点十分。

他觉得自己好像睡了,又好像根本没睡。

那种对实验结果的强烈期待,就像一个小钩子一样,不断地挠着他的神经。

他翻身下床,穿上拖鞋,走出卧室。

刚走到客厅,楚一航就愣住了。

郭长征已经坐在了工作站前面,眼睛死死地盯着屏幕。

“郭老师?”楚一航走过去打了个招呼。

“你这……怎么就睡了这么一会儿?不多休息一下?”

郭长征回过头,眼睛里布满了红血丝,但精神状态却异常亢奋。

“一航,我根本就没睡着。”郭长征指了指自己。

“我在床上躺了两个小时,脑子里全在推演这个模型的结果。”

“因为太期待了,实在躺不住,就起来盯着了。”

楚一航拉开椅子坐下,看向屏幕。

终端上的提示显示,训练已经进行到了最后一轮的最后几分钟。

机箱风扇的转速依旧很高。

两人谁都没有说话,客厅里安静,只有机器的运转声。

终于,进度条走到了100%。

接着,程序开始在验证集上进行最终的测试评估。

几秒钟后,两行关键的评估数据打印在了屏幕上。

TOp-1准确率:50.23%。

TOp-5准确率:70.81%。

郭长征愣了几秒,随后猛地从椅子上站了起来。

楚一航也是一脸震惊,直接爆了句粗口:“卧槽!牛逼!”

两人兴奋地在半空中重重地击了个掌。

两声清脆的巴掌声在客厅里回荡。

他们太清楚这两行数字所代表的含金量了。

激动得脸都红了。

在普通人眼里,这只是两个干巴巴的百分比。

但在懂行的科研人员眼里,这就是炸裂的神迹。

所谓的TOp-1准确率达到50%,究竟是个什么概念?

简单来说,随便给这个刚搭好几小时的AI模型扔一张它从来没见过的图片,比如一张猫的照片。

模型经过计算后给出的第一个判定答案,有足足一半的概率,会精准无误地指出这是一只“猫”。

虽然它也有一半的概率会猜成狗或者别的什么东西,但这个首选命中率,在当时的技术背景下已经高得吓人。

而TOp-5准确率高达70%,则更加恐怖。

这意味着,哪怕模型偶尔犯迷糊,没把正确答案排在头名。

只要它给出的前五个最有可能的猜测名单里,比如依次写着“老虎”、“小狗”、“猫”、“狐狸”、“越野车”。

由于“猫”这个正确选项出现在了前五名的列表里,在测试标准中就算它预测成功。

这种极具包容度的准确率,达到了惊人的百分之七十。

两人之所以激动得有些失态,甚至在半夜的客厅里大喊大叫,是因为这个成绩放在当下,完全是不可思议的。

要知道,他们今晚使用的资源极其寒酸。

为了图快,他们根本没有去下载ImageNet那多达一千五百万张图片的完整数据集。