在唐飒打电话的当天晚上,肖远和杰西卡将各自的任务全部完成了,他们开发的软件进入了联调阶段。
所谓联调,就是将各自编写的模块联接成一个完整的软件进行调试,这是一个大型软件分工开发的必经步骤,调试是建立在各自模块没有问题这一基本假设之上的,调试的内容主要集中在模块之间的接口通讯,以及软件的整体功能之上。
无论是肖远,还是杰西卡,都是具有非常丰富软件开发经验,因此各自的模块在联调之前,都已经进行了反复测试,虽然每人负责的模块都有十余个之多,软件接口也非常复杂,但是联调过程却是非常顺利,几乎是一遍成功。
对于这种情况,两人都非常高兴,特别是肖远,这段时间各种事情缠身,如果联调顺利的话,软件的后期功能测试主要有杰西卡来做,而他则可以从中抽出身来,完成其他几件事情,最迫在眉睫的事情有两件,其一是与龙太杰比试要准备的材料,另一个是鲁宾摆脱他分析的那段奇怪数据。
除了上述两件事情,他还将有一件事情要做,就是等着唐飒来找他,谈关于图像识别的事情,唐飒没有让他久等,在和他打过电话的第二天上午九点多就来伯克利了,肖远请了假,从学校里出来,在家里见到了唐飒。
“我想做个软件,能够搜索网络上的图像,并从图像中识别出人的面部,并根据面部特征找到这个人,软件的网络部分我可以自己做,但是图像的人脸识别部分,你能不能做出来?”唐飒将根据高怀英描述所画的卡尔的素描画拿了出来,放到了桌上,问道。
“可以,人脸识别并不是特别难的技术,这个软件的难度不在这里,而在图像数据源的获取。”肖远扫了一眼那张图,发现那是一张陌生的白人的面孔,就没有过多的留意,而是针对刚才唐飒的解释,提出了自己的一点看法。
“数据源你不必担心,你只需要帮我把图像识别模块做出来就行了。”唐飒说道。
“没问题,你等我两天时间,我加加班,应该能做出来,另外你把这份素描扫描成图像,再给我找一些别的含有人脸的图像当做算法训练材料。”肖远说道,他想要做的图像识别算法是基与统计学原理来设计的,要提高算法的识别率,需要事先利用这个算法对大量的同类数据进行统计分析,这个过程叫做算法训练,用来进行算法训练所准备的素材,叫做训练材料。
“好,这些材料姐姐帮你准备,训练材料你要多少份?”唐飒问道,作为一名人工智能专业的计算机博士,人工智能算法的训练也非常常见,因此她自然能够理解肖远所说的算法训练和训练材料是怎么回事。
“最少要一千份吧,当然越多越好,没有统计数量,算法训练不出来,识别率提不上去。”肖远说道。
“好的,我们分工,你负责编写算法,姐姐去帮你收集训练素材,一下子准备这么多图片,够姐姐忙一阵子了。”唐飒将卡尔的素描画收了起来,说着站了起来,准备离开。
“对了,训练素材你可以让新宇帮你准备一下,玄涅有图片搜索,数据库里已经积累了大量的图片素材,你让他组织人帮你筛选一部分出来,应该很快的。”肖远提醒了唐飒一下。
“姐姐知道了,你忙去吧,姐姐先走了,啥时候你把算法做出来了,就给姐姐打电话,姐姐再来。”唐飒嫣然一笑说道,说完就要离开。
“姐,你这么急就要走吗?”肖远对唐飒确实有些不舍,因为这个时候家里只有他们两个,这让他的心突然有种蠢蠢欲动的冲动。
“如果你留姐姐的话,姐姐很愿意听你的话。”唐飒止住了脚步,向肖远眨了眨眼说道。
“中午吃过饭再走吧。”肖远上前一步说道,不知怎么的,他感到自己竟然有些紧张,心脏砰砰砰的剧烈的跳动着,声音也带着些许的颤抖。