第158章我们究竟在谈些什么_学霸终结者

那就是“百度”，以及比百度逊色一些的“谷歌问答”。

“”，是一个比搜索更加贴近人类语言习惯的问答产品。在搜索的时候，人只会打几个关键词，很少会直接长篇大论写一句话，写一个用人类正常语法表述的问题。

而用百度的时候，因为背后是人类在回答，所以大家都遵循了人类语言的语法。

一个新买的用户，和初秘或者siri聊天的时候，问到的问题，真的是绝无仅有、从来没有前人问过的么？

恐怕不尽然。

十几亿人心中的困惑，有相当大一部分是重合的。同一个问题，可能全国有几百万人想问。

有了百度的云端大数据之后，初秘或者siri再听到主人的语音发问时，就可以先搜一搜这个云端数据，看看有没有近似的或者重复的前人提问。

如果有，直接把前人提问中的“被采纳答案”推送、语音一遍就行了。

在“”这个产品上，谷歌其实走得比百度慢。谷歌的强项，是“谷歌学术”那种专业标准化的问答，而缺少家长里短的日常人工智能锻炼。

在人工智能领域，如果非要对比谷歌和百度的优劣势，只能说：谷歌可以训练出更精密的机器，但是不如百度那样容易给机器学会‘七情六欲’。

因为早年的谷歌，压根就没想到去锻炼其人工智能的这个方面。

当然，说句良心话，百度也没想到。

“百度”日后教会了“度秘”比siri更能插科打诨，也只是百度发展时一招无心插柳的歪打正着。

……

正因为顾莫杰懂行，因为他就懂深度学习算法，所以，他比别人更能领会严磊开出的条件诱惑力。

初音集团，在搜索上是弱项。

但是初音集团，在人工智能的算法领域，是强项。

一个企业人工智能产品的强弱，受制于两个因素。

一个是算法的好坏，一个是大数据的规模。

比如，谷歌的算法效率假设是10，而谷歌的日搜索处理量是10亿条，所以谷歌的人工智能每天理论消化的问答是1亿条。

如果初音的算法效率更好，有20，但初音每天的搜索处理量只有1亿条，那么初音人工智能每天理论消化的问答只有2000万，比谷歌弱了五倍。

有好算法，有好的“数据消化效率”，却没有足够的“数据饲料”去喂养这副“消化功能”极强的“胃口”。

这一直是初音人工智能研究院的缺憾，短板。

但是，如果按照严磊的说法，把谷歌中国五年，在中国市场上搜集到的服务器端历史记录数据统统py，“填鸭式”地塞给“初秘”去学习，那么初秘在“真正听懂中国人讲话”这个问题上，起码可以赢得相当于额外获得两三年锻炼的效果。

历史上siri公司成立于2007年，10年被苹果收购后，在4s上放出了这个人工智能产品。

但是用过iphone4s的用户，恐怕都有一种记忆：

刚开始，4s上的siri智能程度真的很低，几乎听不懂话。还是只能和旧时代的“语音拨号助手”那样，帮主人翻翻通讯录、拨打一下为主。

至于让siri真的近似于人一样和主人聊天，似乎是20122013年的事情了，那时候的siri才渐渐像人话。

那就是因为，siri花了两三年来“学习”、来积累和消化云端大数据，渐渐统计出人类语言习惯。

如果谷歌中国不倒下，谷歌在华的那多年数据记录，肯定是作为商业秘密不会公开的。因为那涉及到其对中国人上网习惯的统计。如果公开了，很有可能被对手拿去，作为优化对手引擎算法的参照物。

但是，如果谷歌中国倒下了，这些数据再遮遮掩掩藏着，似乎就没意义了。

只要顾莫杰出一笔看上去挺诚意的价码，谷歌总部就会把这笔数据财富卖给初音。

顾莫杰意淫着美好前景，简直要兽血沸腾。

恨不得现在就在老拉利佩奇脊梁骨上捅一刀，然后把谷歌中国的数据资源巧取豪夺走。

“磊哥，来，好好说说你数据到手之后的详细使用计划。我都有点迫不及待了……”

“当然没问题，就是如此如此，这般这般……”

严磊一副指点江山状，对顾莫杰讲解了一个钟头的技术路线梗概。

“只要做到了这些，然后，我们的初秘肯定可以在‘人话识别率’上领先siri至少两年。”未完待续。

是由【无错】【小-说-网】会员手打，更多章节请到网址：ledu

第158章 我们究竟在谈些什么（2 / 2）