看见一个花花草草,立刻拍个照片,立刻能告诉TA叫啥,属于什么界门纲目科属种。看见一美女拍一张立刻能为你赋上一首酸诗,给你一段搭讪的由头。通过物品包装立刻能查真伪,查产地,查内涵,不再被华丽丽的外表欺骗。好吃的好玩的,都能通过扫码、拍照、文字和语音,最快速的查询到相关的信息,获知对这一未知的了解。除此之外,你的设备还能通过语音跟你进行交互,对话,为你提供信息和服务的集成,成为你解决问题获取信息的智能助手。这就是手机百度想做的事。

每一次搜索都是一次对未知的探索

在11月25日,手机百度客户端达到了4亿用户数,但通过百度的数据统计来看,目前来自手机浏览器访问手机版百度搜索的量要高于手机百度客户端。移动的便捷性和搜索获取信息低成本,基本上培养起用户,随用随查,不会就问。这也使得用户在移动设备上查询请求的频次更高,日均搜索PV增长达1500%,平均每天的搜索请求高达几十亿次。

做为搜索信息和用户之间的代理,百度通过对用户请求的解读,实时给予用户解答和服务,并把用户的请求信息不断解构成场景下不同需求的表达,通过这种解构建立需求的数理化描述,需求表达的差异化模型,并利用大数据技术、机器学习技术去构建各种相同的、不同的需求模型上的信息呈现方案、交互设计和问题解决方案。

五大技术创新带来的产品化能力的变革

搜索框是上帝洞察人类欲望之门。每天百度搜索都会接受用户来自各种通道的数十亿次搜索请求,而每一次搜索请求后面,用户都会通过一定行为表达自己对搜索结果的感受,比如点击了某一条或者啥也没点直接换了个关键词,等等,而这每系列行为所代表的用户需求满足度和偏好特征,都将成为百度对搜索排序和搜索质量评估的重要依据。如今,基于机器学习影响搜索排序,已经成为搜索结果二次排序的重要技术支撑。

百度将这些数据通过LTR技术应用到搜索结果排序,应用到用户需求分析和特征建模。建模的模型上也因数据的积累和计算能力的极大提升、算法和技术的成熟,由大型线性模型演进到树模型,广泛应用深度神经网络等分布式算法,从而使系统对用户需求建模更准确,信息和服务的提供更能让用户满意。

在这些基础技术应用之外,百度也通过将技术积累垂直产品化,在语音识别引擎的研发上,通过数百亿训练样本达到目前90%以上的识别准确率,除了支持语音转文本的输入处理之外,还发展百度语音助手的语义识别和语音到指令的解析技术,东宝的介绍,百度还在发展自主研发语音合成系统,效果已达到领先水平。

在图片处理技术上,引入深度学习后,OCR错误率相对降低30%,人脸识别,LFW测试世界领先,在朋友圈相信很多朋友都玩过那个著名的“谁跟你长得像”的百度魔图的功能,就是出自于此。

基于扫条码、二维码、OCR、拍照、图像识别等多媒体输入手段,结合使用的情景,通过智能卡片和引导与推荐技术的产品化,实现在移动端对用户信息消费,甚至线上消费,购物、线下生活消费等的消费能力增强,让用户能充分想享受移动搜索带来的探索未知的快乐。这是在移动时代注定要大方光彩的技术成果。

基于情景建模的搜索引擎

移动搜索与PC搜索不尽相同,它会叠加一些基于手机设备和移动的特殊属性,比如定位,录音,拍照以及各种感应器的信息,通过这些信息与用户请求、及请求的时间空间信息的拟合,就会准确在情景模式下,定义用户的需求。

搜索引擎后台通过大规模数据挖掘和机器学习获知该需求的满足方案,组织解决方案相关的信息、服务,结合语义匹配的二次查询和筛选,输出给浏览器或者手机百度进行排序和呈现,并给根据用户的行为不断迭代和更新,形成结果排序的自进化。

用户发生搜索请求最相关的三个维度就是请求的关键词、时间和空间,而基于百度地图不断升级所构建的百度LBS服务,也将是百度移动搜索的底层协同技术。

而在时间维度上,可以想见同一个人在信息获取和信息使用行为特征上都会有明显的不同,统计数据显示,手机百度用户的使用习惯是,白天用浏览器上百度,晚上用客户端上百度,你猜猜为什么?
  
手机百度的超级入口梦

手机百度随时知道,这是百度希望做到的。但是因为现在的搜索引擎反映速度太有快了,相应结果输出质量好,很快找到自己需要的信息,导致用户在获取信息上不会太多的消费时长「哥还做搜索PM的时候,一个Session定义周期是15分钟,按最长时间计」,而手机百度客户端用户平均浏览时长是20分钟,这个我怀疑是国家统计局了,因为手机百度上有大量人在上边看小说,“我”被平均被拉长了。

不过这个不重要,因为未来的手机百度不只是能搜索网页,它还成为轻应用「输入轻应用,可获取什么是轻应用全文推送」的承载平台,而且轻应用的封装还可以向第三方开放,这着实十一个值得期待的玩法。

百度轻应用给开发者LBS、语音输入输出、订阅推送、电话拨打、摄像头调起、分享评论等接口支持,用户在百度搜索框中可实现对百度轻应用平台上应用的破壳检索,即搜索应用内的信息,而且可以订阅应用,实现应用单独提供的推送和通知服务。

用户通过百度平台不仅可以获取信息,还可以通过轻应用把信息和服务往问题解决的方向延伸的体验进一步打通并优化,开发者则通过这一开发平台实现跨平台运行、低成本推广。

百度希望,在移动上继续复制在PC上成功的路径,以信息获取为用户提供价值,进而吸引用户的关注力,通过分发注意力流和内容传播来吸引内容贡献者参与开发、内容共建,通过广告模式或者垂直内容绑定收费服务的模式来形成移动商业生态。与PC上,有需求去输入关键词查一下一样,在移动上,这一行为习惯也存在。但是在移动上,信息的存在态除了直接表达外,还有一种是围绕人,围绕人和人的关系,人和物的关系,因为人而形成的信息的过滤、获取,进行形成传播,进而影响消费和商业决策。

今天我们面临的信息的世界,不是找不到信息,而是找到的太多了,怎么能有效的解决过载问题,这是解决体验问题的关键。如果百度能把信息的消费和APP对于用户需求满足的具体解决方案顺滑衔接,并能基于此构建完整的体验延续和服务保障,甚至从线上到线下,这想象起来还是挺有趣。

移动互联网与PC互联网的最大不同在于,移动时代互联网的终端节点是一个个人,而不是一台台电脑。以信息、主题内容的获取和传播为主,有一定局限性(输入社交可获得此前关于移动互联网通信和社交问题的分析)。在PC上搜索引擎用户使用率在80%,而在移动上,搜索使用率在70%附近徘徊(输入cnnic31、cinnic32可获取相关分析数据参考)。移动互联时代,以信息服务的体验为驱动力的业务模型,更需要要建立精准的问题解决和和富有人文情怀的需求满足匹配模型,此使命的实践有一定难度。

-