欢迎您访问科普小知识本站旨在为大家提供日常生活中常见的科普小知识,以及科普文章!
您现在的位置是:首页  > 科技知识

“双十一”第11年 AI定义网购新玩法

科普小知识2021-07-16 07:45:08
...

《双11》进入第11个年头,现场直播如火如荼。主播李佳琪的“所有女孩”这句话已经成为直播时代的宣言,无数人掏空了他们的口袋。在今年的“双十一”期间,淘宝直播已经成为商家的标准。服装、美容化妆、食品和其他行业的企业已经开始使用直播工具。有些人甚至开玩笑说,这就好像没有没有直播的商店的详细页面。

为了获得更好的观看体验,淘宝自主开发了全新的音视频实时通信架构,实现了大规模低延时直播,将延时从5秒减少到7秒,减少到2秒以下,提高了用户与主持人的互动效率。此外,人工智能技术还可以实时识别主持人解释的商品,并将其显示在直播页面上。

是的,时代之风吹拂的地方,技术首先到来。直播和短视频很流行。在这个新的“双11”游戏的背后,还有一个不断改进的人工智能。

人工智能助手为主持人划分关注点

成千上万的剁手派对进进出出,刷屏幕的情况每分钟都在发生。锚被压垮了。这时,他的艾秘书出现了。帮助主人并提供主人问答、商品问答、优惠券问答等服务轻而易举。换句话说,你在工作室里问的大多数问题都是由人工智能助理回答的。

据阿里巴巴达摩研究院高级董事、阿里巴巴集团智能服务部总经理赵坤介绍,人工智能秘书采用自然语言理解和基于知识地图的问答技术,能够准确分析直播中受众对商品和主持人的复杂表达和查询,实现直播中多对一沟通的高效快速响应,大大提高直播中客户问题的回应率和解决率。

除了基于文本,人工智能客服还可以基于图片进行智能问答。赵坤表示,人工智能客服使用图像分析算法来理解图像的内容,并结合用户的提问来自动理解、识别和截取能够回答用户的图像作为答案,并突出图像中的准确答案位置。目前,智能图片问答已经覆盖了家电数码、休闲果蔬、母婴洗涤和保护等多个行业。

为了直升机派对的方便,卖家也可以从人工智能中受益。在“双十一”期间,卖家需要制作大量的宣传地图、海报地图等。在短时间内,图像智能生成技术得到应用。基于智能图像生成技术,人工智能设计人员可以改变传统的设计模式,在短时间内完成大量横幅广告、海报地图和场馆地图的设计。卖家只需输入想要实现的风格和尺寸,系统就可以代替人工完成耗时耗力的设计项目,如材料分析、铺垫、配色等,并实时生成多套满足要求的设计方案。

阿里巴巴达摩研究所的高级算法专家谢玄松表示,该系统已经达到了高级设计师的水平。它可以提供数十种方案,每秒设计8000种不同的海报。在去年的“双十一”期间,人工智能设计师为20万家企业设计了近600万张图片。天猫网站上消费者看到的几乎所有可移动商品的海报和图片都来自它。

除了图片,短片已经成为标准。谢宣松介绍,短视频智能设计产品是基于图像智能识别技术和视频智能生成技术,帮助用户在很短的时间内完成大量商品营销短视频的设计和制作。“用户只需输入商品详细页面的链接或从本地上传图片和视频资料,就可以进行一系列复杂的设计工作,如图片资料分析和过滤、商品理解和定位、视频资料裁剪准备、视频脚本编导、视频渲染生成等。,并可以根据用户的风格和大小等简单的个性化要求进行输入,为流媒体内容生成视频提供解决方案。”谢玄松解释道。

机器翻译帮助商品走向世界

如果货物销往世界各地,如果你不懂这种语言怎么办?在“双11”之前,机器翻译技术已经进行了升级。对话机器人可以帮助世界各地的中小型卖家自动将产品细节和评论翻译成当地语言,还可以实现客户服务和商务咨询的实时人工智能语言翻译,涵盖64个语言方向。当然,仅仅通过查看商家的网站来获取商品信息是不够的。如果你有任何问题,你可以打电话给客服,海外消费者也不例外。在家里,对话机器人负责客户服务。在过去两年里,它还有一个国际版本,专门服务于海外商业平台。

据赵昆说,这个对话机器人精通11种语言,如英语、法语、泰语、西班牙语和阿拉伯语,并能在两周内学会一门新的外语。

“今年,对话机器人已经学习了阿拉伯语、法语和繁体中文,并启动了马来语-英语、泰语-英语等混合语言问答功能。”赵昆说:“混合语言问答在马来西亚和其他地方非常普遍。在当地的客户服务领域,大多数用户用英语咨询,少数用户用马来语咨询,英语和马来语经常混杂在一起。对话机器人不仅需要同时理解两种语言,还需要理解复杂语言的混合用法并给出相应的答案。”

然而,它并不使用机器翻译技术,而是一种自然语言处理技术——跨语言学习。“小型语言缺乏大规模的训练语料库,很难通过过去的机器学习技术获得。跨语言学习可以克服资源匮乏的瓶颈。”赵昆解释说,跨语言学习是一种多语言自然语言处理技术。它有助于算法模型通过语言间的知识传递和具有足够语料库资源(如中文和英文)的语言来提高其理解小型语言的能力,从而快速扩展机器人的多语言支持功能。借助跨语言学习技术,对话机器人可以掌握更多的语言,甚至像土耳其语和乌尔都语这样的小型语言。

“一般来说,语言是一种符号,不同的语言是不同的符号系统。想象语言中的每一个事物/知识都对应于一个特定的身份,这个身份由不同语言中的不同符号来表示,或者不同语言中使用的符号被映射到同一个语义空间。跨语言学习的作用是帮助机器理解语言所指的身份标记,并在丰富资源的帮助下学习缺乏资源的语言。”赵昆进一步解释道。

他说,基于语言之间的交叉映射关系,对于机器来说,在缺乏资源的情况下通过混合多种语言来学习语言之间的共性要比学习一种语言好。2017年,对话机器人首次登陆海外。学习印尼语花了六个月的时间,达成一个解决方案也花了六个月的时间,这个解决方案堪比智能客服岗位上的中国机器人。现在,多语言机器人学习一门新语言的时间已经缩短到两周。

声纹识别开启了语音购买的第一年。

今年的“双11”,语音购物,然而在她开始向我们走来之前,我们已经打了一千次电话并催促她:消费者可以直接下订单,只要他们告诉天猫精灵他们想买什么。如果启用了“声波纹支付”功能,也可以进行直接的声波纹支付。

“语音购物第一年”听起来非常科学和技术化。据报道,数百万人体验过语音购物,其中超过一半的人是第一次尝试。本发明采用基于深度网络的注意力嵌入模型,通过网络结构的参数设计模拟基于人耳感知的频谱特征,能够在一定程度上消除同一个人在不同场景发音下的频谱特征差异干扰,显著提高远场交互下的声纹识别性能。

如何确保安全?阿里巴巴人工智能实验室语音技术首席科学家聂再清表示,天猫精神作为第一个达到语音识别技术商业化水平的智能扬声器,其语音识别率已经达到99%,这是其支持语音支付功能的基础。在支付级应用下,用户可以在不到10秒的时间内通过三个交互式语音准确描述用户的鲁棒语音特征,识别准确率达到99%以上。

不仅如此,利用中文识别的自然语言理解算法,语音设备能够准确定位消费者需要购买的商品,并基于平台大数据和依托声纹推荐能力为消费者做出个性化推荐。“在语音购物场景中,天猫向导可以基于注意力记忆网络,独立学习各行业导购员的经验,并根据用户特点呈现最佳导购流程,成为最了解用户和行业的智能导购员。”聂再清说。

此外,今年的“双十一”,消费者还可以体验到ar化妆试用产品。AR化妆试验通过标准化工具获得数字信息,如颜色编号和材料,并允许用户通过AI+AR技术看到相同产品在他们脸上的不同效果。通过高效、实时、准确的人脸识别技术,即使当人脸大角度抖动和偏转时,也能具有良好的稳定性能,在用户的脸上以毫秒级绘制出逼真的商品效果。新戏的背后是新技术。除了不断刷新营业额和令人瞠目结舌的商业数字,不断突破的技术正在应用于地面。