11月6日,2018智能科技与产业国际合作论坛在中国国际进口博览会现场成功举办。论坛由中华人民共和国工业和信息化部、江苏省政府共同主办,乐鱼APP官网登录入口、中国电子信息行业联合会、江苏省商务厅、江苏省工业和信息化厅承办。本次论坛以"共创智能新生态 共享智能新时代"为主题,是进博会智能科技与产业领域唯一论坛。百度高级副总裁、乐鱼APP官网登录入口副理事长、深度学习技术及应用国家工程实验室主任做了题为《AI是新的生产力》的主题演讲。
非常高兴参加此次论坛,今天演讲题目是AI是新的生产力。我们知道人类社会曾经经历过几次工业革命,从18世纪开始,每一次工业革命给人类带来的是新的科技,这些科技带来生产力大幅提升,进而带来生产关系的深刻变革,进而对整个社会产生深刻的影响。现在正处在第四次工业革命开始的时候,第四次工业革命核心科技是人工智能,我们知道一句话,科学技术是第一生产力。人工智能是新的生产力。
中央政治局集体学习,习总书记指出人工智能是新一轮科技革命和产业变革的重要驱动力量,希望人工智能能够同经济社会发展深度融合。AI本身为各行各业带来的变革已经无处不在,现在到底有哪些改变?这次人工智能首先带来深刻影响的是互联网,现在已经远远超出互联网,不管是工业、农业、物流、电商等、交通都有很多的变化。
百度从19年以前开始建立开始逐步使用人工智能技术,九年前2010年初全面开始布局人工智能,从自然语言处理到语音、视觉、知识图谱、机器学习、深度学习,从九年前逐步布局。到2016年基本上完成了布局,同时这些技术已经广泛应用于百度所有产品里。2016年开始整体上集成百度大脑对外开放,发展到今年,今年在7月份百度AI开发者大会发布百度大脑3.0,核心是多模态深度语义理解,不只是语言,从数据、知识、视觉、语音等都进入到这个阶段。
这是百度大脑完整布局,基础层,数据算法算力,感知层,跟人的视觉听觉等感知相关的语音、图像、视频以及增强现实、虚拟现实的技术,认知层更多跟人的认知,也是人特有的,语言、知识、凝练、传承等都是人特有的,认知层更多研究人的语言、知识,以及对人本身的理解。所有这些技术在平台层平台化,并且不止对公司内部平台化开放所有人都可以用,也开放出来供社会各界使用。
多模态深度语义理解,人工智能是一个基础,更好地使用数据,而且数据量非常庞大,这些数据在三元空间里,既在物理世界有很多数据,在人类社会,在互联网空间有大量数据。整体上数据是多元异构多模态数据,百度有十亿量级用户,会在互联网上抓取万亿量级网页,所有这些数据首先进行语义化,进行统一表征、关联计算等。进而可以总结规律、提炼知识、提炼价值。这些总结出来的东西,一方面可以用在各种产品,一方面发现很多以前人类没有或者没有掌握的知识,可以拓展人类智慧,助力经济和社会发展。
知识是非常核心的,比如讲神经网络、深度学习、各种学习方法,人工智能发展一定会跟知识更多融合,知识图谱是非常重要的,而且建构了世界上最大的知识图谱,除了基本实体图谱,也有面向不同应用,面向信息流推荐做关注点的图谱,面向不同行业应用做行业图谱等等。
视觉,早期会做基本视觉分析,比如识别一个人脸、物体,现在更多是深层次语义化,比如视频流,首先数字化,基于深层语义理解进行结构化,这样可以很好地理解一个视频。
语音识别做了很多年,基本做法是由声形模型、语音模型,跟真正语言理解没有什么关系,现在做到一定程度,想进一步提升,发现越来越多需要跟语言本身的理解,跟语义结合起来,开始做语音语义一体化识别,浅色是传统语音识别模型,加上基于语义纠错、解码,融合各种语义特征进去。除了识别效果更好,突破现代智能设备体验的瓶颈,现在智能设备用的时候每次做一次唤醒,小度小度唤醒一次说一句话,有了更好地语义技术,唤醒一次可以持续交互。
这个视频里开始唤醒一次,后面和人之间的交流一样,很自然说,而且中间可以打断,背后都是语音语义一体化技术在起作用。
人从小开始对世界的观察、听、看以及触摸感知世界,学习世界,随着逐渐人认识的字越来越多,能从文字里阅读开始学习知识,基本上人到十岁以后最重要的知识来源变成阅读,对百度大脑也是,非常强调阅读理解的能力,庞大的知识图谱很多,千亿量级很多是靠机器自动阅读,阅读大量网页,在里面自动提取知识,这是阅读理解的过程。阅读理解,同时可以应用,应用到推荐、应用到问答,很多系统里,通过用户反馈,改建模型,同时把知识沉淀下来,进入知识图谱。
另一个跟语言相关的理解,对话,人与人之间交流不断学习,在掌握更多的知识,对话理解也是我们引入各种强化学习的技术,以及对话管理、多轮交互,一方面完全跟用户的交互,同时也在凝练和传承知识。
后面给大家看一下我们已经在哪些产业里取得应用,给大家的例子。百度大脑开放完整AI能力,开放130项能力,每一个类别很细分,这是人工智能应用的特点,我们做人脸识别,有很多不同场景的人脸识别,做文字识别有很多不同场景的文字识别,识别一个火车票、身份证、卡等等,都是专门在定制优化达到最好的效果,这也是人工智能真正想应用的效果非常好,一定要跟场景有深度融合。
现在大家出行越来越多离不开地图,越来越多自己不记录,地图怎么越做越好,更多融入人工智能技术百度地图完全进化成人工智能地图,从路况预测、规划,后台数据生产,数据拍回来,先做图象识别、文字识别,自动纠错处理等等一系列处理,使数据生产的效率大幅提升。
这是一段真实的机器人,客服中心里充当客服,这个过程中真正跟用户有很流畅的对话,能完成用户所需要的完成的任务,同时后来用户发现余额不足的同时,不止是基本的知识对话要有,同时感知用户情绪的变化及时的做一些安抚。
再给大家看一个例子,主动外呼,主动给用户打电话。
背后看着很流畅很有趣的对话,背后是人工智能的很多技术,比如语音识别合成,自然语言理解以及知识图谱等等一系列技术支撑机器人的运行。
医疗资源是很紧缺的资源,最好的医生量是很少,怎么提升这些医生的效率?这些医生日常工作很多是解决很简单的问题,如果有智能分导诊在患者第一步智能交互过程让他找到最合适的医生,这时候效率大幅提高,这也是通过自然语言的对话,理解的过程完成的智能分导诊。
中国现在需要做眼底筛查,有潜在风险有多大,这个人群量在中国是4.4亿,在世界范围更多,比如有潜在青光眼、黄斑、糖网,潜在风险人群很大,这些病随着医疗水平的提升,如果在早期能发现是很容易治疗预防避免严重的后果,但是中国眼科医生有看一个眼底照片能力的医生只有几千人,远远满足不了真正做大规模,为这些风险人群做眼底筛查的需求。我们开发了结合人工智能的技术,包括眼底图象识别,后台知识等结合在一起,做了眼底筛查一体机,这会非常快,照一张照片,十秒钟出一张报告,准确率和人类非常好的医生水平基本上接近了,94%左右的准确率,发现问题的概率没有那么大,发现问题及时就医,这时候会为很多人带来真正的预防一些潜在危险。
农业,一个稻田,稻田里如果不分青红皂白用农药,用药本身很浪费,再一个造成更多污染,用智能遥感拍下来光谱,用图象识别视觉技术进行处理,我们可以分析哪一块更多需要用药,哪些不需要或者少药,用药量更下降,针对性杀虫,既降低成本同时又环保。
地板厂商跟我们合作,地板传统需要有人识别地板的质量,看是不是有瑕疵,现在流水线上过去,照片拍下来,自动进行识别,有瑕疵能发现,效率非常高,同时准确率非常高。蓝框是EasyDL,我们开发了零门槛的深度学习的平台,可以不掌握深度学习的知识,上这个平台很容易用起来,用在自己所需要解决的问题上。
这是工厂里的例子,这是工厂里零件质检的例子。挖掘机是很有技术含量的工种,同时这些司机不止需要技术,工作环境也是很艰苦的,通过人工智能技术赋能挖掘机,让它变成没有司机在里面就可以很好的完成挖掘任务。可以用人工智能让更多机器更智能起来。
演讲到这里,相信我们的人工智能技术会和所有合作伙伴一起合作,人工智能让我们生活变得更加美好。