揭秘康辉李彦宏“虚拟人”背后黑科技
9月15日,科技界年度盛会“百度世界2020”线上开幕。今年的百度世界大会由百度与“央视新闻”联合呈现,上午刚刚结束的主论坛精彩纷呈,反响热烈,花式登上热搜:百度创始人、董事长兼CEO李彦宏与央视主持人康辉“虚拟人”亮相、颠覆搜索形态的“度晓晓”、去安全员的“全自动驾驶”……这些炫酷的背后离不开百度大脑的支撑。
百度大脑分论坛带来这些“黑科技”的全面揭秘,展示了百度大脑的技术升级与演进。百度CTO王海峰发布了百度大脑6.0,升级为“AI新型基础设施”。“知识增强的跨模态深度语义理解”让百度大脑的理解能力更加强大,飞桨深度学习平台与百度昆仑芯片的升级则为开发者提供了更优的算法开发平台和更强大的算力。国内首个面向疫情预测与追踪的多方数据协作平台、国内首个云原生量子平台重磅推出,提出AI安全三大维度……大量技术硬核来袭,百度大脑分论坛成为中国百万AI开发者的极客盛宴,诠释着“AI新型基础设施”的巨大能量,这也成为国内AI技术的“风向标”。
(百度CTO王海峰)
王海峰表示,“人工智能是第四代工业革命的核心科技,是国家推进‘新基建’重点建设的新型基础设施,百度建设的AI基础设施正是百度大脑,能够让各行各业更高效、更全面、更深入地应用人工智能技术,加快产业智能化进程。”
瞄定“AI新型基础设施”,百度大脑6.0缔造AI基础底座
栩栩如生、问答如流、认知接近人类甚至可以机机对话、可在手机终端运行的“虚拟人”是大会最大的亮点之一,其背后的技术支撑,也是科技圈及开发者的聚焦点。百度大脑分论坛上,百度集团副总裁吴甜详解百度大脑6.0,阐述了百度如何聚焦人工智能领域的前沿突破,来打造这一产品。
吴甜表示,百度大脑6.0的升级,瞄定的是国家战略与政策角度中“推动互联网、大数据、人工智能和实体经济深度融合”的需求,往推动“新基建”、助力产业升级转型的方向发力,承担着“AI新型基础设施”的重要角色。
(百度集团副总裁吴甜)
对于百度大脑6.0的升级,吴甜从多个层次进行了概括:在基础层,飞桨深度学习平台和百度昆仑AI芯片“软硬一体”升级为开发者打下了坚实的基础;在技术层,百度大脑实现多项核心技术融合,形成知识增强的跨模态语义理解能力,例如基于图像语言一体化理解技术,OCR的准确率提升了24%,基于语音语言一体化理解技术,语音识别的准确率和交互成功率也迎来大幅提升。具有认知能力的“虚拟人”更是这些前所未有技术的综合展示。
技术上的跃进,也在不断加速产业智能化发展。“全国预警发布”百家号可自动制作图文内容,目前已发布37.5万篇,触达用户22.8亿人次;水路运输行业基于零门槛AI开发平台EasyDL打造的首个且唯一基于 AI识别船舶空满状态的智能水运调度平台,空满载识别准确率可达99.7%。
吴甜披露最新数据,百度大脑已经开放了273项AI能力,凝聚超过230万开发者,创建超过31万模型,并培养了超过100万AI人才,有力推动了中国AI技术研发、实践应用与生态建设。
芯片框架、核心算法全面演进百度大脑“AI力”爆棚
百度大脑分论坛上,百度一众AI大咖、科学家纷纷亮相,详解百度大脑各个技术版块。对于前沿趋势与技术干货的呈现,囊括了AI芯片、框架、核心算法、AI安全,以及最前沿的数据联邦和量子计算领域的进展。
(依次:百度语音首席架构师贾磊、百度视觉技术部总监丁二锐、百度知识图谱部&大数据部高级总监朱勇、百度杰出架构师,文心(ERNIE)负责人孙宇、百度深度学习技术平台部高级总监马艳军、百度智能芯片总经理欧阳剑)
基础层,AI芯片是科技竞争的制高点,是历史的趋势。百度昆仑1已量产部署将近2万片,在百度搜索引擎等部署,相比英伟达T4 GPU性能在不同模型下提升1.5-3倍。百度智能芯片总经理欧阳剑预发布了国内首款云端通用AI处理器“百度昆仑2”,采用更先进的7nm工艺,性能最高可超过前代三倍,预计明年初量产。
作为“智能时代的操作系统”,深度学习框架下承芯片,上接应用。百度深度学习平台飞桨公布目前已适配15家硬件厂商、22种芯片型号,对国产硬件的支持力度业内第一。
百度深度学习技术平台部高级总监马艳军带来核心框架的技术进展。动态图和API体系全面升级,飞桨实现了动态图和静态图的统一,灵活性和效率兼顾,让用户更容易开发模型;全面升级的API体系,降低了编程复杂度,对于开发者更加友好。
英特尔的高级工程师Andres Rodrigus也在演讲中提到深度学习框架与硬件配合打出的“组合拳”,可以在AI任务上带来更高的计算性能与精度。据介绍,第二代英特尔至强可扩展处理器可以为文心(ERNIE)在INT8上获得3倍的性能提升;第三代英特尔至强可扩展处理器在Bfloat16上更有利于训练和推理等任务,可提供2倍多的计算性能和计算吞吐量。未来英特尔也将继续与百度合作,在硬件层面为飞桨提供更多的优化与特性。
此外,核心AI算法也迎来全面升级。百度语音技术迭代,语音识别层面,提出端到端的信号声学一体化建模技术,可解决传统数字信号处理和语音识别级联系统耦合严重、迭代困难问题;语音合成方面,实现了个性化TTS、多角色合成、单人千面等能力。百度语音首席架构师贾磊公布,百度智能语音日均调用量超过155亿。
百度视觉技术部总监丁二锐表示,视觉计算在端侧的需求凸显,模型小型化已成为趋势。百度大脑6.0让视觉计算走向极致效率,基于PaddleSlim为开发者开源Slim系列视觉模型,不仅包括刚刚在CVPR低功耗计算视觉比赛获得冠军的基础模型,还包括计算量下降到1/7的人脸识别模型、仅有3.1M的文字识别模型。此次还开放了业界首发的两款视频生产SDK方案和一款端云一体虚拟形象构建及应用解决方案,可在手机端赋予用户2D虚拟真人、二次元等独特的形象,构成了全面的人物生成生态。最后探讨了以度目为代表的视觉硬件在生产生活中的落地应用,正式开启“软硬一体”的视觉时代。
知识是人类在实践中认识世界的成果,是人类智慧的结晶。百度知识图谱部、大数据部高级总监朱勇带来知识图谱的最新进展。百度构建了世界最大规模的知识图谱,拥有超过50亿实体和5500亿事实,并在通用图谱的基础上构建了事件图谱、多模态图谱、行业图谱等,可以让人工智能在多领域都实现“心中有数”。目前,百度大脑的行业知识图谱已经覆盖了100多个行业场景,日均调用次数超过400亿次。
语言是人类思维的载体和沟通交流的工具。百度杰出架构师文心(ERNIE)负责人孙宇表示,百度语义理解技术与平台文心ERNIE已经累计学习50亿条知识。同时,提出了基于多流机制的预训练语言生成技术ERNIE-GEN,可大幅提升自然语言生成任务效果;提出知识增强跨模态语义理解技术ERNIE-ViL,首次将场景图知识融入到跨模态的预训练模型中。
至此,在基础层、感知层和认知层上,百度大脑6.0均实现了全新升级,不仅让人工智能更加接近人类,同时也为广大开发者提供了更加趁手的工具,助力多样、复杂、深度的AI应用落地。
数据联邦、量子计算两大发布首提AI安全三大维度
人工智能同时也在向数据联邦、量子计算等领域融合。百度研究院大数据实验室与商业智能实验室主任窦德景发布国内首个面向疫情预测与追踪的多方数据协作平台—百度数据联邦平台,具备安全数据存储、云上可信数据交换、大规模数据演算等特性,能够实现多个机构间的隐私数据融合、数据访问与联邦学习,目前已助力清华大学、西安交通大学,厦门大学等研究机构进行疫情研究。
(依次:百度副总裁马杰、百度研究院大数据实验室与商业智能实验室主任窦德景、百度研究院量子计算研究所所长段润尧)
量子计算被视为面向未来的计算范式与生产力,继5月20日百度推出量子机器学习工具量桨后,百度研究院量子计算研究所所长段润尧再次带来国内首个云原生量子计算平台量易伏QUANTUM LEAF,可提供QCompute等量子开发套件、缩短量子编程全生命周期、实现量子工具链闭环。量子脉冲计算服务量脉Quanlse、量子机器学习工具集量桨Paddle Quantum也得到了全面升级,构建起百度量子平台为核心的量子生态,开启属于中国的量子时代。
百度大脑的AI能力正通过云和开放平台输出给社会各界,支持各行各业智能化升级。此外,安全体系纵贯百度大脑各层,为AI技术及应用保驾护航。百度副总裁马杰首次提出AI安全研究的三大维度:Security、Safety和Privacy,即强对抗环境下的安全威胁、非对抗条件下自然环境所产生的真实威胁和数据安全与隐私保护。
在百度世界2020大会上,百度大脑分论坛为开发者展示了最前沿的技术进展,以及从AI芯片、深度学习平台到核心AI算法,再到数据联邦及量子计算的重磅发布与全新升级,这些技术干货,正在助推开发者实现自己的业务构想与AI应用,为中国科研创新提供前所未有的加速度。正如王海峰所说:“百度坚持以科技创新为驱动,以产业智能化升级为方向,与社会各界一起共同努力,加快新型基础设施建设,为社会经济高质量发展贡献力量。”(一鸣)