“盘古”走向产业山峦,打开了一串AI落地的新脑洞
人工智能
2021
09/17
20:48

作为中国神话体系中最古老的神,盘古与其他创世神不同的地方,在于开天辟地之后,将自身化为承载华夏文明的山川江海。

《五运历年纪》中记载,盘古气成风云,声为雷霆,左眼为日,右眼为月,四肢五体为四极五岳,血液为江河,筋脉为地理,肌肉为田土,发为星辰,皮毛为草木,齿骨为金玉,精髓为珠石,汗流为雨泽。

今天,众多产业渴望引入AI来提质增效,但传统行业AI人才不足、专业经验与技术相互适配的磨合难题、产业智能化改造的探索成本等等,导致AI落地产业时,很容易面临需求琐碎、解决方案繁多、投入效益比不清晰的混沌局面。

这时,预训练大模型的出现,就成为劈开蒙沌的那把“斧子”。

基于预训练大模型,开发者和产业可以通过微调就能快速开发出适配不同场景的应用,打破AI落地产业的诸多限制条件。GPT等超大参数通用模型的迭代,都会引发学术界和产业界的狂热关注。而中国预训练大模型的技术标杆,大概率要算华为一个。

今年4月,华为云发布了盘古系列超大预训练模型。基于大量数据打造,具有超大规模参数、超高精度的特质,还提供模型预训练、微调、部署和迭代的功能,以减少行业侧的数据标注依赖,从而降低人工智能开发的门槛和成本。

以“盘古”来命名预训练大模型,来自于华为严肃而又浪漫的思考——为AI走向千行百业打开新空间,同时将华为的各种技术能力与产业融合,让AI滋养万物。

AI落地不是奇思妙想的神话,要经受现实的种种考验,盘古大模型真的能够实现技术目标吗?恰好最近有一个实地探访“华为云黑科技”的节目,我们可以通过盘古大模型的探访视频,眼见为实地了解一下盘古大模型在实际案例中的能力。

可以看到, AI正在与千行百业、山川江海凝结在一起,抵达每一座产业山峦,勾勒出数智山河的全新画卷。

其中,“盘古”都扮演着怎样的角色呢?

工业之眼

AI需要望向那些曾被忽视的偏远角落和产业难题。电网巡检,正是这样的地方。

长期以来,电网员工必须穿行在深山峡谷、荒漠戈壁中,亲自去观察和检修故障。而现在,盘古大模型也让AI开始流淌在这些人烟罕至的地方。

在国网重庆永川公司智能电力巡检项目中,就用无人机替代人力完成巡检,但是,要当好一线生产作业中的“眼睛”,并不容易。

一来,许多电网环境和状况都各有不同,意味着训练数据样本少,传统开发方式下很难达到应用效果,无法取代人力;二来,电网作为基础设施,覆盖面积大、范围广,标注海量数据需要耗费大量时间和人力成本。这时,盘古预训练大模型的优势便体现出来了。

首先,盘古CV大模型是目前业界最大的CV大模型,包含超过30亿参数,并且在超过10亿张图像上进行了预训练,在ImageNet等数据集上的小样本分类精度上排名世界第一,所以能够满足无人机智能巡检系统(缺陷检测)中的小样本学习、标注工作量大等问题,提升训练效率。国网重庆永川项目中,就借助盘古大模型将数据筛选效率提升30倍、筛选质量提升5倍。

其次,盘古大模型的开发过程中采用了多项领先技术,比如首次在图像预训练流程中加入生成和判别损失,兼顾CV大模型的判别能力和生成能力,保证模型在底层图像恢复和高层语义理解的能力,从而保证了最终部署的模型精度能够满足作业的需求。

不难看出,盘古大模型的视觉能力,正在点亮中国大地上一个个能力各异的“工业之眼”。

医疗之臂

提到AI医疗,很多人都会想到疫情防控期间行走在医院里的消毒机器人、送餐机器人。很少有人知道,在实验室中,科研人员同样需要AI来加速攻关。

新冠肺炎爆发后,全球的科研人员短期内发表了大量新冠相关的文章,时间紧任务重,要快速从海量文献中提取出最新最前沿的关键知识和研究成果,给中国医疗人员带来了不小的压力:

靠人工整合,不仅需要大量人员投入,影响防疫效率,还可能出现分析效率低、出现误差等情况。而且,当时所能使用的深度学习算法模型,很多没有生物医学领域语料,在知识提取上表现一般。

这时候,盘古大模型迅速化身为科研人员的左膀右臂。

基于盘古大模型,华为云构建了从文献到知识图谱的端到端分析流程,用于医学信息的抽取,同时提出了用于医学关系预测算法,可以自适应地选择更恰当的专家模型,来对输入的数据进行预测。

灵活的模型选择,使得盘古大模型的知识表征方法比传统的知识表征方法,准确度提升了12%。也有效地推动了科研工作的进程。

可能有读者会问,随着疫情逐步得到控制,盘古大模型还能在医疗领域发光发热吗?实际上,今天AI及盘古大模型已经成为生物医疗创新路上不可或缺的伙伴。

城市之路

智慧城市是目前为止人类对AI能力最恢弘也最全面的落地想象。而城市智慧生活,则是由一个个细分且垂直的算法模型来组成的。

举个例子,城市指挥交通往往需要成百上千个算法,来分析和处理错综复杂的交通状况与万级规模视频流数据。仅识别领域,就包括号牌遮挡、人车对比、驾驶行为异常等等诸多细节。

要针对每个AI落地场景都一一开发、训练,智慧城市可能要等到天荒地老。这时候,盘古大模型就成了智慧城市的一条“加速履带”,让创新可以被更快、更简单地实现。

这条加速履带,让AI应用之路更宽广:利用自研的虚拟与现实数据混合技术,配合最新研发的层次化Transformer模块,盘古大模型能够实时处理数百路视频的实时数据,在无需任何手工标注数据的情况下,完成交通参与者的识别与分析。这意味着,基于盘古大模型,许多AI能力薄弱的城市也能快速追赶上智能化队伍。

同时,也让数字化建设变得更集约。一直以来,智慧城市都面临着数据、算力、人才等资源的巨大消耗。而基于盘古的预训练模型,以及自研的小样本微调技术等等,可以大幅降低人工标注量和调优难度,让AI可以低成本、大规模复制。

借助这条履带,越来越多的城市可以点亮AI之路,智能山河的画卷正在城市版图上徐徐展开。

科学之脑

盘古大模型不仅出现在人间烟火、千行百业的实践中,也不忘护航科研创新的星辰大海。

盘古大模型的分身之一科学计算大模型,正在各种科学问题中,用AI技术来促进基础科学的发展。

目前,科学计算大模型还被应用于气象预测、分子动力学预测、微分方程求解等科学问题上,助力AI长远地影响和改变人类生活品质。

目前,盘古大模型已经在能源、零售、金融、工业、医疗、环境、物流等行业多个场景中成功验证。透过这些案例,我们可以窥见盘古大模型为AI描画的想象空间——为产业AI开辟新天地,将己身支撑数智山河的繁荣生长。

在产业山峦间,描画AI的指数级增长曲线

有数据显示,目前AI的渗透率不到10%,产业AI处在初级阶段,带来巨大的市场增长空间。多快好省,是AI接下来走出指数级增长曲线不可或缺的环节。从盘古大模型的实践中,我们也可以看到,加速AI落地产业的几个前提:

1.标准化。盘古大模型在预训练阶段沉淀了大量的通用知识,四大分身模型以流水线的方式,快速适配和扩展不同场景,实现了AI模型在千行百业的批量化落地和可复制性。

2.先进性。只有具备人无我有、降维打击的技术能力,预训练模型才能满足各行各业的差异化开发、训练需求,这也是盘古大模型的价值所在。比如之前业界的一些预训练大模型为了追求泛化能力,基本都不调优,导致一些细分场景下无法发挥出最优性能。而盘古大模型的基于提示(prompt-based)调优、动态冰化等一系列技术,则能够实现小样本训练下的优异性能,提升AI的场景普适度。

3.普惠性。减少行业应用者的成本顾虑,也是科技企业的职责。华为云通过全栈AI协同优化,帮助盘古大模型实现训练加速,单位比特算力成本最优。从算法、算力与数据问题,再到与行业知识的结合,盘古大模型正在一步步移除AI向产业世界进发的种种阻碍。

在AI进入万物的过程中,如何让落地变得更加顺畅、真正解决产业问题?技术与产业,可能需要一个“深情拥抱”。这是科技企业需要担负的时代之责,也是盘古大模型正在写就的传奇故事:

让技术力量化为三山五岳、雨露甘霖,支撑千行百业的智能化升级,在产业土壤中浇灌出千姿百态的AI之花。

9月23日华为全联接线上大会

华为高级副总裁、华为云CEO、

消费者云服务总裁张平安

将在主题演讲中

发布华为云盘古家族新成员