盘古大模型,是华为旗下的盘古系列AI大模型,包括NLP大模型、CV大模型、科学计算大模型。
2020年11月,盘古大模型在华为云内部立项成功,也完成了与合作伙伴、高校的合作搭建。
2021年4月,盘古大模型正式对外发布。[4]
2023年3月消息,华为云官网显示盘古系列AI大模型中的NLP大模型、CV大模型、科学计算大模型已经标记为即将上线状态[1] 。7月7日,华为开发者大会2023上,华为常务董事、华为云CEO张平安宣布,华为云盘古大模型3.0正式发布。盘古大模型3.0是完全面向行业的大模型,包含L0基础大模型、L1行业大模型及L2场景模型三层架构,重点面向政务、金融、制造、医药、矿山、铁路、气象等行业。[2] [3]
2023年7月7日,华为云正式发布盘古大模型3.0。盘古大模型3.0是完全面向行业的大模型,包含L0基础大模型、L1行业大模型及L2场景模型三层架构,重点面向政务、金融、制造、医药、矿山、铁路、气象等行业。[3]
2023年7月18日,华为联合山东能源集团宣布华为盘古大模型在矿山领域实现首次商用,解决人工智能在矿山领域落地难的问题。[5]
主要模型
盘古NLP大模型
盘古NLP大模型可用于内容生成、内容理解等方面,并首次使用Encoder-Decoder架构,兼顾NLP大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。在下游应用中,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配。2019年权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046,多项子任务得分业界领先,是目前最接近人类理解水平(85.61)的预训练模型。[1]
盘古CV大模型
盘古CV大模型可用于分类、分割、检测方面,也是首次实现模型按需抽取的业界最大CV大模型,首次实现兼顾判别与生成能力。基于模型大小和运行速度需求,自适应抽取不同规模模型,AI应用开发快速落地。使用层次化语义对齐和语义调整算法,在浅层特征上获得了更好的可分离性,使小样本学习的能力获得了显著提升,达到业界第一。[1]
盘古气象大模型
盘古气象大模型实现气象预报精度首次超过传统数值方法,速度提升1000倍,提供秒级天气预报,例如重力势、湿度、风速、温度,气压等变量的1小时-7天预测。借助创新的3DEST网络结构以及分层时间聚合算法,盘古气象大模型在气象预报的关键要素(例如,重力势、湿度、风速、温度等)和常用时间范围上(从一个小时到一周)精度均超过当前最先进的预报方法,同时速度相比传统方法提升1000倍以上。[1]