比思論壇

標題: 华为重大发布：将重塑千行百业盘古大模型3.0 [打印本頁]

作者: xiaogui_dota 時間: 2023-7-8 11:12
標題: 华为重大发布：将重塑千行百业盘古大模型3.0

2023年，大模型的大竞争时代开启，目前全球已经有数百个大模型亮相，而战场上的主角们还在不断进化。

　　7月7日，在华为开发者大会2023（Cloud）上，华为云发布了盘古大模型3.0版本。华为常务董事、华为云CEO张平安表示，盘古大模型“不作诗，只做事”，将重塑千行百业。

　　事实上，华为对大模型的探索很早就开启，2019年~2020年，盘古大模型就已在华为云内部立项，并且完成了与合作伙伴、高校的合作搭建。2021年4月，华为云盘古大模型正式对外发布。

　　从盘古大模型面世之初，就主要面向盘古大模型3.0是一个面向行业的大模型系列，包括“5+N+X”三层架构，分别是基础大模型、行业大模型、专用大模型。

　　2021年，盘古的多模态大模型、科学计算大模型还在规划中，如今的3.0版本，盘古的大模型体系已经颇为丰富。不仅从基础通用大模型发展出行业大模型，还针对细分场景提供更细致的大模型服务。

　　张平安在会后接受21世纪经济报道等媒体采访时表示，对于盘古大模型的下一步计划，内部有非常激进的roadmap（路线图）。在盘古大模型的发展上，有团队在研究有更多参数让AI大模型发展更好，也有团队在研究将参数通过量化，以更少的算力需求来满足服务。另外更重要的是，现在华为云已经在铁路、煤矿、金融等行业里做了模型，在行业的垂直深度还要更深一些。

　　盘古大模型3.0来了

　　张平安介绍道，最新版本的盘古大模型共有三层架构。其一为基础大模型（L0层），主要提供通用技能，支撑企业各类应用，具体包括自然语言、视觉、多模态、预测、科学计算五个基础大模型。

　　在参数方面，盘古3.0提供100亿参数、380亿参数、710参数和1000亿参数的系列化基础大模型，匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。

　　同时，大模型也提供一致的能力集，包括NLP大模型的知识问答、文案生成、代码生成以及多模态大模型的图像生成、图像理解等能力，这些技能都可以直接调用。

　　对于基础大模型的炼成，华为的技术专家在会上指出，盘古大模型的特色是可伸缩、高可扩展的稀疏-稠密语言大模型，在数据训练方面，预训练数据超过3万亿个token（AI大模型的数据单位），指令微调数据的规模在千万级。

　　基础大模型之外，第二层架构是N个行业大模型（L1层），华为云既可以提供使用行业公开数据训练的行业通用大模型，包括政务，金融，制造，矿山，气象等大模型；也可以基于行业客户的自有数据，在盘古大模型的L0和L1层上，为客户训练自己的专有大模型。

　　在此基础上，华为云还提供了大模型行业开发套件，通过对客户自有数据的二次训练，客户就可以拥有自己的专属行业大模型。同时，根据数据安全与合规诉求，盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。

　　华为云人工智能领域首席科学家、国际欧亚科学院院士、IEEE/CAAI Fellow田奇谈道，通用大模型在落地行业上面临三大挑战，分别是知识虽多、价值挖掘快但数据安全难保障、通用性强但专业性弱。

　　而盘古大模型通过分层解耦架构从而更好应用到千行百业，从基础大模型迭代出行业大模型。田奇表示，实现行业大模型有四大关键举措，分别是沉淀行业知识、淬炼行业技能、对话专业工具和保障安全合规。

　　行业大模型之上就是N个专用大模型（L2层），提供了更多细化场景的模型。比如，更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景，提供“开箱即用”的模型服务。

　　而大模型的发展离不开算力，在大会上，华为云宣布推出昇腾AI云服务，并在乌兰察布和贵安同时上线。据悉，昇腾AI云服务可以提供更长稳的AI算力服务，达到每秒200亿亿次浮点运算能力，千卡训练30天长稳率达到90%，断点恢复时长不超过10分钟。

　　张平安表示，华为要构建AI算力的另一极，“现在有数百个项目在排队，算力都来不及建设，GPU价格高、交货周期很长，中国算力紧缺，满足不了需求。华为首先在中国先立足和扎根，满足中国行业客户的需求，立志成为算力的另一极。”

　　行业大模型深入应用

　　事实上在OpenAI引爆热潮之前，华为等大企业就已经在钻研AI大模型，此前几年大模型在学术界早就是热门话题，2023年才彻底引燃大众市场。

　　对于华为而言，人工智能自然是必争之地，云、计算都是华为升级转型的重要方向。一方面，华为云盘古大模型并非今年才进入市场，而是已经历经迭代根据业务的需求发展而来，并且已经形成一个系列。

　　另一方面，需要指出的是，盘古大模型和ChatGPT并非在一个赛场，它们属于两个概念。ChatGPT是GPT系列大模型的一个应用场景，可以直接面向C用户群体，而盘古大模型的应用场景更多聚焦在B端的千行百业，华为本身B端起家，在产业端有天然的优势和禀赋。

　　此前，田奇向21世纪经济报道记者表示：“AI是华为云的核心竞争力之一，我们持续在AI领域投入研发，大模型是AI的重要技术方向。未来三年，我们认为将会是大模型是风起云涌的三年，AI将会和各行各业深度结合，AI for industries将是我们的主要方向。”

　　目前，盘古大模型已在政务、金融、制造、煤矿、铁路、制药、气象等诸多领域进行深耕。比如在政务领域，华为云携手深圳市福田区政务服务数据管理局，上线了基于盘古政务大模型的福田政务智慧助手。在煤矿领域，盘古矿山大模型已经在全国8个矿井规模使用，一个大模型可以覆盖1000多个细分业务场景。

　　在制造领域，过去单产线制定器件分配计划，往往要花费3个小时以上才能做齐1天的生产计划。盘古制造大模型学习了华为产线上各种器件数据、业务流程及规则以后，能够对业务需求进行准确的意图理解，并调用天筹AI求解器插件，1分钟即可做出未来3天的生产计划。

　　在气象领域，盘古气象大模型是首个精度超过传统数值预报方法的AI预测模型，同时预测速度也有大幅提升。原来预测一个台风未来10天的路径，需要在3000台服务器的高性能计算机集群上花费5小时进行仿真。现在基于预训练的盘古气象大模型，通过AI推理的方式，研究者只需单台服务器上单卡配置，10秒内就可以获得更精确的预测结果。

　　7月6日，国际顶级学术期刊《自然》(Nature)杂志正刊发表了华为云盘古大模型研发团队研究成果——《三维神经网络用于精准中期全球天气预报》（《Accurate medium-range global weather forecasting with 3D neural networks》）。数据显示，这是近年来中国科技公司首篇作为唯一署名单位发表的《自然》正刊论文。

　　眼下，国内外的巨头们都已经在大模型赛场上落子，随着AI产业“iPhone时刻”的到来，AI如何融合产业进行升级变革、如何进行商用也将备受关注，产业界也更加期待中小开发者们也像雨后春笋一样涌现，构建起更完善的AI生态。

　　大模型成为WAIC最火关键词

　　7月6日至8日，2023世界人工智能

人工智能：BK0800 1269.41 -1.42% +自选
大会（WAIC）在上海举办。本届大会聚焦科学前沿和产业发展，首次设置“迈向通用人工智能”主题展区，集中展示国内外总计30多款大模型，大模型成为今年WAIC的最火关键词。

作者: nicholas0331 時間: 2023-7-17 07:52
提示: 作者被禁止或刪除內容自動屏蔽

作者: 331580185 時間: 2023-7-19 15:41
资源先收藏了

作者: coldestplace163 時間: 2023-7-20 18:22
提示: 作者被禁止或刪除內容自動屏蔽

作者: jinhaibo886 時間: 2023-7-22 16:57
好资源加分！

作者: q5898567 時間: 2023-7-23 01:30
感谢资源分享

作者: lihui19940813 時間: 2023-7-23 03:23
提示: 作者被禁止或刪除內容自動屏蔽

作者: wj3086 時間: 2023-7-31 18:23
图片不错！！！

作者: yp7068337 時間: 2023-8-2 07:01
提示: 作者被禁止或刪除內容自動屏蔽

作者: worini111 時間: 2023-8-5 19:21
资源先收藏了

作者: lzymark521187 時間: 2023-8-6 04:28
感谢资源分享

作者: a82481335 時間: 2023-8-6 17:31
提示: 作者被禁止或刪除內容自動屏蔽

作者: wuguozhong1313 時間: 2023-8-24 05:47
图片不错！！！

歡迎光臨比思論壇 (http://e3-1275v3.bl-phx0.141.9.8.b8.securedservers.com/)