当前人工智能技术快速升级迭代,正进入AI“普惠”时代。随着AI性能提升和能力边界扩展,AI正用于更多场景,让更多个人和企业能够更便捷地获取知识和能力。大模型的快速演进正在催生AI普惠化进程,如何切实让更多人和更多行业能用好人工智能?
中国联通数据科学与人工智能研究院首席科学家廉士国带领团队以算网为基、应用牵引,致力于研究和打造用人工智能赋能千行百业实体经济高质量发展的方法论和工具箱,助力工业、交通、城市、医疗等多个行业领域,持续为新型工业化建设作出贡献。2022年,廉士国入选了美国斯坦福大学发布的“全球前2%顶尖科学家榜单”。
作为2023年北京市科协“卓越工程师”成长计划项目入选人,廉士国的工作不仅涵盖人工智能的前沿理论,也积极推动其在实际产业中的应用。“科技的真正价值在于能够推动实体经济的高质量发展。”近日,在由北京市科协、北京科技记协组织的“首都科技人”宣传活动中,廉士国这样向记者说道。
人工智能只有经历更多应用场景,才会获得可持续发展
廉士国大学时就读于南京理工大学,专业是与人工智能密切相关的信息工程。在他所学的课程中,其中一门正是人工智能导论。“当时这门课程主要是一些基础理论,比如逻辑判断、逻辑推理等,但我觉得很有意思。”廉士国说。
他表示,人工智能有三阶段功能,即感知、决策和执行。但在他上学时之所以没能火起来,主要问题就出在感知阶段。比如人脸识别,当时技术不成熟,没法准确地分辨出谁是谁,识别率很低,阻碍了后续阶段应用。
2005年,廉士国博士毕业后去了一家外企做电视内容的自动拆分研究,后来又去了其他企业继续做人工智能的应用基础研发,比如智能监控、多模人机交互、智能机器人等。这些工作经历,为他后来在大模型应用领域的厚积薄发打下了坚实的基础。
廉士国说,人工智能之前有过高潮期,但因为缺少规模化应用,泡沫接近破裂,陷入了低潮。大模型出来以后,功能有极大扩展和提升,人工智能迎来新的高潮,但规模化应用落地于实体经济仍然是它面临的一个关键性问题。
2019年,廉士国来到中国联通,担任首席AI科学家兼AI技术总师,负责中国联通人工智能技术总体规划、团队组建、核心技术攻关、产品研发及行业落地赋能等工作。廉士国相信,人工智能技术无论多前沿,只有找到更多的应用场景落地才会获得快速可持续发展。
首创性提出行业AI范式,解决AI落地难题
在廉士国的带领下,公司AI团队一起在人工智能,特别是大模型的应用场景上下工夫。通过调研实际的行业需求,他们首创性地提出了行业AI范式,以解决AI落地难题。“行业AI范式在本质上是一套可定制、可复制的方法论,通过大量真实场景实践总结出不同行业场景间的共性和差异化,从而以共性功能为基础,仅需少量修改可实现对多个相似场景的赋能,以一类功能快速服务多个行业。”廉士国说。
行业AI范式不是空中楼阁,它的提出离不开多样化实际场景的长期历练。廉士国表示,行业AI范式的研发周期长,经历了三年时间,其中前两年时间用来摸排各种实际场景,这是一个需要沉淀的过程。
廉士国分享了一个关于化工厂安全防护监测项目的案例。在这个项目初期,廉士国团队采用业界通用的技术方法,虽然识别率达到了较高水平,但在实际应用中仍频繁出现虚警误报情况。经过深入分析和技术创新,团队最终通过调整算法策略,将虚警率降至极低水平。
在各种行业AI范式中,“质检”可谓是典型的例子。无论在何种行业中,质量检测都是生产制造过程中一道不可或缺的步骤。质检是重复性工种,比较枯燥,靠人工也有较大的效率瓶颈。例如,检测皮革上的划痕、布料上的污点、食用油中的杂质、发动机上零部件的漏装、汽车车尾标的漏贴等。因为场景多样,用AI来实现这些质检存在定制周期长、成本高等问题。廉士国说,我们通过食用油质检和酒液质检落地实践,总结出的AI液体质检工具,可以用于快速解决液态化妆品质检问题。
此外,很多实体经济场景需要对人工操作流程的合规性做监测判别,以确保生产质量和安全,但生产场景的多样性也带来AI定制周期和成本上的痛点。他们通过服装拆线工序合规监测和装卸油操作工序合规监测落地实践,总结出了AI操作工序合规监测工具,可以用于快速解决汽车制造车顶擦拭工序合规监测问题。
还有一些人类难以胜任的工种,比如物品的精细测量或统计:对大米进行分类和估重,对铜米纯度进行精确的估算,对处于流水线上的鸡蛋、麻袋或四处乱跑的猪只数量进行统计等。廉士国他们开发的AI物品精细测量及动态计数工具,可以在产线的动态过程中实时地完成此类工作。
大模型的快速发展,也为AI范式构建提供了新的方式。例如,产品设计AI工具可用于服装设计、车身设计、家具设计等;数据分析AI工具可用于生产数据处理、销售数据处理、财务数据处理等;政策咨询AI工具可用于人力政策咨询、财务政策咨询、培训教育咨询等。
据了解,在廉士国团队等的努力之下,联通公司已经在液体质检、物品精确测量、操作工序合规监测、生产安全合规检测、远程巡检、移动设备智能改造、产品外观设计、企业政策咨询等30多种应用场景形成了行业AI范式,为高效率赋能实际场景提供了有力的支撑。
多环节入手,构建场景应用的AI职业技能体系
为了进一步解决AI在各行业中应用落地,以及提高工作效率问题,廉士国和团队又在小模型方面,自主打造了由1个AI能力平台、50多项AI原子能力、6类AI垂直功能和100多种细分行业AI场景应用构成的“职业技能”产品体系,多项能力性能在国内外权威评测和行业竞赛中排名前三。
廉士国认为,应以构建类人架构的AI平台为目标,从感知、决策、执行等多个环节入手,从借鉴人类的各项基础能力到培养出能够持续成长的“职业技能”,从而逐步实现人工智能在制造等行业场景中的全面应用。
目前,在“感知”环节,AI能力突出。在一些智能工厂中,一台台摄像头“目光如炬”,不放过产品线上的每一丝瑕疵,使得整个作业的合格率得到大幅提升。而在“决策”环节,面对复杂的问题或枯燥晦涩的行业知识,人们可以直接通过AI大模型“一问一答”直接获取最核心的知识,得到最合适的解决方案。此外,诸如AI“分析师”、AI“指挥官”等也正在各个行业得到良好应用。
在“执行”环节,AI更是已经“驾轻就熟”。实际上在很多智能化水平较高的工厂,产线上已经鲜少见到工人的身影。装配工作由机械臂有序完成,物料运输的重任则由自动导向搬运车(AGV)一力承担……
AI的职业技能并不仅仅停留于一些简单的工种。廉士国举例说,在一些软件开发行业,比如程序员岗位,以前开发某种复杂的软件程序需要5年以上的经验,但借助于联通的AI职业技能工具,可能1个只有1年程序开发经验的人就可以完成了,降本增效立竿见影。
“我们要实现0代码、低门槛。无论是行业AI范式还是AI职业技能体系,其目标都是推动人工智能落地到千行百业的实际场景,同时让更多的个人或企业都用得起。”他说。
开发“1+1+M”元景大模型体系,深度赋能千行百业
廉士国表示,大模型在不同场景下具有一定的通用性,可降低再次定制开发成本,但“大而全”在一定程度上意味着在单一垂直场景精度上的不足。即使大模型能够在1000多种功能上都达到90%的正确率,距离某些实体经济中垂直场景应用要求的99%正确率仍有不小的差距。
“大模型落地行业应用一方面要通过定制训练来加强某些方面的‘职业技能’,另一方面要提升其使用已有工业流程模块、小模型等工具的能力。就像再聪明的人,遇到生僻字也得查字典,把钉子钉到木板里也得用锤子。面向实体经济场景的大模型开发应用范式是当前业界急需的。”他说。
为子推动大模型的大规模应用落地,廉士国带领团队研发了自主可控的中国联通“1+1+M”元景大模型体系,这套大模型体系既让机器能懂、能听、能看、会说、会画,又可让大模型深度赋能千行百业。
元景“1+1+M”大模型体系包含一套基础大模型,借鉴动物智能演化规律自主打造多参数多模态版本模型,不同参数模型可适用不同场景,同参数性能业界先进,并形成特色多模态能力。一是语言大模型训练1B到180B多参数版本,在9个国内外主流评测上超越GPT3.5,2个超过GPT4。二是多模态大模型具备声、图、文、视频等4种以上模态能力,达到2040亿参数,形成图像局部修改、中文长文本提示生成、多模自然交互等特色能力,理解能力在4个国内外主流榜单上进入前五。三是语音大模型实现一句话5s克隆人声、高自然度语音合成、多语种多方言混合生成等特色能力。四是视觉大模型实现开放式目标检测、开放式目标分割、通用OCR等能力,在4个国际主流榜单进入前3。
这个体系同时进行了大模型安全能力提升,行业首发了AI内生安全白皮书,开源了覆盖风险种类最多的开源安全测试数据集,研发了包括内生安全增强训练、内生安全自检等功能的国内领先端到端模型服务安全工具链。它还通过了中央网信办生成式人工智能服务和算法双备案,并在工信部中国软件评测中心大模型产品安全测试中获得了最高等级A级。
在此基础上,中国联通也打造了一套自主特色的大模型MaaS平台,能力达到业界先进水平。研发团队借鉴人类职业技能形成规律,研发了覆盖“选模型-改模型-用模型”全链条的100+工具,实现了基础模型从通用能力到专业能力再到职业技能的转变,并为开发者提供0代码、低门槛服务;受人类善于使用外部知识和工具的启发,打造了元景RAG和元景智能体2大核心组件,已通过信通院RAG和智能体最高评级;受人类善于总结沉淀技能经验启发,基于元景基础模型、RAG和智能体打造ChatDoc、ChatVideo、ChatBI、ChatConsult、ChatAudio、ChatYourVioce、ChatBook、ChatCode 等8大可复制、高通用的标准功能组件,广泛适用于文案生成、音视频分析、数据决策、代码生成、知识问答等多种领域场景。
以M种行业大模型来说,中国联通构建体系化赋能体系,以元景基础模型和MaaS平台为基础,自主打造其各自领域的行业模型及应用。截止目前,已支撑打造网络、客服、办公、政务热线、城市治理、公共安全、经济运行、文创、医疗、服装、电子生产、装备制造等领域超37个具备“职业技能”的行业大模型,并推动上百个标案落地应用,为各行各业带来了更懂行业、更易定制、更加安全的智能化解决方案。
据了解,这套大模型体系应用十分广泛,已在多个行业实践落地,例如:
元景服装大模型:可实现服装行业智能问答、服装款式生成/创新、虚拟试衣、效果图生成等功能,以人机对话互动方式提供服装领域多模态知识的整合、分析、输出等服务,满足企业、设计师等多样化需求,将设计图出图时间从几天缩短到几秒,提高了新品开发效率,降低了服装设计周期。
元景文物活化大模型:可实现文物知识问答、基于文物的文创图片生成、基于文物的文创视频生成等,支持以文本提示词控制生成、图像和文本联合生成、多种风格图像个性化生成等,并保持高度真实性,助力文物衍生品开发,促进文物活化。
元景政务热线大模型:可实现知识辅助、智能工单生成、智能派单、知识生成、智绘感知、智能问数、边聊边办等功能,目前已在辽宁省级12345平台等上线,助力平台承办、监管、诉求、运营等多个参与方降本提质增效,提升公共服务智能化水平。
元景城市治理大模型:可实现民生诉求全量汇聚、智能打标与分拨、联通处置、自动回访、效能分析,全流程闭环管理,已在成都新津区试点应用,系统智能派单准确率超95%,民生诉求响应和处置时间从6天缩短至3天,助力民意速办。
元景经济运行大模型:可实现面向经济领域的智慧问数、知识问答、 智能分析、区域经济等智能体功能,已在多个部委及省市政府落地应用,赋能经济运行调度,助力提升经济决策效率和精准度。
元景反诈大模型:可实现覆盖全流程、全场景的涉诈识别、风险等级判定、智能防诈提示、智能阻断处置等,支持100 种标签,识别12类诈骗类型 ,针对换脸查伪成功率达83%,为用户提供了更快捷的安全通信体验。
支持和培育国产算力,打破人工智能发展瓶颈
当前,我国人工智能发展迅速,但面临的挑战仍然艰巨。廉士国表示,目前存在一些痛点,例如:大模型开发应用门槛高、大模型落地实体经济存在碎片化、算力规模及使用有瓶颈等。其中,算力又是最为关键的环节之一,因为大模型需要基于大量数据进行迭代训练,依赖于足够的智算规模。
当前,美国的Meta、xAI、微软和OpenAI等企业正在或已经构建10万卡以上规模的智算,有利于支撑大模型快速迭代演进和大规模推理应用,而国内AI企业目前在智算规模上相对有差距。
当前,我国对国外先进智算的使用受到限制,国内智算产品又处于迭代中,尤其先进训练算力有待成熟。廉士国认为,目前因受国外先进智算限制,我国要想通过外部来解决智算问题困难较大,应积极培育国内智算企业,通过鼓励大家多使用来加速国产智算产品的迭代成熟,逐步建设自己的开发者生态,最终迎头赶上。
“元景大模型和MaaS平台已实现国产化适配,可提供全套自主可控的大模型解决方案”,廉士国说,“我们积极拥抱国产智算生态,通过实际行动助力国产算力发展。”
来源:北京科技报
撰文:记者 罗中云