理解提问,快速给出回答;训练声音,翻唱经典歌曲;根据描述,绘出趣味画作……近期,基于大模型研发的生成式人工智能,展示了在语言理解和内容生成等方面的出色能力,引发社会关注。
大模型赋能,生成式人工智能正在引发新一轮智能化浪潮。得益于拥有庞大的数据、参数以及较好的学习能力,大模型增强了人工智能的通用性。从与人顺畅聊天到写合同、剧本,从检测程序安全漏洞到辅助创作游戏甚至电影……生成式人工智能本领加速进化。随着技术迭代,更高效、更“聪明”的大模型将渗透到越来越多的领域,有望成为人工智能技术及应用的新基座,变成人们生产生活的基础性工具,进而带来经济社会发展和产业的深刻变革。人工智能大模型强大的创新潜能,使其成为全球竞争的焦点之一。
经过多方努力,我国人工智能大模型已具有一定基础。在2023中关村论坛上发布的《中国人工智能大模型地图研究报告》显示,中国人工智能大模型正呈现蓬勃发展态势。据不完全统计,截至目前,10亿级参数规模以上的大模型全国已发布了79个。我国在大模型方面已建立起涵盖理论方法和软硬件技术的体系化研发能力。也应看到,人工智能大模型离不开多项技术的融合创新。在前沿基础理论和算法上,我国与国际先进水平还存在差距。筑牢智能时代的根基,需要瞄准短板,着力推动大模型领域生成式算法、框架等原创性技术突破。同时,还应发挥我国应用场景优势,进一步深耕垂直领域,以行业专有训练数据集为基础,打造金融、医疗、电力等领域的专业大模型。要以高质量应用和数据反馈技术优化,帮助大模型迭代升级。
数据质量影响大模型“智商”。国际上一些大模型之所以领先,与大量公开高质量数据的训练息息相关。我国有海量数据和丰富应用场景,应逐步开放共享优质数据,通过制定共享目录和共享规则等方式,推动数据分级分类有序开放,让流动数据激发创新活力。例如,前不久印发的《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023—2024年)》提出,“建立多模态公共数据集,打造高质量中文语料数据”。期待各地各行业从实际出发,加强高质量数据供给,为大模型成长提供充足“养料”。
人工智能大模型研发周期长、投入大、风险高。经过数年持续研发,国际领先的大模型聚集了较好的资源和人才。当前,我国不少高校院所、企业正在做研发工作,在大模型、大数据、大算力等方面各有侧重,研发力量较为分散。作为追赶者,有必要进一步强化企业科技创新主体地位,整合优势创新资源,推动形成大模型产学研攻坚合力。
人工智能大模型带来的治理挑战也不容忽视。营造良好创新生态,需做好前瞻研究,建立健全保障人工智能健康发展的法律法规、制度体系、伦理道德。为促进生成式人工智能技术健康发展和规范应用,今年4月,国家互联网信息办公室发布《生成式人工智能服务管理办法(征求意见稿)》。新技术应用往往先于规范。着眼未来,在重视防范风险的同时,也应同步建立容错、纠错机制,努力实现规范与发展的动态平衡。
人工智能是新一轮科技革命和产业变革的重要驱动力量,加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题。从战略高度着手,凝聚合力、攻坚克难、勇于创新,努力拓展理论和技术应用空间,必能更好培育壮大新动能,构筑发展新优势。(喻思南)
来源:人民日报