上海新闻

ChatGPT引发科研范式变革和产业变革,沪上三大模型开发者谈看法

来自:解放日报 作者:上海要闻 访问量:1292
记者 俞陶然
  ChatGPT问世以来,上海学术界和产业界已开发出MOSS、“曹植”和“魔力写作”等多个大型自然语言模型。其中,MOSS由复旦大学科研团队开发,目前在校园网内测阶段,计划4月完成升级并开源;“曹植”由达观数据公司开发,也处于内测阶段,计划今年上半年正式发布;“魔力写作”由竹间智能公司开发,多家企业用户正在试用,其面向个人用户的版本“灵感闪写”和“文胆”微信小程序已上线一个多月。
  如何看待ChatGPT引发的科研范式变革和产业变革?政府、高校院所和企业可以有何作为?三个大语言模型开发负责人谈了他们的看法。
  重视通用人工智能研究
  “科研范式变革可以分为两个层面,一个是在众多学科领域引入人工智能,开展AI for Science(人工智能驱动的科学研究);另一个是在人工智能领域内,从传统的自然语言处理转向以大语言模型为基座的通用人工智能(AGI)研究。”复旦大学计算机科学技术学院教授、MOSS开发团队负责人邱锡鹏说。
  邱锡鹏认为,国内科技界要重视通用人工智能研究,不能只盯着GPT模型本身和这类产品的落地应用。“通用人工智能就是人工智能像人一样,可以干很多事,不再局限于某些特定任务。”他解释,“微软最近发表的测评论文说,GPT-4能力的广度和深度显示,它可以被视为AGI系统的雏形。OpenAI、谷歌、华盛顿大学等头部机构都已转向,研究以大模型为基座的AGI。”
  为了在这场科技革命中不被落下,我国也要加强通用人工智能研究,包括将视觉、语音等多模态感知能力接入大语言模型,增强大模型与现实世界的交互能力,并构建以通用人工智能为核心的产学研合作生态。
  作为国内第一个对话式大语言模型,MOSS今年2月启动内测后引发广泛关注。近日,复旦科研团队正在对它进行升级。目前,邱锡鹏和博士生孙天祥等人一方面在提升它的中文水平,中文词语训练量已由内测启动时的300亿增至1000亿;另一方面,他们在为MOSS添加联网搜索、图片生成等功能,让它可以上网获取新的知识,向通用人工智能系统演进。
  复旦科研团队计划4月完成升级并开源,公布MOSS模型参数和训练细节,与学术界和产业界分享大语言模型开发经验,让企业在开源模型基础上开发各种应用,促进产业生态繁荣。
  建立人工智能公共算力池
  谈及大语言模型产业前景,达观数据董事长兼首席执行官陈运文预测,产业上游是算力供应商,中游是百度等开发C端通用大模型的大企业和开发B端服务大模型的企业,下游是开发各种应用的中小企业。其中,B端服务大模型的参数量是C端通用大模型的1/5至1/3,适合较大规模的企业开发。
  达观数据研发的“曹植”就是一个B端服务大模型,参数量超过500亿,公司希望它像曹植那样有“七步成诗”的能力,成为满足金融、政务、制造等行业需求的智慧大脑。它拥有ChatGPT的所有功能,可以生成贷后管理报告、投行申报文档、法律文书等各类文本,也可以与用户对话。“我们想打造垂直、专用、自主可控的国产大模型。”陈运文说,“为了能生成长篇专业文本,比如上百页的报告,我们开发了一个能输入复杂指令的表单界面,有望为企业员工大幅减负。”
  在研发过程中,达观数据也有些烦恼——公司只有100张GPU(图形处理器)卡,而要“跑”大模型,至少需要1000张GPU卡。为此,陈运文只能到处“化缘”借卡。在他看来,新型举国体制适用于大语言模型研发和产业化,国家和地方政府可建立人工智能公共算力池,租给企业和高校院所使用。“一张A800 GPU卡的价格是8万元,公共算力池可配备5000—10000张卡,建设成本在10亿元以内。开发大模型产品的企业可分时租用池里部分GPU,大幅节省自购算力资源的成本。”
  新型举国体制还可在大模型的中文预训练中发挥作用,推动图书馆、出版社、新闻机构等拥有高质量中文语料库的单位与人工智能企业合作,提高大模型的中文知识水平。
  竹间智能创始人兼首席执行官简仁贤也表达了人工智能企业的心声:在这轮产业变革中,希望政府和投资机构更多地关注、支持中小企业。大模型并非只有“BAT”等巨头才“玩得起”,事实上,OpenAI就属于创业期的中小企业。创业公司决策效率高、创新能力强的优势,在大模型技术创新中得到了充分体现。“就像OpenAI与微软的合作一样,创业公司与大企业、投资机构联手,有望开发出颠覆性产品。”

相关阅读