ChatGPT引发科研范式变革和产业变革，沪上三大模型开发者谈看法_新闻中心|上海福建人|老乡会|福建人在上海

ChatGPT引发科研范式变革和产业变革，沪上三大模型开发者谈看法

来自：解放日报作者：上海要闻 2023-04-09 访问量：1292

记者俞陶然
ChatGPT问世以来，上海学术界和产业界已开发出MOSS、“曹植”和“魔力写作”等多个大型自然语言模型。其中，MOSS由复旦大学科研团队开发，目前在校园网内测阶段，计划4月完成升级并开源；“曹植”由达观数据公司开发，也处于内测阶段，计划今年上半年正式发布；“魔力写作”由竹间智能公司开发，多家企业用户正在试用，其面向个人用户的版本“灵感闪写”和“文胆”微信小程序已上线一个多月。
如何看待ChatGPT引发的科研范式变革和产业变革？政府、高校院所和企业可以有何作为？三个大语言模型开发负责人谈了他们的看法。
重视通用人工智能研究
“科研范式变革可以分为两个层面，一个是在众多学科领域引入人工智能，开展AI for Science（人工智能驱动的科学研究）；另一个是在人工智能领域内，从传统的自然语言处理转向以大语言模型为基座的通用人工智能（AGI）研究。”复旦大学计算机科学技术学院教授、MOSS开发团队负责人邱锡鹏说。
邱锡鹏认为，国内科技界要重视通用人工智能研究，不能只盯着GPT模型本身和这类产品的落地应用。“通用人工智能就是人工智能像人一样，可以干很多事，不再局限于某些特定任务。”他解释，“微软最近发表的测评论文说，GPT-4能力的广度和深度显示，它可以被视为AGI系统的雏形。OpenAI、谷歌、华盛顿大学等头部机构都已转向，研究以大模型为基座的AGI。”
为了在这场科技革命中不被落下，我国也要加强通用人工智能研究，包括将视觉、语音等多模态感知能力接入大语言模型，增强大模型与现实世界的交互能力，并构建以通用人工智能为核心的产学研合作生态。
作为国内第一个对话式大语言模型，MOSS今年2月启动内测后引发广泛关注。近日，复旦科研团队正在对它进行升级。目前，邱锡鹏和博士生孙天祥等人一方面在提升它的中文水平，中文词语训练量已由内测启动时的300亿增至1000亿；另一方面，他们在为MOSS添加联网搜索、图片生成等功能，让它可以上网获取新的知识，向通用人工智能系统演进。
复旦科研团队计划4月完成升级并开源，公布MOSS模型参数和训练细节，与学术界和产业界分享大语言模型开发经验，让企业在开源模型基础上开发各种应用，促进产业生态繁荣。
建立人工智能公共算力池
谈及大语言模型产业前景，达观数据董事长兼首席执行官陈运文预测，产业上游是算力供应商，中游是百度等开发C端通用大模型的大企业和开发B端服务大模型的企业，下游是开发各种应用的中小企业。其中，B端服务大模型的参数量是C端通用大模型的1/5至1/3，适合较大规模的企业开发。
达观数据研发的“曹植”就是一个B端服务大模型，参数量超过500亿，公司希望它像曹植那样有“七步成诗”的能力，成为满足金融、政务、制造等行业需求的智慧大脑。它拥有ChatGPT的所有功能，可以生成贷后管理报告、投行申报文档、法律文书等各类文本，也可以与用户对话。“我们想打造垂直、专用、自主可控的国产大模型。”陈运文说，“为了能生成长篇专业文本，比如上百页的报告，我们开发了一个能输入复杂指令的表单界面，有望为企业员工大幅减负。”
在研发过程中，达观数据也有些烦恼——公司只有100张GPU（图形处理器）卡，而要“跑”大模型，至少需要1000张GPU卡。为此，陈运文只能到处“化缘”借卡。在他看来，新型举国体制适用于大语言模型研发和产业化，国家和地方政府可建立人工智能公共算力池，租给企业和高校院所使用。“一张A800 GPU卡的价格是8万元，公共算力池可配备5000—10000张卡，建设成本在10亿元以内。开发大模型产品的企业可分时租用池里部分GPU，大幅节省自购算力资源的成本。”
新型举国体制还可在大模型的中文预训练中发挥作用，推动图书馆、出版社、新闻机构等拥有高质量中文语料库的单位与人工智能企业合作，提高大模型的中文知识水平。
竹间智能创始人兼首席执行官简仁贤也表达了人工智能企业的心声：在这轮产业变革中，希望政府和投资机构更多地关注、支持中小企业。大模型并非只有“BAT”等巨头才“玩得起”，事实上，OpenAI就属于创业期的中小企业。创业公司决策效率高、创新能力强的优势，在大模型技术创新中得到了充分体现。“就像OpenAI与微软的合作一样，创业公司与大企业、投资机构联手，有望开发出颠覆性产品。”

上一篇芭蕾小演员争上大舞台
下一篇巴黎春天门店减少到7家，置地广场等老牌商场纷纷谢幕