经济观察网 记者 钱玉娟 “你好,我叫通义千问。”4月7日午后,阿里云通过官方微信公众号对旗下的超大规模语言模型进行官宣,并面向企业开始了邀请测试。
经济观察网记者第一时间注册申请并进行内测,在“通义千问”的自我介绍中可知,它是达摩院自主研发的预训练语言模型,“能够回答问题、创作文字,还能表达观点、撰写代码”。
(相关资料图)
基于上述能力,“通义千问”认为其可以在自然语言处理、问答系统、文本创作与协作以及观点表述等领域或场景中,为用户提供帮助和支持。
众所周知,预训练语言模型把自然语言处理带入了一个新阶段,最引人关注的便是OpenAI开发的ChatGPT。当记者问及“通义千问”其与ChatGPT的区别时,它指出,后者是经过多轮预训练和微调,能够生成高质量的文本和提供精准的问答服务,自身则“拥有丰富的技术积累和经验,在一些领域和场景中可能会表现地更为出色。”
“通义千问”对自身优势加以列举,例如支持更多定制化需求,“可以针对不同场景和应用进行扩展和定制,提供更加个性化的服务和解决方案”。另外,它集成了阿里巴巴集团内部的资源和技术支持,“能够更好地服务于阿里巴巴集团的业务和内外客户”。
记者在提问演示中看到,“通义千问”可以撰写电影脚本,讲述一个北漂草根创业逆袭的故事;它还可以用故事来阐释幸福的意义,由此撰写一篇短文;另外它还能理解之后,依据要求写邮件,基于需求扮演“职场助理”,为手游行业的产品经理“出谋划策”。
自ChatGPT面市以来,国内科技领域基于大模型,在垂直场景化模型以及应用方向的开发不断提速。在搜索、大数据及人工智能多维度占据优势的百度,率先研发推出了超大规模语言模型“文心一言”,同为科技互联网大厂的阿里,也早有动作。
记者了解到,阿里达摩院自2019年就已启动中文大模型研发,并基于云平台进行大模型生态的建设,去年末推出的模型社区“魔搭”,还汇集了数百个开源模型。
如今紧随百度之后,阿里也推出了超大规模语言模型“通义千问”,在被问及与“文心一言”的区别时,除了常规的定义输出,“通义千问”特别强调自身更具“自主性和个性化”。
在阿里云官宣之前,一位投资者向记者透露,阿里的AI大模型叫“通义”,侧重于零售行业商用落地。如今,记者在“通义千问”的官网看到,其定位是一个“专门响应人类指令的大模型”,它还给自身冠以“效率助手”、“点子生成机”的称号。针对这一自研AI大模型,阿里云方面表示将在4月11日举行的云峰会上予以相关进展公布。
责任编辑:
标签: