7月7日,阿里云在2023世界人工智能大会(WAIC)上发布了其大模型相关产品,一是AI绘画创作大模型通义万相,二是面向创业者和开发者的大模型社区。
(资料图片仅供参考)
通义万相是阿里云“通义”大模型系列第三个产品,此前的通义千问、通义听悟分别具备文字问答和语音文字处理的功能。阿里云透露,已有超过30万企业申请测试通义千问,通义听悟累计用户数达到36万。
据介绍,AI绘画创作大模型通义万相有三大功能:在基础文生图功能中,可根据文字内容生成水彩、扁平插画、二次元、油画、中国画、3D卡通和素描等风格图像;在相似图片生成功能中,用户上传任意图片后,即可进行创意发散,生成内容、风格相似的AI画作;该模型还支持图像风格迁移,用户上传原图和风格图,可自动把原图处理为指定的风格图。
通义万相基于阿里研发的组合式生成模型Composer,其可通过对配色、布局、风格等图像设计元素进行拆解和组合,该研究成果已在国际AI顶会ICML 2023上发表。
阿里云在现场展示了该模型生成图片的效果,当输入“沉浸在全页灰度涂色的迷人世界中,有一只老虎在曼陀罗宁静的森林中,画面采用线条、笔画”后,系统能生成线条细节丰富的老虎图片,如果继续使用风格迁移功能,还可切换图片风格。
图为界面新闻测试,通义万相可识别中英文提示词。
目前通义万相仅支持定向邀测,之后将逐步向行业客户开放。
阿里云同时介绍了其MaaS(Model as a Service,模型即服务)理念,提出以AI模型为核心的开发范式,并搭建了一套以AI模型为核心的云计算技术和服务架构,积累了丰富的大模型研发经验、工具和平台,这套能力将全部向大模型初创企业和开发者开放,提供包括模型训练、推理、部署、精调、测评、产品化落地等在内的全方位服务。
灵积模型服务平台是其MaaS之一,平台建设了一系列自动化的模型上云统一工具链路,支持模型的自主接入,所有接入灵积平台的模型都能自动获取平台的服务能力。对于AI开发者而言,这些不同模型的能力都能通过统一的SDK方便地获取并集成到自己的AI应用中去。当前灵积平台上托管了包括通义千问、ChatGLM-v2、百川、姜子牙、Dolly等在内的业界领先大语言模型。
在开发者生态层,阿里发起AI模型社区魔搭,允许模型生产者上传模型、测试技术能力和应用场景等。魔搭社区打通了与灵积平台的部署链路。基于此,阿里云推出了智能工具魔搭GPT(ModelScopeGPT),它能接收用户指令,通过“中枢模型”一键调用魔搭社区其他的AI模型,大小模型协同完成复杂任务。魔搭GPT现已能够调用魔搭社区十多个核心AI模型的API。
阿里云CTO周靖人在演讲中表示:“阿里云将把促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供全方位的服务,包括最强大的智能算力和开发工具,并在资金和商业化探索方面提供充分支持。阿里云魔搭社区现已聚集180万AI开发者和由20多家顶尖人工智能机构贡献的900多个优质AI模型,我们将努力把魔搭社区培育成中国最大的‘大模型自由市场’。”
(文章来源:界面新闻)