通义万相拥有的文生图和图生图能力,可以辅助人类进行图片创作,大幅降低图片设计门槛。未来还可应用于艺术设计、游戏和文创等应用场景。通义万相只要包括文本生成图像、相似图像生成和图像风格迁移三大功能。
通义万相是阿里云通义系列ai绘画创作大模型,基于阿里研发的组合式生成模型Composer,它拥有 50 亿参数,并在数十亿个文本、图像对上进行训练,通过一个基于扩散模型的「组合式生成」框架,Composer 能够对配色、布局、风格等图像设计元素进行拆解和组合,实现了高度可控性和极大自由度的图像生成效果。
通义万相功能:
1、文生图:文生图页面左侧有一个简洁的界面,上方有一个文本输入框,在输入框内可以输入prompt。文本框下方提供8个可选的画面风格,你可以在水彩、油画、中国画、扁平插画、二次元、素描、3D 卡通等多种风格中进行选择。在输入文字描述并选定风格后,ai 便可自动生成创作图片了。同时为了方便使用,输出图像的比例有现成的 1:1、16:9 和 9:16 三种可选。
2、相似图生成:用户只要提供提供一张参考图像,可获取内容、风格相似的 AI 画作。这里要注意,上传的图像大小要在 10M 以下,格式则支持常见的 JPG、JPEG、PNG、BMP 等,通义万相文本生成的图片可以直接生成相似图,点击生成按钮,右侧生成4张相似图片可供下载。
3、风格迁移:风格迁移界面支持输入两张图片,一张为原图,一张为指定风格图。生成的图像会保留原图的内容和风格图的风格。你只要上传想要变换风格的原图和目标风格的示意图,就可以很快将原图处理为目标风格的创意图了。与相似图像生成一样,原图和风格图的大小不得超过 10M,格式相同。
无论是文生图还是图生图,通义万相从语义相关性、画面完整性以及细节丰富度等方面来看,都给了我们很大的惊喜。
通义万相优点:
- 生成速度快。
- 文生图风格多样:支持8种风格,并且风格之间的差别,特色都十分显著。无论是二次元风格还是写实风格,表现力都不错。
- 相似图与原图贴合程度极高:产品将相似图片与原图进行精确匹配,保留了原本图片的特征和细节。使用过程中无需担心生成的图片与原图差异过大。
- 风格迁移保留原本图像信息:万相能够保留原本图像的信息,使得生成的图片在拥有新的艺术风格的同时仍然能够保持原始图像的特征。
通义万相的推出标志着阿里云在人工智能领域的持续创新。在去年的世界人工智能大会上,阿里云“通义”大模型系列首次亮相。此后,通义千问、通义听悟等模型和产品相继推出,家族新成员通义万相的亮相,至此,AI 的三大主要方向已经全部打通。意味着阿里云在大模型领域已经具备处理或生成文本、语音和图片等模态的能力。
Recraft AI 是一个无限的人工智能画板,用户可以使用其生成和编辑矢量艺术画、图标、3D图像和插画等资源,提供多种样式的可选风格,适合网站、印刷品和网络营销等设计用途。Rrecraft 对所有用户都是免费的,并允许对生成的图像进行商业使用。