如果要评选2023年到目前为止最热门的话题榜,相信AI人工智能一定榜上有名。从文字、图片、甚至视频,AI都能快速生成足以以假乱真的内容,也引发了越来越多人的关注和讨论。
从网上各种声音的变化可以明显看出,大家的心态也从一开始的好奇和好玩,逐渐变成了对AI生成内容真实度的感叹,陆续也开始有了担心被AI替代的焦虑。
其实,科技的发展必然会带来人类做事方式的变化。就像当年汽车替代马车一样,马车车夫的需求量虽然下降了,但汽车司机的需求量上升了。
拿AIGC(AI Generated Content,AI生成内容)中的大热领域AI绘画来举例。如果在社媒上搜索相关话题,可以看到网友已经在讨论公司要求美术员工学会AI绘画出图了,据说有严重的甚至开始末位淘汰,学不会就得下岗。
这和汽车替代马车的情况类似:以前绘画的工具是纸笔,后来是Photoshop和Illustrator等软件,未来(甚至已经开始)可能会变成AI绘画工具。不变的是灵感创意(开头)和内容产出(结尾),变的是工具和中间过程。
对于内容生产者而言,需要继续抓牢“开头”的创意能力和“结尾”的把控能力,中间过程的工具变了,就去学习新的工具,变得快,需要学的也快。
一、什么是AI绘画?
AI绘画是通过AI(人工智能技术)实现的一种绘画形式,它使用算法和机器学习模型来生成艺术作品。这些技术使得计算机可以模拟人类艺术家的绘画技巧和风格,并且可以产生视觉上令人满意的结果。AI绘画的应用包括图像处理、虚拟现实、游戏开发、动画制作等领域。
二、什么是念咒(Prompt)?
在AI绘画中,Prompt是指用户输入的文本或图像,用于指导模型生成艺术作品。Prompt通常包括描述作品主题、风格和视觉要素的关键词和短语,模型会根据这些输入生成一幅新的艺术作品。Prompt也可以是一张图片,模型会尝试在该图片的基础上进行创作。
其实就是通过输入文字指令和图像等方式,“”引导“AI生成所需内容的过程。用广告人的话,相当于是给AI下“brief”。
因为AI只是工具,它并不知道你想要的是什么,而且往往很难一步到位一次念咒就生成想要的结果,所以需要多次和AI“念咒”一次次引导和微调,直到生成想要的结果。
网友们形象地给Prompt起了个“外号”叫做“念咒”。就像是魔法世界的魔法师一样,通过念咒吟唱,变出想要的结果。
现在甚至已经有了念咒师这么一个新的职业,英文叫Prompt Engineer,中文叫提示工程师。据网传,2022年12月,第一位被正式聘用的念咒师已经出现。
而AI绘画念咒有可能会变成未来创意内容行业的一个基本技能,就像Photoshop技能一样,写进相关岗位职位要求。
三、AI绘画对哪些职业可能有帮助?
艺术家和设计师:更快速生成草图、原型和设计概念,至少可以作为灵感或草稿再进一步通过人工加工来完成,提高效率,节省时间。
游戏开发者:辅助生成游戏中的环境、角色和道具等元素,节省制作成本和时间,提高游戏视觉效果。
媒体和广告行业:辅助生成媒体和广告中的视觉元素,如海报、广告牌、标志和漫画等。
建筑师和城市规划师:辅助生成建筑外观和内部布局,以及城市规划方案的可视化呈现。
工业设计师:辅助生成产品的外观设计和造型,进一步提高产品开发的效率和质量。
四、AI绘画如何快速上手?
要想知道梨子的滋味,就要亲口尝一尝。我们以目前最热门的AI绘画平台 Stable Diffusion (简称SD)为例,参考下面的5个步骤:
1)安装部署AI绘画工具
可以直接到Stable Diffusion的官网注册使用(免费账号会有使用额度限制),也可以安装部署到本地。网上已经有热心网友做好了Stable-Diffusion-Webui傻瓜安装包,解压即用。可以在B站搜索”Stable Diffusion 下载 安装”等关键词。为了避免有广告嫌疑,这里就不具体给链接了。
2)先从抄咒语开始模仿体验
就像学习一门新的语言都是先从模仿开始,念咒这门新语言虽然不难(相对于其它编程语言而言),但还是有一定的规则和门槛的。如果完全按照我们平时说话的自然语言念咒,很难得到我们需要的结果。
所以一个很快上手的办法,就是先“抄咒语”(模仿),在一些AI作品交流网站或者社群,经常会有网友分享自己生成的作品和对应“咒语”,包括输入的指令和设置等。可以先拷贝粘贴一些作品的咒语来模仿生成类似的作品,然后再对个别咒语进行微调,从而获得自己想要的结果。这个过程就慢慢的入门了。
3)“学语法”和“背单词”
语法包括咒语的一些规则和写法(比如英文逗号用于分隔不同词组,英文括号用于强调/增强权重等),以及工具设置;单词则是一些常用的词组(目前SD只支持英文)。在Prompt框中输入时,下拉菜单里也会自动弹出一些提示词组用于辅助。比如可以用Stable Diffusion官网的Prompt Search Engine作为辅助,了解一下实际的Prompt的写法“词组搭配”作为参考。
学会了语法和单词,就能逐渐不再需要从抄咒语(模仿)开始,而是从0开始自己和AI对话念咒,从而生成想要的内容了。
做完以上3步,至少就可以开始尝试生成一些内容了。但我们会发现生成的和网上咒语对应的作品差别太大了,甚至可能是很奇怪的图。这是为什么呢?因为网上的作品可能用到了不同的模型。如果想要模仿的像,就得去下载相应的模型文件。
4)下载更多主模型
傻瓜安装包里自带的有AI模型,直接可以使用。如果想要体验不一样的效果和风格,就需要下载更多的定制化主模型。有很多网站可以下载到,如某C开头的网站。
下载的定制化主模型文件放在本地根目录下的 Models/Stable-diffusion文件夹里。
5)下载微调训练模型
有很多种fine-tune微调训练模型,如DreamBooth、TextualInversion、ControlNet、LoRA等。以LoRA为例,英文全称是 Low-Rank Adaptation of Large Language Models,直译为大语言模型的低阶适应。可以理解为大模型基础上的一个小模型或插件,已经按照某个方向训练过大模型,并“冻结”了相关参数,从而让使用者不再需要从0开始往某个方向训练模型。
打个可能不一定准确的比方:类似于“预制菜”,比如买一盒“猪肚鸡”预制菜,用户可以直接在这个基础上按照自己的口味添加或修改(比如额外加一些“蔬菜”进去,或者多放一些“盐”),就可以做出猪肚鸡这道菜了,最多就是蔬菜放多了或者太咸了,或者是有所创新的猪肚鸡,但它大方向还是猪肚鸡,不会说做出来发现是宫保鸡丁。
比如如果是某个游戏人物角色的LoRA,就可以通过在念咒中加上这个LoRA,让生成作品里的人物特征符合这个游戏人物角色,看起来就像是这个游戏人物角色的新的原画。
当然,如果找不到现成的微调训练模型,也可以自行训练模型(很多玩家称之为“炼”)。这个就属于比较进阶的玩法了,这篇文章里不做展开。
下载的LoRA文件放在本地根目录下的 Models/Lora文件夹里。
通过上述5个步骤,只要有基本的电脑使用能力,应该就可以开始上手体验AI绘画了。当然,上手容易精通难,想要熟练掌握AI绘画,还需要更多练习与实践,我也还在学习摸索中。相信随着AI的进一步进化以及人类的进一步推动(比如微软把AI集成到Office套件中),未来AI生成内容的门槛会越来越低。
张亮(Leon Zhang),BCW博雅公关北京数字与创意董事总经理,中国传媒大学广告学院专业讲师,曾就职于竞立媒体/群邑集团、博雅公关、麦肯光明、微软,持有中国人民大学商学院企业管理硕士学位,系福布斯中国撰稿人,表达观点仅代表个人。