2022 年 8 月,游戏设计师 Jason Allen 参加了一场数字艺术比赛。
他的作品《Theatre d’opera Spatial》成功夺冠,却在赛后引起了极大的争议。
参赛者们回过神来发现,这是一场「人类一败涂地」的比赛。当他们将 Adobe 全家桶视作数字艺术的画笔,冠军作品已经在靠着 AI 工具 Midjourney 傲视群雄。
Jason Allen 没有偷懒,也没有隐瞒使用 AI 的事实。在几周时间里,他持续修改灯光、视角、构图等提示词(prompt),生成了 900 多幅作品,还用 Photoshop 做了处理。
我们或许无法称呼他为画家,但他担得起一个名号:提示工程师(prompt engineer)。
在不经意间,Jason Allen 预判了热点。等到 ChatGPT 横空出世,提示工程师这个职业更加声名大噪,成了当下科技行业最热门的职业。
赛博导师,专业陪聊
Prompt,原意是「提示」或「驱使」,在机器学习和自然语言处理中,它通常是一些文本或语言,被输入到训练好的 AI 模型,告诉模型要执行什么任务或生成什么样的输出。
你让 ChatGPT 写一篇有关卖鱼贩的小说,请 DALL-E 画一幅宇航员骑着马的写实作品,这些过程都是在输入 prompt(提示词)。
如果提示词不够贴切,效果也就平平无奇,就像你采访一个大佬,却无法提出好问题。
我的同事小黄正在探索用 Midjourney 绘制食物,但让食物排列整齐这件事,就让他犯了难。他尝试了很多句子:东西整齐地放在桌子上,镜头从上往下拍,摆放的数量要多少……
▲ 同事作品,这种风格就叫 knolling.
后来看到有人分享,小黄才发现原来这种风格有个专有名词「knolling」,一下子就豁然开朗了:
很多时候一个提示词能解决的事情胜过一长句描述。
提示工程师们,吃的就是这口饭:找到正确的提示词,用 AI 生成想要的作品。
但他们的能力也并非与生俱来,同样需要不断的试错。
设计师 Justin Reckling 擅长 DALL-E 的提示词,他往往需要花费价值 10 到 15 美元的积分,才能试出理想的提示词。然后他再卖出 5 到 10 个提示词,才能填补这笔支出。
▲ Justin Reckling 的作品.
不过 Reckling 也没想着靠这门手艺赚大钱,而是享受着熟能生巧的过程,他的心得是,提示工程师需要熟悉「超写实」「微距摄影」「电影照明」「远景」等术语,才能更好地理解和控制画面。
所以,优秀的提示工程师应该文理兼通,技术和设计最好都懂一点。
提示工程师只是不断调整提示词,确定哪些词更有用吗?不完全是,他们也是在挖掘 AI 的更多能力,让它更好地完成更多任务。
比如,有些提示工程师会引导 AI「一步步思考」,这种技巧被称为思维链。
去年 10 月,提示工程师 Riley Goodside,先是询问了 GPT-3「哪支球队在贾斯汀·比伯出生的那年赢得了超级碗?」
GPT-3 给出了错误的答案「绿湾包装工队」,正确答案是达拉斯牛仔队。