人与人沟通的桥梁是语言,人与机器的沟通同样需要桥梁。而作为懂得大模型特殊咒语的“魔法师”,提示工程师(prompt engineer)成为了许多企业高薪争抢的人才。
Claude母公司招聘提示工程师年薪25万美元左右(人民币约180万)
浪潮之下,许多人开始将目光转向提示工程师这一岗位,但越是风口,越需要一些“冷思考”,提示工程师的职业“光环”究竟能够持续多久?
01
大模型进化
prompt终将消失?
今年1月,OpenAI的CEO山姆奥特曼表示,prompt engineering(提示工程)是生成式AI的一个临时阶段。
Hugging Face的研究员Sanh也认为:提示工程师的角色是暂时的。毕竟,最终用户不应该通过输入一串复杂的常用短语来与聊天机器人进行交互,“你应该只是和它交谈。”
除了AI公司,今年6月,哈佛商学院著名杂志《哈佛商业评论》刊文称“AI prompt engineering isn’t future(提示工程不是未来)”,并认为prompt engineering是一种短暂的现象,随着AI模型的进步,它将变得多余。
这些言论不仅仅是预测。事实表明,提示工程师的角色正在逐步被取代——9月21日,OpenAI推出了图像生成工具DALL-E的最新版本DALL·E3。
而相较于去年四月推出的上个版本DALL·E2,OpenAI评价,“DALL·E3比以往系统更能理解细微差别和细节,让用户更加轻松地将自己的想法转化为非常准确的图像。”
此次更新的亮点是将ChatGPT接入了DALL·E3。
目前,文生图模型如Midjourney等在处理需要精确提示词的复杂场景时仍存在局限。单独的物体和角色较为容易生成,但表达对象间关系的复杂场景则依然需要非常精确的提示词指导。这是当前阶段文生图模型面临的核心挑战。
DALL·E3连接ChatGPT正是为了弥补这一缺陷。ChatGPT强大的语言生成能力可以为DALL·E3提供长句详细的提示词。
DALL・E3生成的乐高风格的核聚变工厂
具体来说,ChatGPT的出现让prompt设计变得更加简单和智能。在使用DALL·E3生成图像时,用户无需再自己苦思冥想设计复杂的prompt。只需要向ChatGPT表达一个想法,它就能自动为DALL·E3生成一个量身定制、细致入微的prompt。
随着大语言模型性能的提升,许多任务可以通过简单的prompt完成,不再需要复杂的prompt设计。
02
光环散去
提示工程师如何自处
prompt是用户使用大模型时输入的内容,prompt的质量决定了模型输出的质量。对于终端用户来说,大模型是一个预训练好的黑盒,内部结构无法更改。在这种情况下,prompt就成为了用户与模型交互的桥梁和媒介,是影响输出的关键所在。
一个高质量的prompt需要用户对任务和模型有深刻理解,才能发挥模型最大效果。prompt的设计直接影响结果的好坏,它就像一个魔法师给出的咒语,不同的语言会产生不同的魔法。
当前提示工程师之所以备受关注,是因为大模型技术刚刚兴起。如何设计好的prompt直接影响模型效果,因此promptengineering被视为一项高端技能。但是随着技术的成熟,prompt的设计也会趋于标准化和模块化,门槛或许也将进一步降低。
DALL・E3生成的提示工程师概念图
曾几何时,程序员也同样风光无限,但随着互联网行业的降温,程序员的地位也随着技术进步而面临挑战。而现在,提示工程师作为一个新兴且拥有潜力的职业,未来的空间与前景充满未知。
一方面,简单的prompt可能被大模型自动生成,这降低了设计门槛。未来普通用户提出一个需求,大模型就可以直接输出提示词,用户不再需要自己设计。