近期,ChatGPT的更新再度引发市场热潮。想必这个产品大家都不陌生,很多人也都有使用过。而最新版本的GPT4是将各大模块进行了集成,可以在任务中选择并组合使用各种工具,包括数据分析、网页浏览和DALL·E 3。那么,我们今天就一起来深入了解一下,看看它的前世今生是什么样的,未来又将走向何方?
一、前世:ChatGPT的核心——Transformer 架构
首先,在了解ChatGPT之前,大家肯定会好奇一个问题,就是它为什么那么能聊?
核心其实很简单,More is different,量变到质变,多即不同。这其实也恰好吻合了凝聚态物理的核心思想。ChatGPT的开发归功于OpenAI,但其技术基础实际上源于谷歌在2017年的一项创新。那一年,谷歌发布了一篇论文,介绍了一种新型的神经网络架构——Transformer Architecture。这种架构专为处理自然语言而设计,最初主要被应用于语言翻译领域。
为什么Transformer架构用来处理自然语言会很有优势呢?
我们都知道,人类大脑的运作依赖于数十亿神经元所构成的复杂网络,这些神经元通过节点(Node)相互连接,共同参与信息的传递和处理。神经网络架构正是模仿了这种人脑的思维模式。在这些架构中,节点间的连接模式各异,以适应不同类型的任务。例如,图像处理通常采用卷积架构(Convolution Architecture),而早期的语言处理则采用了循环神经网络(RNN)架构。RNN架构将语言视为马尔可夫链(Markov Chain),即每个词仅与其前一个词唯一相关。然而,这种处理方式并不完全符合人类语言的实际运作规律。例如,中文等语言的语法规则相对模糊,没办法用简单的线性关系来描述。
RNN vs Transformer
图片来源:网络,截至2023.10
而Transformer架构的创新之处在于,它不将语言处理视为简单的马尔可夫链。相反,它允许每个单词与之前的所有单词建立联系,并通过大量训练来优化不同节点间的权重分配。这种方法更贴近于人类语言的模糊性和经验性特征。比如一个外国人跟我们讲中文,哪怕他讲得乱七八糟,词也乱用,我们也能猜出来他想表达什么。根据我们在中文方面的充足经验,大脑对中文的处理已经趋近完美,所以这句话我们很容易理解。那为什么我们看很多外国人都是一个样子很难分辨呢?这就是因为我们的经验不够,对于外国人面部识别的节点权重分配不到位的原因。
$工银科创板50ETF联接A(OTCFUND|011614)$
$工银科创板50ETF联接C(OTCFUND|011615)$
二、今生:OpenAI都做了什么?
在ChatGPT的开发过程中,OpenAI在Transformer架构的基础上进行了大量复杂且繁琐的数据训练,使ChatGPT经历了多个版本的迭代,每个版本都在不断完善其语言处理能力。最初,它主要学习网络上的数据,但这导致了一些问题,如生成的内容偏向于粗俗和暴力。为了解决这一问题,后续版本采用了更加有针对性的数据源,并通过人工干预来不断纠正和优化AI的回答。
ChatGPT的训练过程
来源:网络,截至2023.10
这种持续的迭代和优化最终实现了从量变到质变的转变,使得ChatGPT能够更加精准和自然地处理语言。随着越来越多的用户使用ChatGPT,其智能水平和语言处理能力将持续提升,类似于AlphaGo也是不断地经过专业棋手的训练,持续进步才击败了柯洁这种国际顶尖棋手的。所以,这种迭代过程对于AI技术的发展也是至关重要的。
三、未来:ChatGPT将走向何方?
随着人工智能技术的不断发展,ChatGPT的未来展望引人关注。目前,ChatGPT已经展示了其在生成连贯、有意义文本和进行深入对话方面的能力。然而,它尚未达到真正理解所生成或接收到的语言的水平。这引出了一个关键问题:ChatGPT和类似技术将如何进化以更接近人类的认知和理解能力?
一方面,ChatGPT的未来发展可能集中在提升其理解和响应能力。这意味着不仅仅是在语言生成的流畅性和连贯性上取得进步,更重要的是在理解复杂语境、抽象概念以及用户意图方面的提升。这将需要更先进的算法和更大规模的数据训练,以便更准确地捕捉和反映人类的语言多样性和复杂性。
另一方面,随着人工智能技术的发展,特别是在通用人工智能(AGI)领域的探索,ChatGPT可能会成为实现这一目标的重要步骤。AGI旨在创造出能够执行任何人类智能活动的机器智能,包括感知、运动技能、学习、问题解决和创造力等。尽管这一目标仍然遥远,但ChatGPT和类似技术的发展无疑为我们提供了通向更高级人工智能形式的线索。
此外,我国政府对人工智能技术的重视和大规模投资为该领域的发展提供了强大的推动力。我国的“新一代人工智能发展规划”旨在到2030年将中国建设成为世界主要人工智能创新中心。目前,从智能制造、医疗健康到智慧城市和教育,人工智能技术正在中国的各个领域迅速渗透。这些应用不仅展示了人工智能技术的广泛潜力,也为ChatGPT及其它类似技术提供了丰富的应用场景和实践案例。据IDC和浪潮信息联合发布的《中国人工智能计算力发展评估报告》,2022 年,各个行业的AI 应用渗透度都在不断加深,其中,互联网、金融、政府、电信和制造位列人工智能行业应用渗透度排名的前五位。
中国人工智能行业应用渗透度及提升百分点
数据来源:IDC、浪潮信息、东方证券研究所,2021-2022年
此外,根据德勤数据,中国人工智能市场规模将由2017年的709亿元增长至2025年的5460亿元,年均复合增长率为29%。这也充分展示了中国在人工智能领域的快速发展和市场潜力。
中国人工智能行业市场规模(亿元)
数据来源:德勤、中信建投,2017-2025E
我们可以预见,随着技术的不断进步和应用领域的扩展,AGI将成为未来人工智能市场的重要增长点。尽管目前AGI仍处于初级阶段,但其市场前景广阔,可能会成为推动全球经济增长的重要力量。随着技术的成熟和应用的深入,AGI相关的产品和服务或将在全球范围内产生巨大的经济价值。