近期ChatGPT突然爆火,2个月内猛增1亿用户,科技巨头争相布局业务,大量资本跟进投入,足以见得它的受欢迎程度和应用前景潜力。这一不断被提及讨论和试用体验的“聊天机器人”,并不仅仅是陪聊这么简单,而是可能成为人们工作、生活的实用工具,甚至取代部分人的工作。
“我记得上次引发全民兴趣和讨论的还是iPhone手机的面世。”凯旋创投董事总经理朱璘说,她并不认为ChatGPT的突然爆火是昙花一现,相反,她认为ChatGPT不只是一个现象级的产品,其背后的GPT3.5更是一种颠覆性的技术,在各行各业都有落地应用的可能。
与此前同样突然备受关注的“元宇宙”相比,ChatGPT背后的技术能力,使得它不仅是存在于想象之中,而是成为真切发生的现实,是人工智能有望赋能不同产业的最新实践。那么,包括ChatGPT在内的生成式AI以及背后的大模型技术是否具有长期投资价值,国内企业在这方面又有什么应用发展机会呢?
凯旋创投董事总经理朱璘认为,ChatGPT不只是一个现象级的产品,其背后的GPT3.5更是一种颠覆性的技术,在各行各业都有落地应用的可能。
澎湃新闻:您认为包括ChatGPT在内的生成式AI以及背后的大模型技术有什么投资价值,它是昙花一现的概念还是具有长期价值的应用技术?
朱璘:技术本身和投资是否活跃,其实是两个维度的事。我先说技术,ChatGPT和iPhone在技术层面和对人类生活的影响上是非常接近的,甚至前者比后者的技术更为颠覆。我认为,ChatGPT不只是一个现象级的产品,它背后的GPT3.5更是一种颠覆性的底层技术。它所带来的不仅是工作会被取代的问题,更深层的影响在于它可能会改变人类如何学习、掌握知识这件事。因此,我觉得ChatGPT的出现非常有意思,也将可能产生深远的影响。
我个人非常看好包括ChatGPT在内的生成式AI以及背后的大模型技术的投资价值,它的颠覆性在于提升了理解力、智能程度,这是一项技术革命。ChatGPT已经可以作为一种生产力工具帮助某些行业了,我们的学习模式也将因此和过去有所不同。
不过,从投资角度看,模型层方向上的机会可能更多属于大厂,因为需要一定量的数据量级为基础,且需要大量的资金、时间、人才的投入,以及一定的容错率。创业公司需要考虑更多的是如何利用大模型把各类产品更好落地,并将其融入我们日常能够长期使用的一些应用里。
当然,具体投资情况还是要看企业项目如何,如果大家能运用这项技术踏实做些事,而不是急着赶这一波热点,行业就会有一个良性的发展。
澎湃新闻:企业如何借助GPT3.5等大模型技术实现商业化,在这一过程中需要注意什么?
朱璘:从投资人角度来说,我认为创业公司一定会发掘出很多有意思的应用,就像当年iPhone面世时,我们也无法预测究竟哪个APP会火,但这类的应用一定有很多,因为大模型技术带来的是一种深层的改变。
刚才也说到,企业应该聚焦的是如何把GPT、Diffusion这类基础模型做到应用上,特别是一些可以日常长期使用的应用上,这往往和算法层面有关,需要降低应用成本,否则AI训练成本太高,在商业模式上不一定能跑得通。
为了降低大模型的应用成本,企业在基于大模型训练应用时,可以考虑如何用更少的数据训练出更好的结果,或者把较大的神经网络做小,减少模型层数,这方面也需要技术较高的算法工程师。此外,只有更好的数据才能渲染出更好的模型,以ChatGPT为例,虽然它的数据量不是很大,但却使用了非常专业的数据标注。总之,通过更好的数据和模型,并降低模型层数和数据量,才可能降低算力成本。
因此,对创业公司来说,需要考虑技术、算法层面的调整,把模型做细,这其中有很多技术难关有待攻克。而在考虑数据层面时,要注意如果数据源不同,最终跑出的模型就会有所不同。比如AI作画工具midjourney和DALL·E,它们的画风就有所不同,因为不同的数据源导致训练的图片库有所不同。
与此同时,创业公司还需要考虑,他们能提供什么样的产品,让市场上的哪些人去使用,以及他们有哪些数据,怎么把这些数据用好,需要渲染出什么模型。我们也希望在这些方面看到创业者的思考和创新,将产品更好落地。此外,中国创业者比较擅长UI、吸引流量,而将文字、图像、语音、3D等多模态结合,也很有商业价值,这可能需要一个渐进的过程。
澎湃新闻:在与ChatGPT有关的AIGC领域,什么样的商业模式有机会跑通?
朱璘:从AIGC领域来看,ChatGPT和AI作画工具midjourney、DALL·E并非处于同一层面。从底层上讲,语言难度实际上高于图像难度,因为还涉及到对人类知识库的理解和认知,而作画主要是将语言转化成触发,也是基于ChatGPT大模型语言理解之上的应用。
AIGC主要是基于大模型,需要花费大量时间和资金投入,因此一般来说,只有国内较大的互联网公司才能真正推出自己的大模型,大家再在这一基础上做应用。比如,百度、阿里巴巴就在这一领域投入了很久,其中涉及布局算力,通过大量数据做训练等工作。这类大模型也不一定用在他们自己的主要业务中,而是作为通用技术应用在很多领域之中。
目前,AIGC领域的投资还处于非常早期的萌芽阶段,但其实各行各业都有机会。对大公司来说,可能是人才、投资、不同知识模型的积累;但对创业公司来说,只要没有政策或合规限制,就可以基于最好的模型去做应用。
澎湃新闻:您看好AIGC这一投资方向吗,其中有哪些发展机会?
朱璘:类GPT、Diffusion这样的基础大模型基础上生成的各类应用毫无疑问是我们关注的重点。只要产业能落地,应用领域其实有很多。比如,AIGC在娱乐、游戏、工业、教育、医疗等方面,在影视内容辅助、编程辅助工具、虚拟客服功能等领域都有较大的应用前景。在AIGC和元宇宙的结合上,比如通过AI生成画面、虚拟人、3D模型以及语音交互等的应用方面,也有发展机会。
我觉得今年下半年,国内AIGC领域中可能会有一些不错的企业出现,这也是基于国内外大模型的推出和开源情况。
这其中,最具挑战性的还是多模态应用。调用多个大模型生成以往没有的全新应用,不仅需要创业公司对用户需求有深度了解,还需要对技术有独到的认知,我觉得非常有可能会跑出新一代的平台级产品,也相信肯定会有属于这个时代的字节跳动、美团、微博出现。
当然,除了AIGC之外,从基础设施层面来看,AI算力是支撑背后大语言模型训练的硬件基础,算法则包括模型架构和优化方法,决定着模型的核心技能。神经网络日趋复杂,以 ChatGPT 为代表的底层模型已达千亿参数量级,多模态趋势给预训练模型的参数量级带来数量级的飞跃,带来对 AI 算力需求的显著提升。这就带来了一些大的机会,比如,怎样可以以最高性价比的解决方案帮助客户实现大模型商业化的落地。算法方面的机会,则是怎样在现有条件下,用更少的数据训练出更适宜的算法模型,以此达到降本增效的目的,这里面想象空间很大,还有很多事情值得创业公司去做。
澎湃新闻:如何看待整个AI产业的发展,我们与国外在技术上的差距主要在哪?
朱璘:从技术上看,AI模型可分为分析式AI(Analytical AI)和生成式AI (Generative AI)两类,前者主要基于对现有事物的分析,后者则是生成新的知识和内容,这两类之间其实是一个巨大的跨越。
近年来,国内AI研发主要集中在分析式AI方面,国外则在这之外,也将大量资金和时间投入在了生成式AI的研发上。比如Google在2017年推出神经网络架构Transformer时,就认为这一技术可以引发机器对语言理解力的质变,因此一直没有停止这方面的开发和投入。
但由于参数量、模型层数的剧增,需要投入巨额资金和大量的时间、人才,且结果充满不确定性,国内企业并没有在这一领域继续跟进,所以就慢慢有了差距。要想 “弯道超车”比较难,不过随着国内资金的大量投入、创业人才的涌入,基础研究的不断深入,再加上原本中国创业公司就很有优势的场景商业化能力、流量吸引和变现能力以及快速迭代效率,有理由相信目前的技术差距可以不断缩小。
澎湃新闻:国内AI产业的发展目前存在什么困难和阻碍,希望得到哪些支持?
朱璘:AI技术的发展离不开三件事——算法、算力和数据。算法主要取决于要有足够的工程师,算力则对资金投入、高算力的GPU都有要求,这方面我们也面临“卡脖子”的问题,需要得到政策上的支持。
而在数据方面,大模型主要是基于人类知识,包括互联网所提供的大量丰富语料。语料质量如何对于模型训练影响很大,因此,数据对于做出特别好的大模型来说也是一大需要解决的问题。
为避免资源失效太快,本站资源绝大部分为.7z或.tar格式压缩包,无法在网盘中解压,请下载到本地使用支持.7z或.tar格式的解压软件进行解压。(如果以上格式都不是,请将后缀改为.7z进行解压),详细解压教程请点击: 新手必看解压教程
[/dr_vipb2v]
为避免资源失效太快,本站资源绝大部分为.7z或.tar格式压缩包,无法在网盘中解压,请下载到本地使用支持.7z或.tar格式的解压软件进行解压。(如果以上格式都不是,请将后缀改为.7z进行解压),详细解压教程请点击: 新手必看解压教程
[/dr_vipb2v]