摘要:
1、ChatGPT概念走强,多模态方向领涨,发生了什么?
2、多模态是ChatGPT的下一站,下游应用空间广阔,催生算力需求
3、视频编解码核心领军,在前沿超高清编解码技术有显著优势,有望深度受益
聊点事:
OpenAI宣布,将在ChatGPT推出新的语音和图像功能,新功能将于未来两周内面向Plus和企业用户推出。新功能允许用户将与ChatGPT进行语音对话(适用于iOS和Android),并在对话中以图片形式向ChatGPT展示正在谈论的内容(适用于所有平台)。
讲逻辑:
国盛证券认为,AI领军企业OpenAI与科技巨头谷歌在多模态大模型上竞相提速彰显了多模态技术的重要性,并有利于推动多模态AI尤其是基础模型取得进步,进一步推动多模态相关应用落地。
当前多模态的输入输出主要是文本、图像,应用场景包括智能办公和各类AIGC功能,1-5年内,随着多模态GPT的发展带来AI泛化能力提升,通用视觉、通用机械臂、行业服务机器人(300024)、真正的智能家居等会进入生活。在5-10年内,结合复杂多模态方案的大模型有望具备完备的与世界交互的能力,带来通用机器人等千行百业的广阔应用。
国盛证券进一步指出,多模态模型需要处理的输入和输出信息将包括文本、图像、视频、音频等,复杂度远超纯文本数据,同时将不同模态的特征进行融合,找到不同模态间的内在关联和交互关系也需要更复杂的模型架构,这也增加了计算负载,要发挥多模态模型的优势,必须有强大的算力支持。同时多模态发展打开广阔下游应用空间,用户增长将让应用厂商在模型推理侧需要更多算力,进一步催生算力需求。
选标的:
万兴科技(300624):与华为云签署战略合作协议,双方将在昇腾算力、数字人支持、AI大模型、品牌营销、生态共建等方面展开深入合作。
虹软科技(688088):利用基于多年积累的包含有效语义的大量样本,以及丰富的面向商拍应用的新样本集,建立了虹软的AIGC专属商拍大模型,开发了一整套支持服装、饰配和各类商品的速度快且成功率高的AIGC智能商拍产品。基于当前的开发进度,公司计划在2023年下半年正式向市场推出智能商拍摄影产品解决方案。
当虹科技:GPT多模态演绎下,视频成为输入输出形式,数据量或远超文字,将极大刺激视频压缩的需求,公司为视频编解码核心领军,在前沿超高清编解码技术有显著优势,有望深度受益。