敲下键盘回车后,屏幕上闪烁的光标,仿佛提醒着你,AI正在思考。没一会儿,一句句回答在屏幕上悉数展开,大语言模型仿佛一个温和谦逊的绅士,耐心地回答每个提问。
只是这种语言模型似乎有热切回答任何问题的强迫倾向,甚至不惜巧舌如簧地编造事实。它一本正经地胡说八道的特质,让不少人在使用一段时间后感到空洞无趣。
为了最大限度减少胡说八道(业内术语称为“幻觉”),并在尽可能遵循用户指示不离题(业内称为“对齐”),当前AI领域的共识是,在现有技术条件下,扩大训练数据量是目前为数不多的解决方案之一。
因此,为了在自然语言处理领域制造出表现最优异的语言模型,各大AI公司陷入了对计算资源和训练数据量近乎无止境的竞争。
2022年11月,OpenAI向公众开放ChatGPT后,纽约时报(NYT.N)发现自己的大量内容可能被OpenAI悄然用作模型训练,为两家公司后续在知识产权领域爆发的纠纷埋下了伏笔。
数字订阅带动近2年营收
在纽约的总部,几乎24小时不间断有人工作的新闻编辑部大厅里,纽约时报的记者和编辑们在忙碌之余,茶歇的闲聊话题又多了一个:大语言模型是否会颠覆新闻行业?
这家因古典严肃有“灰色女士”(The Gray Lady)之称的报社,过去以其镇定稳重的风格自以为豪,如今也难掩胸中的忐忑。
自1851年创立以来,纽约时报见证了从凸版印刷到移动互联的时代变迁,在2022年新增超过100万订阅用户的推动下,继续保持增长态势。在新闻媒体行业发展的时代篇章中,纽约时报在数字时代,用二进制语言续写它的故事。
2022年,公司营收23.08亿(同比+11.25%),毛利率47.63%(去年同期为49.9%),净利1.74亿(同比-20.94%);2023前三季度营收17.5亿(同比+6.65%),毛利率46.97%(去年同期为46.56%),净利1.23亿(同比+18.8%)。
(注:本文除额外说明,金额单位默认美元。)
(来源:市值风云App)
纽约时报2022年营收增长主要得益于数字订阅收入增加。公司当下在大力推广其订阅套餐All Access,以期待通过多产品捆绑销售的方式,增加客单价。
2022年,纽约时报增加了超过100万数字订阅用户。
截至2022年Q4,纽约时报拥有955万付费数字订阅用户,付费订阅数达1,098万。
(注:订阅用户数和订阅数是纽约时报在信披中使用的两个不同的指标。订阅用户指的是注册接收纽约时报内容的个人或机构。一个订阅用户可以有多个订阅,例如同时订阅了数字版和印刷版。)
2022年净利下滑的第一个因素是因收购The Athletic而产生的相关成本,达到0.35亿。相关成本主要包括与加速执行The Athletic股票期权有关的费用,以及法律、会计、咨询和整合规划费用。
The Athletic (中文译作“运动员”)是一个订阅制媒体平台,为北美的体育爱好者提供体育信息(包括新闻、播客和视频等)。The Athletic由亚历克斯·马瑟(Alex Mather)和亚当·汉斯曼(Adam Hansmann)于2016年创立。
2022年1月,纽约时报以5.5亿的对价,现金收购The Athletic 100%的股权。此次收购是纽约时报为推进其共计1,000万订阅数的战略目标而进行的。收购时,The Athletic拥有120万订阅数。
收购后,The Athletic继续独立于纽约时报新闻编辑部,独立运营。
至今,The Athletic 仍处于营业亏损状态。2023年前三季度,The Athletic的调整后营业亏损为0.27亿。纽约时报计划在两年内使The Athletic盈利。
(来源:市值风云App)
2022年净利下滑的第二个因素是纽约时报决定停止参与一项多雇主养老金计划,该调整带来了0.22亿的多雇主养老金计划负债调整(multiemployer pension plan liability adjustment)。
多雇主养老金计划是一种由两个或两个以上的雇主和一个工会共同建立的退休储蓄计划。这些雇主通常来自相同或相关的行业。这种计划有利于那些频繁更换雇主但仍在同一领域工作的员工累积权益和退休福利。
当一个公司决定退出此类计划时,通常需要支付撤回责任金(withdrawal liability)。纽约时报必须支付该金额的原因是为了确保计划中其他公司不会因纽约时报的退出而导致计划资金出现缺口。
这一设计确保参与该计划的所有雇主平等分担该养老金计划的成本,避免因个别雇主的退出而让其他雇主承担额外的资金负担。
2023年前三季度的营收均有一定幅度的同比增长,分别为4.34%、6.33%和9.25%。其中Q3的同比增速最为明显,主要源于订阅收入的拉动。其中Q3的订阅收入中,又以数字订阅为主,达到2.82亿,同比增长15.7%。
公司反映,在其2023年Q3数字订阅收入中,多产品套餐订阅的营收同比增长4,410万,而单一产品订阅的营收同比增长220万。
当下,数字订阅已成为公司最大营收来源。2023年前三季度,数字订阅共计贡献了8.11亿的营收,占公司总营收的46.33%。
(来源:市值风云App)
2023年前三季度净利同比增长的原因,除了营收增长的推动之外,还因2022年收购The Athletic所产生的相关成本拉低了2022年同期的净利润,使得2023年前三季度的净利润相比显得更高。
大力推广订阅套餐,实质上等于隐性涨价
纽约时报管理层坦言,目前公司收入增长的关键驱动力是通过鼓励用户选择套餐订阅的形式,实现公司各类服务的捆绑销售。公司目前正努力推销其“无限访问(All Access)”订阅套餐。
All Access订阅用户可以同时解锁新闻、游戏、烹饪、产品测评(Wirecutter)和体育新闻(The Athletic)五大服务的订阅内容。
纽约时报在其旗下各平台通过弹窗等方式推广All Access订阅服务,提供首年订阅折扣来吸引用户。例如,美国用户第一年每月仅需4美元(英国每月2英镑),远低于原价的25美元(或12英镑)。在一年过后,订阅费用恢复原价。
(来源:pressgazette)
目前,纽约时报对推广套餐订阅所带来的数字订阅增长颇为满意。公司管理层采用用户平均营收(ARPU)指标来追踪相关业绩表现。纽约时报将ARPU定义为该季度以28天为计费周期的每名数字订阅用户的平均营收。
2023年Q3,数字订阅ARPU为9.28美元,同比增长4.6%,环比增长1.4%。
(来源:2023 10-Q)
2023年Q3环比增长主要是因为部分用户在促销价结束后选择了续约,按原价续费给公司带来了更高收入,此外,在单品订阅价格上涨后,部分老客户仍选择了单品订阅续约,因此单品订阅带来的营收也有所增长。
2023年Q3同比增长的主要驱动因素是在单品订阅价格上涨后,部分老客户仍选择续约。
这背后是纽约时报在变相涨价:用户要么选择价格更高的单品订阅,要么选择价格更高的All Access。(风云君:这真的是选择题吗?)
2023年,纽约时报的单品订阅用户开始发现自己订阅的服务价格在涨价,部分用户甚至发现自己的电子版新闻订阅价格从每年143美元上涨到195美元,涨幅达36.4%。
此前,纽约时报游戏和烹饪版块的单品订阅(均为每月5美元/3英镑)都有第一年订阅费半价的优惠,但现在任何订阅者都必须支付原价,比当下提供第一年订阅折扣的All Access套餐(每月4美元/2英镑)还要贵。
不想支付更高单品订阅价格的用户,纽约时报以“五合一有优惠”的营销方式诱导用户认为自己买到了实惠,转化成了All Access订阅套餐用户,但整体平均而言,今年纽约时报用户支付的费用较往年有所上涨。
甚至,从2023年6月开始,纽约时报官网已不再提供纯新闻的单品订阅选项了。如果想只订阅新闻服务,只能通过电话客服的方式。
总体来看,在当前北美通胀的大环境下,纽约时报通过不断涨价在一定程度上维持了其盈利能力。2023年Q3,公司的季度营业利润率为8.41%,在同行业内属于中上水平。
(来源:市值风云App)
2023年Q3,公司的季度净利润率为7%,也高于行业平均水平。
(注:每日期刊(DJCO.O)的净利润率近期波动较大,因此没有将其纳入净利润率对比图表中。)
(来源:市值风云App)
与同行相比,公司的另一大优势在于其较低的有息负债率。截至2022年末,公司的有息负债率为2.33%。
(来源:市值风云App)
在AI时代谨慎捍卫自己的知识产权
纽约时报是美国著名报社之一,由亨利·雷蒙德(Henry Raymond)和乔治·琼斯(George Jones)于1851年9月18日创办。两人之前均干过记者。
同样总部在纽约的华尔街日报,更专注商业和金融相关新闻报道。相比之下,纽约时报则追求更广泛的报道主题,以落实其格言:本报所有新闻都值得被印刷(All the News That’s Fit to Print)。
这句格言自1897年开始使用,时至今日仍出现在纸质报纸的报头上。由于纽约时报不惜直击深入剖析政治、文化以及全球重大事件,其观点倾向也常引起争议。
(来源:blogspot)
如今,纽约时报再次成为舆论焦点,不过这次引起议论的不是其报道,而是一起诉讼。2023年12月27日,纽约时报对微软和OpenAI提起诉讼,指控两者侵犯版权并滥用纽约时报的知识产权。
对纽约时报来说,作为传统新闻报社的代表,这不仅仅是法律诉讼,而是对新闻业知识产权这道防线的捍卫。
随着纽约时报大量新闻内容以电子形式而非纸质传播,被复制和盗用的可能性有所增加。因此,纽约时报格外重视数字信息的知识产权保护。
公司在2006年之前的过去20年里,仅在1991年和2001年出现过营收同比下滑。这两次下滑都与美国经济衰退直接相关,并非行业特征或经营问题所致,分别是由1991年广告客户缩减开支,以及2001年读者消费减少导致的。
(来源:市值风云App)
但从2007年智能手机(以iPhone为代表)开始逐步改变人们阅读习惯,以及2008年经济危机爆发后,美国经济用上数年时间才获得一定程度的复苏。
尽管其他行业可能已逐步回到正轨,但以纽约时报为代表的传统报业发现,行业正以缓慢但几乎不可逆的方式发生变化:广告收入已不再能成为他们赖以生存的收入来源,纸质报刊的订阅数也在逐年下降。
信息覆盖的独家性,新闻叙事的吸引力,数字化内容的丰富度,是吸引数字订阅用户的关键,也成为纽约时报目前的生存之道。因此,优质的数字新闻内容是纽约时报当下最宝贵的资产。
如今,无论大小事件对新闻业知识产权造成的影响,都会让纽约时报格外谨慎。这次,OpenAI大语言模型的迅速发展,也使得纽约时报有所戒备。
纽约时报指出,OpenAI的ChatGPT模型在以下三个方面涉嫌侵权:
1.信息生成:ChatGPT能对部分文章做出准确而深入的分析,这显示其参考并学习了纽约时报的内容;
2.逐字摘抄:在回答某些问题时,ChatGPT有时会几乎原文逐字引用纽约时报的原文;
3.误导内容:ChatGPT会捏造不存在的错误信息,并声称来源于纽约时报,这对该公司的形象造成负面影响。例如,ChatGPT声称纽约时报于2020年1月10日发表文章,题为“研究发现橙汁和非霍奇金氏淋巴瘤可能有联系”。
(注:准确来说,ChatGPT是基于GPT-3.5大语言模型的面向消费者的对话服务。为便于理解,本文所有涉及的OpenAI文本类大语言模型技术统称为ChatGPT。)
(GPT-4生成内容和纽约时报的原文对比,来源:hollywoodreporter)
让事情变得棘手的是,即使OpenAI未直接使用纽约时报的内容,其训练数据中所用的其他语料也可能间接引用纽约时报的报道。
就像人在广泛阅读后能够融会贯通各种相关知识一样,严格依据训练语料要求进行训练的语言AI,也可能通晓训练语料之外的信息。这导致OpenAI及其他开发大型语言模型的公司,都需考虑训练过程中可能引发的法律责任。
此外,公众似乎已经对ChatGPT胡诌不存在的信息视为平常。因此,纽约时报对此事的严肃对待,引发了一定的公众讨论。
在这篇文章的写作过程中,风云君参考并模仿了部分纽约时报的新闻写作风格(例如避免单一宏大叙事,使用细节故事以小见大)。
这引出一个有趣的思考,那就是文字信息的知识产权很难被完美地保护。如果外人花时间模仿和临摹,他们就可以在一定程度上复制这些文字的语义和笔调。
此外,发展迅速的大语言模型本质就是以模仿语言特征和规律为核心的工具,他们的出现,降低了语言模仿的门槛。这使得现今捍卫文字内容的知识产权变得愈发困难。
在新闻报道方面,纽约时报一直在不断努力紧跟时事发展。那么这一次,在技术变革方面,纽约时报也需要面临着紧随行业变革的挑战。