无论是出于惊叹还是吐槽,开年至今应该没有什么能比ChatGPT更吸引网友关注了。
在这之前大部分普通人对人工智能的印象,可能还停留在2016年 AlphaGo 和李世石九段那场世纪对决。在此之后,虽然名义上我们已经通过短视频推荐、导航路线规划等场景接触过人工智能,但其实始终缺乏实感。
而ChatGPT的出现不仅让人们“直接与AI接触”,甚至可以用来写论文、打代码、回邮件、甚至面试。从学生到打工人,不仅是信任AI,而是忙于让AI为自己服务了。
实际上,ChatGPT在通用语义领域有着如此高的水准,若将同源技术在垂直领域进行训练与积累,其背后的商业价值,与对产业的影响,或许将从现在记为一个元年,改变一个时代的产业形态。
从作弊到辅导的技术嬗变
根据纽约时报报道,一月份北密歇根大学的哲学教授安东尼·奥曼Antony Aumann在为他的世界宗教课程批改论文时,读到了他所说的“班上最好的论文”:段落干净、用例恰当、逻辑严谨地讨论《布卡禁令》的道德性。
不出意料,后来在询问中学生承认,这篇内容是由 ChatGPT 完成的。
事实上,ChatGPT给美国教育界带来的刺激是不小的。全美范围内,许多大学教授都在重新设计课程,更多地采用口试、小组合作和手写文章作为评估方式,而不是让学生家庭作业式地提交文章。
但对ChatGPT严防死守的同时,这样的故事隐约透露着一个更重要的真相——由于 ChatGPT 在语义理解、信息整理、模仿能力上都有不俗实力,从某些角度来讲,这个人工智能产品无疑称得上是个优等生。换句话说,ChatGPT 除了可以扮演学生枪手,更可以扮演学生的辅导老师,针对问题辅导学生功课,以及帮助学校的教师备课出题。
同样是在美国,有的老师开始在课程中让学生和 ChatGPT 辩论,以训练逻辑能力;有的老师用 ChatGPT 出题,提高备课效率;还有的老师用其快速搜索整理资料,提高课程丰富度。
借着热度,很多教育企业也纷纷发布了自己的产品或计划。
网易有道AI技术团队正投入到ChatGPT同源技术在教育场景的落地研发中。此前有道已经在AI口语老师、中文作文批改等细分学习场景中尝试应用;科大讯飞官宣今年5月将发布AI学习机;而好未来也在推出的学而思学习机上上线AI讲题机器人小π。
ChatGPT 的出现,可能是教育走向更好状态的契机。
中式教育,如何找到自己的答案
根据2019年统计,中国小学净入学率99.95%,初中100%,高中88.8%。这样的教育普及成绩在14亿的人口基数下,全球罕见。但另一边,中国整体教育完成“量变”转向“质变”,依然是一条需要探索的道路:
宏观的层面来说,偏远地区的教育资源依然需要外部支援、大城市的家长在争取优质的学区资源。具体到生活中,家长每天还要查看家长群通知、紧盯孩子写作业;老师们除了上课,每天还要布置作业和无止尽地发消息@家长,下课后,老师们还得批改作业、备课、排课。这种内耗式的师、生、家长关系,几乎是整个中国教育下的同病相怜,无比熟悉、无处可逃、每天无限循环。
这些问题的根源,都来自教育资源与精力的分配依然是不平衡的。比如,老师明明应该花更多时间在孩子身上,但布置批改作业、备课这些机械、重复的事情却占用了大量时间;为了弥补老师失去的辅导时间,家长好不容易下班了还要捡起快忘干净的知识点指导孩子功课;不同地区的发展差异短时间是很难弥补的,优秀的教师数量往往也就只有那些。如果不能让优秀的教育资源普惠,那么这些问题都很难得到解决。
其实,教育行业一直都有着很好融入人工智能的基础:
首先是“资源”:教育领域具有大量的可被归纳的数据和资源,这些数据可以被AI技术进行深入分析和挖掘,帮助教师和学生更好地理解和应对学习难点。
其次是“场景”,教育领域的应用场景相对集中,比如改作文、打分、讲解等,可以针对特定的教育场景进行AI技术的应用。这样做可以避免AI技术的泛化问题,让AI技术更加垂直贴近实际需求,提高应用效果和用户体验。
最后是“受众”,教育领域对于AI技术的接受度较高,教育工作者普遍具有较高的文化素养和技术素养,这使得他们更加容易理解和应用AI技术,推动AI技术在教育领域的落地。
这也是为什么在ChatGPT走红以后,“教育领域可能是ChatGPT最容易落地的场景”成为国内行业热议的话题:当ChatGPT这样的产品,可以低成本地被每个家庭的孩子访问和使用,那么每个学生都相当于获得了一位辅导老师,这对于整个行业生产力的解放将是不可估量的。
但AI+教育,并不是一个简单的1+1问题。
“虽然我们在讨论人工智能技术,但是仅人工智能技术本身是做不出一个产品的。传统的机器已经无法承载深度学习时代的巨大计算量的需求,知识获取(训练)和提供服务本身都依赖巨大的算力。”
网易有道总裁金磊曾表示,跟业务场景结合的技术才能真的解决用户问题。这不仅涉及到对模型的不断训练,还需要对模型压缩、蒸馏、量化等多项相关技术的持续探索,以及针对硬件设备的深度优化。只有让其达到了应用的门槛,并且能够产生商业价值以后,一大批垂直领域的优化定制需求大量涌现,
“如何实现低成本的模型定制,也成为算法和算力侧都需要关注的重要问题。”他说。
隐形玩家的方法论
如何把人工智能技术融入教育,需要想很多办法。我们可以从行业中不同企业的业务模式中,看到一些共性。
针对资源,需要构建起知识图谱,覆盖学习各场景沉淀数据。比如学而思多年来所积累的内容资源,为学习机内置了超1000万分钟的优质学而思自研课程,课程内容100%由原学而思老师讲授;有道积累了基于K12的知识图谱、智能批改系统、学情大数据、自适应学习、个性化课程、口语评测、自动答题系统等解决方案。
针对场景,很多垂直领域的探索,比如口语练习、作文批改、英文写作、在学术侧也做了很多的纵深。虽然模型没有ChatGPT那么大,但是在细分场景下有着更好的表现。比如有道推出了有道写作,根据不同课程的需要,开发了批改、优化、润色和打分的能力;阿里和讯飞都曾推出针对阅卷场景的人工智能,减轻阅卷老师压力。
针对受众人群,要通过恰当的智能硬件设备,通过AI+硬件+内容的综合能力,低门槛使用的同时,建立起符合学生、老师使用场景需求的产品。代表性的就是各家的词典笔、学习机、还有智能台灯。
这一系列策略,林林总总,其实就一个思想:将技术集中投入到教育行业与人工智能相性比较好的垂直领域,避免技术停留在实验室中,让它更容易落地。
网易有道总裁金磊曾表示,跟业务场景结合的技术才能真的解决用户问题。这不仅涉及到对模型的不断训练,还需要对模型压缩、蒸馏、量化等多项相关技术的持续探索,以及针对硬件设备的深度优化。只有让其达到了应用的门槛,并且能够产生商业价值以后,一大批垂直领域的优化定制需求才会大量涌现。
“如何实现低成本的模型定制,是成为算法和算力侧都需要关注的重要问题。”他说。
一个比较有讨论价值的例子,是有道的爆款产品词典笔。
从功能点来看,这支笔可以实现文字扫描、拼图、识别、机器翻译、语音合成、语音识别,并做到离线精准翻译。将这些功能落地到一支小小的笔头上,这背后需要的是大量的算法模型,考验的更是技术在端侧的落地能力。
众所周知,端侧的技术难度是如何在资源有限的硬件环境里满足业务对性能的要求。无论是存储、内存,或者计算资源都比较有限,对AI模型必然提出了更高的要求,并且是一个极为难啃的硬骨头。有道不仅做到了技术在业务场景中的落地,还不断刷新了词典笔这一细分品类的天花板。实现了在查词过程中的交互、点查、扫描翻译、一目十行等功能点上的创新。
事实上,无论是有道深耕多年的智能学习硬件,还是讯飞植入各类产品的语音技术,都是自然语言处理相关技术的一个领域。也正是基于此,他们才在做到了业界相对领先的自然语言处理能力的同时,能够深入教育行业,并做到持续引领。
当然,如果只有自然语言处理能力的话,即使训练出来很好的模型也只能支持文本的能力。所以有道有着图像识别、人脸识别、语音合成、OCR等基础技术。这种多维度的补充,给AI带来了能“看”能“听”的体验,通过更全面地感知世界,诞生出更符合用户的使用直觉与需求的产品。
这也是为什么在ChatGPT走红后,有道能够快速做出应对的深层原因。
而技术上的坚持,最终将反映在经营状况,最新一季的财报数据显示,网易有道2022年Q4净收入达14.5亿元,同比增长38.6%。其中,学习服务、智能硬件以及在线营销服务三大业务板块第四季度同比分别增长39.2%、28.1%、58.6%。最终2022全年,有道实现净收入50.1亿元,同比增长24.8%。——在“人工智能的精工细作”时代,持续多年的投入逐渐有了回报。
收入变化的背后,研发、资本开支是着眼于未来的投资:2020、2021、2022年有道研发费用分别为3.7亿元、6.1亿元、8亿元。增长主要来自于对智能硬件在内的业务研发投入的增加。
四季度,学习服务净收入为8.1亿元。有道特别披露了学习服务中数字内容服务的销售额为超6亿元,并已连续两个季度实现净收入可覆盖成本及运营支出。数字内容的本质仍然离不开对于AI技术的依托。内容收入作为典型的长尾收入类型,随着时间推移将会持续创造价值。
每一个新技术都有自己的成长周期。在近两年这种高度不确定的环境中,大家都在追求稳妥收缩,长期主义的投入更需要战略定力。无论是中国的AI还是教育,国家长远发展的两种战略支撑,离不开最为本质的底层驱动力科技企业的自立自强。
这也是在ChatGPT爆火、被热议的今天,在两个行业中留下的不起眼的注脚。