0°

当ChatGPT来到非洲:编教材,读医学文献,教农民治玉米病

  大巴车穿过塞内加尔首都达喀尔市区,在老旧二手车的车流中缓慢前行,不时有小贩向堵车中的司机兜售小商品和零食。市郊的环形路口中央裸露着沙土,有牧民赶着羊群吃草。出了市区上高速,约莫半个小时,大巴来到了一片开阔地带。在大西洋潮湿海风的滋养下,草木郁郁葱葱,而我们此行的目的地:阿卜杜·迪乌夫国际会展中心,就坐落在这片尚待进一步开发的“开发区”。

  会展中心内人们讨论的话题——时下最火爆的生成式AI——和周遭环境颇有格格不入之感:AI正在飞速迭代,但离非洲似乎仍然很遥远。

  10月28日,“AI教父”杰弗里·辛顿表示,科技公司计划在18个月内将AI大模型的计算规模扩大100倍,为此他和约书亚·本吉奥、姚期智三名图灵奖得主联合发文,呼吁管控AI快速进步的风险。“若被正确和公正地应用,先进的 AI 可以为人类解决长久以来的问题,如疾病、贫困和环境问题……AI也可能会固化甚至加剧全球的不平等,”他们在文中警告称。

  正是带着同样的期望和担忧,今年10月盖茨基金会将2023年大挑战(Grand Challenges)年会的举办地点选在了非洲最西端的塞内加尔首都达喀尔,重点关注生成式AI对全球健康和发展议题的助益。

  《每日经济新闻》记者受邀参加了为期三天的活动,和多个受盖茨基金会资助的AI项目负责人、科技产业领袖交流,聆听专家的圆桌讨论,整体感受是潜力很大,挑战不小。然而,正如比尔·盖茨和不少非洲领导人反复说的那样,非洲在新冠疫情时未能及时获得疫苗,这样的事情不应该再重演。在大模型起飞之初就让中低收入地区参与进来,对于公平利用AI技术至关重要。

  “效率提高了50倍,3个月做了60本书”

  “你能相信吗,马里教育体系讲授的语言,99%的人都不会在生活中使用,”说起自己开发非洲本土语言教材的初衷,迈克尔·利文撒尔(Michael Leventhal)感叹道。

  马里是西非面积第二大的国家,曾经是法国的殖民地。1960年独立之后,法语仍然是教育和官方体系的语言,而本地人说的班巴拉语,则是一门书写体系尚未完全规范化的弱势语言。近10年前,在硅谷工作多年的美国人利文撒尔来马里短期“支教”,被这里缺乏教育资源的状况触动,最终扎下根来,把推动班巴拉语的教学为人生新志向。

  技术出身的利文撒尔曾在芯片巨头美光工作过,对前沿科技并不陌生。三个月前,在获得了盖茨基金会10万美元的资助后,他迅速行动起来,探索如何把生成式AI运用在教育上。

  利文撒尔对《每日经济新闻》记者表示,班巴拉语教学的一大痛点是阅读材料的匮乏,生成式AI在这一块能发挥很大的作用。他的团队用英语或法语往GPT-4输入故事的想法“种子”,让它来填充内容,然后再把故事翻译成班巴拉语。随后,他们用Stable Diffusion的文字生成图片技术,给故事配上生动的配图,这样就做出了一本图文并茂的儿童读物。

  利文撒尔和他的班巴拉语图书 图片来源:每经记者 李孟林摄

  “我很喜欢读中国的《红楼梦》,所以我就问ChatGPT,这本书里面有什么会是非洲儿童感兴趣的情节?然后从那个点出发,发展出一整个故事,”利文撒尔对记者举了一个例子。仅在3个月时间里利文撒尔的团队已经做出了60本书。他表示:“这些事情并不是说人类做不来,但是AI把效率提高了50倍。要知道,世界银行资助的非洲语言童书项目,一年也才能编写20本。”

  这些故事书已经在不少社区中心和学校试用,孩子们都很喜欢。近期马里的国家语言政策委员会开会,商讨改善该国65%的文盲率问题,已经表示要从利文撒尔这里订购50万本故事书做教材。

  同利文撒尔的项目一样,还有近50个来自中低收入国家的AI项目分别获得了10万美元的资助,涉及医疗、教育、农业和普惠金融等领域。不少项目的负责人在交流过程中对记者表示,AI大模型能节省人力物力投入、降低满足需求场景的技术门槛,这对资源紧缺的地区而言至关重要。

  50个受资助项目交流现场 图片来源:每经记者 李孟林摄

  坦桑尼亚索科因农业大学的助理讲师蒂欧弗里达·马金加(Theofrida Maginga)原本在研究利用物联网(IoT)技术监控玉米疾病的早期征兆。现在,她的团队利用ChatGPT技术开发了聊天机器人,能够及时向文化水平不高的小农户提供玉米疾病的诊断意见和解决方案。对于靠玉米挣到一半收入的当地农民而言,这些指导的重要性不言而喻。

  蒂欧弗里达·马金加 图片来源:每经记者 李孟林摄

  最重要的是,这个工具可以直接在类似微信的Whatsapp里面使用,只需加个好友就行,不用单独安装应用,而且能用当地的斯瓦西里语语音输入和输出。“用最简单的方式帮助农民决策,这是我们一直的目标。农民觉得我们的技术很亲切,希望这能成为他们日常生活的一部分,”马金加对记者表示。

  南非健康基金会的斯科特·马奥尼(Scott Mahoney)看重的则是大模型处理大量文本的能力。每年,世界卫生组织(WHO)、医学研究协会以及各国的卫生部门都会发布大量的临床医疗证据,需要靠人力分析才能形成临床指导建议,这是一个耗时耗力的过程。

  “高收入国家有很多付费的临床指南,但订阅费要250美元到500美元一年,相当于(发展中国家)医护人员一年工资的5%到10%,这是一个很大的障碍。”马奥尼表示。“另一方面,从临床证据的出现到其实际应用于临床实践,大概需要10到17年的时间,加速这一进程可能会改变很多病人的命运。”

  马奥尼所在的团队希望用GPT-4和微软云Azure的机器学习平台去提炼出这些文件里的实用建议,给医护人员做决策参考。目前,他们已经就180多页的WHO文件做了试验,发现机器得出的结果和专业编辑团队的重合率可以达90%,显示出这一路径的潜力。

  在“大草原硅谷”,所有人都在看大模型

  在2022年11月ChatGPT横空出世之后不久,《时代》杂志的一则新闻报道将世人的目光引向了远在非洲的肯尼亚。据报道,OpenAI在这里雇佣了外包的数据标注人员,员工的低薪、工作时长和精神压力引发不少批评。

  实际上,肯尼亚的科技创业氛围在整个非洲位于前列,首都内罗毕的科创产业区甚至有“大草原硅谷”(Silicon Savannah)名声。大模型的爆发让当地创业圈子看到了远不止外包审核的产业机会。

  “肯尼亚是通往非洲的重要门户,人口结构年轻,开发者社区规模很大,而且还在快速增长。大模型带来了一个激动人心的时刻,可能根本性地改变很多商业策略。”非洲移动支付应用M-Pesa的金融科技负责人朱丽安娜·罗蒂奇(Juliana Rotich)对记者表示。

  朱丽安娜·罗蒂奇(右)与比尔·盖茨(左)等嘉宾讨论AI前景 图片来源:盖茨基金会

  罗蒂奇是肯尼亚科技界举足轻重的人物。她联合创立的灾情信息开源软件Ushahidi已经被新西兰、日本等发达国家采用。在内罗毕,她联合发起了孵化空间iHub,成为当地创业者的基地。

  同样来自内罗毕的托尼·恩东古(Tonee Ndungu)也是一名创业“老兵”,创立过孵化中心,还是教育科技公司的Kytabu的创始人。和一众受资助项目相比,他的项目要成熟得多:在已有的K-12教育软件里引入ChatGPT,为不同年级的学生提供个性化的学习辅导。

  “内罗毕的每个创业公司都在看大模型带来的机会。不管你是做健康产业,还是教育、保险,都需要个人化的服务,而AI能提供更快、更便宜的个人化服务,这真是一个分水岭时刻,”恩东古对《每日经济新闻》记者表示。

  在恩东古看来,肯尼亚人一直很推崇技术,而且肯尼亚的智能手机渗透率已经非常高,市场爆发的潜力已经具备,而大模型降低了很多功能开发上的门槛,这正是肯尼亚科创企业急需的。

  就在恩东古来大挑战年会的前几天,亚马逊云科技(AWS)在内罗毕开设了新的办公室。肯尼亚2022年通过了数据保护法律,对本国公民的数据存储在海外做了严格限制。“有了AWS,创业者可以合法地收集数据了,再加上开源大模型,我们可以做很多本地化的改进。”恩东古表示。

  潜力巨大,但还有很多工作要做

  来自南非的卡罗琳·戈瓦森(Caroline Govathson)的工作重点是HIV防治。她的团队用大模型开发了一个HIV感染风险评估应用,希望既能解决医生资源不足的问题,也能让潜在感染者放心咨询。

  “我看到了AI巨大的潜力,来参会的人也都这么说,但是还有很多进一步的工作要做。”她对记者表示。

  卡罗琳·戈瓦森 图片来源:每经记者 李孟林摄

  的确,虽然与会者洋溢着对AI大模型的乐观情绪,但毕竟从项目征集到大挑战年会的现场展示交流只过去了三个月,很多项目还处于验证概念或试运行阶段,而不少难点和痛点已经暴露了出来。

  首当其冲的是大模型在跨文化应用上带来的本地化不足的问题,毕竟互联网上的语料还是以英语等强势语言为主,来自中低收入国家的小语言视角相当匮乏,AI生成的内容常常与本地文化格格不入,甚至带有冒犯性。

  编撰班巴拉语教材的利文撒尔对这一点体会颇深,比如他想要ChatGPT写一个关于非洲的故事,系统给出的内容却更像是欧洲人写的幻想小说,是外国人想象中的非洲,与实际情况相去甚远。

  戈瓦森同样表示,不少非洲人的文字输入能力有限,对智能设备的熟悉程度不高,只能依赖于语音的输入和输出。要确保咨询内容的准确性,如何让模型更加熟悉本地的俚语就是一个必须要处理的问题。

  此外,虽说大模型的生成能力能替代很多人力,但要真正用好还是要颇费一番功夫,对使用者的技能要求很高。

  “我写了一辈子的代码,我可以说写Prompt(提示语)比写代码还难。你首先要理解这个系统的原理,还要熟悉马里文化,懂得语言学知识和教学法。普通人拿ChatGPT来玩可以很有乐趣,但是要得到高质量的结果,还是需要专家,”利文撒尔表示。

  恩东古的教育软件不是单纯引入ChatGPT,而是需要拿自己的题库做训练和微调,这就在智力和算力上提出了更高的要求。“智力资源是一大挑战。开发产品的难度很高,我们不得不到欧洲去招聘人才,”恩东古表示,“另一方面,儿童学习的内容必须确保准确,要杜绝‘幻觉’的出现。因此我们的项目需要进行测试,而每跑一次测试的价格高达4000美元,这很贵。”

  恩东古展示教育软件的个人化AI功能 图片来源:每经记者 李孟林摄

  南非的马奥尼则持乐观心态,相信快速迭代的AI技术能够解决掉很多问题:“当然,大模型还有很多局限,但是我们也要看到大模型发展的现实情况。三个月前的困难,到今天可能已经完全消失了,这可能是通过模型的微调,或者提高应用程序接口的响应速度。”

  或许正是看到了各个项目反映的困难,大挑战年会期间,比尔·盖茨宣布盖茨基金会将投入3000万美元,支持非洲建立一个AI平台,给非洲科学家和创业人士提供技术和运营上的支持,比如数据存储方面的支持。此外,这些资金还将帮助有潜力的项目进入下一阶段。

  “我们很幸运得到了(第一轮的)资助,我们工作很努力。即使没有进一步资助,这些AI生成的教材也能使用很长时间了,甚至永远被人阅读。”利文撒尔对《每日经济新闻》记者表示。

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论