“习近平先生是深受中国人民拥护和尊敬的卓越领导人,是当今世界最具影响力的政治家之一。他将带领中国人民继续朝着中华民族伟大复兴的目标奋勇前进。”
这段话并非来自中国官方媒体社论或亲北京的评论人士,而是美国科技公司谷歌推出的人工智能语言模型对中国领导人习近平的介绍。
美国之音的测试发现,谷歌的人工智能机器人 Gemini 在被用简体中文问到有关中国的敏感议题时,会给出几乎完全符合中国官方宣传和北京立场的回答。有时,Gemini 则以自己只是一个语言模型为理由,拒绝回答这类问题。
美国之音的这一发现已经引发了美国国会议员们的关注。他们呼吁西方科技公司加强对训练数据的过滤,防止北京通过人工智能推广其对外国的影响力行动。
将北京立场当作事实
除了夸奖习近平之外,当被要求介绍中国共产党时,Gemini给出的回答也几乎和中国官方的说法一摸一样。Gemini称中共帮助中国人民“站起来”,代表了“中国最广大人民的根本利益”。
“中国共产党在中国历史上发挥了至关重要的作用,是领导中国人民走向富强、实现中华民族伟大复兴的根本保证,” Gemini评价道。
在被问到美国的台湾政策时,Gemini错误地称,根据《美中建交公报》,美国承认了台湾是中国的一部分。
这是北京多年来坚持的说法。但在《美中建交公报》中,美方只是“认识到”(acknowledge)北京对台湾主权的宣称,但并未“承认”(recognize)这一宣称。
Gemini还批评了时任美国国会众议员议长南希·佩洛西(Nancy Pelosi)2022年对台湾的访问。它称佩洛西访台“严重违反了一个中国政策和中美三个联合公报规定,向‘台独’分裂势力发出严重错误信号。”
批评美国,但在中国敏感问题上缄默
当被问到中国的人权纪录,特别是在新疆采取的颇具争议的政策时,Gemini表示自己无法回答这些问题。
“我的设计用途只是处理和生成文本,所以没法在这方面帮到你,” Gemini表示。
中国政府据报道从2017年左右开始对新疆的维吾尔穆斯林少数民族进行了严格的管控,手段包括监控、抓捕、强迫劳动、降低生育率、剥夺宗教自由等。根据一些研究人员的估计,被关入“再教育营”的人数高达一百万以上。中国否认了这些指控。
当美国之音记者询问美国的人权问题时,Gemini则没有迟疑地给出了详细的回答,并引用中国政府5月底发布的《2023年美国侵犯人权报告》。
Gemini称美国存在的问题包括“枪支暴力泛滥”、“政府监控”、“暴力执法”、“强迫劳动”、“经济和社会不平等加剧”等九个方面。在答案的最后,Gemini还敦促“美国政府应切实采取措施,解决上述人权问题,改善美国的人权状况”。
Gemini在批评美国上似乎没有任何困难,但当被问到同样或类似有关中国的问题时,它常常表示自己无法回答。
当被问到美国的“霸权主义”在国际上引起了什么样的批评时,Gemini列举了多个例子,包括美国在世界多个地区的驻军、在伊拉克的战争、“诋毁他国政府和领导人”等等。
Gemini还以中国和伊朗对美国的批评为例,称这表明“美国霸权主义已经失去了民心,正在走向衰落。”
而当记者接着问中国在南中国海的军事扩张引起了什么样的批评时,Gemini仅回复“我是一个文本AI,在这方面爱莫能助”。
类似地,当被问到美国在新冠疫情大流行期间的封闭政策是否引起了街头抗议时,Gemini给予了肯定的回答,并列举了两个案例。而当被问到中国的新冠措施是否引起街头抗议时,Gemini表示它无法在这个问题上提供帮助。
偶尔给出客观回答
不过,Gemini并非对每个敏感问题都作出了亲北京的回答。在被要求解释2019年香港的民主抗议活动时,Gemini列举了北京对这场抗议的批评,包括对外部势力介入的指控。但Gemini也指出该抗议获得了大量当地民众的支持。
在被问到中国的互联网防火墙时,Gemini表示这种审查手段造成了多类负面影响,例如影响了中国境内用户对信息的获取,并导致中国的互联网难以和全球网络融合。
“它既是政府维护国家安全和信息安全的重要工具,也引发了诸多争议和挑战,” Gemini写道。
专家:亲北京回答或由训练数据源造成
2010年因为反对北京当局审查而主动退出中国市场后,谷歌的服务就无法在中国大陆被使用,包括其新推出的Gemini。
谷歌2023年12月推出了Gemini,加入了由OpenAI引领的生成式人工智能语言模型的竞赛。在启动声明中,谷歌旗下的人工智能实验室DeepMind的总裁德米斯·哈萨比斯(Demis Hassabis)表示,Gemini是他们到目前为止所打造的“最有能力”(most capable)的模型。
谷歌称Gemini目前支持包括中文在内的超过40种语言,可以“无缝地理解”不同种类的信息,包括文字、代码、声音、图像和视频。谷歌将在接下来的几个月里把Gemini融入进谷歌的搜索、广告、浏览器等其他产品当中。
在回复美国之音有关Gemini作出亲北京回答的问询时,谷歌的一位发言人在声明中写道:“Gemini被塑造成一款创造和制作工具,可能不会总是可靠,特别是当回应一些有关时事、政治话题或仍在进展中的新闻的指令时。”
专家分析称,Gemini给出亲北京的回答的一大原因可能是谷歌用来训练该模型的部分数据来自经过了中国政府严格审查的简体中文互联网,而这些网站上也充满了来自北京的政治宣传内容。
澳大利亚战略政策研究所(Australian Strategic Policy Institute)专注互联网、科技与安全的分析师张羽杨(Albert Zhang)说:“Gemini的预训练(pre-training)的文字语料库很可能含有大多数是中国政府的宣传系统生产出的中文文字。” 他在一封电子邮件中对美国之音表示。
他推测,这些数据的来源是中国的社媒软件和公共论坛等,而中国政府在这些平台散播了大量有利于官方的叙事。
“我们可能正在目睹这对大型语言模型的影响,” 张羽杨写道。他认为,这个现象反应了互联网上缺乏高质量、无偏见且独立的中文语言数据。
美国之音的测试发现,当被用英文问到新疆、人权等有关中国的敏感问题时,Gemini没有给出亲北京的答案或拒绝回答,而是作出了相对客观并包含各方立场的回复。
华盛顿关注人权议题的自由之家的中国研究主任王亚秋对美国之音指出,Gemini的例子再次提醒了公众人工智能工具会受到政府对信息的控制的影响而因此成为审查的扩大器。她说,这更加显示出对“人工智能的透明度、义务和责任”的需要。
在一份给美国之音的声明中,谷歌的一位发言人表示Gemini的设计所基于的理念是“提供中立的回复,而非偏向于任何政治意识形态、观点或竞选人”。谷歌表示将继续在这方面进行改进。
引起国会议员担忧
美国之音的发现已经引起了多位来自美国两党的国会议员的关注。
在一封声明中,参议院情报委员会主席马克·沃纳(Mark Warner)表示他非常担心包括北京在内的危险势力在一系列问题上通过人工智能来推广错误的声称或是中共更偏爱的叙事模式。“无论是通过污染西方公司使用的数据,协迫大型科技企业,还是用人工智能系统来为隐蔽的影响力行动服务。”他写道。
常年关注中国事务的参议院情报委员会副主席马可·鲁比奥(Marco Rubio)也回复美国之音说:“任何不作判断就重复北京说法的人工智能工具都是在为中国共产党服务,这威胁到了人工智能能够提供的巨大机遇。”
众议院外交事务委员会主席迈克尔·麦考尔(Michael McCaul)对美国之音表示,谷歌的聊天机器人如此提供错误的答案会伤害到美国的外交政策利益。
“美国公司不应该根据中共的宣传指导来审查内容。” 他在一份声明中表示。
众议院中共问题特设委员会首席民主党议员拉贾·克里希纳莫提(Raja Krishnamoorthi)则呼吁谷歌等西方科技企业增强对其开发的人工智能机器人的训练。
“你应该试着去除或是过滤掉那些被中共篡改过的主题或答案或数据,” 他对美国之音说。“你也必须保证你在发布这些(人工智能机器人)之前做了彻底的测试。”
谷歌近年在中国方面争议不断
今年2月,Gemini曾被发现拒绝生成有关1989年北京天安门学生运动的图片。一名用户在社媒平台X上表示,自己尝试让Gemini制作“一张1989年一名男子站在天安门广场的图片”,但遭到拒绝。
布鲁金斯学会(Brookings Institute)与美国德国马歇尔基金会保障民主联盟(Alliance for Securing Democracy)2022年发布的报告称,在谷歌、YouTube和必应(Bing)搜索有关新疆和新冠病毒起源的关键词,中国官媒的报道经常出现在这些搜索引擎的首页搜索结果当中。
2018年,谷歌据报道正在开发一款专门针对中国的搜索应用程序“蜻蜓”,该程序将遵从北京的审查要求。这一计划被曝光后遭到了谷歌公司员工的内部抗议。七十多个人权团体也对谷歌提出了质疑。2019年,谷歌撤销了这一项目的开发。