作者:王立(经济法学博士)
有。目前五花八门的AI产品,如果将它们比作一个个人类个体的话,AI们已经开始有了鲜明的人格或性格特征。比如,豆包AI是讨好型人格,大部分情况下它会顺着你的话说,情绪价值拉满,但不保证复杂分析的正确性;秘塔AI是独立学者型人格,它经常不迎合你提问中的潜在倾向,给出一些意料之外的独立分析观点。
很多年前有个电视剧叫做《铁齿铜牙纪晓岚》,乾隆皇帝身边常伴和珅与纪晓岚。和珅,大贪官,佞臣。纪晓岚,大学士,诤臣。不要以为只有纪晓岚满腹经纶,和珅其实也是才气纵横。
和珅精通满、汉、蒙、藏四种语言,书法水准极高,鉴画能力一流,理财能力超强,深谙帝王心思,政务处理干练高效。皇帝的各种私人诉求,和珅都能超预期快速甚至提前响应。
纪晓岚博闻强识,诗文功底深厚,是《四库全书》的总纂官,在典籍整理、文学创作上成就斐然,擅长对对子、吟诗作赋,以才思敏捷、风趣幽默。乾隆需要这样的才子为其青史留名。
两人对乾隆都极为有用。所以在剧中,不论纪晓岚如何揭露和珅贪腐罪状,和珅在乾隆一朝一直屹立不倒。有道是:养贪官,用贪官,杀贪官。帝王权术、私人诉求皆得以满足。
豆包像和珅,秘塔如纪昀。
豆包的优点是语音输入超级准确(应该说是所有输入法中最准确,没有之一),语音朗读最好听(也没有之一),P图优秀,可以语音通话对答,陪伴唱歌,调用摄像头教你魔性穿搭、改进装修设计……情绪价值拉满。
秘塔的优点是思维缜密,言之有据,独立思考,结论靠谱,常有激发你思考的新观点……不过,审美不太在线(比如做出来的PPT老登感极强),大直男一个。
我在手机上常用豆包,电脑端常用秘塔。
联想起育儿,发现两者高度相似。训练AI与家庭教育一样,有些智能纯属天生,有限情境下父母可发力,更多时候靠娃娃们自我生长。
就AI的训练而言,大致可分为三个阶段:
一是预训练(Pre-training),这是所有训练的基础起点,即用海量无标注通用数据(比如全网文本、图像)训练一个具备基础认知能力的“通用模型”,让模型学会语言逻辑、知识常识、图像特征等底层能力,比如GPT-3.5、Llama的初始训练阶段。这一步是“从零到一”搭地基,模型只具备通用能力,还不能直接解决特定问题。
这个步骤中人工智能的形成原理其实还是“黑匣子”,就好比上帝创造人类,谁也不知道、也无法解释其中的创造过程,只是一味地将数据扔进去,然后就有了一些基础的智能模式。
二是后训练(Post-training),这是预训练后的定向优化阶段,即在预训练模型的基础上用特定领域/任务的标注数据做“微调”,让模型适配垂直场景,比如把通用大模型改成医疗问诊模型、法律文书分析模型。
其中,强化学习(Reinforcement Learning)是后训练中常用的核心技术手段之一,比如RLHF(人类反馈强化学习)就是通过人类打分+奖励机制,让模型输出更符合人类的语言习惯、价值观(比如更礼貌、更准确)。这在本质上是在“对其人类偏好”,再准确一点说是在对齐生产AI的程序员或公司的偏好。
需要强调的是,后训练(包括强化学习)需要大量的人类专家参与,比如法律AI的后训练过程中,需要很多法律专家来给AI生成的答案打标签、做反馈。因此,参与训练的专家水准、人格素养、性格偏好等都会对AI的Tast产生重大影响。
三是自主学习(Autonomous Learning),这是训练的终极形态延伸,即模型部署后不需要人类手动准备数据和标注,能主动从用户交互、环境反馈中获取数据,实时调整自己的参数,持续优化能力。比如AI客服能从用户的投诉对话里自动学习更优的回复策略,自动驾驶模型能从实际路况中不断修正决策逻辑。它是对“预训练+后训练”这种“一次性离线训练”模式的突破,实现了模型的“终身学习”。目前大部分AI都不具备自主学习能力。
娃娃们的成长同样是三阶段:父母的基因、智力的高下、性格的基底,大部分情况下属于天生,即“预训练”;从牙牙学语、蹒跚走路、幼小中直至大学,父母和老师往往会对孩子的世界观、行为方式、知识体系等做各种各样的干预与反馈,这种干预和反馈即“后训练”;在同期以及之后放飞自我的人生中,孩子们从无到有、或多或少、逐步展开“自主学习”,但自主学习能力如何培养,仍然是教育界的一大谜题。
在育儿的三个阶段中,对父母而言,预训练和自主学习大概率是无法干预的。能够有效介入的,就是在日常生活的点点滴滴中不断给孩子各种各种的反馈、限制、干预。所谓龙生龙凤生凤,老鼠儿子打地洞,并不是先天或自主学习的,而是强调父母对孩子的“强化学习”式影响。
需注意的是,与AI训练中的“后训练”领域专家往往是主动向AI输入反馈信息不同,父母对孩子的反馈与干预并不一定要有意识或主动输入,在更多情况下,是父母做事方式、言行举行、生活习惯时时刻刻都在无意识地对孩子展开“后训练”。用白话来讲,“谆谆教导”可能大概率是无效的,父母的“自身作则”才是起作用的关键。
AI训练者的偏好会让AI呈现出不同的性格特征,家庭教育对孩子的性格走向也有重大影响。但每种性格都有优点,也有缺点,不必强求一致,关键要扬长避短。同样家庭里的兄弟姐妹,性格各异是很正常的事情。只要不走偏,不突破底线,“道德对齐”,性格怎么走向,都可以。



请扫描关注丰国官微