您好,欢迎进入乐鱼体育电动伸缩门有限公司官网!
乐鱼体育-LEYU乐鱼体育官方网站-LEYU SPORTS

联系我们

邮箱:youweb@admin.com
电话:@HASHKFK
地址:广东省广州市番禺经济开发区 在线咨询

乐鱼体育-LEYU乐鱼体育官方网站-LEYU SPORTS科学家用AI翻译动物对话发现人类语言并不独特

发布日期:2025-03-23 09:45 浏览次数:

  乐鱼体育,LEYU乐鱼体育官方网站,乐鱼体育靠谱吗,乐鱼体育app,乐鱼体育官网

乐鱼体育-LEYU乐鱼体育官方网站-LEYU SPORTS科学家用AI翻译动物对话发现人类语言并不独特

  近年来,已有不少用生成式AI破解动物语言的尝试。本文将先讲述是哪些技术因素促成了这些进展,之后介绍几项相关研究成果,并以对未来的展望结尾。对动物语言的研究,不仅有助于我们更深入地理解和引导野生动物的行为,还能对畜牧业生产有所助力。对于爱宠人士,动物“语言”的研究或许能够让我们更深入了解爱宠的诉求,从而得以“换位思考”,更体贴地关爱宠物。而从满足好奇心的角度,这项研究有可能从进化和生理机制方面,为人类语言的产生提供新的视角。从更科幻一些的角度,破解动物语言过程中所积累的技术,也将可能用在识别外星生物的语言上。

  2024年出版的一本关于动物语言的优秀科普读物《听不见的大自然——博物学家的自然聆听笔记》,详述了近期科学家如何使用数字技术去理解自然,还谈到了过去人类在理解动物语言中走过的弯路。20世纪中期,人们曾多次尝试教非人灵长动物使用人类语言,当时的愿望是通过教它们“说人话”来评估它们的智力。这一努力失败后,人们发现这种做法有些过于人类中心主义了。正如1974年美国哲学家Thomas Nagel在一篇著名的论文中问道:“成为一只蝙蝠是什么感觉?”他得出的结论是,试图根据人类心智和身体的框架去理解动物注定会失败。为了去掉人类的视角,他表示,研究人员必须把自己放在动物的“umwelt”(环境),但人类永远无法以蝙蝠的身体体验世界。

  前文的“umwelt”是生物学家创立的一个术语,用以描述生物体的生活经历或世界观。如果我们关注某种生物的umwelt,比如蜜蜂的,我们当然不会期望蜜蜂说人类语言,但我们会对蜜蜂的迷人“语言”非常感兴趣——这是一种基于翅膀振动发声和三维空间位置的语言,蜜蜂能用身体传达非常细微的差异,比如阳光的变化。因此在理解动物语言时,我们首先要做的就是考虑动物如何用自己的方式,用自己的身体,在自己的世界观中进行复杂交流的能力。

  而在没有任何先验知识中学习到规律,正是大语言模型擅长的。大模型通过处理大量现有的语言内容来学习哪些单词应该组合在一起,以及以什么顺序组合。例如,“他喜欢加牛奶和两块糖的咖啡”,大模型学会了“咖啡”、“牛奶”和“糖”这些词经常一起使用。换句话说,大模型并不是通过被教授语法规则来学习一种新语言;也不是通过首先掌握英语,然后通过处理大量翻译内容来学习西班牙语。考虑到人类语言和动物“语言”存在潜在的相似性,比如几乎所有人类语言和动物的发声都是由音节长度和音高的停顿和变化构成的,这就为基于大模型破解动物语言奠定了哲学上的可行性。用《听不见的大自然》一书作者在FT Tech Tonic播客中说的,“你和我无法像蝙蝠一样回声定位,像大象一样吹喇叭,像蜜蜂一样嗡嗡作响。但我们的计算机可以。”

  考虑到群居动物交流的时候,往往发声的动物不止一个,因此按来源分离重叠的声音,是利用AI解读动物语言的第一步。之后要做的是收集大量的数据。这是目前的主要问题之一。因为即使经过几十年的手工录音和拍摄,科学家也只捕捉到了所需数据的一小部分。近年来,随着设备小型化、通信技术的进步,研究者可以让动物带上摄像头、录音设备或通过无人机持续记录数据,从而得以获得足够多的数据。AI模型的训练过程,还是熟悉的配方:例如向机器输入所拥有数据的80%,训练后的模型可以预测剩余20%,即动物接下来将发出什么音节。这就像语言模型基于训练数据,预测句子中的下一个单词一样。

  在介绍基于AI解析动物语言的具体案例之前,读者可以想想科学界为什么对鲸鱼感兴趣。从历史文化角度来说,鲸歌在民间传说中反复出现,人们一直怀疑鲸鱼有着自己的语言。而从生理特性上,抹香鲸拥有所有动物中最大的大脑,且以家庭为单位生存。根据“社会复杂性”假说,有着复杂社交生活的动物需要演化出复杂的语言系统来应对社交需求。事实上,人们观察到抹香鲸可通过类似摩尔斯电码的“点击”声进行交流。例如多米尼加海岸附近的一群抹香鲸使用1+1+3的声音来自我识别。前面两个是均匀间隔的“点击”,之后是三个快速连续的“点击”。随着越来越多的证据表明鲸类的交流不是随机的、偶发的、简单的,而是遵循复杂逻辑构建,这就为首先研究鲸鱼语言提供了必要性论证。

  2024年5月7日,来自重庆大学、麻省理工学院(MIT)及CETI的研究者在Nature Communication上合作发表的论文[1]可视为该项目的初步成果。该研究使用机器学习对抹香鲸录音做分析并可视化,证实了抹香鲸发出的声音是前后有关联性的,且像人类的发音那样,由不同特征组合形成。研究人员收集了来自东加勒比氏族抹香鲸的 8719 个尾声数据,构建了抹香鲸的“拼音字母表”。类似人类语言,抹香鲸发出的声音组合也不是均匀出现的,某些组合比其他组合更频繁;不同类型的尾声依次组合在一起,产生了一个更大的不同发声家族,这让人想起人类语音产生的二级组合结构(可类比拼音中的声母和韵母)。研究还发现,抹香鲸可以发出不同的尾声模式,而其他鲸鱼则能识别出不同鲸鱼发声的细微变化,表明它们有音色判别的能力。

  要想养好猪,首先要了解猪。近年已有多项研究,基于AI通过猪、牛、鸡等动物的脸部图片、视频和叫声,识别其情绪[3-6]。研究人员通过多个摄像机持续记录动物行为,然后由兽医等专业人士根据场景进行人工标注:例如猪在吃东西时是开心的,在被人拖走时是紧张的。研究人员将其作为训练AI模型的标签,然后训练卷积(对图像)或循环(对声音)神经网络模型,给动物行为进行分类;最后用专家标注的标签当作金标准,用以评估模型的准确率。这也是这类研究的一贯套路。

  同样,家畜声音也被收集训练以理解它们的情绪。一项基于411头猪,一生中的7414叫声及对应背景数据[6],研究人员开发出分类模型,区分正向和负向情绪,准确率可达到91.4%。而一项预印本研究[8]使用了80只鸡的样本,细致地记录并分析了它们在不同情境下的鸣叫。为了确保系统解读的准确性,研究者与一个由八位动物心理学家和兽医组成的团队合作,建立基于深度学习的模型,该系统可识别多种情绪,包括饥饿、恐惧、愤怒、满足、兴奋和痛苦。

  从巴甫洛夫的狗到珍妮·古道尔的黑猩猩,人们对动物语言和行为的研究,不断改变着我们认识自身的方式。我们在动物中找到人性共有的部分,再反观自身,找到人性中独特的与崇高的部分。从动物语言研究获得的新知越多,越让我们意识到和我们共享地球的生灵的复杂性。例如前述的关于抹香鲸的研究,抹香鲸能够通过节奏、语速、装饰音的组合产生复杂的语言,是除人类语言外第一个具有组合排列特征的语言系统。自从哥白尼原理将人类从宇宙的中心驱逐以来,我们又一次发现自身并没有那么特殊,这能教会我们要在未知面前保持谦卑。

  同时,这也意味着可以让更多普通人有机会成为“公民科学家”,通过贡献数据,进行干预性实验,以及参与数据分析,切身参与到第一线的科研活动。例如在很多轶事中出现的有超强学习天赋的狗,但如果只是特例的一两只,无法视作严谨的科学研究。2023年的一项研究[12]显示,通过普通人参与数据收集,有41只被认定为能根据主人指令拿起特定的玩具;基于收集到的数据,研究者进行了统计分析,发现了这些“天赋异禀”的狗的共性,甚至它们可被视为一个全新的品种。

  类似的研究,可以在众筹网站上由爱好者自行开放讨论,完善实验设计,募集所需资金,之后招募志愿者完成实际数据分析,最终合作撰写研究报告。例如笔者构想,可以让狗狗带上类似GoPro这样的相机,去记录遛狗时狗与其它动物间的互动:当遇见体型明显比自己大的狗,与体型比自己小的狗的时候,发出的叫声(或遇见同一性别或不同性别)有何差异。人们可以构建基于类似的动物互动的AI预测模型,搭建站在宠物视角的“翻译应用”。而非当下站在人类视角,将狗叫声翻译成如何想要与人互动这种“讨好型”的应用。

联系方式

全国服务热线

@HASHKFK

手 机:@HASHKFK

地 址:广东省广州市番禺经济开发区

扫一扫,加微信

Copyright © 2002-2024 乐鱼体育电动伸缩门有限公司 版权所有 非商用版本 备案号: