狗狗也有方言,当AI开始翻译动物语言
狗狗也有方言,当AI开始翻译动物语言
狗狗也有方言,当AI开始翻译动物语言界面新闻记者(xīnwénjìzhě) | 丁欣雨
界面新闻编辑 | 姜妍
你想了解猫咪发出咕噜咕噜的响声、小狗一直舔(tiǎn)人是什么含义吗?数字技术正在帮助人类实现跨物种交流的可能(kěnéng)。
根据本月(běnyuè)由国家知识产权局发布的一份专利文件,百度拟定开发(kāifā)一种能破译动物交流方式的系统,利用收集到(dào)的声音、动作数据,经人工智能(réngōngzhìnéng)识别出情绪状态结果后,再映射到语义含义中,翻译成人类语言。
而在国外类似(lèisì)的研究正在如火如荼(rúhuǒrútú)进行中(zhōng),在今年世界海豚日(4月14日)前后,谷歌也发布了一款(yīkuǎn)即将在夏天(xiàtiān)开源的“DolphinGemma”AI大模型,称其能与海豚实现水下实时交流,并对它们的后续声音序列进行预测。这种高智商的社会化物种会在从鼻腔喷出空气时发出尾音音节(coda)声来彼此交流,就像人类(rénlèi)使用摩斯密码一样。
和(hé)海豚同属(tóngshǔ)鲸类的鲸鱼们的语言同样在被研究,近期在《Nature》发表的一项研究,就是利用人工智能梳理了(le)鲸鱼近9000个尾音,发现了其内含的新特征——“弹性伸缩(rubato)”和“装饰音(zhuāngshìyīn)(ornamentation)”,鲸鱼会根据对话(duìhuà)语境,采用(cǎiyòng)在弹性伸缩、装饰音与稳定节拍间组合变换的方式,创造出独特尾音。研究人员更因此提出了一种类似于我们(wǒmen)国际音标的“抹香鲸音标”。
几十年来,鲸类动物的语言一直是自然(zìrán)声学(shēngxué)研究的重中之重,这既源自对于其他物种的探索(tànsuǒ)冲动,还有(háiyǒu)更加切实(qièshí)的诉求。1970年,美国生物学家罗杰·佩恩录制了一张全程只有海浪背景下鲸鸣声的音乐专辑《座头鲸之歌》,销量超过10万张,并激发“拯救鲸鱼”国际运动的发生,最终阻止了多种海洋哺乳动物的灭绝。

图源:unsplash
而在当下,“鲸类翻译计划(CETI)”和纽约大学(niǔyuēdàxué)法学院超人类生命项目(MOTH)也试图借鲸类动物(lèidòngwù)声音研究来促进动物新权利的诞生,影响法律裁决。他们发表在《生态法季刊》上(shàng)的一篇文章指出,了解鲸类交流的复杂性和具体内容,能揭示其在船舶交通、石油勘探和深海采矿等人类活动产生(chǎnshēng)的水下噪音中(zhōng)受到的痛苦与折磨。
在反对赋予动物(dòngwù)权利的论点中,语言被(bèi)认作是人类独有的特征。世界各地的土著社群早已意识到动物有自己的交流方式(fāngshì),而西方科学界则习惯完全否定动物交流的概念,他们更(gèng)倾向于注重视觉而非听觉,觉得(juéde)人类无法观察到的事物就不存在。而这门科学利于打破这种固定思维,也能更好地与土著群体对于鲸类动物的知识(zhīshí)传统相融合。在他们眼中,鲸鱼承载一种古老的神圣精神(jīngshén),把万物凝聚起来,2024年,新西兰(xīnxīlán)、塔希提岛和库克群岛就曾签署一项“海洋宣言”,承认鲸鱼具有法人地位。
与动物交流的创想(chuàngxiǎng)在国外也落实到(dào)了宠物领域,全球首个人宠翻译器Traini在2024年底于iOS程序推出,这款主要用来理解(lǐjiě)“狗狗语(yǔ)”的软件由一个华人团队进行开发,依靠其自主研发的PEBI(宠物情绪与行为智能)模型,收集主要来自北美和(hé)欧洲区域应用平台上的用户(yònghù)社区信息(xìnxī),目前覆盖了120个不同的狗狗品种,能够检测12种情绪,包括快乐(kuàilè)、恐惧等基本情绪和其之外的细微感受。用户只要上传相关的声音、图片和视频,就能实现(shíxiàn)翻译,且官方数据显示准确率高达至81.5%。反过来,Traini也能把用户的话语例如“看我”“一起走”转换成犬吠,传递给狗狗。
Traini的CEO孙邻家近期接受一条(yītiáo)采访(cǎifǎng)时表示,狗狗拥有的语言表达功能受到其心智程度、社会化进程、品种和生活地区的影响而呈现差别(chābié)。比如“边牧学得更快,词汇量就会更大”;而由于(yóuyú)“狗狗也有方言”,这个主要面向英文用户的AI原生应用,听不懂中国狗的情况也会出现。“当然还有一种可能,就是狗狗听懂了,但是不想做。就像一个小孩(xiǎohái)子在(zài)打游戏,你跟他说(shuō)去做作业,小孩听懂了,但他就是不想。”

社交媒体截图
就如几百年前显微镜的发明拓展了人类视觉所能触达的极限那样,人们也(yě)在依靠AI开启一个全新的声音世界。用科技记者艾德·永(Ed Yong)的话(dehuà)来说,当意识(yìshí)到动物声音也享有一套历史性的、社会性的互动代码,那些人类独有的权利也将有可能扩展到非人类动物上,同时丰富所谓“语言”的包容性(bāoróngxìng)定义、重新审视(shěnshì)人与自然的关系(guānxì)。
《听不见的(de)大自然:博物学家的自然聆听笔记》一书的作者、牛津大学环境地理学博士凯伦·巴克(bākè)还提醒我们注意,物种间的交流声(shēng)也能间接反映气候变化的问题,例如非洲大草原上鸟类和(hé)其他物种经常在黎明或黄昏(huánghūn)时刻进行合唱,是由于这些时刻空气湿度较(jiào)高,声音也能传播得更远、更快。但随着大气温度和湿度受到影响(yǐngxiǎng),它们在更干燥和炎热的环境中更难正常交流。失去相互警告威胁和找到配偶的机会,动物的安全性也会降低,最终影响到它们的繁衍和生存。

[加] 凯伦·巴克 著 邓婧文 译北京科学技术出版社 2024-3
人工智能实现的(de)跨物种交流,“既能用来(yònglái)引发更深层次的亲密感,也可能用来培养一种支配(zhīpèi)感和操控能力,从而驯化人类以前从未(cóngwèi)控制过的野生物种。”巴克称,德国的一个研究小组将蜜蜂(mìfēng)信号编码到一个机器人当中,把它送到蜂巢里,机器人能利用蜜蜂的摇摆舞交流,指示蜜蜂停止移动,并飞往特定的花蜜源。研究的下一阶段会将机器人植入蜂巢,让蜜蜂从一开始就接纳这些机器人,把它们视作群体(qúntǐ)的一员。“这样一来,我们(wǒmen)将对蜂巢拥有前所未有(qiánsuǒwèiyǒu)的控制,而且动物在军事上的使用由来已久,我觉得这会是一条值得警惕的路径。”

界面新闻记者(xīnwénjìzhě) | 丁欣雨
界面新闻编辑 | 姜妍
你想了解猫咪发出咕噜咕噜的响声、小狗一直舔(tiǎn)人是什么含义吗?数字技术正在帮助人类实现跨物种交流的可能(kěnéng)。
根据本月(běnyuè)由国家知识产权局发布的一份专利文件,百度拟定开发(kāifā)一种能破译动物交流方式的系统,利用收集到(dào)的声音、动作数据,经人工智能(réngōngzhìnéng)识别出情绪状态结果后,再映射到语义含义中,翻译成人类语言。
而在国外类似(lèisì)的研究正在如火如荼(rúhuǒrútú)进行中(zhōng),在今年世界海豚日(4月14日)前后,谷歌也发布了一款(yīkuǎn)即将在夏天(xiàtiān)开源的“DolphinGemma”AI大模型,称其能与海豚实现水下实时交流,并对它们的后续声音序列进行预测。这种高智商的社会化物种会在从鼻腔喷出空气时发出尾音音节(coda)声来彼此交流,就像人类(rénlèi)使用摩斯密码一样。
和(hé)海豚同属(tóngshǔ)鲸类的鲸鱼们的语言同样在被研究,近期在《Nature》发表的一项研究,就是利用人工智能梳理了(le)鲸鱼近9000个尾音,发现了其内含的新特征——“弹性伸缩(rubato)”和“装饰音(zhuāngshìyīn)(ornamentation)”,鲸鱼会根据对话(duìhuà)语境,采用(cǎiyòng)在弹性伸缩、装饰音与稳定节拍间组合变换的方式,创造出独特尾音。研究人员更因此提出了一种类似于我们(wǒmen)国际音标的“抹香鲸音标”。
几十年来,鲸类动物的语言一直是自然(zìrán)声学(shēngxué)研究的重中之重,这既源自对于其他物种的探索(tànsuǒ)冲动,还有(háiyǒu)更加切实(qièshí)的诉求。1970年,美国生物学家罗杰·佩恩录制了一张全程只有海浪背景下鲸鸣声的音乐专辑《座头鲸之歌》,销量超过10万张,并激发“拯救鲸鱼”国际运动的发生,最终阻止了多种海洋哺乳动物的灭绝。

而在当下,“鲸类翻译计划(CETI)”和纽约大学(niǔyuēdàxué)法学院超人类生命项目(MOTH)也试图借鲸类动物(lèidòngwù)声音研究来促进动物新权利的诞生,影响法律裁决。他们发表在《生态法季刊》上(shàng)的一篇文章指出,了解鲸类交流的复杂性和具体内容,能揭示其在船舶交通、石油勘探和深海采矿等人类活动产生(chǎnshēng)的水下噪音中(zhōng)受到的痛苦与折磨。
在反对赋予动物(dòngwù)权利的论点中,语言被(bèi)认作是人类独有的特征。世界各地的土著社群早已意识到动物有自己的交流方式(fāngshì),而西方科学界则习惯完全否定动物交流的概念,他们更(gèng)倾向于注重视觉而非听觉,觉得(juéde)人类无法观察到的事物就不存在。而这门科学利于打破这种固定思维,也能更好地与土著群体对于鲸类动物的知识(zhīshí)传统相融合。在他们眼中,鲸鱼承载一种古老的神圣精神(jīngshén),把万物凝聚起来,2024年,新西兰(xīnxīlán)、塔希提岛和库克群岛就曾签署一项“海洋宣言”,承认鲸鱼具有法人地位。
与动物交流的创想(chuàngxiǎng)在国外也落实到(dào)了宠物领域,全球首个人宠翻译器Traini在2024年底于iOS程序推出,这款主要用来理解(lǐjiě)“狗狗语(yǔ)”的软件由一个华人团队进行开发,依靠其自主研发的PEBI(宠物情绪与行为智能)模型,收集主要来自北美和(hé)欧洲区域应用平台上的用户(yònghù)社区信息(xìnxī),目前覆盖了120个不同的狗狗品种,能够检测12种情绪,包括快乐(kuàilè)、恐惧等基本情绪和其之外的细微感受。用户只要上传相关的声音、图片和视频,就能实现(shíxiàn)翻译,且官方数据显示准确率高达至81.5%。反过来,Traini也能把用户的话语例如“看我”“一起走”转换成犬吠,传递给狗狗。
Traini的CEO孙邻家近期接受一条(yītiáo)采访(cǎifǎng)时表示,狗狗拥有的语言表达功能受到其心智程度、社会化进程、品种和生活地区的影响而呈现差别(chābié)。比如“边牧学得更快,词汇量就会更大”;而由于(yóuyú)“狗狗也有方言”,这个主要面向英文用户的AI原生应用,听不懂中国狗的情况也会出现。“当然还有一种可能,就是狗狗听懂了,但是不想做。就像一个小孩(xiǎohái)子在(zài)打游戏,你跟他说(shuō)去做作业,小孩听懂了,但他就是不想。”

就如几百年前显微镜的发明拓展了人类视觉所能触达的极限那样,人们也(yě)在依靠AI开启一个全新的声音世界。用科技记者艾德·永(Ed Yong)的话(dehuà)来说,当意识(yìshí)到动物声音也享有一套历史性的、社会性的互动代码,那些人类独有的权利也将有可能扩展到非人类动物上,同时丰富所谓“语言”的包容性(bāoróngxìng)定义、重新审视(shěnshì)人与自然的关系(guānxì)。
《听不见的(de)大自然:博物学家的自然聆听笔记》一书的作者、牛津大学环境地理学博士凯伦·巴克(bākè)还提醒我们注意,物种间的交流声(shēng)也能间接反映气候变化的问题,例如非洲大草原上鸟类和(hé)其他物种经常在黎明或黄昏(huánghūn)时刻进行合唱,是由于这些时刻空气湿度较(jiào)高,声音也能传播得更远、更快。但随着大气温度和湿度受到影响(yǐngxiǎng),它们在更干燥和炎热的环境中更难正常交流。失去相互警告威胁和找到配偶的机会,动物的安全性也会降低,最终影响到它们的繁衍和生存。

人工智能实现的(de)跨物种交流,“既能用来(yònglái)引发更深层次的亲密感,也可能用来培养一种支配(zhīpèi)感和操控能力,从而驯化人类以前从未(cóngwèi)控制过的野生物种。”巴克称,德国的一个研究小组将蜜蜂(mìfēng)信号编码到一个机器人当中,把它送到蜂巢里,机器人能利用蜜蜂的摇摆舞交流,指示蜜蜂停止移动,并飞往特定的花蜜源。研究的下一阶段会将机器人植入蜂巢,让蜜蜂从一开始就接纳这些机器人,把它们视作群体(qúntǐ)的一员。“这样一来,我们(wǒmen)将对蜂巢拥有前所未有(qiánsuǒwèiyǒu)的控制,而且动物在军事上的使用由来已久,我觉得这会是一条值得警惕的路径。”

相关推荐
评论列表
暂无评论,快抢沙发吧~
你 发表评论:
欢迎