第98章 相长(四)(1/2)

投票推荐 加入书签 留言反馈

    处理完沈晴的需求,魏宏思重又回到完善项目建议书的工作中。

    他登入公司的中央伺服器,找到对音频文件进行预处理的标准模型,将沈晴录制的八个音频文件导入,加工整理成八个数据包。

    接下来,就又要用到CMS了。身为IR1和CDU两个项目组的技术核心成员,魏宏思已经拥有了这个系统的常规功能使用权限,不必再做任何申请。

    本书由??????????.??????全网首发

    智维的认知镜像系统(WD-CMS)是一套基于认知科学的AI系统,它的核心功能是对人类的认知行为进行模拟丶解析与反向重构。

    之前魏宏思对CMS的使用,主要围绕「看」这个功能,现在则是要让它去「听」。

    其实CMS的功能不止于此。它还有「嗅觉」和「味觉」,只不过功能未发育完全,仍处在类似于婴儿的程度,远远不如「视觉」和「听觉」强大。

    之所以会有这麽大的差异,主要是受到了硬体条件的制约。

    相较而言,视觉与听觉对应的传感器,如摄像头丶麦克风等,技术已经相当成熟,信号采集非常便利,并且易于数位化成像素阵列或声波波形,数据格式相对统一。

    而嗅觉与味觉则涉及到复杂的化学分子识别,需要高精度丶高特异性的化学传感器阵列来将气味或味道转化为可量化的多维度数据。这类传感器的灵敏度丶稳定性和抗干扰能力,以及对海量化合物的广谱识别能力,都是巨大的挑战。

    魏宏思把做了预处理的数据包交给CMS进行解析,这是它能够「听懂」的标准格式。

    由于只是对拟采取的研究方法做补充说明,因而不需要做太复杂的分析,他选用了较为基础的「核心二维」解析模型。

    在这个模型中,情绪只用两个连续的核心维度来表达:一个是愉悦度,范围从-1到+1;一个是唤醒度,范围从0到1。情绪就可以表示为一个向量,离原点越远则代表情绪越强烈。

    过了不长时间,解析结果出来了。从数据来看,沈晴给的八个音乐片段还是非常有代表性的。

    比如对编号1的音频文件的分析结果为:愉悦度(-0.9至-0.8),唤醒度(0.8至0.85),处于「愤怒」情绪的区间。

    编号2:愉悦度(-0.2至+0.2),唤醒度(0.8至0.9),处于「惊讶」的情绪区间。

    其馀六个音频,分别对应着恐惧丶喜悦丶厌恶丶平静丶悲伤丶狂喜/兴奋。

    这并非对音乐片段的情绪语义做出的分析,虽然表面上看二者似乎是一回事,而是模拟了大脑在接受听觉认知信号后的复杂反应。最后结论中的情绪,只是给那一系列复杂反应贴了个标签。

    对于魏宏思来说,那八个音乐片段表达的是什麽情绪并不重要,他关注的是听了某个音乐片段后大脑会产生什麽样的反应。

    举个例子,比如说摇滚乐,喜欢的人听了会愉悦丶兴奋,不喜欢的听了则会感到烦躁甚至愤怒。魏宏思并不在乎摇滚乐本身要表达的情绪,他只关心具体的听者所产生的心理反应。

   &nbs-->>

本章未完,点击下一页继续阅读

章节目录