来源期刊

刊名：影视艺术

主办单位：中国人民大学书报资料中心

期次：2020年10期

人工智能技术与电影录音技术变革及其美学意义探赜

收藏 |打印|下载word |下载pdf

作者：

赫铁龙/姚国强

作者简介：

赫铁龙，新加坡莎顿国际学院兼职副教授，上海大学上海电影学院博士研究生；姚国强，福建省闽江学者，福建师范大学讲座教授，北京电影学院教授，博士生导师。

原文出处：

现代传播：中国传媒大学学报

内容提要：

随着人工智能与语音识别(Speech Recognition)、计算机作曲(Composing with Computers)以及电影声音创作之间融合度的不断加深，人工智能在电影录音技术制作领域中的应用将为电影声音创作和电影声音美学带来又一次的革命。电影录音技术制作中的对白编辑(Dialogue Editing)、环境声编辑(Ambient Sound Editing)以及音响编辑(Sound Effects Editing)等工作环节的制作效率都将在人工智能技术的支持下得到显著的提升。此外，人工智能的加入将导引电影声音美学发生极大的变革，主要体现在带动电影观众接受审美模式的升级、引发电影声音制作人员创作观念的进化、推动电影声音美学理论的发展等方面。

期刊代号：J8

分类名称：影视艺术

复印期号：2020 年 10 期

关键词：

人工智能录音技术录音流程电影声音创作声音美学

字号：大中小

一、引言：人工智能技术引入电影录音领域

2016年3月，由世界著名科技公司谷歌(Google)旗下的DeepMind团队开发的“阿尔法”(AlphaGo)围棋机器人以4：1的总比分战胜韩国围棋世界冠军、职业九段棋手李世石。2017年5月，“阿尔法”围棋机器人在中国乌镇围棋峰会上，再次以3：0的总分战胜围棋世界排名第一的中国选手柯洁。两次战胜人类围棋世界冠军，让人工智能技术及其自我学习、进化能力得到普遍关注。“阿尔法”围棋机器人的工作原理被称为“深度学习”(Deep Learning)。“深度学习”是“机器学习”(Machine Learning)领域研究中的一个重要研究方向。“机器学习”则是人工智能的核心概念，是使计算机获得智能的途径。“深度学习”是学习样本数据的内在规律和表示层次，这些学习过程中所获得的各类信息对诸如文字、图像和声音等数据的解释具有很大的帮助。因为，“机器学习”的最终目标是让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据；而“深度学习”则是一个更加复杂的机器学习算法，它在语音和图像识别方面所取得的各类成果，已远远超过先前的相关技术。①“阿尔法”围棋机器人的全面胜利预示着这样一个事实，那就是以计算机人工智能为基础的新信息技术时代(新IT时代)的到来。如今，人脸识别、语音识别、地图导航、无人驾驶、智能家居等人工智能技术已然进入人们的日常生活中，并逐渐成为一种无法拒绝的生产及生活方式。

电影中的声音是构成电影视听语言的重要艺术元素。1927年，美国华纳兄弟公司出品的电影《爵士歌手》(Jazz Singer)的上映标志着有声电影时代的到来。从此，电影从一门纯视觉艺术转变成为一门视与听的综合艺术形式。声音的引入在很大程度上提升了电影的艺术审美表现能力。首先，它使得电影更加真实。无论是对白语言亦或是自然音响的加入，都使观众在观看电影时越发接近于自身的生活感知经验，极大地提升了电影的真实度和可信度。其次，声音丰富了电影的时空特性，使电影增加了一个全新的信息维度。电影从以视觉信息为主导的视觉空间进化成同时兼具视觉及听觉信息的视听空间，最终得以再现真实或梦想生活中的现实或虚拟环境。再次，声音赋予了电影讲述复杂故事的能力，形成了丰富的电影视听语言与视听思维(如画外音、闪回、声画对位等)。同时，声音亦解放了摄影机的运动形态，使得摄影机能够以更加自由、灵活的视角与声音共同进行叙事。所以，不难理解，与视觉语言以及其他种类的语言一样，电影声音也是认识世界、描述世界和理解世界的一种重要方式。

电影的艺术属性是由其工业属性决定的。在声音进入电影的不到一百年的时间里，电影艺术经历了不断的发展与变化。而电影声音的录音技术制作则经历了由“唱盘发声”到“片上发声”，从“光学”到“磁学”，从“模拟”到“数字”，由“单声道”到“立体声”，再由“多声道环绕声”(Surround Sound)到“空间声”(Space Sound)的不同革命性的发展阶段。但必须指出的是，纵观国内外，电影声音的录音技术制作工艺在数十年的发展过程当中并没有实现质的变化。早期的电影声音是记录在光学和磁性声片上的，对声音的处理需要手动地对光学或磁性声片进行物理上的剪辑和拼贴等工作，这就需要耗费巨大的人力成本和时间成本。而数字化计算机时代到来以后，随着计算机数字音频工作站(DAW)以及计算机非线性编辑技术(NLE)的引入，使传统对磁性声片上的线性剪辑处理工艺得以淘汰，从而进入到了电影声音的数字化计算机非线性编辑时代。这种将声音信号记录在计算机硬盘，通过计算机CPU、内存、DSP(数字信号处理技术)芯片和相关专业音频软件进行运算处理的非线性音频编辑方式，极大地提高了电影录音技术制作的生产效率。这种录音技术制作工艺允许录音制作人员在一个完整的工程序列中的任意位置对声音进行插入、删除、移动、叠加、淡入淡出等声音蒙太奇的艺术处理，使得曾经一个具备熟练操作技巧的录音制作人员几个小时的工作内容，在计算机平台上只要几分钟就可以完成，并且这种处理方式在流程上还是可逆的，只需一个快捷键就能够退回到编辑前的状态，这为电影录音技术制作行业乃至整个电影行业的快速发展和崛起都起到了极大的推动作用。

然而，直至今天，电影录音技术制作工艺仍然维持着这种从目前的眼光来看已然相当传统和保守的工业生产模式。通过回顾声音的发展历史可以得知，1992年美国电影《蝙蝠侠归来》(Batman Returns)和1993年《侏罗纪公园》(Jurassic Park)的上映标志着电影数字多声道环绕声时代的开启。在此后的一段时间内，形成了以Dolby SR·D(数字频谱录音)、DTS(数字影院系统)以及SDDS(索尼数字动态声音)三种数字多声道环绕声影院还音系统三足鼎立的局面。

1998年10月23日，美国悬疑惊悚影片《最后的广播》(The Last Broadcast)上映，这部影片是世界影史上第一部从拍摄、剪辑到放映等全流程采用了数字化技术，且影片时长为一部标准故事片长度的影片。该片将电影带人了全面数字化的时代，具有重要的历史里程碑意义。而数字电影的到来犹如一颗重磅炸弹，一夜之间将拥有百年工业历史的传统胶片电影推入到历史发展的滚滚洪流中。曾为全球最大的胶片供应商、世界影像巨头的美国柯达公司也在受到了数字电影冲击后于2012年申请破产保护。电影发行载体的巨变对电影的工业化生产流程带来极大的冲击与改变，各类声画素材经过后期制作完成后会输出一个数字电影发行数据包(DCP，Digital Cinema Package)。DCP作为数字电影制作和发行专门开发的数据包，可经由移动硬盘、光盘、宽带网络等形式输入进数字电影院中的播放服务器，从而对DCP进行解包以放映数字电影。当前的DCP文件在声音技术层面包含有16个声道，全部支持48KHz、24Bit无损数字音频格式，采用PCM方式进行编码和解码。过去，Dolby SR·D、DTS与SDDS之所以能够占据多年的市场份额，其原因主要在于这三种电影声音制式在胶片极其有限的物理空间上找到了用于存储数字声音信息的位置(SR·D是在片孔之间，SDDS是在胶片片边缘，DTS则在胶片上记录了与外部CD同步的TC时码信号)，并在空间局限与还音品质之间取得了良好的平衡性。这些数字电影声音的技术应用同样随着全流程数字化电影的到来画上了句号，因为数字电影已不再需要严苛地节省信息存储空间，也不再需要对声音进行各类有损压缩来进行存储和还放。

共10条结果上一页12 3 4 5 下一页全部展开

走出困境，创造辉煌

金章才

电影、...1998年第04期
纪实美学在影视剧中的生成和发展

黄俊杰

电影、...1998年第04期
好戏连台，群星璀璨

刘卫星

电影、...1998年第04期
水浒的英雄主义及其大失败的悲剧

李希凡

电影、...1998年第04期
关于电视剧《水浒传》的不同意见

李子木

电影、...1998年第04期

来源期刊

人工智能技术与电影录音技术变革及其美学意义探赜

相关文章：