(人民报)作为一名具备音乐创作和表演能力的信息技术工程师,阮黄保大(图中)这位1994年生的年轻人常被人们称作“懂代码的作曲家”。
不久前,他凭借基于人工智能技术的音乐创作模型成为被谷歌承认为其计算机科学开发技术专家的第三个越南人,成为了越南信息技术界的骄傲。
在胡志明市自然科学大学攻读计算机科学专业之后,阮黄保大成为研究自然语言处理和计算机视觉领域的人工智能的工程师,但他从未放弃从小对音乐的情有独钟。由他创作和表演的音乐短视频《IT一族》颇受技术工作者的青睐,在YouTube上获得数万人次的观看。
保大说,他有先作曲后作词的习惯。这也是他倾注最多的心血和时间的环节,因为他认为一个好的歌曲,首先要有优美的旋律。对于很多歌曲,他要花了个把月时间才完成曲子,因为要反复修改、精雕细琢。鉴于这样的现实,年轻的工程师突发奇想,打算用学到关于人工智能的专业知识来支持实现自己的音乐梦想。保大分享说:“我想人工智能能够画画,那也可以作曲。因此,我打算根据越南人的爱好和习惯设计一个针对越南人的人工智能作曲模型”。
2017年初,他正式着手研究。在两年探索、研究和尝试之后,人工智能创作音乐的模型正式问世,以一秒钟写出十首曲子的能力给人们带来惊喜。有了这个模型,作曲家只需要给出几个音符,系统就会对数据进行处理,将输入的旋律转换成各种更长的旋律。人工智能随机算法允许系统将生成完全不同的旋律版本,供听者选择,从而根据需要进行调整。该模型通过提供启发灵感的建议帮助音乐家缩短旋律制作过程,让音乐家有更多时间专注于其余环节,如和声、编曲、写词。
保大说,世界上也有了对音乐中人工智能模型的研究,但这些模型主要面向古典音乐创作,与越南人的音乐爱好有着很大不同。因此,为了打造以人工智能创作适合越南人的流行音乐、流行民谣等歌曲类型的模型,他不得不建立自己的算法。这位“工程师作曲家”面临的最大挑战是如何找到足够大的输入数据源来训练模型。想让模型具备流行音乐创作能力,就要有流行音乐的数据来源。
为此,保大只好花好几天的时间在电钢琴上弹奏和录制越南流行歌曲的旋律,并将其处理成MIDI格式。在该模型使用的三万首歌曲文件中,只有5000首是保大从朋友分享的音乐论坛上找到的,其余多达2.5万首是他自己弹奏来规范数据的。有时候,他好几天彻夜不眠,为的是重新弹奏二三百首歌曲。
此外,还要面临操作系统的挑战,因为普通的台式电脑或笔记本电脑没有足够的计算能力来训练人工智能,如果投入一整套计算机,这位年轻工程师就承担不起这个成本。拿出全部的积蓄,保大选择了租用电脑、使用云计算和按需付费的方式。在打造模型的过程中,他希望拥有既懂音乐、又具备人工智能技能的同伴,但找到满足这些条件的人似乎太难了。一个人单独拼搏有点艰难,但功夫不负有心人,这位年轻工程师的科研成果真正让所有人十分钦佩。
对于人工智能作曲模型的优越性是否导致对技术依赖度增加、作曲家音乐创作能力受限的问题,保大坦率地说,该模型的本质是帮助创作者通过对比和选择的过程节省作曲时间,但绝不是用来取代作曲家工作的全能工具。每个音乐作品必须带有风格、情感和个人印记,才能站稳脚跟,因此音乐工作者主导创作的作用是不可或缺的。
阮黄保大说,今后为了优化模型的功能,他将继续研究开发制作和弦、写词等能力,使该模型成为音乐创作者的得力助手。(完)