在日新月异AI技术的加持下,市面上不断推陈出新各种文本转语音、文本转图片、文本转图片或语音转文本等应用与工具,人们的工作效率也因此达前所未有的高度。如今,澳洲雪梨科技大学(University of Technology Sydney,UTS)科学家更进一步开发出能将人类想法转换成文本或语音(Thought-to-text/Thought-to-speech)的新技术,一旦这个技术成熟,势必会对人类的学习、研究、工作、生活乃至整个人类文明造成颠覆性的改变。
由以人为本AI中心(GrapheneX-UTS Human-Centric Artificial Intelligence Centre,澳洲雪梨科技大学与GrapheneX合作创建)主任林进灯(CT Lin)教授带领的研究团队开发出一种便携式、非侵入性的BrainGPT系统,可以将人类心中的想法转换成实际看得到的文本。
不需大脑植入芯片,只需戴上EEG头套就能将想法转成文本
受测者会佩戴一个可携式、非侵入性脑电图 ( electroencephalography,EEG ) 头套,该头套连接到具有多任务功能的脑电图编码器,以便从脑电波中侦测到连贯性的可读句子。这套系统能从原始脑电波中识别和捕获资讯,并通过专门设计和训练的DeWave AI模型将波形脑电波信号处理转换成文本。
研究人员一共对29名参与者进行测试,这表明了这项技术可以适用于不同的人,这很重要,因为每个人都有独特的脑电图大脑信号。林进灯表示,这是首次将离散编码技术引进脑波转文本之转译过程,进而提出了一种创新的神经解码方法。与大型语言模型的集成也为神经科学和AI领域打开新篇章。该技术的研究论文已于周二(12日)在美国纽奥良举行的NeurIPS神经资讯处理系统大会上发布。
这项技术对于因瘫痪或中风而失去语言能力的人特别有帮助,它让这些用户与机器之间能进行无缝、直接且非侵入式的交流,同时进一步推动未来与BrainGPT系统结合的仿生义肢开发。对于一般人而言,该技术能将任何想法转换成文本或语音,比起手写或打字更有效率。
目前BLEU-1评估指标准确率只有40%,未来有信心提升至90%
在此之前,马斯克创立的Neuralink公司早已积极发展脑机接口,但他们采用的是永久性、侵入性且需经由手术植入脑部的技术,反观BrainGPT系统只需戴上EEG头套便能非侵入性地读取并转换脑波。而且Neuralink不得不将12只参与实验的猴子安乐死,也引起很大的争议。
比起处处受限的Neuralink,研究人员表示,BrainGPT系统可应用的领域更广,能让无法说话的人再度与人正常沟通并通过大脑活动操控设备,提供远比手写或打字更有效率的文本生成方式,还能应用在生物义肢的开发上。
但研究人员表示,该技术仍处于早期阶段,存在许多问题与挑战,目前系统在BLEU-1评估指标上的准确率只有40%。但该团队相信,未来可以将BLEU-1评估指标的准确率提高到90%。
(首图来源:视频截屏)