深圳市北科瑞声科技股份有限公司董事长刘轶
(相关资料图)
深圳商报记者 涂竞玉 文/图
从高校教师到企业家,刘轶的梦想一直没变,就是致力于将人工智能技术与行业结合落地,带动国家人工智能行业的发展。2014年暂别校园后,他创办了北科瑞声。经过多年的努力,北科瑞声目前已经成长为智能音频领域的领军企业。
在接受记者专访时,刘轶说,未来会继续在智慧医疗、数字政务、智能交通等领域拓展更多与音频相关的创新应用场景。“用人工智能赋能行业发展,为科技自立自强贡献力量,这是我作为一个科技工作者的初心。”
受阻发音场景下,实现语音实时处理
自香港科技大学博士毕业后,刘轶先后在香港科技大学、清华大学、北京大学等高校任教,培养过很多优秀的毕业生,担任过国家第一批科技创新创业辅导师。“这些学术研究上的经历虽然还算丰富,但是对于自己来说,我在音频领域已经深耕了十余年,如何把核心技术转化为产品,并带动国家人工智能行业的发展,这才是我一直以来的梦想。”刘轶说。
带着这个梦想,他离开了“三尺讲台”,创办了北科瑞声,致力于将人工智能技术在行业落地。
谈及印象最深刻的经历,刘轶说,那是2020年1月,北科瑞声在国际上首次突破穿戴防护设备和多层口罩场景下特殊语音实时处理技术难题,实现全程非接触语音操控,研发了非接触智能语音HIS系统。
2022年以来,为了积极探索人工智能在智慧医院场景下的创新应用,北科瑞声基于自研的语音交互、5G通信和生成式预训练(GPT)模型技术,推出了语音智慧医院系统。该系统能够实现诊疗过程全流程智能化管理,通过融合多模态智能语音交互技术,突破了以HIS为代表的复杂行业信息系统中人机交互的效率瓶颈,实现了人、物、信息的全要素闭环管理。
值得一提的是,多年来,通过不断的科研攻关,北科瑞声目前已经拥有全链条核心自主知识产权,申请发明专利百余项,并作为主要单位参与了两项国家标准(智能语音识别和交互)制定,参与编制《人工智能伦理治理标准化指南》《中国人工智能开源软件发展白皮书》。
深耕智能音频,突破“卡脖子”问题
在科技工作者心中,“美”是什么?刘轶认为,美是高度的智慧和技术能力的表现,是科技工作者们不断探索和创新的结果,是科技创新所带来的改变和进步。“美又是一项具体的使命,如何用科技的力量让我们的生活和社会更美好,我认为,智能语音交互技术就能做到。”
近期,刘轶带领团队构建了语音交互的云端大型模型方向(包括AIGC语音生成,与GPT 结合的语音交互等)、面向芯片的语音交互小模型方向、秒级指数级AI自进化能力。在音频信息感知、语音识别、人机交互等方向构建了全链多模态人工智能核心技术栈。重点在一“大”、一“小”以及AI自进化领域形成技术壁垒。具体来看,“大”是指拥有中文大规模预训练模型,超过100亿级参数;“小”是指拥有芯片级小型神经网络模型,百万级参数;AI自进化能力拥有秒级指数级自主学习能力。
据了解,北科瑞声团队基于存算一体芯片的智能语音交互系统,片上计算核心实现10mW以下超低运行功耗,性能功耗比20GOPS/W以上,使用全国产制程工艺,可实现在线任务重构。代替进口美国公司的同类产品,解决高能效终端智能语音芯片“卡脖子”问题。
在行业应用方面,北科瑞声正通过人工智能模型和系统的行业化定制,在智慧医疗、智能高速交通和数字政企领域打造系列软硬一体化产品,构建云端芯全链核心产品架构,实现了国产化平台适配,从而实现了智能语音系统全链自主可控运行。
“选定赛道,不断奔跑”是刘轶奋斗的目标。他说,随着ChatGPT的出现以及火爆,自然语音语言处理领域的技术和应用正在不断进步和发展。“下一步,我们会继续在智慧医疗、数字政务、智能交通等领域拓展更多的创新应用场景。我们将继续深耕智能音频领域,积极承担国家级项目建设,积极解决更多‘卡脖子’难题。用人工智能技术赋能行业发展,实现人工智能技术真正落地应用。同时我们也会结合最新最热的技术,持续迭代产品,提升企业的创新能力,为数字经济建设贡献人工智能力量。”
责任编辑:
标签:
Copyright © 2015-2022 南极物业网版权所有 备案号:粤ICP备2022077823号-13 联系邮箱: 317 493 128@qq.com