http://www.cn-im.cn

  • 当前位置:首页 > 视界 > 行业资讯 >
  • 科大讯飞:让世界听见AI的声音

    导语 怀揣着“让世界聆听我们的声音”的梦想,科大讯飞依托世界领先的核心技术,引领智能浪潮,服务亿万用户,从中国语音产业的拓荒者一跃成为世界人工智能产业的领军者,而最初科大讯飞把语音作为切入点却是源于偶然……
     


     

     

            源于偶然:让机器开口说话
     
            
            科大讯飞1999年成立的时候,手上只有一项技术就是语音技术,当时的目标是让机器开口说话。
            
            胡郁笑谈:
     
            “当时我们并不知道,我们处于人工智能的范畴,至少自己没有清晰的概念。我们更加不知道的是,1999年恰恰是人工智能的第二次冬天。就像华为任总以前经常讲的一句话,华为要是知道通讯行业这么难做,可能就不会做了。我们当时也是,如果知道人工智能处于那样的环境,可能就不会创业了。这既有巧合,又是冥冥之中的注定。”
     
            “2003-2004年以后,人工智能还不是特别热,我们慢慢意识到我们做的恰好是人工智能最关键的技术。”
     
            人类的智能相对于其他动物或者相对于机器,最重要的是认知智能,而认知智能的主要来源是人类对语言的掌握和对知识的表达,然后在这个基础上进行逻辑推理和复杂的决策。以语音和语言为中心的认知革命,是人类智慧的最高水平,也是现在人工智能所面临的最大挑战。
     
            作为讯飞超脑的总牵头人,胡郁作出了这样的诠释:
     
            “2014年,我们在业界第一次推出‘讯飞超脑’计划,这不仅仅是一个口号。我们同时发布了对人工智能的定义,即运算智能。机器从发明的第一天开始,就比人类强很多,比如会下围棋的机器,就是机器运算智能的表现。还有类人机器具有感知智能和运动智能,具体表现是机器能够看到、听到、感觉到周围的世界。现在的类人和动物的机器已做得不错了。但是,人类之所以能够屹立在地球生物链的顶端,是因为人类的语言能力,我们称为认知智能。这是讯飞超脑计划的一个目标,让具备感知智能的机器从能听会说、能看会认,过渡到认知智能,即能理解,会思考。”
     
            当前,“讯飞超脑”利用大数据来进行训练以提升相关算法,这其中的“训练”指代的并不是那种填鸭式的数据输入和训练,而是来自于真实应用场景的真实交互数据,让系统能够依据真实数据实现自主学习和提升,胡郁称之为涟漪效应,就像水滴入水面产生的涟漪一样,随着产品覆盖面的不断增加,数据量级也在快速攀升,进而带来产品体验的快速优化迭代,这一切的背后都依赖于“讯飞超脑”这个强大的人工智能引擎。
     
            科大讯飞在语音合成、识别、评测,翻译等领域都拥有全球领先的核心技术。

     

     

            2005年至2018年,在全球最高水平的语音合成比赛Blizzard Challenge中,科大讯飞取得13连冠,同时科大讯飞各项关键指标均名列第一。在国际机器翻译评测IWSLT2014、NIST2015等大赛中科大讯飞连夺冠军。


            在过去6年中,科大讯飞的语音识别技术准确率从60.2%提升到98%以上。语音技术上的优势为科大讯飞向人工智能发展,同时落地行业与应用打下良好的根基。

     

            讯飞在布局当前的大数据人工智能的同时,也在关心人工智能发展的另一方面,即与人脑相结合,基于类脑计算,试图找到人脑智能的奥秘,发现其中的智能动力学,进而真正让机器具备像人一样的智能,同时不受人脑物理空间的局限,以此来实现人工智能领域真正的突破。

     

            讯飞翻译机,出境游so easy

     

            科大讯飞是真正把人工智能的应用落地了。在2010年,科大讯飞开发了世界上第二个、中国第一个语音输入法,仅次于谷歌,讯飞输入法主打语音输入,语音识别准确率超98%,同时支持22种方言的语音输入。

     

     

            在2016年,科大讯飞发布了第一个智能终端产品讯飞翻译机。

     

            2018年4月又推出了讯飞翻译机2.0,主打中文与33种语言实时互译、方言翻译和拍照翻译,并独家具备4G、Wi-Fi和离线翻译模式。

     

            翻译机86%的用户用于出境游。考虑到用户可能不会使用标准普通话,讯飞翻译机同时搭载了方言和带方言口音非标准普通话的识别能力,目前已支持粤语、四川话、东北话、河南话四大方言。

     

            方言种类还在持续增加中,并能根据用户的不同使用场景与用词习惯,准确识别并给出最符合语境的翻译结果,真正做到了落地实用。“可以说,讯飞翻译机2.0是至今世界上销量最好、好评度最高的手持式智能翻译系统。”

     

            为了构建未来人工智能产业生态体系,在2010年讯飞发布了语音云平台。目前平台上的开发者已经超过86万,连接19亿设备,每日提供近46亿次交互服务,数以百万计的开发者正在借助科大讯飞的核心技术开发智能产品,服务于人们生活的方方面面。

     

            共建AI未来
     
            科大讯飞与华为公司始终保持着紧密合作,双方充分依托各自行业领域的长期积淀优势,在电信平台、智能终端等领域建立了战略合作关系,携手推动语音及人工智能技术的深入应用。
     
            双方合作在2010年建立了世界上第一个中文语音的开放云平台。云计算能力开放以后,众多公司和开发者可以面向最终用户的各种需求,开发各种各样的产品,这就形成了生态的建设。
     
            2018年5月,华为与科大讯飞签署战略合作协议,未来双方将在公有云服务、ICT基础设施产品、智能终端、以及办公IT四大领域开展深度战略合作。
     
            双方还将面向未来开发创新AI语音应用,拓展全新行业市场,做大规模共享收益,共同做强人工智能产业生态。
     
            对于消费者市场,华为手机使用的技术中,有一部分是源于科大讯飞的智能语音技术加持。华为手机还将科大讯飞的AI技术和能力内化为华为手机能力的一部分,为其带来差异化的竞争优势。
     
            双方将基于科大讯飞的语音识别、语音合成、讯飞听见、讯飞翻译等语音AI技术和能力,围绕手机等智能终端产品以及终端云服务进行合作。
     
            对于2B市场,华为在基础设施、内部办公产品等使用科大讯飞的技术与产品,双方将基于讯飞引擎和华为云资源,共同构筑华为云EI平台。
     
            面向未来+智能的时代,胡郁认为将来的人工智能都要在云上实现。由于云计算的资源消耗比较大,将来有可能会在端计算和边缘计算上实现更好的人工智能,也许很快成为技术上的突破口。人工智能的应用也会更多地落地,真正解决问题。

    郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。