百度的人工智能新产品,是一个计算机速记员 —

数据｜案例

百度的人工智能新产品,是一个计算机速记员

执牛耳网编辑Aira 发表于 2017-03-16 22:05

摘要：这个过程就相当于用机器算法取代了速记员、听写员的工作。SwiftScribe 会在广泛的领域内带来积极影响,提高生产力,包括医疗机构、法律、商业和媒体。

来源：好奇心日报

阅读数： 13734

百度用人工智能技术做了新产品。

　　百度硅谷实验室(SVAIL)周一上线了网页应用 SwiftScribe，基本的功能是把音频资料转录成文字。在一篇博客文章中，项目主管 Tian Wu 说他们解决了一个重要的“痛点”：消耗大量时间的逐字听写转录。

　　SwiftScribe 目前还处在内测阶段，并未开放，不过你可以通过一个演示示例了解它是怎么工作的。SwiftScribe 支持上传时长 1 个小时以内的 wav 或 mp3 文件，目前只接受英文。接下来它需要花点时间生成文字，官方说法是，1 分钟的录音需要不到 30 秒、1 小时的录音需要 20 分钟左右。

　　接下来你会在网页上看到转录好的文字，但这并不意味着转录结束。文本不会区分大小写、没有标点符号，更没有分段，你需要在文本框中手动编辑，然后再做导出。这个过程也会被百度记录，就像所有的人工智能学习过程一样，它用来帮助算法纠正错误，提高准确率。　　

　　文本框底部有一排工具栏，播放按钮开启，一个高亮的标识会跟随语音标出阅读的进度，方便你停下来查看这个单词对应的语音。这个工具栏还有变速、标记的功能。

　　这个过程就相当于用机器算法取代了速记员、听写员的工作。“SwiftScribe 会在广泛的领域内带来积极影响，提高生产力，包括医疗机构、法律、商业和媒体。”Tian Wu 在博客中说，专业领域的人工听写效率低，1 小时的录音往往需要花费 4-6 个小时，每分钟语音的成本在 1 美元，SwiftScribe 能把完成工作的时间平均缩短 40%。

　　Tian Wu 在接受采访时表示，他们以后还会增加对视频文件的语音识别支持，也会添加自动插入标点符号等功能。

　　语音识别并不是什么新鲜事物，你手机里的各种语音助理比如 Siri、 Cortana 都基于此，用户关心的唯一问题可能是到底识别的准确性有多高。

　　按照 Tian Wu 的介绍，SwiftScribe 基于他们的最新研究成果 Deep Speech 2。2014 年百度的首席科学家吴恩达刚刚入职百度不久，就带着一个 10 人的团队开发 Deep Speech，一套语音识别系统。

　　当时的研究重点在怎么提高嘈杂环境下的英语语音识别准确率。百度收集了 9600 个人 7000 小时的语音样本，添加了 15 种噪声，把样本扩充到 10 万小时。吴恩达说这套系统的错误率比同期的微软 Bing Speech、Google Speech API 等竞争对手低 10%。

　　2015 年，硅谷人工智能实验室又发表论文公布了 Deep Speech 2 ，这个系统开始学习汉语，也提高了对不同英语口音识别的能力。

　　到 2016 年，百度利用 Deep Speech 技术推出基于 Android 的语音输入应用 TalkType，强调输入法对“语音优先”。同一年，Deep Speech 2 还入选了《MIT 评论》评出的“ 2016 年十大突破技术”，入选的理由是“语音识别技术让智能手机变得更易操作”。

　　可以确定的是，百度之后还会花费更多的精力、更多的钱来支持人工智能的研究，这是李彦宏反复提及的最新故事。

　　上个月的财报电话会议上，李彦宏说会压缩百度糯米和百度外卖的补贴和营销费用、公司的未来在人工智能领域：“人工智能是改变互联网和传统工业的一个巨大机会。”

　　与之对应的是，百度 2016 年的营收涨了 6.3%、净利润少了三分之二。这是百度自成立以来，年度净利润首次下跌。而百度总收入中，依然有九成以上来自广告业务。

喜欢： 0

不喜欢： 0

0条评论

作者

执牛耳网编辑Aira

本网编辑。所转载稿件仅代表作者观点，不代表执牛耳立场，最终解释权归原作者所有。

文章：1478

“最会玩的小饼干”进军元宇宙，阳狮集团到底帮奥利奥做了什么？

执牛耳 2021-11-03 14:59:06

70262

关于我们

【执牛耳新媒体｜数字营销技术邦】

Digital Marketing Technology Space

——更懂营销的科技商业报道

提供复杂商业环境中的优质数字营销内容，为数字营销业界领袖带来立体式阅读。执牛耳新媒体（www.zhiniuer.net）定位为“数字营销技术邦”，于2015年12月25日全面上线。以打造全球数字营销技术领域首席媒体平台为目标。目前团队积极依托专业素养，全力为数字营销领域从业者搭建有质感的交流空间，执牛耳新媒体内容传播矩阵至今已与百余家互联网企业、媒体传播公司、品牌主、业界品牌活动等建立了深厚的内容交流关系。

网站编号：2415825 主办单位证件号码：110105018978892

信息产业部备案管理系统网址/工信部网站：http://www.beian.miit.gov.cn

反馈建议、业务咨询与媒体合作：13051575215

投稿邮箱：zhiniuerox@163.com

内容主编微信号：AdMarketer

官方微信账号：执牛耳［zhiniuer］、执牛耳传媒［zhiniuermedia］

寻求报道QQ：2603466379

关注我们

1、本网站刊载的所有内容，包括但不限于文字报道、图片、视频、图表、标志标识、商标、版面设计、专栏目录与名称、内容分类标准等，均受《中华人民共和国著作权法》、《中华人民共和国商标法》、《中华人民共和国专利法》及适用之国际公约中有关著作权、商标权、专利权以及或其它财产所有权法律的保护，相应的版权或许可使用权均属本网站所有。

2、凡未经执牛耳新媒体书面授权，任何媒体、网站及个人不得转载、复制、重制、改动、展示或使用执牛耳网站的局部或全部的内容或服务，或在非执牛耳网站所属服务器上建立镜像。如果已转载，请自行删除。同时，我们保留进一步追究相关行为主体的法律责任的权利。

3、本网站摘录或转载的属于第三方的信息，目的在于传递更多信息，并不代表本网站赞同其观点和对其真实性负责，转载信息版权属于原媒体及作者。如其他媒体、网站或个人擅自转载使用，请自负版权等法律责任。

4、对网站上、网站下设的个人主页（专栏主页）以及与本网站链接的其他网站上的信息的准确性以及因该信息而产生的任何纠纷与损失不负任何法律责任。如发现上述信息存在问题欢迎通过电子邮件方式与我们尽快联系。

5、本站之声明以及其修改权、更新权及最终解释权均属【执牛耳新媒体www.zhiniuer.net】所有。

友情链接

备案号：京ICP备15025886号-1 网站编号：2415825 主办单位证件号码：110105018978892 信息产业部备案管理系统网址/工信部网站：https://beian.miit.gov.cn

首页

庖丁解牛

牛耳空间

生态圈

牛栏

活动

我的

投稿