编辑推荐——慧眼看PDF电子书
本书是《从0到1》的美国版权商2019年全新重磅作品,智能语音入选《麻省理工科技评论》2019年全球十大突破性技术,本书为你解密苹果、亚马逊、谷歌、Facebook、微软等科技巨头的智能语音布局与商业角逐,决胜未来的智能语音核心技术、商业思维和未来趋势。《连线》主编尼古拉斯·汤普森、Siri创始人汤姆·格鲁伯、传奇预言家雷·库兹韦尔、科大讯飞创始人刘庆峰等大咖联袂力荐。
内容简介——慧眼看PDF电子书
我们正在进入语音科技时代,我们的衣食住行都将发生巨变,对着智能音箱说,我想买一件T恤,它就会为你推荐甚至帮你下单;在餐厅,服务员已经变成了机器人助手,想约一顿火锅直接打电话给它就行;在家里,电视、音箱等声控中心可以听懂你的指令,在你起床之前为你打开窗帘,煮上一杯咖啡……
你我生活常见的,用键盘或在面板上写信息、在网上搜寻资料、用遥控器换台……这些都已成为历史。未来是语音操控的时代,所有的科技大腕如谷歌、 苹果、脸书、微软、亚马逊、科大讯飞等都已经初步展示这一新科技平台。未来的连结不再是空间,而是对话!本书诉说这一重大改变的过去与未来。
全书分四个部分来讲述:第一部分“竞争”,讲述智能语音时代的竞争之战和范式转换,解密苹果、亚马逊、谷歌、脸书、微软等科技巨头的智能语音布局与商业角逐;第二部分“创新”,讲述智能语音的技术探索和创新之路,探索了语音人工智能的技术突破、个性设计和交谈能力;第三部分“革命”,讲述智能语音的革命之路,探索了语音人工智能的情感陪伴、超级智能、隐私风险和虚拟永生。第四部分“最后的计算机”,预测了智能语音的未来,并探讨了它将如何最终改变世界。
在本书中,你会了解到 :
科幻电影中出现的场景,贝佐斯和扎克伯格等科技大佬们如何把它们变成现实的?
乔布斯为什么要收购Siri公司?乔布斯为何从来没有这样执着地每天都给某个人打电话?
贝佐斯是个科幻迷,亚马逊布局智能语音领域竟然与《星际迷航》有关?
贝佐斯团队是如何秘密研发虚拟语音助理的?
Siri之父是何许人也?作为智能语音领域的“吃螃蟹者”,Siri是如何进行商业化的?
人工智能可以让人们跟逝者“对话”?
为什么说电子商务可能是在智能语音领域*的盈利模式?
机器计算、神经网络技术、深度学习技术等技术的突破口在哪里?
智能语音行业的商业模式是怎样的?
语音助理的个性是如何设计的?
智能语音的核心技术是什么?
智能语音行业的未来盈利模式是怎样的?
智能语音将如何改变世界和未来?
……
作者简介——慧眼看PDF电子书
James Vlahos是《纽约时报》、《大众科学》、《科学美国人》、《大西洋》、《智族GQ》和《国家地理》等杂志著名专栏作者,美国鬼才科普作家。James Vlahos以兴趣盎然、发人深省的方式来讨论这些复杂难懂的科学问题见长。《智能语音时代》内容十分扎实,作者从20世纪80年代开始关注和跟踪语音科技,本书是作者多年来研究成果的集中呈现。
苑东明,企业高管,独立译者,已出版译著近二十部。胡伟松中国农业大学博士,在地方政府经济部门工作,案牍劳形之余,译海寻珠为乐。
目录——慧眼看PDF电子书
第一部分 竞争
CHAPTER01 范式转移
CHAPTER02 语音助理
CHAPTER03 科技巨头
第二部分 创新
CHAPTER04 探索之旅
CHAPTER05 技术突破
CHAPTER06 个性设计
CHAPTER07 交谈能力
第三部分 革命
CHAPTER08 陪伴功能
CHAPTER09 超级智能
CHAPTER10 隐私风险
CHAPTER11 虚拟永生
后记 最后的计算机
前言——慧眼看PDF电子书
智能语音,开启万物互联时代的大门,让AI闪耀人性光芒
一位被诊断为患有晚期肺癌的父亲,在生命末期,为孩子留下了91970个单词的口述。孩子打造了一台爸爸机器人,让父亲在声音的世界里“永生”—— 这个孩子就是本书的作者。
这个令人动容的故事让我们感受到语音的温度和科技的温暖。
在中国,科技也在创造着这样的温暖。2018年年初,在全球首部利用人工智能配音的纪录片《创新中国》中,我们合成了中央电视台已故配音大师李易的声音,用技术向艺术致敬。在首映式上,李易老师的弟子们集体起立、热泪盈眶。
语音,是人类呱呱坠地后最早使用的沟通方式,也是现代人际交流最基本的方式,更是未来人机交互最重要的方式。人工智能跌宕起伏发展60多年,智能语音是发展到今天最为成熟、也是最重要的板块之一。“最近的一次范式转移正在进行中。” 作者在书中提到,这次转移正是关于智能语音的。
语音,开启万物互联时代的大门。
在互联网发展的下半场,我们将进入万物互联的新时代。随着越来越多的设备在无屏、移动、远场状态下被使用,作为人类最自然、最便捷的沟通方式,语音将会成为所有设备至关重要的入口。未来,我们将迎来以语音交互为主、键盘触摸为辅的全新的人机交互时代,人和机器之间的沟通,可能完全是基于自然语言的,你不需要去学习如何使用机器,只要对机器说出你的需求即可。
比如在导航软件中,你能听到各种明星的合成声音,可以用他们的声音为你指路;在电视上,你能看到虚拟主播播报的多语种新闻,与真人相比不仅相似度高,而且24小时无休;在居家生活中,你能通过语音控制音乐、灯光、温度,实现智慧家居;甚至在医院里、社区里,你能用语音调动机器人帮你办理事项,节省时间……人工智能已经在为我们的日常生活服务,智能生活的大门正缓缓打开。
语音,让时代更具人性温度。
智能语音是通向万物互联时代的必经之路,它的存在让交互方式拥有无限的可能,也让这个时代更具人性的温度。
20世纪90年代,我在就读于中国科学技术大学时被选进人机语音通信实验室,研究“如何让机器像人一样开口说话”。那时,团队的一个梦想是研发一台能自动翻译的电话,即使交流时语言不通,通过人工智能技术也能让我们无障碍地交流;20多年后的今天,我们自主研发的翻译机已经支持中文与50种语言的实时翻译,每个月总共为全球提供超过 5000 万次服务。智能语音让被地域、文化等因素隔离的人们也能无障碍地沟通。
此外,我们通过技术在听障和视障人群间搭起沟通的桥梁,让听障群体通过语音识别技术“看得见”声音,让视障群体通过语音合成技术“听得见”文字。2017年我们发布了“三生有幸”公益计划,目前已有几十万残障人士受益。语音转写、语音朗读为他们获取信息带来了极大便捷。我们希望,随着语音技术的使用与发展,未来每个人都将因AI而能。
语音,在万物互联时代技术门槛将会更高。
在以语音为主、键盘触摸为辅的万物互联时代,人们对语音交互提出了更高的技术期待与需求。今天,虽然在安静、发音标准的情况下,中文的语音识别准确率已经可以达到98%,英文的语音识别准确率可以达到95%,但在有方言、噪音、口音和远场的情况下,距离语音识别高准确率或许还有很长一段路要走。
以2018国际语音识别比赛CHiME-5为例,它是世界上最权威的语音识别比赛,考察在噪声和远场环境下的语音识别效果。但是让人意想不到的是,比赛主办方用最新的算法和深度学习模型做了参考系统,在测试中语音识别错误率竟高达81.14%,可以说是“史上最难语音识别任务”。科大讯飞虽然在这次比赛中取得全部四个项目的第一名,将错误率降低了35个百分点,但是距离高准确率仍有不小的差距。可以看到,在万物互联时代,语音识别技术还有非常大的提升空间,语音识别的门槛不是降低了,而是提高了。
20年前,我和实验室的同学们一同创立科大讯飞,就是认定了智能语音巨大的潜力和广阔的前景,它会让人机信息沟通无障碍。今天,看到这本《智能语音时代》,我非常高兴。作者对语音技术的发展趋势有着深刻洞察,从Siri诞生到谷歌助理、亚历克莎的规模化应用,以翔实的资料、细致的文笔讲述智能语音时代的到来及其可能带来的影响。这本书不仅是对智能语音的科普,更让读者对智能语音未来的发展有了更多的了解。
“他山之石,可以攻玉。”人工智能正在成为全球化发展的关键力量,中国的语音技术和产业也必将在其中发挥更大力量。相信本书的出版,会让更多人重新认识神秘且熟悉的语音世界,让我们一起携手,让世界聆听我们的声音,让沟通从AI开始。
刘庆峰
科大讯飞董事长
- 微信号
- 网站问题、用户注册登录请联系站长,看到第一时间及时回复。
- 公众号
- 慧眼看每日荐书,关键字找书,新功能陆续增加中,敬请关注!