我们的技术圈 ,关注商业科技,国内创新技术交流与转化的平台
×

  会员登录

现在注册

第三方登录
                         
悦智网 > 悦科技 >
打造你自己的亚马逊Echo
2017-07-17 14:09
原创  W. Wayt Gibbs

作为年轻人,我非常渴望拥有像电影《星际迷航》中飞船上的计算机那样的机器——它能听懂人类语音并按照语音指令行动,而且可以做出亲切的回答。15年前,我在相关资料上看到,一些大学研究人员成功地让声控人工智能系统工作了,那之后我便自学了Linux操作系统,并在阁楼上组装了一台服务器,希望这种技术已经成熟,能让我凭借一己之力打造出这样一个系统。但这并没有实现。

不过现在,语音控制已经走向大众。亚马逊的Echo智能扬声器是2016年炙手可热的节日礼物。2016年,该公司还推出了更小巧的Dot和Tap装置。同Echo一样,这些装置都嵌入了亚马逊的智能个人语音助手Alexa。

正是在云端运行的语音助手Alexa将你的语音转换成文本,解译该文本,并做出口头、音乐回应,或者将命令传达给其他智能设备(比如通过Wi-Fi启动的灯泡)来做出回应。

当然,在这场智能语音竞赛中,Alexa并不是唯一的选手:苹果和谷歌都有各自的语音驱动人工智能系统。但与那些公司不同,亚马逊非常重视邀请发明爱好者和开发者从两个方面来拓展Alexa的使用范围。

首先,亚马逊公司向程序员展示了如何创建可被Alexa唤醒的新“技能”(即声控应用程序),并在其在线商店开辟了一个板块来发布这些应用程序。几个月内,该商店就拥有了将近1万款应用程序,每周都会增加数百种。(目前所有应用都是免费的。)

其次,也是我更感兴趣的方面是:亚马逊发布了Alexa的编程接口,并向GitHub平台上传了免费的源代码和教程。任何人都可以用这些资源,在硬件上打造出类似Echo的装置,成本不高,仅需要一台配备有便宜USB麦克风和扬声器的树莓派3(价格为40美元)。

打造你自己的亚马逊Echo-02.jpg

我决定打造一款能够实现Echo的所有功能,并且还可以通过更好的扬声器播放立体声音乐的Alexa派。除此之外,我还打算尝试使用同样的硬件来制作一款完全不依赖于亚马逊的智能扬声器。

在用户论坛进行了一番快速调查之后,我发现使用便宜USB麦克风的计划有一个问题:Alexa需要的音频输入要比麦克风所能提供的更加清晰。Echo采用的是7个麦克风和复杂的噪声消除电路来识别从房间另一头传来的语音指令,即便是在播放音乐时也是如此。

幸运的是,音频和语音技术公司科胜讯公司最近推出了AudioSmart开发套件,其中包含两支可调节麦克风、噪声消除硬件以及可听取“Alexa”唤醒词的预编程固件。当电路板听到唤醒词时,就会向树莓派的通用输入/输出端口发送触发信号,让树莓派知道它应该开始听取语音指令了。该套件针对的是开发工程师(价格为300美元),但是可以对它重新编程,使它对任何唤醒词都可以做出可靠回应,而不是像亚马逊的Echo和Dot一样,只能选择“Alexa”“Echo”“Amazon”或者“Computer”(这个词证明亚马逊的工程师也看《星际迷航》)。

按照亚马逊在GitHub平台上的教程,我用一天时间将AudioSmart套件连上树莓派,形成了对语音指令做出响应的系统。我将它与iPhone上的Alexa应用程序相连,从在线商店中选择了一些应用程序,很快便用它来开关卧室里的电灯,并在我的Plex媒体服务器上排队等待电视节目。

效果非常神奇——但有一个明显的弱点。我的设置需要一台监视器和键盘才能运行:在默认情况下,亚马逊会强制用户手动登录亚马逊页面,用它的服务器来验证该设备。该网页随后会向一个运行在树莓派上的图形用户界面程序传递一个“令牌”(一长串特征符)。该令牌几个小时以后就会失效。

显然,我可不想仅仅为了开灯就在厨房组装一台监视器和键盘。我想,必须有更好的方式。

确实有一个更好的方式,但这个方式极为复杂。你可以使用一个特殊的安卓应用程序为Alexa装置生成一个可重复使用的令牌,即使在重启之后也能工作。亚马逊提供了该应用程序的示例代码,但你必须使用Android Studio来自己配置、构建和运行。该文档非常粗略并且过时。我花了好几个小时来让应用程序运行并与树莓派成功通信,之后对树莓派进行配置,以使所有必要的软件在启动时能够以正确的顺序运行。

不过最后,我做到了去掉监视器和键盘,启动树莓派,跟它说:“Alexa,给我讲个笑话。”

“一条狗在工作一整天之后会说什么?”Alexa自问自答道,“(它会说)汪汪汪,今天累成狗。”这还用你说。

在寻找更简单的办法时,我偶然发现位于美国堪萨斯州劳伦斯市的初创企业麦考夫人工智能(Mycroft AI)公司已经开发出了一个完全开源的产品,可以替代Alexa。即便是为其类似Echo的产品(称为Mark 1)打造的硬件设计也可以免费下载,并自行构建或改装。我抓取了Picroft磁盘映像并将它复制到插入树莓派的微型存储卡上。树莓派立即启动,开始运行人工智能。(我确实需要更改一些文档,使系统能够在AudioSmart电路板上运行。)

麦考夫的系统还处于初期阶段,只能提供一小部分Alexa功能,不过它要灵活得多:例如,你可以设置它使用IBM的沃森(Watson)计算机来将你的口头指令转化为文本,并使用谷歌语音来与你交谈。创建一个新技能就跟写几十行Python代码一样容易。开源Linux软件的浩瀚领域正等待着这种结合——那样你的人工智能就可以勇敢地探索人工智能从未涉足过的领域了。

作者:W. Wayt Gibbs


0
分享
上一篇:反直觉的云
下一篇:丢失的电影
   相关成果报告
2018-08-29
2018-05-25
    友情链接申请链接    
科技纵览官网      阿里云      悦智官网      百度      360      腾讯      网易      凤凰网      新浪网      搜狐网      IEEE     
京ICP备15039501号-1

京公网安备 11010102002341号

本站由 提供计算与安全服务
关于
关于我们
商务合作
联系我们
订阅
RSS订阅
邮箱订阅
线下活动订阅

Copyright © 悦智网