多用户支持: Siri可以为不同的声音提供响应

08 月 15 日
威锋网
5425

根据外媒 Apple Insider 的报道，苹果公司正在考虑让 Siri 能够为特定的用户提供个性化的搜索结果，使用的方法是让这个数字助手可以识别用户的身份，同时增加一种可能性，即只对一个用户的声音进行查询。

本周二，美国专利商标局(USPTO)公布了一项名为“语音输入处理的用户特征分析”的苹果专利，该专利详细描述了语音识别系统如何通过对用户的语音识别来使用已经注册的用户信息。这种识别可以通过多种方式进行，包括生物识别信息，专利表明这可能是一种“语音打印”。

这项专利将帮助 Siri 执行任务，包括只能为该用户执行的项目。举个例子，用户可以请求读取新消息，但是指定的用户配置文件将仅限于读取该用户接收的消息，而不读取其他人接收的消息。这种工作模式还可以扩展到存储在设备上的其他内容，比如用户拍摄的照片或视频。

随着用户继续使用 Siri 助手，该专利表示语音识别系统可以记录用户使用的单词和语言风格，为特定用户构建一个库。这可能包括与内容元数据对应的单词，或者用户可能使用的应用程序。

该系统还可以分析设备以前的使用情况，比如最常用的应用程序或常用联系人，以帮助构建库。这些类型的元素还将被赋予权重，以便更有可能在使用库的请求中识别相关的术语，而不是其他用户的一般查询。

识别语音查询用户的声音不仅有助于提高准确性，该系统还有潜力通过 Siri 解决一些现有的可用性问题。目前，Siri 无法支持多个用户，这可能导致其他用户滥用 Siri 的结果。它也不能对错误的输入免疫，比如最近在英国议会的一次演讲。

苹果每周都会向美国专利商标局提交大量专利申请，其中很多都获得了批准。公开专利的存在并不能保证专利文件中所描述的创意能够很快进入商业产品。

话虽如此，Siri 提供多用户支持可以大大提升 HomePod 的吸引力，最关键的是，它是一个基于软件的概念，而不需要改变硬件，这赋予了所有 Siri 设备一个很好的生产机会。据报道，iOS 11.2.5 测试版中还发现了多用户支持，代码字符串表明识别多种声音和提供定制结果的基础已经就绪，但还没有完全实现。

同样值得商榷的是，苹果已经以一种略微不同的方式，将这种数字助理的思维方式付诸实践。

上周四，苹果公司在《机器学习期刊》(Machine Learning Journal)的一篇新文章中详细介绍了如何应对提高 Siri 识别当地兴趣点(如小企业和餐馆)名称能力的挑战。苹果表示，它已经建立了定制的语言模型 Geo-LM，将用户的地理定位知识融入其中，提高了 Siri 自动语音识别系统的准确性。这些模型使 Siri 能够更好地评估用户的语音内容。

根据研究公司 Loup Ventures 最近的一项研究显示，Siri 在整体准确度上仍落后于 Google Assistant，希望这些改进真的能提高 Siri 处理用户请求的能力。

爱思助手