当前位置:首页>编程日记>正文

语音识别发展必牺牲隐私?最大问题或因不符用户预期,需增透明性

今年以来,科技巨头苹果、谷歌、亚马逊、脸书和微软的语音助手或软件无一例外被爆出“监听门”。有专家表示,在目前的弱人工智能阶段,人工监听和分析是必须的。

那么,语音识别技术发展和隐私保护之间的冲突要如何解决?9月17日,在国家网络安全宣传周的个人信息保护高峰论坛上,小米集团法务总监朱玲凤试图结合行业已有的实践操作作出回答。

“语音助手是人工智能领域非常重要的应用领域”,她指出,从2010年开始,互联网巨头通过自主研发或者并购/参股的方式开始探索智能语音行业,包括苹果的Siri,谷歌的Google Assistant和亚马逊的Alexa等。

国内阿里巴巴、百度和小米等企业也纷纷投入智能音箱市场。据调研公司Canalys预计,到今年年底,中国智能音箱保有量将超过5990万台,与截至2018年底的2250万台相比增长166%,使得智能音箱的普及率达到13%——语音助手已经成为大家生活中非常习惯的一个场景。

然而,智能语音助手市场的疯狂增长离不开海量用户数据的“喂养”,隐私问题也随之滋生。

今年7月26日,苹果被爆出雇佣外包商监听用户和Siri的对话,其中包含位置信息、联系方式等个人敏感信息。此前亚马逊Alexa、Google Assistant、微软的Skype和语音助手都被曝出类似事件。

朱玲凤表示,现在的语音识别技术还处于监管之下的机器学习,而不能靠自主学习提升识别能力。“简单的操作过程就是把粗略的语音资料输入进去,由人工进行分析,再分类标注,然后把它灌输到整个模型当中,最后用大量的用户数据去验证这个模型是不是正确。”

所以,在目前的阶段,“人类的转入和标注是语音识别技术提升必然要经过的一个过程”,她说。她还总结道,这就是用户使用语音助手产品和预期明显冲突的地方——用户不希望和语音助手之间的私人交谈被第三方转入,但是第三方语音转入确实是技术发展所必需的东西。

朱玲凤认为,不能因为不符合用户预期,就因噎废食不继续发展语音识别技术,因为这项技术确实给老人、小孩以及残障人士带来了福音。

但是,这是否意味着需要牺牲用户的隐私?

朱玲凤认为,企业应该拿出更加尊重用户隐私的态度来,并介绍了一些行业内已有的实践操作。

语音识别发展必牺牲隐私?最大问题或因不符用户预期,需增透明性 配图01

小米集团法务总监朱玲凤介绍行业已有的实践操作。

首先是企业要遵守透明性原则,让用户知道可能存在人工分析语音指令的情况,以及为什么保存这样的数据、保存多久。同时,要给用户提供一个控制机制,让用户可以选择退出。

例如,苹果在隐私事件爆发后就进行了调整,允许默认情况下不收集用户的录音,只有当用户选择加入语音改善计划之后,才会把用户的语音上传到服务器进行人工分析。

其次,还要添加别的安全措施。比如苹果Siri使用随机标识符来保存用户语音助手相关信息,这些标识符不会与用户的Apple账号和手机号进行关联。六个月后,设备的数据会与标识符取消关联。

朱玲凤还建议,企业可以同时使用一些非语音唤醒的模式,比如通过长按Home键就可以调动语音助手,这样可以避免误唤醒问题。

采写:南都见习记者 李慧琪


http://www.coolblog.cn/news/1d6f5c7369f4dde8.html

相关文章:

  • asp多表查询并显示_SpringBoot系列(五):SpringBoot整合Mybatis实现多表关联查询
  • s7day2学习记录
  • 【求锤得锤的故事】Redis锁从面试连环炮聊到神仙打架。
  • 矿Spring入门Demo
  • 拼音怎么写_老师:不会写的字用圈代替,看到孩子试卷,网友:人才
  • Linux 实时流量监测(iptraf中文图解)
  • Win10 + Python + GPU版MXNet + VS2015 + RTools + R配置
  • 美颜
  • shell访问php文件夹,Shell获取某目录下所有文件夹的名称
  • 如何优雅的实现 Spring Boot 接口参数加密解密?
  • LeCun亲授的深度学习入门课:从飞行器的发明到卷积神经网络
  • Mac原生Terminal快速登录ssh
  • 支撑微博千亿调用的轻量级RPC框架:Motan
  • java受保护的数据与_Javascript类定义语法,私有成员、受保护成员、静态成员等介绍...
  • mysql commit 机制_1024MySQL事物提交机制
  • 法拉利虚拟学院2010 服务器,法拉利虚拟学院2010
  • 2019-9
  • jquery 使用小技巧
  • vscode pylint 错误_将实际未错误的py库添加到pylint白名单
  • 科学计算工具NumPy(3):ndarray的元素处理
  • 工程师在工作电脑存 64G 不雅文件,被公司开除后索赔 41 万,结果…
  • linux批量创建用户和密码
  • js常用阻止冒泡事件
  • newinsets用法java_Java XYPlot.setInsets方法代碼示例
  • 气泡图在开源监控工具中的应用效果
  • 各类型土地利用图例_划重点!国土空间总体规划——土地利用
  • php 启动服务器监听
  • dubbo简单示例
  • [iptables]Redhat 7.2下使用iptables实现NAT
  • Ubuntu13.10:[3]如何开启SSH SERVER服务
  • 【设计模式】 模式PK:策略模式VS状态模式
  • JS实现-页面数据无限加载
  • CSS小技巧——CSS滚动条美化
  • 最新DOS大全
  • Django View(视图系统)
  • 阿里巴巴分布式服务框架 Dubbo
  • 阿里大鱼.net core 发送短信
  • 程序员入错行怎么办?
  • Sorenson Capital:值得投资的 5 种 AI 技术
  • 两张超级大表join优化
  • Arm芯片的新革命在缓缓上演
  • 第九天函数
  • Linux软件安装-----apache安装
  • HDU 5988 最小费用流
  • 《看透springmvc源码分析与实践》读书笔记一
  • 正式开课!如何学习相机模型与标定?(单目+双目+鱼眼+深度相机)
  • nagios自写插件—check_file
  • python3 错误 Max retries exceeded with url 解决方法
  • 通过Spark进行ALS离线和Stream实时推荐
  • 行为模式之Template Method模式