欢迎来到池州三陆五信息科技有限公司- 未来科技

微信
手机版
网站地图

WAIC 2022丨集四方之智,探索架起数据要素流通市场的“路与桥_

2024-05-22 09:03:41 栏目 : 移动互联 围观 : 0次

从2021年开始,中国将陆续出台《国家信息化发展规划》、《数字经济发展规划》等重要国家数据战略,强调建设数字中国,加快数据要素市场化流通,创新数据要素开发利用机制。价值流是数据要素流的本质和核心,制度和技术是激活数据要素的“道路和桥梁”。利用技术构建互联的数据价值网络,确保数据安全和隐私,实现“数据不可见,数据不可移动”的价值。对数据产权、交易流、收益分享、安全治理等数据基础体系进行顶层设计和完善,构建多维数据价值循环体系,是数据要素市场化建设的关键“眼睛”。9月3日,在世界人工智能大会组委会秘书处指导下,粤港澳大湾区大数据研究院、开放岛开源社区、智慧投资研究与技术联盟(ITL)、FATE开源社区共同主办的2022年世界人工智能大会-数据元素流通技术前沿探索论坛,来自学术界、产业界和科研机构的30余位专家学者和行业领袖齐聚一堂,聚焦培育数据要素市场和建设基础设施体系。讨论了关键技术创新、交流和数据元素流的前沿动态和创新成果。完善数据要素市场化基础体系的重要性是毋庸置疑的,但也面临着许多困难。机构数据交易在各个领域都在“前进”,并停滞不前。其原因在于,在数据要素资源化、资产化的过程中,缺乏数据要素流通基础制度。数据元素的共享、流通、交易仍处于小规模阶段,数据元素市场供不应求,流通不良,应用深度不高。

国家信息中心前常务副主任、粤港澳大湾区大数据研究院名誉理事长杜平提出了三点建议,以激活数据元素的价值。一是深化数据要素产权、供给、流通、监管等多方面基础制度改革,推动数据要素市场化配置。第二,建设集中高效的“根服务+公共服务+计算服务”三大数据交易基础设施,建立数据元素技术服务、交易服务、计算能力跨云、跨域调度系统。第三,加快数字技术研发和成果转化进程。探索元空间生态及其商业应用场景,拓展新的数据资源生成空间和数据元素资产化证券化空间。国家信息中心大数据发展部规划处处长、粤港澳大湾区大数据研究院院长王建东认为,数据要素市场配置改革应探索在数据要素基础支撑体系的基础上,形成多层次、立体的数据交易市场体系和数据交易服务生态系统。可以着力构建全国统一的数据要素市场体系,如加强数据要素基础设施和标准规范,加大公共数据共享开放和新技术应用,发挥政府领导作用,提升产业集聚优势,创新完善监管机制和信用体系,积极开展跨境数据流试点示范项目等。中国信息通信研究院云大研究所所长何宝宏表示,数据产权的分割、保护和交易流通滞后造成了“数据孤岛”、“数据垄断”等现象,阻碍了数据元素的流通。我们认为,培育数据要素市场的核心思想是完善数据市场规则,明确数据产权,确定数据价值评估方法,加强隐私计算等关键技术创新,实现数据要素的“共性”。在数据流中扮演核心技术角色的专家们一致认为,完善数据要素市场配置机制体系将进一步推动行业发展,为中国数据要素市场定位未来的方向。在通过数字技术创新确保原始数据“可用性”的前提下,以安全可靠的方式实施数据流和集成应用,确保跨行业、跨机构数据使用的合规性和范围控制,确保数据所有权不因分发和共享而转移。在促进数据要素的流通和包容方面,这是一个关键问题。近年来,可信联邦学习、多方安全计算、可信数据空间等隐私计算技术正成为数据价值共享系统的重要技术基础,产业应用实践也日趋成熟。

中国人工智能学会(CAAI)名誉副理事长、加拿大工程院会员、加拿大王立科学院会员杨强具有可信赖的联邦学习安全性、模型性能可使用、决策可监督、模型可监督、综合等特性。他表示,将为培育高质量的数据要素市场提供基础技术支持。然而,开源对于使数据元素的流动更加顺畅和安全至关重要。“开源是数据元素流通产业发展的重要'轴心”,构建和发展开源社区,让更多的角色参与到数据流通技术生态中,是实现技术普及的必要前提之一。据Yang介绍,FATE是世界上第一个隐私计算和联邦学习开源社区,目前有4000多名个人工程师和开发人员以及800多家公司加入该社区。自2019年FATE社区发布第一个开源项目以来,国内联邦学习环境和参与者从个体战斗向生态过渡的速度大大加快。未来,社区将进一步推动建立跨平台互联和安全机制,以支持数据确认、定价、模型交易、数据交换和跨境数据交易。

华为数据首席架构师马云表示,数据元素易于复制,难以验证,难以定价,并考虑了非排他性等特点。为了让数据成为生产中的流通要素,我们必须从数据的清理、共享和受控交换开始,然后在流程中增加价值,就像数据一样。从2014年开始,华为开始探索和构建真正实现数据流的治理体系和IT平台。目前,华为正在构建企业数据库,构建具有“管入、存储、管出、执行”平台功能的EDS企业数据空间,实现企业内部高效数据共享和敏捷自助服务,实现“可信、可控、可控”。具有可验证的“平台”功能,在企业之间实现可控制的数据交换和价值释放。除了技术之外,数据流的另一个关键问题是如何平衡安全性和性能。为了最大限度地保护数据的安全性和隐私性,许多数据元素循环技术引入了大量的密码运算,使计算量呈几何增长。以完全同态技术为例,通用芯片上的密文运算速度比明文运算慢10万倍,这也是隐私计算等技术未被广泛应用的根本原因。

香港科技大学教授、智能网络与系统研究所所长、Nebula Clustar创始人陈凯表示,安全性、效率和效益的平衡与统一是数据元素循环技术大规模应用的关键。“随着硬件和软件的结合,如算法和协议的创新,计算能力硬件的加速,网络优化的加速,在保证数据隐私安全和数据建模效果的前提下,提高计算效率是非常重要的断点。陈凯表示,目前实验室和星云集群都在不断地从这三个方面提高计算性能。在算法优化方面,提出了一种基于随机掩码的奇异值分解方案。该方案的效率比同态加密高出10,000倍,误差比差分隐私方案小10个数量级,并提供安全分析和实验验证。在硬件加速方面,对12种常见加密运算符和2种核心运算符进行硬件加速,用于隐私计算应用场景中的数据建模、推理和对齐。FPGA计算功率加速器卡将端到端性能提高了30倍以上。在网络优化中,数据中心通过优化内部网络传输和WAN数据传输,实现高带宽、低延迟的数据传输。“更有效地应用隐私计算技术,挖掘数据价值,推动业务创新服务,并在应用端创造附加值,是隐私计算广泛应用的关键要素之一。在未来,我们希望数据的交易和分发能够达到与明文计算相同的效率,同时确保足够的安全性。“陈先生总结道。在圆桌会议上,来自中国信息通信研究院、粤港澳大湾区大数据研究院、中国银联、中国移动、华为、百度、成飞集团、FATE开源社区、Bitflying、Dixin Technology的专家、学者和企业代表出席了会议。与会者分别从业务和实践的角度讨论了“互连促进数据元素循环生态”和“可靠的数据空间促进数据元素循环”的主题。讨论了数据流技术与数据元素市场之间的密切关系。他们一致认为,这是激活数据元素潜力、培育数据元素市场、创新数据元素分布机制、搭建道路、实现有序、安全、合规的数据流的必然途径。

展开剩余内容

分享到:

猜你喜欢

热门标签