张华平:从技术角度谈互联互通
2021-11-17 10:27:44
  • 0
  • 0
  • 0

张华平

北京理工大学教授

金句摘录:

利用数据脱敏及同台加密等技术手段,可以在保护各平台知识产权的前提下,通过互联互通进行安全和多方计算。通过技术手段可以让多利益方成为一个生态的合作伙伴。

发言内容:

前面几位专家都是人文和管理学者,法律学者比较多,我是纯粹做技术的,我就通过互联互通做一些技术上的思考及提一些解决方案。首先一个,我相信在座很多人对这个已经比较了解了,叫做梅特卡夫定律,如果一个网络在全连通前提下价值等于节点处的平方,互联互通前其实我们现在至少非常明确的是某里系和某讯系,实际上还不止,我们假设互联互通就这两个垄断前提下面,各自之间是全连通网络,分别由M和N节点,中国整个互联网的价值就是N平方+M平方的关系,我们现在要打通这个互联互通的网络之间按照同样公司可以推导出它的价值实际上变成一个新的价值,M+N的平方,这个过程当中生产要素并没有增加,仅仅是说我们打通了它们之间的连接,连接之间互联互通价值争议非常明确,两个一相减就是V,这里M和N在中国这个量是非常大的,都是以亿或者几亿级的节点,甚至有一些服务就是10亿的,所以我们很简单可以看到互联互通从推导来讲势在必行,对整个国家,对中国互联网价值来说如果不打通这里面后面的风险和危机非常大,没有前景。正如方博士提到中美之间对抗的时候不同互联网的价值包括市值的变化从这里面推导是完全可以得到的,如果再继续这样下去证明问题还会更加严峻,现在我们国家推动互联互通从理论推导来说是非常势在必行的做法。

我们现在讨论更多的是第一个层面叫做链接的互联互通,其实也有很多种,一个是我的链接可以在即时通讯,包括在聊天过程当中,包括看视频过程当中可以来打开,另外一个链接应用类可以转化或者分享到群聊或者社交网络,比如在抖音的时候可以进行购买电子商务的行为,平台内部链接可以发给第三方应用。第二个层次就是现在考虑的不算太多,现在已经有一些但是是局限于很多大的平台本身自己的生态系统,我们叫做服务平台的互联互通,目前大部分应用都是基于云服务,云服务过程当中其实很多的应用提供了第三方的可以很方便调用的API或者开发的接口,因此我们有很多网站就可以利用微信、微博的用户认证,有些还可以利用它的征信和支付功能,这是在服务上的互联互通。包括小程序等等,其实从技术角度来看我们现在每一个人做的工作都是可以开放出我的服务协议,只要征求我的服务协议,我的大量能力其实都是可以推广应用,这样的话用户用起来会更加简单。这是第二个层次。第三个层面,现在建造的非常少,学术界做学术研究的时候数据的互联互通做的非常好,比如说我们做任何一个算法会公开的测试,这个在学界都是以有多少人用了我的数据,做了多少研究为荣,包括有多少源代码被利用为荣,但是现在中国互联网大的企业方面,这方面做的远远不够,对比来看像美国很多企业其实做的非常棒,比如说谷歌、安卓、Facebook大量平台是开放源代码的,数据互联互通包括数据可导入可导出,自己的东西可以随时拿走可以随时给别人用。第二个是爬虫,比如说我们现在很多网站信息,默认的都是对爬虫开放的,这里头也是变相的一个数据共享,当然也有很多问题,大家可以看到右边(图),前两天刚刚的一个案例,这个案例非常有意思,新浪被湖南蚁坊起诉,包括新浪的数据也有确权问题,法律上不多讲,比如我发的微博内容就是为了让别人看到,最终实际做法新浪做成自己的资产,最后蚁坊被新浪起诉判不正当竞争,判了五百多万的赔偿,现在蚁坊在湖南发起反诉讼,诉讼它们数据垄断。同样在推特上因为日常要做一些社交网络的分析,我们需要这种数据,我们自己的真实感受却爬取新浪微博数据,阻碍是非常大的,推特做的非常好,有公开的API,新浪也有,但是限制非常多,要付大量费用,推特上应该来说是整个开放、互联互通做的非常到。还有源代码,包括知识产权,甚至说大家可以看到现在它们做的比较好的是大量的开放了知识产权。这个道理在哪儿呢,右边找了一个图,我们能力是越大,责任越大,我相信像今天的包括前面学者讲到的我是很认同的,当你用户规模到了一定规模的时候,你其实不仅仅是一个企业,你是一个社会公众平台,从这个角度来看中国互联互通任重道远,今天仅仅是走了第一个层次的一步到两步,后面其实还有更多工作要做,我们还有期待有更多潜力可以发挥出来。我对中美互联网企业做了基本的对比,细节不去讲了,美国典型的就是F、A、A、N、G,我们要看到今天很多很好的技术,包括深度学习实际上来自于谷歌,对于今天人工智能技术的迅猛发展是起到了不可估量的作用,它们是在创新引领全球,包括我们对于语言的理解,谷歌Bert,Facebook的GPT3.0,对于社会语言做预测,可以自动写文章,所以有很多有意思的工作它们都在推动,包括云计算平台,还包括操作系统等等。尤其是谷歌也好、Facebook也好它们大量的会收购一些小的在创新生态当中的厂商,比如说Instargam十亿美金收购,而我们的BAT,美团也好,字节跳动也好,我们的应用创新在哪儿呢,坦率的讲有一些工作,但是给我们印象最深的是什么?是我用算法逼着快递员跑的更快,不断超越极限,把这个记录从原来数据缩短成原来的两倍,只有原来的一半,让快递员增加大量的受到伤害,出车祸的概率,包括游戏、金融,今天很多互联网都在变相做一件事就是用自己的数据资源通过金融的方式放贷,都是变相做一些回收,包括买。实际上很大情况下创造一个新的生态但是对于我们线下社会的生态其实起到了巨大的破坏作用,包括创新生态破坏者形象其实很难洗白,我只是列举了一些某讯的情况。

为什么会这样?我们也对美国的一些,比如说TikTok,就是抖音境外版,一边向星辰大海进军,一方面在往下,往底层空间压榨我们底层的这些人的生态呢,大家可以看到根本的就是格局不一样。第一张图是Facebook在科研、研发的投入,Facebook最高期研发投入接近30%,就是营收的30%,这里头包括谷歌,也是接近于15%、20%,百度的话稍微好一点,我们看一看腾讯,这么多年来我们公开分析到的数据从来都没有超过10%,阿里公司大家可以看到实际上阿里从2017年就开始走向末路,从来没有超过10%,就算它顶峰期都没有超过15%。它们的经费,它们的投入到底放在哪儿呢,不好听来说用来挖沟、筑墙,扩大自己的小网络,其实就是格局的差异所以会导致背后的一系列的差异。互联互通之下其实有很多争议、争执的部分,比如反欺诈的分析,如果来自于两家,现在很多欺诈或者说我们不良的信贷原因都是什么呢,一个人从不同平台不断借钱,最后还不上,假如A公司和B公司借贷打通的话,同样这个手机号,一个手机号在平台里面姓张,另外一个平台里面姓郑,如果这个数据一打通很显然欺诈问题一下子就可以大量的降低它的不良贷款率,可以提升整个金融率。很多企业会争辩一个问题,凭什么把我辛辛苦苦拿到的数据给你呢,有没有技术手段解决?其实现在在技术方面是有很好的技术,一方面就是数据脱敏,个人数据我们有很好的脱敏技术,时间关系不去展开来讲。现在脱敏技术有三代,都有非常好的可适用性。怎么取去标识,保护个人隐私的前提下。还有一种情况就是同台加密,我的原始数据不愿意给你,我又想判别这个人有没有在我们这里有欺诈行为,就像类似于刚才那个计算,其实各自的数据都可以做加密,加密完了之后这种数据可以做各种计算,最后得到结果,就像类似刚才的情况,一旦碰到,这个时候对两家都有帮助,所以我想解密,我想看看这个人到底是谁,因为在你那边也发现了他有借贷,而且用不同的名字。互联互通在保护各自知识产权的前提下,数据版权前提下,在互联互通可以进行安全和多方计算的行为,包括医院的数据、政府的数据还有厂商的数据,通过技术手段成为一个生态的合作伙伴,尤其是在恶意竞争对手,包括半诚实竞争对手下都有一些成熟的方法。包括如何做安全的多方计算问题,现在这块的技术,包括谷歌等等都开放了一些源代码,技术手段上绝对有好的解决方案来实现我们的互联互通。这是部分技术方案(图)。

最后做一个小结,从国家利益来讲,互联互通可以释放巨大的潜能,从理论来看中国的互联网其实要跟世界互联网相通。从更高格局来看,未来一定是做整个的互联互通,这是必然的趋势。这是对于整个互联网家族,以及中国互联网价值增值来说都是非常有益的,也是非常有必要的一个工作。从社会创新角度来讲,一鲸落万物生,互联互通会为中小企业提供一个好的生态,会成为生态扩展主力军,如果在一个强垄断环境下中小企业没有安全感,它的精力不会用在创新、创业上,更多的会用在站队,同时我们目前大的企业在互联互通大趋势下一定要从挖沟筑墙到创新转变,短期会有阵痛,长远来看会给它带来更大的价值。比如说某度,如果生态仅仅变成了你的某度内网,搜什么东西都在你的内部,最终结果一定是这个生态不愿意再赋能了,这里面就变成了自弹自唱。最终其实它的价值会下降的,某度就是因为后面垄断的能力在下降,所以大家可以看到它的科研投入在政府,才会有后面的一些创新改变,才会有一些升级,有一些新的机会。最后就是从个人角度来讲回归互联网的本质,因为共享、便利、消除信息不对称才是中国和世界真正的互联网。

 
最新文章
相关阅读