之前,在白洞计划的很多期里,我们都在讨论以深度学习为代表的AI与产业融合的细节。
其中,数据收集困难、处理任务困难、模型训练成本高等。,这已经成为了一句俗语。在众多解决方案中,近年来最常被提及的词是“图网”技术。
简单来说,就是一个基于图形数据的神经网络。它的特点是可以从一开始就读取数据,尤其是非结构化数据之间的隐藏联系。
比如深学看到一张照片,只知道“你长得像照片里的另一个女人”,而图王却知道“你长得像她,是因为她是你妈妈,这个时候她还想打你”。论逻辑推理能力,后者是不是强大得多?
但是我们应该如何训练网络技术呢?具体有哪些应用场景?坑有什么不同?真的让AI萌新人们的旧忧未解,又添新忧。本期《白洞计划》我们专门搜索了与“图数据平台”及其所服务的技术应用方实现交互安全的极致体验,共同揭秘图网在安全领域的神奇功效。
穿越生死之门:盘旋在直播平台上空的安全困境
按照节目的传统,本期我们邀请的技术应用方是直播平台。在沟通的过程中,对方的安全负责人孙总确实没少抱怨。才知道在丰富多彩、生动活泼的直播平台背后,真实的生存环境和技术迭代的需要,根本就是“南添南”。
综上所述,直播平台面临的主要安全问题有两个:
一是黑灰产生的“薅羊毛”严峻形势。简单来说,犯罪团伙通过批量账号观看直播,通过签到领取福利攫取不当利润,充当水军,领取活动红包,消费平台本该给主播和真实用户的奖励。但是,如果平台在排查问题账号时不能及时、快速、准确地识别出异常行为,就会造成一定的业务损失或者影响平台的用户体验,比如错误地为一个真实用户降低视频比特率。
二是安全防御的投入产出平衡。虽然直播平台往往有自己的安全技术团队,但从与孙总的交流中,我们知道很多黑灰黑客都在不断更新自己的技术,利用算法攻击服务器,模仿真实轨迹的情况屡见不鲜。对于这种“长期抗战”,企业自身往往在工业场景行为数据的积累和算法模型的快速迭代方面“做得不够”。如果他们在安全领域过度追求天顶技术,继续对抗,就会过度消耗企业宝贵的现金资源。
可以说,如何应用数据和AI帮助平台降低运营成本,维护健康的直播环境,提高网络安全的性价比,正在成为直播平台,也是千商万商长久生存的前提和新的匹配点。
图数据库上的安全堡垒:新兴网络保护需要什么样的AI?
为什么上述问题需要用图网技术来解决?我们或许可以从经验证的安全解决方案中找到答案。
简单来说,通过图数据+深度学习训练的图网络在新的网络安全业务中扮演着三个重要角色:
第一个角色是“守护者”。
最直观的表现就是平台运营安全的保障。
互联网领域存在许多欺诈或隐性攻击,如恶意爬虫窃取平台用户数据,或金融领域一村人组织诈骗放贷,或恶意利用电商领域平台漏洞疯狂“薅羊毛”。如何识别和检测这些异常行为已经成为一个难题。
图网络的优势在于可以发现一些“非结构化”数据之间的关系,进而更容易看到用户的行为轨迹和意图。
比如很多黑灰产品在攻击网站或应用时会使用一些自动化脚本,更高级的会模拟一些真实的人的行为轨迹,借助图数据平台对正常用户的行为数据进行分析建模。最后,生成的神经网络可以更好地找出这些“工具”留下的把柄,实现预警,为平台的数据资产安全保驾护航。
第二个角色是“精算师”。
在图形数据中加入神经网络的另一个好处是可以直观地提高平台的智能处理效率,从而有效降低运营成本。
为了理解这一点,极限交互安全实验室的闫老师给我们举了一个真实的例子。
在为直播平台服务的过程中,发现他们对音视频流媒体色情暴力内容的识别要求很高,稍有不慎就会面临App审查、整改等风险。然而,使用传统的深度学习图像分割技术,需要对每一帧进行处理和识别,相应的计算成本极高。
如何实现多维内容的毫米级精确识别,能够识别图像中复杂且相关的图形数据平台,采用分布式、并行的训练方法高效学习十亿级大图形数据,能够更好地满足此类企业的业务需求。
第三个作用是“激活酶”。
最直接的理解是激活深埋在数据库中的数据资产作为关键媒介。
严先生告诉我们,还有大约60~70%的数据没有被大家真正使用。其中一个原因是其中有大量的结构化数据,这是传统的深度学习神经网络难以处理的。
一旦这些无形资产在未来被激活,将是工业价值和业务增长潜力的巨大释放。
举个直观的例子,社交网络是最典型的非结构化数据。a关注B,B赞C的微博,D转发文章。人与人、人与内容、话题与文章之间有着密不可分的关系,很难以数据库的形式存储。
通过构建图形数据建模平台,收集这些关系数据,对上层算法进行建模,可以实现一些前所未有的分析。进而帮助平台提升用户体验,或者真正实现千人产品推送等。,这将进一步激活行业对AI的新价值想象。
当然,通过交流,我们也了解到了Extreme Experience作为图网技术的开拓者和实践者,在现实中遇到的一些现实障碍。
最头疼的问题之一是客户层面的技术疑虑。
闫先生直言,刚接触对方直播平台时,对Extreme Test的产品有一定的怀疑。一方面源于对图网技术本身的不理解,另一方面源于技术与业务能否顺利耦合的困惑。
在此基础上,通过对直播行业的充分调研,如分析平台的支出结构,Extreme Test打造了打击黑灰制作+内容模型的互动模型,提高计算效率,最终能够赢得一个兼具节约运营和工资成本双重效果的综合解决方案。
Extreme Test也告诉我们,今年7月,他们刚刚发布了一款名为Stack Map的产品,该产品基于GCN,解决各行各业不局限于安全领域的业务问题。
从这个角度来看,如今的工业智能浪潮不仅需要企业自身的认知迭代,AI技术也在一步步挑战更高的穹顶,突破自身的瓶颈。
与此同时,整个互联网和物理世界的数据复杂性将变得越来越混杂、越来越复杂。安全问题,以及业务增长、体验优化、更好的AI和技术服务等其他服务,也在这些变化中孕育而生。