仅凭聊天频率这个算法就能辨别谁是潜在网络违法者

人工智能 5 年前

5.59W

随着网络的普及，网络违法事件也成为了不容忽视的社会问题。互联网消弭了潜在违法者和受害者之间的时空距离，使得人人都有客观条件违法，而人人也有被伤害的危险。中国司法大数据研究院发布的《网络犯罪特点和趋势(2016.1—2018.12)》报告指出，社交类平台，尤其是QQ、微信等已经成为虚拟犯罪的主要工具，不法分子通过它们在网络上策划、实施犯罪行为。

这种过程不需要现实接触，因此非常难捕捉，给执法带来了许多困难。

近日，日本德岛大学的计算机研究者联合日本大型网络公司代理商Cyber Agent在《人类行为计算》上发表论文，他们用机器学习的方法，分析了Cyber Agent旗下一款社交类游戏的使用数据，并且在不监测聊天内容的情况下，仅基于聊天次数、聊天对象、聊天时间等基本信息，就能较为精准地识别出潜在网络违法者，并预测出违法行为的大概时间。

“疑犯追踪”的理论基础

这不是一个异想天开的想法。尽管在游戏中大家只是依靠网线交流，但我们在网上的行为也留下了海量数据，为预测网络违法行为提供了丰富的材料。

研究者基于两种传统犯罪学理论开发了这套算法：日常活动理论和社会传染理论。

日常活动理论提出，许多犯罪行为并不是随机发生的，犯罪者和被害人往往在日常活动中有交集。例如，在现实生活中，小偷在盗窃前会去目标地点踩点，并观察目标人物的行为规律；同样的，网络上的犯罪者更需要提前与“猎物”取得联系，套取信任。因此，玩家的社交活动数据中或许就藏着“犯罪预告”。

另外，社会传染理论还补充了重要的一点：违法倾向或违法行为也会传染。最常见的例子就是网络暴力。网络暴力往往来源于某种过激情绪的广泛传播：在群体的裹挟下，有的人不知不觉就失去了独立判断能力，无意间成为了网上的施暴者。有研究指出，在“目睹”群体内其他人的网络骚扰行为后，旁观者也很容易对同一名受害者发起攻击，或者尝试骚扰其他人。这样的传染行为也为预测网络违法事件提供了重要的对象和时间线索。

在这两种理论的基础上，研究者选择了是一款名叫Pigg Party的手机游戏。它主打社交功能，用户登录账号后，可以装扮虚拟的房间和个人形象，与朋友或陌生人以私聊、群聊、公聊的方式进行交流。研究人员采用擅长从复杂数据中提取特征的算法——多层非线性模型，对55万用户6个月内产生的聊天数据，包括每名用户的聊天频率、聊天时间、消息的接收者等进行了分析。

想做坏事的心逃不过AI的眼

研究者组合多种神经网络模型和算法，搭建了预测违法事件的人工智能。性能测试结果显示， AI能根据用户数据，较为准确地预测未来的违法者和受害者账户。输入用户两个月内聊天的时间、频率、对象，AI对接下来两个月内违法账户的预测准确率可以达到84.85%，对受害者账户的预测准确度也接近85%。

除了对个体账户违法或受害的风险有较好的预测能力外，只需提供一周内的用户活动数据，AI就能基本精准地预测接下来的一周网络社区里发生违法事件的时间，对小时和日期的预测准确率高达95.83%和85.71%，并且结果与预测受害给出的时间相吻合。更有趣的是，AI分析数据后预警发生违法事件的时间，并不一定处在以往发生违法事件的时间段中，可见它掌握的并不仅仅是固定的规则，还有违法者言行中的真正“逻辑”。

可进行违法预测的AI将海量、零散分布的用户日常活动记录压缩转化成可以定量分析的数据，并从中提炼、理解规律，最终形成了强大的预测能力。研究者认为，借助AI，系统管理员能更好地维护网络安全和用户权益。尽管目前的AI并且不能进一步预测违法事件的具体类型，但它或许能抓住网络上“隐形”的违法者，更好地保护我们的安全。