黑客特种兵潘少华:如何用人工智能“套路”一个骗子 | 硬创公开课
|
接下来我详细说一下实时阻断在技术上是如何实现的。
我们会在运营商网络里部署一个实时监测系统。 1、话单采集。我们会从通话记录设备里采集实时话单。 2、话单脱敏。由于谁给谁打电话这类信息是敏感信息,我们会通过特定的加密算法进行脱敏处理,从这些脱敏的数据里,无法得知特定的通话记录。
【脱敏之后的电话列表】 接收的电话,我们会进行哈希处理。对端的号码,我们会保留明文(因为可能是诈骗电话)。 3、输入机器学习系统。对于机器学习系统来说,它并不用知道电话是由哪个具体的号码拨打的,它只需要判断这种行为是不是诈骗。 通过提取数据特征,输入机器学习系统,就可以用事件模型来加以判断,最终可以分辨出哪些通话行为是诈骗行为。在这个过程中,我们不断地用云端数据和参数调整来保证检测结果的准确——误报率低的同时,尽可能多地检测出诈骗电话。
4、数据解密。把处理好的数据输入运营商的数据,进行对称解密。 5、告警提示。判断出诈骗电话之后,运营商可以做选择,利用自己的工单系统提示用户。 短信提醒:你刚才接的是诈骗电话,千万不要上当。 闪信提醒:通过手机弹窗方式,提醒用户遭遇了诈骗。 电话提醒:给用户拨打电话提示。 彩印提醒:为用户下发和号码关联的彩印。 机器学习的核心技术实现一、数据对于机器学习系统来说,最重要的是数据。这些数据来自云端的 250 万活跃诈骗号码库,包括网民举报和历史案件数据,这些作为训练样本来让机器学会如何识别一个正在拨打的电话是诈骗电话。 由于这些数据很多都来自手机客户端,所以信息更新比较及时,所以这 250 万数据是最新的。 二、机器学习系统大数据机器学习以前高高在上,但是现在已经在很多领域得到了应用。我们对于机器学习,也是开箱即用的方法,在反诈骗的特定领域进行工作。 我们在里面内置了超过五十种诈骗电话的话单模型。这其中包括几个要素,包括: 用户被叫地的分布 被叫时长分布 被叫时间分布(早晚、半夜) 用户特征 。。。 我们也并不知道这些要素和诈骗这个行为哪个是最强相关的。所以我们把数据扔到机器学习系统里,进行有监督或者半监督的学习,自动找出相关性来。
号码数据特征,大概分了六个方向。 1、号码活跃特征数据例如日呼叫次数,平均通话时长,最早最晚通话时间等等基本的统计属性。正常的一个号码,应该是呼入和呼出次数差不多,并且不会每天连续拨打。 2、号码的社交网络例如号码的好友数,陌生人通话比例,你的号码曾经给多少人打过等等。同样,社交网络还包括被拨打的号码它有哪些好友,好友和呼叫号码之间是否具有相关性等等。 3、号码的行为事件流(编辑:成都站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |




