(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210587455.2
(22)申请日 2022.05.27
(71)申请人 江苏大学
地址 212013 江苏省镇江市京口区学府路
301号
(72)发明人 李致远 何恩寒 徐丙磊 毕俊蕾
吴越
(74)专利代理 机构 南京智造力知识产权代理有
限公司 32382
专利代理师 王军丽
(51)Int.Cl.
G06F 16/36(2019.01)
G06Q 20/38(2012.01)
G06Q 20/40(2012.01)
G06N 20/00(2019.01)
(54)发明名称
一种基于知识图谱的区块链匿名追踪方法
及电子设备
(57)摘要
本发明公开了一种基于知识图谱的区块链
匿名追踪方法及电子设备, 首先根据已知可疑地
址账户按照交易价值进行筛选, 得到交易发生时
间及相应地址账户范围, 并根据交易的流向及价
值对区块链进行切片分析; 然后通过对切片分析
后得到的图谱进行依存句法树分析提取出图谱
中隐含的逻辑规则, 其次使用GraphSAGE算法学
习得到各个节点在低维空间的向量表示 以供逻
辑推理分析任务使用。 紧接着由关系评估函数对
节点的向量表示进行评估从而推理得到节点间
潜在的逻辑 关系并采用K ‑shell算法评估节点在
区块链网络中的重要程度, 最后使用可视化工具
将节点的重要程度或影响力表示出来 以观察节
点间的关系及影 响范围, 推测出地址账户间的隐
藏关系, 从而发现实体间的关系。
权利要求书4页 说明书8页 附图4页
CN 115269858 A
2022.11.01
CN 115269858 A
1.一种基于知识图谱的区块链匿名追踪方法, 其特 征在于, 包括如下:
S1、 对区块链切片文件进行解析, 得到相应的交易信息, 如金额, 地址账户, 时间戳;
S2、 根据可疑事件发生的时间及金额, 对可疑事件的发生时间及涉及的金额大小对应
的区块链切片文件进行筛选得到相应的地址账户范围, 将 可疑地址或账户记为A={a1,…,
an}, 其中ai表示第i个地址或账户; 地址或账户的交易价值记为m={M1,…,Mn}, Mi表示在切
片起止条件间αi交易的价值 大小; 将地址账户间隐藏的规则定义为Rx, 依存句法树规则库中
的规则集合定义为R={R1,…,Rn}, 通过将规则Rx与规则库中的规则进 行匹配的得到对应的
逻辑关系;
S3、 根据上述步骤S2得到的逻辑关系及地址账户采用Graph SAGE算法进行嵌入式学
习;
S4、 对步骤S1解析得到的区块链数据进行启发式实体识别, 得到每个账户地址对应的
区块链实体, 按序号依次进行 标识;
S5、 使用机器学习 对节点间的关系进行训练从而对可疑地址分析推理得到实体间潜在
的关系;
S6、 利用KSN 算法以更加全面的网络 拓扑特征来评估节点重要程度。
2.根据权利要求1所述的一种基于知识图谱的区块链匿名追踪方法, 其特征在于, 所述
S1中, 区块链解析包括如下:
S1.1通过区块链的钱 包下载交易数据;
S1.2对区块数据进行结构化解析区块数据信 息, 将解析到的比特币数据的关键字段进
行提取并存 储到Key‑Value数据库中。
3.根据权利要求1所述的一种基于知识图谱的区块链匿名追踪方法, 其特征在于, 所述
S3中, Graph SAGE算法进行嵌入式学习包括如下:
S3.1从解析好的区块链数据库中读取相应数据, 如时间戳、 地址或账户关系;
S3.2将读取出的数据转化为低维向量, 其中每个地址的向量维度相同, 对相应的地址
或账户进行初始化, 使之变为固定维度的低维向量;
S3.3将区块链网络中的地址账户按照逻辑关系表示成邻接矩阵A, 其中每个地址账户
对应唯一 id, 每个id都对应着该地址账户的初始特 征表示向量;
S3.4将S3.3产生的表示地址账户逻辑关系的邻接矩阵A以及各个地址账户的初始向量
化表示(也称节 点特征)作为Graph SAGE算法的输入, 这里将 每个地址账户视为图结构中的
一个节点, 通过Graph SAGE算法的不断迭代执 行最终生成了每 个节点的向量表示。
4.根据权利要求3所述的一种基于知识图谱的区块链匿名追踪方法, 其特征在于, 所述
S3.4中, Graph SAGE算法的执 行包括:
步骤3.4.1首先对每个节点统一采样一个固定大小的邻域集, 在每个迭代k处抽取不同
的均匀样本;
步骤3.4.2其次每个节点
在其直接邻域
中聚合节点的表示转化为
一个向量
时的向量表示被定义 为输入节点特 征, 表示为:
其中
表示聚合领域的特征表示, u表示节点v的邻居, N(v)表示由邻居组成的节点权 利 要 求 书 1/4 页
2
CN 115269858 A
2邻域,
表示当前邻居节点特征, 经过聚合函数后生成邻域的当前特征表示
步骤
3.4.3在聚合完相邻的特征向量后, Graph SAGE将节点的当前表示
与聚合邻域向量
相连接, 这个连接向量通过非线性激活函数σ 的全连接层馈送, 转化为下一步骤使用的参
数, 表示为
表示为:
其中
表示在下一步迭代中的输入特征表示, Wk表示第k层的权重矩阵, σ 表示激活函数
一般为Sigmo id;
步骤3.4.4在Graph SAGE经过k次迭代后, 对特征表示进行归一化
最终
生成每个节点的特 征表示
5.根据权利要求1所述的一种基于知识图谱的区块链匿名追踪方法, 其特征在于, 所述
S4中, 对区块链实体的识别过程包括如下:
步骤4.1对所有区块链地址账户按照交易类型进行启发式实体识别, 具体如下:
步骤4.1.1将所有交易 集合定义为T, T={t1,t2,t3,…,tm}, m表示交易总数;
步骤4.1.2对于每一笔交易将其定义为一个五元组t=(I,O,VI,VO,F), I表示输入地址
账户集合, I={i1,i2,i3,…,in}, n为输入地址账户数量; O={o1,o2,o3,…,ok}, 其中O表示输
出地址账户集合,, k为输出地址账户数量; VI表示所有的地址账户输入价值总和, VO表示所
有的地址账户输出价 值总和, F表示交易费用, 其中VI, VO, F集合的计算如公式3, 4, 5所示:
其中
表示单个输入地址账户is的输入价 值,
表示单个输入地址账户os的输出价 值;
步骤4.2按照区块链 的不同交易类型对实体进行识别, 从而将不同的地址账户聚类到
不同的实体。
6.根据权利要求1所述的一种基于知识图谱的区块链匿名追踪方法, 其特征在于, 所述
S5中, 对节点向量表示关系的评估 包括如下步骤:
S5.1每个节点与其特征一一对应表示, 从网络中抽取相应的关系及实体, 并存留30%
的测试集;
S5.2使用DisMult作为打 分函数, 函数的定义如下 所示:
其中es和eo是使用Graph SAGE学习到的节点特 征表示, Rr是关系r对应的对角矩阵;
S5.3使用负采样训练机器学习模型, 对每个正样本采样ω个负样本, 即将s或o替换为
其他实体, 通过优化交叉熵损失函数使模型给正样本的打分高于负样本, 具体定义如下所
示:权 利 要 求 书 2/4 页
3
CN 115269858 A
3
专利 一种基于知识图谱的区块链匿名追踪方法及电子设备
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:53:50上传分享