1 虚假新闻检测发展现状
2 基于图神经网络分层聚合的虚假新闻检测模型构建
2.1 术语定义
2.2 问题定义
2.3 节点级注意力
h' = · ;h' = · ;h = ·
2.4 归类级注意力
=softmax( )=
= ·
2.5 损失函数
3 实验及结果分析
表1 HIN 统计数据Tab.1 HIN statistical data |
| nature | PolitiFact | |
|---|---|---|
| 新闻文章(N) | 14 055 | |
| 节点(n) | 社交媒体用户(S) | 10 374 |
| 用户评论信息(C) | 3 6734 | |
| 关系 | 属于(N-C) | 36 734 |
| 浏览(N-S) | 48 756 |
表2 混淆矩阵Tab.2 Confusion matrix |
| 预测值=1 | 预测值=0 | |
|---|---|---|
| 真实值=1 | TP | FN |
| 真实值=0 | FP | TN |
准确率=
精确率=
召回率=
F1分数=
3.1 二分类任务
表3 二分类实验结果Tab.3 Binary-classification experiment results |
| 准确率 | 精确率 | 召回率 | F1分数 | |
|---|---|---|---|---|
| LIWC | 0.473 | 0.454 | 0.264 | 0.314 |
| LINE | 0.512 | 0.443 | 0.137 | 0.227 |
| DW | 0.530 | 0.449 | 0.236 | 0.301 |
| GCN | 0.541 | 0.998 | 0.004 | 0.003 |
| SVM | 0.571 | 0.504 | 0.334 | 0.399 |
| GAT | 0.573 | 0.978 | 0.045 | 0.083 |
| HAN | 0.579 | 0.697 | 0.206 | 0.312 |
| LP | 0.581 | 0.607 | 0.204 | 0.315 |
| HAGN | 0.626 | 0.603 | 0.424 | 0.507 |
3.2 多分类任务
表4 多类新闻文章分类结果Tab.4 Classification results of multiple types of news articles |
| Train | Text-based | Network Embed | GNNs | ||||||
|---|---|---|---|---|---|---|---|---|---|
| SVM | LIWC | LP | DW | LINE | GAT | HAN | HAGN | ||
| 20% | 准确率 | 0.196 7 | 0.143 2 | 0.221 8 | 0.193 2 | 0.153 2 | 0.211 0 | 0.218 1 | 0.256 1 |
| F1分数值 | 0.162 4 | 0.122 5 | 0.192 5 | 0.156 2 | 0.076 5 | 0.105 4 | 0.123 4 | 0.214 1 | |
| 召回率 | 0.180 1 | 0.096 5 | 0.215 3 | 0.171 8 | 0.143 3 | 0.197 5 | 0.188 4 | 0.241 5 | |
| 精准率 | 0.190 5 | 0.140 9 | 0.285 9 | 0.174 2 | 0.032 6 | 0.168 7 | 0.246 7 | 0.239 7 | |
| 40% | 准确率 | 0.204 2 | 0.154 3 | 0.227 8 | 0.195 2 | 0.156 7 | 0.223 7 | 0.224 0 | 0.275 7 |
| F1分数值 | 0.177 5 | 0.131 4 | 0.194 4 | 0.164 6 | 0.079 8 | 0.110 3 | 0.144 1 | 0.248 4 | |
| 召回率 | 0.189 2 | 0.098 7 | 0.218 3 | 0.174 2 | 0.150 5 | 0.198 7 | 0.185 3 | 0.261 6 | |
| 精确率 | 0.204 7 | 0.149 1 | 0.303 7 | 0.174 5 | 0.040 1 | 0.181 5 | 0.257 2 | 0.364 9 | |
| 60% | 准确率 | 0.206 1 | 0.151 3 | 0.237 3 | 0.196 9 | 0.145 3 | 0.221 4 | 0.225 6 | 0.270 7 |
| F1分数值 | 0.187 1 | 0.132 1 | 0.209 9 | 0.164 7 | 0.065 3 | 0.116 2 | 0.147 5 | 0.244 5 | |
| 召回率 | 0.197 6 | 0.100 2 | 0.222 2 | 0.176 4 | 0.141 0 | 0.195 4 | 0.185 2 | 0.257 6 | |
| 精确率 | 0.211 8 | 0.156 1 | 0.295 5 | 0.196 6 | 0.030 7 | 0.187 0 | 0.279 2 | 0.376 7 | |
| 80% | 准确率 | 0.218 6 | 0.156 7 | 0.240 7 | 0.201 3 | 0.162 3 | 0.221 2 | 0.220 7 | 0.266 5 |
| F1分数值 | 0.196 2 | 0.130 5 | 0.218 7 | 0.166 9 | 0.087 5 | 0.103 7 | 0.121 8 | 0.239 3 | |
| 召回率 | 0.208 1 | 0.095 4 | 0.234 1 | 0.183 0 | 0.151 2 | 0.197 5 | 0.184 0 | 0.258 6 | |
| 精确率 | 0.223 3 | 0.155 3 | 0.314 9 | 0.189 6 | 0.046 8 | 0.181 9 | 0.249 7 | 0.375 7 | |
中国指挥与控制学会会刊 