Task 4: Hyperpartisan News Detection
- Download Data
- 本地地址:
- 提取完xml地址:
- 转id后地址:
- 训练集80w,验证集13.3w
数据 | 正样本 | 负样本 | 比例 |
训练集 | 533334 | 266667 | 2:1 |
验证集 | 66666 | 66666 | 1:1 |
测试集 | 66666 | 66666 | 1:1 |
- 平均长度,title有8.49个单词,content有616个单词.
- 有提供测试脚本,最终指标accuracy;
- 12月份会开放一个leaderboard来看排名;
- 10月1号开放数据;