1 相关工作
1.1 源代码摘要
1.2 知识蒸馏
2 GPT-3.5摘要和人工编写摘要的比较
2.1 研究方法
2.2 主要源代码、摘要、参与者
2.3 有效性影响
2.4 RQ1结果
3 提取GPT-3.5的知识
3.1 蒸馏过程
3.2 主要语言模型和数据集大小
表1 模型参数设置和参数量Tab.1 Model parameter setting and parameter quantity |
| Jam | Jam | Jam | Starcoder | |
|---|---|---|---|---|
| 嵌入维度 | 512 | 768 | 1024 | 6144 |
| 层数 | 4 | 10 | 24 | 40 |
| 注意力头数 | 4 | 8 | 16 | 48 |
| 参数总量 | 38 m | 110 m | 350 m | 15.5b |
3.3 评估指标
3.4 RQ2结果
表2 RQ2的METEOR得分Tab.2 Meteor score for RQ2 |
| 数据集 大小 | Jam | Starcoder | ||
|---|---|---|---|---|
| 38 m | 110 m | 350 m | 15.5 b | |
| 17万 | 33.88 | 36.71 | 40.73 | 44.8 |
| 62万 | 28.29 | 33.98 | 41.57 | 45.59 |
| 125万 | 30.19 | 35.58 | 42.63 | 46.38 |
| 215万 | 32.11 | 37.18 | 44.77 | — |
表3 RQ2的USE得分Tab.3 Use score for RQ2 |
| 数据集 大小 | Jam | Starcoder | ||
|---|---|---|---|---|
| 38 m | 110 m | 350 m | 15.5 b | |
| 17万 | 62.52 | 64.88 | 68.21 | 71.55 |
| 62万 | 57.78 | 62.84 | 69.24 | 72.15 |
| 125万 | 59.67 | 64.28 | 70.08 | 72.74 |
| 215万 | 60.43 | 64.82 | 70.85 | — |
表4 训练所需时间(小时)Tab.4 Training time required (h) |
| 数据集 大小 | Jam | Starcoder | ||
|---|---|---|---|---|
| 38 m | 110 m | 350 m | 15.5 b | |
| 17万 | 0.2 | 0.3 | 1.0 | 28 |
| 62万 | 0.5 | 1.5 | 3.5 | 97 |
| 125万 | 0.9 | 2.5 | 6.5 | 195 |
| 215万 | 2.0 | 4.0 | 10.5 | — |
4 GPT-3.5与蒸馏模型生成摘要的比较
表5 GPT-3.5和Jam生成的摘要示例, 偏好表示志愿者的选择Tab.5 Summary examples generated by GPT-3.5 and Jam, preference representing volunteer choices |
| 偏好 | 模型 | 摘要 |
|---|---|---|
| √ | GPT-3.5 | 为给定索引回收一个视图,检查索引是否在项目范围内,以及视图是否需要添加到空项目或项目列表中。 |
| Jam | 接收一个View对象和一个索引,如果索引超出范围,将视图添加到轮中,并将emptyItems标志设置为true。 | |
| √ | GPT-3.5 | 从缓冲区读取下一个字节并返回相应的字符,如果没有足够的数据则抛出异常。 |
| Jam | 从缓冲区读取一个字符,如果没有足够的数据可用,则抛出异常。 | |
| √ | GPT-3.5 | 使用给定的属性(如用户ID、类别、描述、开始/结束日期、最低出价和名称)将一个新项插入数据库中。 |
| Jam | 使用指定参数将一个新条目插入数据库表中。 | |
| √ | GPT-3.5 | 根据其ID在Physical2DEnvironment中搜索特定的Physical2DObject并返回它。 |
| Jam | 根据给定的ID从ArrayList中检索一个Physical2DObject。 |
中国指挥与控制学会会刊 