LDC2009T10(Language Understanding Annotation Corpus)是 LDC 于 2009 年 3 月 17 日发布的英阿双语语义语用标注语料库,聚焦信念、事件 / 实体共指、对话行为与时间关系四层标注,适配语义理解、机器翻译与文本摘要等任务。以下是详细介绍:
基础信息
| 项目 | 详情 |
|---|---|
| 发布机构 | Linguistic Data Consortium(LDC) |
| 发布日期 | 2009 年 3 月 17 日 |
| 语种 | 英语(6949 词)、阿拉伯语(2183 词),合计超 9000 词 |
| 数据来源 | 电话对话文本、新闻专线、邮件、广播新闻、广播对话、合同、书面说明等 |
| 标注内容 | 承诺信念、事件 / 实体共指、对话行为、时间关系四层语义 - 语用标注 |
| 应用场景 | 语义理解、语用分析、机器翻译、文本摘要、信息抽取、信念挖掘、事件时序推理 |
| 版权信息 | 多机构联合版权,遵循 LDC 用户协议,仅限授权用户使用 |