Hindi WordNet(官网编号 LDC2008L02)是印度理工学院孟买分校(IIT Bombay)语言技术中心(CFILT)开发、语言数据联盟(LDC)于 2008 年发布的印地语词汇语义知识库,以普林斯顿英语 WordNet 为蓝本,聚焦印地语词汇的语义关联与结构化组织,是印度语言词网(IndoWordNet)项目的核心基础资源。以下从核心信息、数据规模、结构内容、格式与许可、应用场景等方面详细介绍:
核心信息
| 项目 | 详情 |
|---|---|
| 发布主体 | 语言数据联盟(LDC),编号 LDC2008L02,2008 年发布 |
| 开发机构 | 印度理工学院孟买分校(IIT Bombay)CFILT,2000 年启动,2006 年首次公开 |
| 设计蓝本 | 普林斯顿英语 WordNet,采用 “概念优先” 原则,按词义聚类而非词条排序 |
| 许可协议 | API 与系统基于 GNU GPL 3.0,词典内容基于 GNU FDL |
| 开发背景 | 获印度通信与信息技术部 TDIL 项目支持,旨在填补印地语结构化词汇语义资源空白,支撑印地语自然语言处理研究与应用 |