注册

《信息技术 多场景、多字体藏文文字识别数据标注规范》由TC28(全国信息技术标准化技术委员会)归口上报,TC28SC2(全国信息技术标准化技术委员会字符集与编码分会)执行,主管部门为国家标准委

目录

基础信息

标准编号
20263254-T-469
计划下达日期
2026-06-27
项目周期
与中文国家标准项目周期一致
归口单位
全国信息技术标准化技术委员会
执行单位
全国信息技术标准化技术委员会字符集与编码分会
主管部门
国家标准委

翻译承担单位

国内外简要情况说明

多场景藏文多字体文字识别数据集是跨模态模型研究中的关键基础语料,其质量直接影响人工智能模型架构的性能表现。

作为稀缺的小语种资源,藏文文字识别数据在国内外学术界和工业界都具有极高的需求度,目前面临着严重的供给不足问题。

当前,构建高质量、多场景的藏文多字体文字识别数据集已成为藏语自然语言处理领域的迫切需求。