《信息技术 汉藏平行语料加工流程》由TC28(全国信息技术标准化技术委员会)归口上报,TC28SC2(全国信息技术标准化技术委员会字符集与编码分会)执行,主管部门为国家标准委。
汉藏平行语料是跨语言人工智能研究(如神经机器翻译、多语言大模型训练)的核心资源,其加工规范的统一性与质量直接影响模型对低资源语言对的泛化能力和跨文化场景的适应性。
对国内外学术界及产业界而言,汉藏双语平行语料属于稀缺资源,尤其在句级对齐精度、语义标注深度、方言变体覆盖等方面存在显著缺口。