国家标准计划《基于文本数据的金融风险防控 知识图谱构建技术框架指南》由 TC180(全国金融标准化技术委员会)归口 ,主管部门为中国人民银行。
主要起草单位 中国银行业协会 、中国工商银行 、中国农业银行 、中国银行 、中国建设银行 、交通银行 、中国邮政储蓄银行 、招商银行 。
03 社会学、服务、公司(企业)的组织和管理、行政、运输 |
03.060 金融、银行、货币体系、保险 |
金融风险防控是金融工作中的重要主题。
金融风险防控能为金融机构提供安全稳定的经营环境,能保障金融机构顺利实现经营目标,促进金融机构资金筹集和资金经营决策的合理化与科学化。
此外,金融风险防控有利于社会资源的优化配置,有助于经济的稳定发展,有助于社会稳定。
伴随着互联网与信息技术的发展普及,海量文本在各领域不断地被积累,文本数据作为金融风险信息重要的信息载体之一,是金融风险防控的重要数据基础,对金融风险防控发挥着举足轻重的作用。
在金融风险防控中涉及的文本数据带有明显的领域特征,且包含大量的专业词汇,甚至拥有独特的语言模式,还常伴随着各式各样的“噪音”。
如何利用先进的技术手段在文本中提取有效的关键信息,是金融风险防控的重要任务。
知识图谱作为一种新兴技术,其实践与应用近年已经广泛遍布于各类金融机构,并呈现出阶梯式增长趋势。
在金融风险防控方面,知识图谱技术可对无序、独立的文本数据进行有效的抽取加工,形成有序的实体信息与关联关系,其独特的数据提取方式、加工方式、存储管理方式、计算方式将更有利于挖掘与揭示隐含风险,实现数据的图形化和认知的立体化,为金融风险防控提供有力指导。
上述以文本数据为基础,以金融风险防控为目标的知识图谱构建工作,尚无明确的标准与范式。
“基于文本数据的金融风险防控 知识图谱构建技术框架指南”对上述知识图谱构建过程中涉及的技术框架与关键步骤,给出了指导性建议。
此标准的制定,为今后以金融风险防控为目的,以文本数据为基础的知识图谱构建提供了明确的方向和思路,并且为今后进一步制定相应的详细技术规范打下了良好的基础,具有重要意义。
本标准针对金融风险防控,规定了基于文本数据构建知识图谱技术框架的一般原则与方法,提供了知识图谱构建过程中涉及的知识抽取、知识加工、知识管理等关键步骤的构建建议,给出了知识图谱在金融风险防控方面的应用方式与指导信息。 主要技术内容包括:标准范围、规范性引用文件、标准涉及的术语和定义、总则、需要考虑的要素、资料性附录、参考文献。