江苏银行向“新”而行!大模型助力数据治理提质增效

2024/09/06 18:02来源:第三方供稿

“通过数据治理平台的血缘分析工具,我们可以在几分钟内对上千条SQL语句、数百个存储过程进行分析,从指标一路追溯到数据源,数据处理过程中的加工口径与筛选逻辑也一目了然。”一名试用江苏银行数据治理平台的工作人员表示。值得注意的是,江苏银行在数据治理领域巧妙引入大模型技术,成功缩减了指标变量迁移工作中99.85%的开发阶段人力投入,相当于释放了24名研发工程师的研发生产力,革新成果十分亮眼。

数据治理平台依托于江苏银行自主研发的“智慧小苏”大语言模型服务平台,运用抽象语法树分析算法、启发式搜索、图结构向量匹配等先进生产技术,智能分析数据血缘关系与异构数据库SQL语句,高效生成数据血缘关系与重构优化建议,赋能全行数据治理工作。用户可通过自然语言直接与平台页面进行交互,大幅度降低操作门槛与平台使用成本。

自OpenAI于2020年6月发布GPT-3模型以来,大语言模型在自然语言处理领域取得了诸多突破性进展,也引发了金融业对大模型应用场景的广泛探索,智能客服、智慧办公、代码续写等金融科技大模型场景应用不断涌现。

如何将成熟的大模型工业化运用落地,成为金融行业亟待攻克的重要课题。在此背景下,江苏银行独辟蹊径,聚焦数据治理这一细分领域,开展创新性探索,自主研发并推出基于“智慧小苏”大模型的数据治理平台,开启数智化转型新篇章。在刚刚结束的银行业数字金融典型实践案例评选中,该解决方案荣获“AI金融大模型”典范案例奖,彰显其行业影响力。

据了解,大模型赋能的数据治理工作在目前国内银行业属于开创性举措。江苏银行基于大模型建立的数据治理平台,提供个性化定制服务,不但减轻了基层数据治理人员的日常工作负担,还能够有效提升数据管理的质量和效率。

“在没有血缘分析工具的情况下,我们常常淹没在海量的SQL查询和数据变更中,很难评估数据表中字段的内容变化对上下游产生的影响,而如今,这一切变得清晰可控。”一位基层数据治理员工表示。

大模型赋能的数据治理血缘分析工作,基于业内主流图结构向量数据库技术,结合成熟的抽象语法树分析算法与开源的血缘算法,为数据治理人员提供了直观易懂的可视化视图与精准的指标口径。此外,江苏银行进一步运用大模型的处理与分析能力,结合客户旅程理念与计算机视觉手段,成功将大模型与平台深度整合,实现大模型技术全方位、深层次的参与和介入。用户只需要简单表达需求,大模型便能够智能操作用户浏览的页面,及时呈现对应结果,极大地提升了工作效率与用户体验。

具体应用方面,该平台聚焦字段级血缘分析、数据清洗、指标口径自动研发与优化、自然语言交互等方面,为数据治理人员提供一整套工具与解决方案。以征信衍生指标重构为例,针对数据集市的3000个指标,“智慧小苏”大模型能够深入理解业务需求并分析历史指标数据,自动生成符合业务逻辑的指标定义和计算规则,通过单元测试确保编写指标计算的准确性和高效性,大大节省了开发资源。

过去一个月的实践证明,江苏银行通过“智慧小苏”生成的数据血缘图谱辅助数据治理工作开展,显著提升了数据治理的效能。“引入大模型分析SQL数据血缘,让基层员工从繁琐的手工报表梳理中解放出来,将更多精力投入到数据治理工作的主动探索与创新中去,实现从被动应对到主动作为的工作机制转变。”该项目负责人表示。

江苏银行在数据治理领域的创新性实践,不仅为金融领域数据治理提供了宝贵经验,也为数字经济时代下的金融高质量发展开辟了新路径。下一步,江苏银行将紧紧围绕做好“数字金融”这篇大文章,努力把握高质量发展与新质生产力的逻辑契合点,将数据治理作为重要抓手,进一步挖掘数据价值,不断彰显“高效率、强协同、优服务”的比较优势,以高质量金融发展助力中国式现代化江苏新实践。

编辑:第三方供稿