江苏银行向“新”而行！大模型助力数据治理提质增效

2024/09/06 18:02来源:第三方供稿

“通过数据治理平台的血缘分析工具，我们可以在几分钟内对上千条SQL语句、数百个存储过程进行分析，从指标一路追溯到数据源，数据处理过程中的加工口径与筛选逻辑也一目了然。”一名试用江苏银行数据治理平台的工作人员表示。值得注意的是，江苏银行在数据治理领域巧妙引入大模型技术，成功缩减了指标变量迁移工作中99.85%的开发阶段人力投入，相当于释放了24名研发工程师的研发生产力，革新成果十分亮眼。

数据治理平台依托于江苏银行自主研发的“智慧小苏”大语言模型服务平台，运用抽象语法树分析算法、启发式搜索、图结构向量匹配等先进生产技术，智能分析数据血缘关系与异构数据库SQL语句，高效生成数据血缘关系与重构优化建议，赋能全行数据治理工作。用户可通过自然语言直接与平台页面进行交互，大幅度降低操作门槛与平台使用成本。

自OpenAI于2020年6月发布GPT-3模型以来，大语言模型在自然语言处理领域取得了诸多突破性进展，也引发了金融业对大模型应用场景的广泛探索，智能客服、智慧办公、代码续写等金融科技大模型场景应用不断涌现。

如何将成熟的大模型工业化运用落地，成为金融行业亟待攻克的重要课题。在此背景下，江苏银行独辟蹊径，聚焦数据治理这一细分领域，开展创新性探索，自主研发并推出基于“智慧小苏”大模型的数据治理平台，开启数智化转型新篇章。在刚刚结束的银行业数字金融典型实践案例评选中，该解决方案荣获“AI金融大模型”典范案例奖，彰显其行业影响力。

据了解，大模型赋能的数据治理工作在目前国内银行业属于开创性举措。江苏银行基于大模型建立的数据治理平台，提供个性化定制服务，不但减轻了基层数据治理人员的日常工作负担，还能够有效提升数据管理的质量和效率。

“在没有血缘分析工具的情况下，我们常常淹没在海量的SQL查询和数据变更中，很难评估数据表中字段的内容变化对上下游产生的影响，而如今，这一切变得清晰可控。”一位基层数据治理员工表示。

大模型赋能的数据治理血缘分析工作，基于业内主流图结构向量数据库技术，结合成熟的抽象语法树分析算法与开源的血缘算法，为数据治理人员提供了直观易懂的可视化视图与精准的指标口径。此外，江苏银行进一步运用大模型的处理与分析能力，结合客户旅程理念与计算机视觉手段，成功将大模型与平台深度整合，实现大模型技术全方位、深层次的参与和介入。用户只需要简单表达需求，大模型便能够智能操作用户浏览的页面，及时呈现对应结果，极大地提升了工作效率与用户体验。

具体应用方面，该平台聚焦字段级血缘分析、数据清洗、指标口径自动研发与优化、自然语言交互等方面，为数据治理人员提供一整套工具与解决方案。以征信衍生指标重构为例，针对数据集市的3000个指标，“智慧小苏”大模型能够深入理解业务需求并分析历史指标数据，自动生成符合业务逻辑的指标定义和计算规则，通过单元测试确保编写指标计算的准确性和高效性，大大节省了开发资源。

过去一个月的实践证明，江苏银行通过“智慧小苏”生成的数据血缘图谱辅助数据治理工作开展，显著提升了数据治理的效能。“引入大模型分析SQL数据血缘，让基层员工从繁琐的手工报表梳理中解放出来，将更多精力投入到数据治理工作的主动探索与创新中去，实现从被动应对到主动作为的工作机制转变。”该项目负责人表示。

江苏银行在数据治理领域的创新性实践，不仅为金融领域数据治理提供了宝贵经验，也为数字经济时代下的金融高质量发展开辟了新路径。下一步，江苏银行将紧紧围绕做好“数字金融”这篇大文章，努力把握高质量发展与新质生产力的逻辑契合点，将数据治理作为重要抓手，进一步挖掘数据价值，不断彰显“高效率、强协同、优服务”的比较优势，以高质量金融发展助力中国式现代化江苏新实践。

江苏银行向“新”而行！大模型助力数据治理提质增效

2024/09/06 18:02来源:第三方供稿

编辑:第三方供稿

相关