基于自然语言预训练大模型技术的勘察设计软件
基于自然语言预训练大模型技术的勘察设计软件
某公司具有海量设计数据(19余万条图纸、文件数据,1000余册常用设计规程规范,300余万条煤矿行业数据),如何在实际工作中高效精准应用成为一项重要课题。因此,基于自然语言预训练大模型技术的勘察设计软件成为研究方向之一。
基于大模型技术的勘察设计知识问答软件,使用开源大模型重点解决公司员工勘察设计行业标准规范查询、公司制度查询、煤炭行业知识查询需要翻阅较多文件、工作效率低的问题,便于员工有效利用工作时间,使用知识问答形式便能获取对应知识。将繁杂的数据查询工作交给大模型处理,更能提高公司员工的工作积极性。
(一)技术方案
1.使用9B开源大模型+知识赋能小模型+设计知识图谱模式进行本地化部署。以大模型为基础,自主开发知识赋能小模型+设计知识图谱,形成知识精准查询、拆分、整理、推送,辅助设计工作,提升设计质量和效率,实现根据设计知识精准推送。
2.大模型海量煤炭行业数据增量训练,训练数据:19余万条图纸、公司规章制度、行业标准规范共1123册,抓取煤矿生产、安全、科技相关数据共3249816条。
3.开发智能推送问答应用,结合设计公司工作特点,与设计协同系统联动,实现知识精准问答、数据全域查询、文本智能纠错、设计要点推送、全网信息搜索推荐等功能。
(二)实施方案
1.数据整合与预处理
对现有的海量设计数据进行整理,包括图纸、文件数据、设计规程规范以及煤矿行业数据等,进行清洗、分类和标准化处理,确保数据质量,为大模型训练提供高质量的输入数据。
2.大模型的选择与训练
根据公司实际需求,选择合适的开源大模型作为基础,并对其进行定制化训练,使其能够理解和处理勘察设计行业相关的专业术语和知识内容。
3.识问答系统开发
构建知识问答界面,允许员工通过自然语言输入问题,并从大模型中获取准确的答案。系统能够处理复杂的查询请求,并提供相关的设计标准、公司制度和煤炭行业知识。
4.知识检索与提取算法优化
开发高效的算法来检索和提取大模型中的知识,确保问答系统的响应速度和准确性,减少员工等待时间,提高工作效率。
5.系统集成与测试
将开发的知识问答系统集成到公司现有的工作流程中,并进行全面的测试,确保系统稳定运行,满足实际工作需求。
6.效果评估与持续改进
通过对比使用前后的员工工作效率和设计质量,评估知识问答软件的实际效果。根据评估结果和用户反馈,持续对系统进行改进和优化,确保其长期有效地支持公司的勘察设计工作。
通过本软件的广泛应用,员工能够迅速检索到相关专业标准和规范,同时查询公司内部的规章制度以及煤矿领域的专业知识,有效节约了员工在资料查询上的时间,提升了工作效率。同时,通过广泛收集用户反馈,以快速迭代的方式不断优化模型的数据分析和语义理解功能,成为设计人员的得力助手。目前,已累计登录次数已超过8000次,知识推送次数达到2万次。根据估算,若以节省员工时间3%计算,每年可节约人工成本约500万元。
免责声明:文中图片来自转载或网络,版权归作者所有,如有侵权,请联系删除、

