11月21日,由21世纪经济报道主办的“2023首席科技官思享会(闭门会)”在北京成功举行,聚焦大模型的热点话题,金融机构、金融科技公司等资深人士进行了深入研讨。
民生银行数据管理部总经理沈志勇在发表主旨演讲时表示,“判断一家企业是否能做好大模型,至少应从算力规模、NLP(自然语言处理)基础、数据积累这几个维度来判断。算力规模影响大模型的迭代速度;大语言模型属于NLP领域,因此NLP能力积累至关重要;而海量文本数据是训练大语言模型的重要基础。”
沈志勇认为,大模型应用于银行领域至少可以提升生产效率、重塑知识体系以及改善内外部用户的体验。比如,辅助员工生成文本、代码等内容,更快、更富体验地满足行内外用户知识获取的需求等。对此,除了模型本身,银行还需要建设算力基础;准备训练数据;建设模型训推和应用框架等。
“应用大模型一定要注意安全合规。”沈志勇表示,从数据角度看,可以对大模型进行两种教育和设立三道防线。其中,两种教育,一是训练时通过数据注入正确的价值观;二是在训练时通过强化学习对模型的错误回答进行纠偏。三道防线是指过滤掉训练数据、模型返回结果以及用户提问中的不良内容。
沈志勇提出,不能忽略大模型运行的经济性,须结合传统AI技术做好智能资源的优化配置。同时,还要做好各方对于投入产出的期望管理。关于大模型技术未来的发展方向,横向是往多模态的发展,纵向个人比较看好智能体。
责任编辑:王超
免责声明:
中国电子银行网发布的专栏、投稿以及征文相关文章,其文字、图片、视频均来源于作者投稿或转载自相关作品方;如涉及未经许可使用作品的问题,请您优先联系我们(联系邮箱:cebnet@cfca.com.cn,电话:400-880-9888),我们会第一时间核实,谢谢配合。