金融领域的生成型人工智能:FinGPT、BloombergGPT以及更多进展
《美丽时尚领域的生成型人工智能:FinGPT、BloombergGPT以及更多进展》
生成式AI是指能够生成与输入数据类似的新数据样本的模型。ChatGPT的成功为各个行业带来了许多机会,激发了企业设计自己的大型语言模型的灵感。金融部门由于数据驱动,现在比以往任何时候都更加数据密集。
我在一家总部位于法国的金融服务公司担任数据科学家。在那里已经工作了一年多,我最近观察到在所有部门中,LLM的使用案例显著增加,用于任务自动化和构建强大、安全的人工智能系统。
每个金融服务机构都致力于使用开源模型(如LLAMA 2或Falcon)打造自己的精心调整的LLM。特别是那些拥有几十年金融数据的传统银行。
迄今为止,由于计算资源有限以及模型较为简单/低参数,将大量数据纳入单个模型中是不可行的。然而,这些具有数十亿参数的开源模型现在可以对大量文本数据集进行精调。对于这些模型来说,数据就像燃料,数据越多,结果越好。
数据和LLM模型可以通过提高自动化、效率、准确性等方面为银行和其他金融服务机构节省数百万美元。
麦肯锡的最新估计表明,这种生成式AI仅在银行业每年就能节省高达3400亿美元。
BloombergGPT与生成式AI的经济学
2023年3月,彭博社展示了BloombergGPT。这是一个从零开始构建的语言模型,具有500亿个参数,专门针对金融数据。
为了省钱,有时需要花钱。训练像BloombergGPT或Meta的Llama 2这样的模型并不便宜。
训练Llama 2的700亿参数模型需要170万个GPU小时。在商业云服务上使用Nvidia A100 GPU(用于Llama 2)每个GPU小时可以花费1-2美元。做一下计算,100亿参数的模型可能需要花费大约15万美元,而1000亿参数的模型可能高达150万美元。
如果不是租用,直接购买GPU是一个选择。然而,购买大约1000个A100 GPU组成一个集群可能会花费超过1000万美元。
与人工智能的迅猛发展相比,彭博社投资超过100万美元的数字尤为令人瞩目。令人惊讶的是,仅花费100美元的模型在半年内就成功超越了BloombergGPT的性能。而BloombergGPT的训练中只有很小一部分(99.30%)是自家数据,其余大部分是公开可访问的。然后出现了FinGPT。
FinGPT
FinGPT是一种先进的金融精调大型语言模型(FinLLM)。由AI4Finance-Foundation开发,FinGPT在成本效益和整体准确性方面目前超过其他模型。
目前有3个版本;FinGPT v3系列是使用LoRA方法改进的模型,它们经过训练以分析情绪的新闻和推文。它们在许多金融情绪测试中表现最佳。FinGPT v3.1基于chatglm2-6B模型,而FinGPT v3.2基于Llama2-7b模型。

FINGPT
FinGPT的操作流程:
- 数据获取与工程化:
- 数据获取:使用雅虎、路透等信誉良好的数据源,FinGPT整合了广泛的金融新闻,涵盖美国股票到中国股票。
- 数据处理:这些原始数据经过多次清洗、标记和提示工程化处理,以确保其相关性和准确性。
- 大型语言模型(LLM):
- 训练:使用精选数据,不仅可以对LLM进行精调以产生适合特定需求的轻量级模型,还可以对现有模型或API进行适应以支持应用程序。
- 精调策略:
- 张量层(LoRA%20LoRA%20(Low%2DRank%20Adaptation))):发展像FinGPT这样的模型的一个关键挑战是获取高质量的标记数据。FinGPT认识到这一挑战,采用了一种创新方法。它不仅仅依赖传统的标记,而是使用市场驱动的股票价格波动作为标签,将新闻情绪转化为正面、负面或中性等具体标签。这在模型的预测能力方面取得了巨大的改进,特别是在辨别积极和消极情绪方面。通过LoRA等精调技术,FinGPT v3在优化性能的同时减少了计算开销。
- 通过人类反馈进行强化学习:FinGPT使用“人类反馈强化学习(RLHF)”。这是BloombergGPT所没有的特性,RLHF使LLM模型具备识别个体偏好的能力,无论是用户的风险承受能力、投资模式还是定制化的智能投顾设置。这种技术是ChatGPT和GPT4的基石,可以确保更加个性化和直观的用户体验。
- 应用和创新:
- 智能投顾:像经验丰富的金融顾问一样,FinGPT可以分析新闻情绪并精准预测市场趋势。
- 量化交易:通过从各种来源(从新闻媒体到Twitter)识别情绪,FinGPT可以制定有效的交易策略。事实上,即使仅由Twitter情绪指导,它也展示了有希望的交易结果。
FinGPT与ChatGLM、LLAMA 2和BloombergGPT的比较
FinGPT的现行轨迹与未来:2023年7月对于FinGPT来说是一个令人兴奋的里程碑。团队发布了一篇名为“Instruct-FinGPT:通过对通用大型语言模型进行指导调整进行金融情绪分析”的研究论文。该论文的核心是对指导调整技术的探索,该技术使FinGPT能够执行复杂的金融情绪分析。
但是FinGPT不仅仅局限于情绪分析。实际上,还提供了其他19种不同的应用程序,每个应用程序都承诺以新颖的方式利用LLMs。从提示工程到理解复杂的金融背景,FinGPT正在成为金融领域中多功能的GenAI模型。
全球银行如何拥抱生成式AI
虽然2023年初,像美国银行、花旗银行和高盛等主要金融机构对员工使用OpenAI的ChatGPT实施了限制,但该行业的其他机构却明确选择更具包容性的立场。
例如,摩根士丹利已将OpenAI驱动的聊天机器人集成为其金融顾问的工具。通过利用公司广泛的内部研究和数据,这些聊天机器人作为丰富的知识资源,增加了金融咨询的效率和准确性。
今年3月,对冲基金Citadel正在努力获得企业级ChatGPT许可。计划的实施旨在加强软件开发和复杂信息分析等领域。
摩根大通也致力于利用大型语言模型进行欺诈检测。他们的方法是利用电子邮件模式识别潜在的妥协。而且,该银行还制定了一个雄心勃勃的目标:到年底实现高达150亿美元的人工智能增值。
至于高盛,他们并不完全抵制人工智能的魅力。该银行正在探索生成式AI的力量,以强化其软件工程领域。正如高盛首席信息官Marco Argenti所说,这种整合有可能将他们的员工变得“超人”。
银行和金融行业中生成式AI的使用案例
金融中生成式AI的使用案例
生成式AI正在从根本上改变金融运营、决策和客户互动。以下是其应用的详细探讨:
1. 防欺诈:生成式AI处于开发尖端的欺诈检测机制前沿。通过分析大量数据,它可以识别复杂的模式和异常,提供更主动的方法。传统系统往往由于数据量庞大而不堪重负,可能产生误报。相比之下,生成式AI不断完善其理解能力,减少错误,确保更安全的金融交易。
2. 信用风险评估:评估借款人的信用价值的传统方法虽然可靠,但已变得过时。生成式AI模型通过各种参数(从信用历史到细微的行为模式)提供全面的风险概况。这不仅确保更安全的借贷,还满足了更广泛的客户群体,包括那些传统指标可能无法服务到的客户。
3. 增强客户互动:得益于生成式AI驱动的自然语言处理模型,金融界正在经历客户服务的革命。这些模型善于理解和回应各种客户查询,及时提供个性化解决方案。通过自动化例行任务,金融机构可以减少开支、简化运营,并最重要的是提高客户满意度。
4. 个性化金融:一刀切已经成为过去。如今的客户要求根据其独特需求和愿望量身定制的金融规划。生成式人工智能在这方面表现出色。通过分析数据,从消费模式到投资偏好,它制定个性化的财务路线图。这种全面的方法确保客户更加了解情况,更有能力应对他们的财务未来。
5. 算法交易:生成式人工智能在波澜起伏的算法交易世界中的分析能力无价。通过剖析数据,从市场趋势到新闻情绪,它提供深入的见解,让金融专家优化策略,预测市场变化并减少潜在风险。
6. 强化合规框架:反洗钱(AML)法规对维护金融系统的完整性至关重要。生成式人工智能通过筛选复杂的交易数据来发现可疑活动,简化了合规流程。这不仅确保金融机构遵守全球标准,还显著降低了虚假阳性的机会,简化了业务。
7. 网络安全:随着网络威胁不断演变,金融行业需要灵活的解决方案。生成式人工智能恰好提供了这种解决方案。通过实施动态预测模型,它能更快地检测威胁,加强金融基础设施,抵御潜在的侵犯。
然而,正如任何发展中的技术一样,生成式人工智能在金融行业也面临一些挑战。
挑战
- 偏见扩大:尽管AI模型如此复杂,它仍然依赖于人类生成的训练数据。这些数据因其固有的偏见(无论是有意还是无意的)可能导致结果偏离正常。例如,如果某个特定人群在训练集中被少数化代表,AI产生的输出结果可能会继续强化这种疏忽。在金融等关注公平和平等的领域,此类偏见可能带来严重后果。金融领导者需要积极主动地识别这些偏见,并确保数据集尽可能全面和具有代表性。
- 输出可靠性和决策:生成式人工智能有时会产生错误和误导性的结果,通常被称为“幻觉”。这些错误是可以预期的,因为AI模型在不断改进和学习,但在精确性不可妥协的金融领域,后果是严重的。单凭AI做出关键决策,例如贷款批准,是危险的。相反,应将AI视为一种帮助金融专业人员的高级工具,而不是取代他们的工具。它应处理计算任务,为人类专业人员提供见解,以做出最终明智的决策。
- 数据隐私和合规:保护敏感客户数据仍然是生成式人工智能应用中的一个重要关注点。确保系统遵守《欧洲通用数据保护条例》(GDPR)和《加利福尼亚消费者隐私法》(CCPA)等全球准则至关重要。AI可能对这些界限不知道或不尊重,因此在金融领域中,机密性至关重要,必须通过严格的数据保护指南对其使用进行调节。
- 输入数据质量:生成式人工智能的表现只取决于输入给它的数据。不准确或不完整的数据可能会间接导致劣质的金融建议或决策。
结论
从提升交易策略到加强安全性,生成式人工智能应用广泛而具有变革性。然而,与任何技术一样,我们必须谨慎采用生成式人工智能,考虑到伦理和隐私问题。
那些成功利用生成式人工智能的机构,同时尊重其限制和潜在风险,无疑将塑造全球金融领域的未来发展路径。





