本书旨在为读者提供一本实用的指南,帮助他们运用现代技术深入探索金融数据领域。
本书以 Python 为主要编程语言,结合实例和 ChatGPT 的协助,详细介绍了从获取金融数据到数据处理、数据可视化、探索、建模,再到机器学习和深度学习等的应用,并且探讨了生成式 AI 在选股和分配权重方面的潜在应用,为读者打开了金融领域未来的一扇新窗。除了提供全面的理论知识
和实用技术指导,本书还附赠了大量高质量的金融数据,可供读者在不方便调用接口时下载和使用。
本书主要面向金融从业人员,或者对金融和数据分析感兴趣的读者。
亲爱的读者朋友,非常感谢您选择本书!在这里,我想和大家聊一聊这本书的写作背景、写作过程以及价值。
有那么一段时间,一些从事金融工作的朋友时不时向我抱怨,他们需要在繁忙的工作之余学习编程语言,以便更好地处理和分析金融数据。我深知这种挑战非常困难,因此,写这本书的初衷是帮助金融从业者快速掌握 Python 在金融数据分析中的应用技能,减轻他们的工作负担。而随着 AI技术的飞速发展,AI 大模型的出现为这一目标的实现提供了前所未有的可能性。
AI 大模型,如 ChatGPT,以及以文心一言、讯飞星火认知大模型等为代表的国产大模型等,
都具有强大的自然语言处理能力,可以根据用户的自然语言提示生成相应的代码。这一特性使得
金融从业人员只需有一点编程基础,就可以通过简单的自然语言描述,快速生成用于数据分析的
Python 代码。这无疑极大地降低了数据分析的门槛,让更多的人能够轻松地掌握这一技能。
当然,要使用 AI 大模型生成 Python 代码,高质量的提示词至关重要。在写作本书的过程中,我也不断尝试调整提示词,以便让 AI 大模型生成的代码能够顺利运行并实现我所期待的结果。通过持续实验,我总结出一些经验和大家进行分享。
首先,我们要明确想要 AI 大模型生成的代码实现什么功能,是进行数据清洗、特征工程、模型训练,还是进行预测?我们要确保提示词清晰地描述了这一目标。
其次,对于重要的步骤和逻辑,提供足够的细节。例如,如果我们想生成一段用于数据分区的代码,可以这样写:请将数据集分为训练集和测试集,比例为 70% 和 30%。
再次,我们要确保提示词没有歧义,以免导致生成的代码不符合预期。例如,不要简单地写生成一个循环,而要明确循环的次数、条件等细节。
最后,我们要确保使用正确的专业词汇,从而让 AI 大模型更准确地理解我们的需求,并提高代码的质量。
需要强调的是,在每次生成代码之后,都要进行测试,确保其满足我们的需求。根据测试结果,对提示词进行微调,逐步优化生成的代码。
举个例子,假设我们想生成一段用于计算股票收益率的 Python 代码,可以这样写提示词:请
编写一个 Python 脚本,从 CSV 文件中的收盘价列读取股票的价格数据,计算每日收益率,并将结果保存为新的 CSV 文件。这样的提示词既明确了目标(计算收益率并保存结果),也提供了足够的细节(从 CSV 文件中的特定列读取价格数据、计算每日收益率等)。
写出高质量的提示词需要一定的经验积累。通过不断测试和反馈,相信大家很快就能够熟练地运用这一技能,快速获得满足需求的 Python 代码。
本书将手把手教读者利用精确详细的提示词,让大语言模型生成可用性极高的金融数据分析与建模代码。此外,本书不仅仅涉及经典的金融数据分析理论与模型,还引入了目前大语言模型在投资组合选股方面的最新研究,旨在帮助读者拓宽视野,为适应 AI 时代的工作方法打下基础。
在编写本书的过程中,我深感责任重大,所以试图竭尽所能地为读者呈现最全面实用的知识,
但由于计算机技术发展迅速,书中难免有疏漏和不妥之处,敬请广大读者不吝指正。如果大家在学习过程中遇到问题,欢迎添加我的个人微信dynhyper,我将尽力为大家进行解答。
本书赠送全书案例源代码及相关数据资源,读者可扫描下方二维码关注博雅读书社微信公众号,输入本书 77 页的资源下载码,即可获得本书的下载学习资源。
最后,衷心祝愿读者朋友在金融数据分析领域取得更大的成就,实现自己的职业发展目标。同
时,也让我们一起迎接 AI 大模型带来的新挑战与新机遇,共同迈向数据驱动的新未来!
段小手