文科生の量化闯关记:代码篇-1,搭建 Python 开发体系(附 GPU 配置)
  我是宽客 24天前 335 0

一、开篇

Life is short, you need Python!

人生苦短,我用Python !

python之父.2.png

文科生学习量化投资,确实存在诸多门槛。在前文提及的数理、代码、金融、交易这四个维度里,我觉得数理当属最为关键且难度最高的部分。毕竟里面有线性代数、统计、概率论、计量经济这些硬核内容,咱可以先Pass这部分。先把代码关攻克了,后面学数理的时候会轻松点。代码就像量化的“地基”,先把Python拿下,能更快从理论过渡到实操。因此,《文科生の量化闯关记》的第二关是代码关。

代码不是门槛,而是量化投资的‘翻译器’—— 把金融逻辑翻译成计算机能执行的指令。

对文科生来说,Python 的用处不只是它本身的技术,更在于它能很快打破 “搞量化就得懂特别高深的数学” 这种想法。先把代码工具学会,文科生在实际操作里就能慢慢熟悉量化相关的概念(像 “最大回撤” 这些词意思),给之后学那些数理知识打个实践基础 —— 毕竟,能写出算 “夏普比率” 的代码,可比死记硬背公式,更容易明白它在金融里什么意思 。

接下来我将按以下顺序展开详细解析:

  1. 选择Python的原因
  2. 环境规划思路
  3. 基础环境安装实操:从0到1的分步指南
  4. GPU配置要点

二、Python 开发体系搭建(分步骤实操)

(一)为什么选择python ?

python_ranking02.jpg

咱外行人学编程,首选肯定是Python,这没啥好说的。你看TIOBE排行榜上,Python到现在还是第一。

python_ranking01.jpg

为什么选择Python?首先在于它的简洁性,语法接近自然语言,即使是英语基础有限的人也能快速上手。其次是它强大的生态系统,不仅自带丰富的标准库,还有大量第三方库可供调用。众多开发者开源的各类功能函数覆盖了多个行业场景,使用者无需重复开发,直接调用即可。

作为应用广泛的高级编程语言,Python在各类编程场景中都不可或缺。其语法设计注重可读性,代码清晰易读,这也是它成为Web开发、游戏脚本、计算机视觉、物联网管理及机器人开发等领域主流语言的重要原因。随着物联网技术的发展和智能家电的普及,Python的应用前景将更加广阔。

以深度学习为例,谷歌开发的TensorFlow和Facebook的PyTorch等主流框架,都可通过Python便捷调用,大幅降低开发门槛。

(二) 环境规划

在安装Python开发环境时,需优先完成操作系统与版本的规划。

操作系统选择建议

  • Windows系统:推荐入门者作为首选,其图形化操作界面友好,安装流程直观,对编程新手更易上手;
  • Linux系统:适用于后期进阶场景,多为量化服务器的主流选择,但操作门槛较高,建议具备一定基础后尝试;
  • Mac系统避坑提示:使用Homebrew包管理工具时,需注意权限配置问题,避免因权限不足导致安装流程受阻。

Python版本与安装方案决策

  • 版本选择:建议选用3.8-3.10版本,规避TA-Lib等量化核心库与最新版本的兼容性问题;
  • 安装方案对比
    • Anaconda:更推荐的方案,自带conda包管理工具,可一键完成numpy、pandas等科学计算库的安装,大幅提升环境搭建效率;
    • 原生Python:个人习惯使用原生版本亦无不可,可根据偏好选择。

两种安装方式的官方下载链接均可在官网获取,安装流程与常规软件类似,参考公开教程即可完成部署。下面以 Anaconda 为例,为初学者详细说明。
两种方式区别请参考下面链接:
https://zhuanlan.zhihu.com/p/1885636216730395625

(三)基础环境安装 :从 0 到 1 的实操步骤

关于 Python 的安装与环境管理,网上已有大量教程(B 站、抖音及技术文章中均有详细指南)。这里专为入门小白梳理核心要点,帮助快速掌握环境搭建逻辑,避免踩坑。

下面我将演示安装顺序:

  • 安装 Miniconda
  • 创建 Python 3.10 环境(激活环境)
  • 安装 PyCharm
  • 创建项目(选择已有 Python 3.10 环境)
  • 安装相关第三方库

1、安装 Miniconda(Anaconda)

Anaconda下载链接
https://www.anaconda.com/download/success

miniconda01.jpg

页面里“Distribution Installers”(Anaconda 安装包)和“Miniconda Installers”(Miniconda 安装包)是 Anaconda 生态里两种不同的 Python 环境管理工具,核心区别体现在 功能、体积、适用场景

  • Distribution Installers(Anaconda):下载的是「完整生态包」,装完直接能用大量科学计算库,适合新手快速启动数据分析、AI 实验。
  • Miniconda Installers(Miniconda):下载的是「极简基础包」,装完只有 Python 和 Conda ,需要自己用 conda install 装库(比如 conda install numpy ),适合想“轻量开局”或对环境有精细需求的人。

我们选择下载Miniconda,个人单独用电脑时,选 “Just Me” 足够,然后将安装路径选择为 D 盘的 D:\miniconda3

√ Create shortcuts (supported packages only)  —— 必选,生成开始菜单和桌面快捷方式,方便快速启动终端(如Anaconda Prompt)。  
□ Add Miniconda3 to my PATH environment variable  —— 新手不建议勾选,避免与系统Python冲突,直接使用Anaconda Prompt更稳妥。  
□ Register Miniconda3 as my default Python 3.13  —— 仅当完全使用Miniconda开发时勾选,否则建议手动在IDE(如PyCharm)中配置解释器,避免影响系统默认Python。  
√ Clear the package cache upon completion  —— 必选,安装后自动清理缓存包,节省磁盘空间(通常可释放数百MB)。  

安装minicoda时,上述勾选方案通过 “必选 + 慎选” 的分层设计,既能满足新手对便捷性的需求(快捷方式、清理缓存),又能规避环境变量冲突风险。其中 “不勾选 PATH 和默认 Python” 的核心逻辑是:Miniconda 的虚拟环境机制已能实现多版本 Python 隔离(如通过conda create创建 Python 3.10 环境),无需通过系统变量全局配置,直接用 Anaconda Prompt 或 IDE 内配置更安全可控。

2、创建 Python 3.10 环境(激活环境)

由于 Miniconda 的基础环境 Python 版本为 3.13,而量化开发通常选用 3.8-3.10 版本,因此需要配置 Python 3.10 环境。通过虚拟环境可实现多版本 Python 隔离,确保后续项目依赖仅作用于当前环境,不污染系统 Python。具体操作如下:

打开 Anaconda Prompt(或系统终端),输入以下命令:

conda create -n py310_env python=3.10  # 创建环境
conda activate py310_env  # 激活环境(Windows)

python310检查.png

  1. 首先通过 conda --version 命令确认 Miniconda 是否安装成功,若安装成功会显示版本号。
  2. 接着激活虚拟环境,再执行 python --version 命令,查看是否已搭建 Python 3.10 环境。
  3. 若配置成功,命令行将显示 Python 3.10.x 版本信息。

3、安装 PyCharm

我们推荐使用 PyCharm 和 Visual Studio Code(VS Code)这两款专业级 Python 集成开发环境(IDE)。二者均可在官网下载,且均提供 Professional(专业版)和 Community(社区版)两种版本。对于新手而言,免费的社区版(Community)功能已足够使用。以 PyCharm 为例,下载社区版后,可按常规软件安装流程将其安装在 D 盘(如D:\JetBrains\PyCharm Community Edition 2025.1.2)。

pycharm001.jpg

Pycharm下载地址:
https://www.jetbrains.com/zh-cn/pycharm/download/?section=windows#

4、创建项目(选择已有 Python 3.10 环境)

安装PyCharm后即可创建Python项目,具体操作如下:

  1. 打开PyCharm,点击顶部菜单「文件」→「新建项目」;
  2. 在「解析器类型」选择界面,指定为自定义虚拟环境中的Python 3.10(即此前激活的环境);
  3. 该虚拟环境的Python 3.10默认路径为:
    • Windows:Miniconda安装目录\envs\py310_env\python.exe
    • Mac/Linux:~/miniconda3/envs/py310_env/bin/python

创建新项目00.jpg

5、安装量化相关第三方库

在 Python 环境中安装第三方库时,可通过 CondaPip 命令实现,但二者存在本质区别:

  • Conda:Anaconda/Miniconda 自带的包管理器,支持跨语言依赖(如 R 包、C++ 库),优先安装预编译二进制文件,适合数据科学场景。
  • Pip:Python 官方包管理器,仅管理 Python 包,依赖源码编译(部分库需本地编译器支持)。

推荐策略

  1. 优先使用 Conda 安装科学计算库(如 numpy、pandas),避免编译报错;
  2. 仅 Conda 源中没有的包(如某些小众工具),再用 Pip 补充安装。

(1)注意点:添加环境变量(推荐方式)

为了日后在CMD中直接使用pip命令安装Python库更方便,可按以下步骤设置:

  1. 右键点击“此电脑” → 选择“属性” → 进入“高级系统设置” → 点击“环境变量”。
  2. “系统变量” 区域找到 Path 变量,点击“编辑”。
  3. 新建两条路径(按顺序添加以确保优先级):
    D:\miniconda3\envs\py310_env\Scripts
    D:\miniconda3\envs\py310_env
    
  4. 调整路径顺序:将上述路径移至 Path列表顶部,确保系统优先调用。
  5. 点击“确定”保存所有更改。

验证是否生效:
在CMD中输入以下命令检查pip所属环境:

where pip

预期输出D:\miniconda3\envs\py310_env\Scripts\pip.exe,确认pip来自Python 3.10环境。

(2)镜像源加速配置(小白必看)

国内直接从默认源(https://pypi.org/simple)下载可能很慢,需配置国内镜像源。以 清华镜像 为例:

方法 1:临时使用(单次加速)

pip install 包名 -i https://pypi.tuna.tsinghua.edu.cn/simple

方法 2:永久配置(推荐)

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

验证配置是否生效

pip config list # 应显示 index-url = https://pypi.tuna.tsinghua.edu.cn/simple

其他可用镜像源

  • 阿里云:https://mirrors.aliyun.com/pypi/simple/
  • 腾讯云:https://mirrors.cloud.tencent.com/pypi/simple
  • 华为云:https://mirrors.huaweicloud.com/repository/pypi/simple

避坑指南

  1. 混合使用 Conda 与 Pip

    • 避免在同一环境中频繁混用二者,可能导致依赖冲突;
    • 若必须混用,先 Conda 后 Pip(Conda 更擅长处理底层依赖)。
  2. 镜像源失效处理

    • 若安装报错(如“404 Not Found”),可能是镜像同步延迟,临时切回官方源:
      pip install 包名 --index-url https://pypi.org/simple
  3. 验证包安装路径

    pip show 包名 # 查看包的安装位置,确认是否在当前虚拟环境中

(3)量化投资分析常用Python库如下:

一、数据处理与分析(基础必备)

pip install pandas numpy scipy
  • 核心作用
    • pandas:表格数据处理(清洗、转换、聚合),量化分析的“瑞士军刀”;
    • numpy:高性能数值计算(矩阵运算、向量操作),底层数据结构支撑;
    • scipy:科学计算库(优化算法、积分、信号处理)。

二、数据可视化(结果呈现)

pip install matplotlib seaborn plotly
  • 场景差异
    • matplotlib:基础绘图(折线图、散点图),自定义程度高;
    • seaborn:基于matplotlib的统计可视化(热力图、分面图),风格更美观;
    • plotly:交互式图表(3D图、动态趋势),支持Web端嵌入。

三、金融数据接口(国内市场)

pip install akshare tushare
  • 使用提示
    • akshare免费开源,覆盖A股、基金、期货等数据(如ak.stock_zh_a_hist获取日线);
    • tushare:需申请token(新手可领免费积分),接口更规范,示例:
      import tushare as ts ts.set_token('你的token') pro = ts.pro_api() df = pro.daily(ts_code='000001.SZ', start_date='20230101')

四、多因子与回测分析

# 统计与机器学习基础 pip install statsmodels scikit-learn # 多因子专用工具 pip install alphalens empyrical
  • 工具解析
    • alphalens:因子有效性分析(IC值计算、分层回测),量化多因子模型核心;
    • empyrical:绩效评估(夏普比率、最大回撤、卡玛比率),一键生成专业指标。

五、回测框架(按需选择)

pip install backtrader # 经典轻量级框架,适合个人开发 # 或 pip install qlib # 腾讯开源框架,支持多因子与分布式回测
  • 框架对比
    • backtrader:纯Python实现,文档完善,适合快速验证策略(如简单均线策略);
    • qlib:依赖C++组件,需先安装libstdc++6等系统库,适合机构级多因子研究。

六、数据存储(非结构化数据)

pip install pymongo
  • 适用场景
    • 存储高频交易数据、非结构化研报文本;
    • 配合MongoDB数据库,实现数据的快速查询与更新(如db.stocks.insert_one({"code": "000001", "date": "2023-01-01"}))。

后续需要其他库时,用pip或conda安装即可。建议优先手动安装——既能精准控制安装内容、节省磁盘空间,又能避免自动安装的冗余依赖,更符合“按需取用”的高效原则。

三、进阶环节:GPU 配置手册

装完Python和各种库,接下来就该配置GPU了。

(一)、GPU 为何重要?

在 AI 学习与量化场景里,GPU 应用广泛:高频交易策略计算、借 LSTM 做股价预测的机器学习任务、深度学习、借强化学习挖掘 Alpha gen 因子,以及加速期权定价的蒙特卡洛模拟 。

简单类比:CPU 像单人流水线,一次处理少量任务;GPU 像千人同时干活,处理大规模数据时,速度能比 CPU 快 10 - 100 倍 。因此,配置 GPU 需安装 CUDA(GPU 计算基础工具)和 PyTorch(AI 开发框架) 。

(二)、CUDA 简介与安装简化指南

CUDA(Compute Unified Device Architecture)是英伟达开发的并行计算架构,能让显卡高效处理复杂计算任务,广泛用于科学计算、AI和游戏开发。

安装前准备:硬件检查

显卡要求:通常时英伟达部分型号(如GeForce、Quadro系列)支持CUDA,AMD显卡无法安装。注意别随便下载安装包,要根据电脑显卡驱动的版本选择匹配的CUDA版本安装,否则容易出现不兼容问题。

步骤1:查驱动版本

先查看电脑的显卡型号是否支持CUDA的安装
https://developer.nvidia.com/zh-cn/cuda-gpus

1、打开英伟达官网的CUDA GPU支持页面(链接如上),向下滚动至下方“CUDA支持的GPU产品”区域,点击进入;
2、若显卡较旧,页面也提供了旧版CUDA GPU的支持列表供确认;
3、确认显卡型号支持CUDA(GeForce RTX 5090)后,下一步需查看当前电脑的显卡驱动版本。

右键桌面→打开Nvidia控制面板→点击左下角“系统信息”,即可看到当前显卡驱动版本(如573.24)。

cuda001.png

步骤2:选CUDA版本

根据驱动版本(如573.24),到Nvidia官网查询支持的CUDA最高版本(如对应12.8)。
查看可以安装的CUDA版本:
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html#general-cuda

cuda002.png

步骤3:下载安装

到Nvidia官网下载对应CUDA版本(如12.8),安装时取消勾选冗余选项(如GeForce Experience),一路“下一步”完成安装。

cuda003.png

CUDA安装地址:
https://developer.nvidia.com/cuda-toolkit-archive

步骤4:验证安装

打开命令行(CMD),输入nvcc --version,显示版本号即安装成功。

cuda完成安装.png

小贴士:量化入门优先选NVIDIA(CUDA生态更成熟,量化库支持更友好)。

对刚上手的新手来说,不一定非要GPU——CPU版本的PyTorch也能跑起来,完全能满足基础学习需求。

(三)、安装PyTorch

1、为什么选择PyTorch?

在深度学习框架领域,最流行的有谷歌的 TensorFlow、Meta(原 Facebook)的 PyTorch,以及国内百度的飞桨(PaddlePaddle )等。它们凭借高度的可定制性与可扩展性,成为当前备受欢迎的框架。曾经最热门的框架要数 TensorFlow,不过近几 年 PyTorch 实现了全方位逆袭。在自然语言处理领域最火的开源库 Hugging Face 上,85% 的模型仅能在 PyTorch 环境中使用 。

Pytorch03.jpg

下面通过 8 个顶级期刊论文在过去数年里对框架的采用情况数据,能清晰看到 PyTorch 的采用率增长迅猛,短短几年间就从原本的 7% 攀升至近 80% 。此外,在学术顶会上 PyTorch 也一骑绝尘,像 EMNLP、ACL、ICLR 这 3 大 AI 顶会,PyTorch 的占比已超 80% 。

Pytorch02.jpg

基于这些情况,选择 PyTorch 框架,能无障碍上手绝大多数开源项目,所以我就不考虑其他框架啦 ^^

2、安装PyTorch

安装地址:
https://pytorch.org/get-started/locally/

PyTorch本质是个计算工具,能帮计算机高效完成复杂运算。其中“Py”是Python的缩写,“Torch”(火炬)寓意其强大的计算能力,核心是支持GPU加速的矩阵运算,速度比普通CPU快很多。

安装时需注意版本匹配:先根据显卡驱动版本下载对应的CUDA工具包(支持GPU加速),再根据CUDA版本选择兼容的PyTorch版本。如果电脑没有NVIDIA独立显卡,也可以安装CPU版本——学习阶段用CPU跑小实验完全没问题,但实际项目中训练模型还是得用GPU。选好选项后,页面会生成安装命令,复制“Run this Command”部分后在Anaconda Prompt中进入对应环境,粘贴命令回车即可,剩下的就是等待安装完成。

pytorch001.png

等PyTorch安装完成后,接下来检查GPU是否能正常使用:在代码中输入torch.cuda.is_available()并运行。

pytorch完成.jpg

如果返回True,说明GPU可用;如果安装的是GPU版本但返回False,建议按前面讲解的顺序排查PyTorch、CUDA、NVIDIA驱动问题,一定能找到原因。

四、总结

量化学习的门槛,从来不是 “高不可攀”,而是 “万事开头难” 。从选对 Python 作为 “地基”,到装好 Anaconda、配齐科学计算库,再到搞定 GPU 加速 —— 每一步看似繁琐的操作,都是在为后续的策略开发筑牢根基。

记住:环境搭建没有 “标准答案”,但有 “最优路径”—— 新手优先用 Miniconda 轻量起步,GPU 并非必需但建议尽早配置(CPU 也能跑小型实验 );遇到版本冲突别慌,可按 “PyTorch→CUDA→驱动” 的顺序排查 。实在搞不定,直接找 GPT 或 DeepSeek 帮忙解决就好!

下一篇预告:深入浅出分享Python代码部分。

最后一次编辑于 9天前 3

暂无评论

推荐阅读