PySpark 数据处理
通过 PySpark 编写 Python 代码运行在 Spark 集群上,进行大规模 ETL 和分析。
Matplotlib 数据可视化
使用 Matplotlib 创建线图、散点图、直方图,精细控制图例、标签和样式。
Python 数据分析 Pandas
使用 Pandas 加载、清洗、转换和分析结构化数据,掌握 Series 和 DataFrame。
Python 调用 C 扩展
通过 ctypes 或编写 CPython 扩展模块,在 Python 中执行 C 代码提升性能。
Cython 加速 Python
使用 Cython 为 Python 代码添加静态类型并编译为 C 扩展,大幅提升执行速度。
多进程 multiprocessing
使用 multiprocessing 模块启动子进程,利用进程池和管道/队列实现并行计算。
Python 上下文管理器
实现 __enter__/__exit__ 方法或使用 contextlib,管理文件、锁等资源的自动释放。
Mock 模拟与打桩
使用 unittest.mock 或 pytest-mock 模拟网络、数据库等外部调用,编写确定性测试。
Python 测试 pytest
掌握 pytest 编写单元/功能测试,使用 fixture 管理依赖,参数化提高覆盖率。
Pydantic 数据校验
使用 Pydantic 定义数据模型,进行运行时类型校验与序列化,常用于 FastAPI。
Requests HTTP 库
使用 Requests 发送 GET/POST 等请求,处理响应、头信息和会话保持。
Playwright Python 版
使用 Playwright for Python 进行多浏览器自动化,支持移动设备模拟和网络拦截。
Python 爬虫 Scrapy
使用 Scrapy 编写 Spiders、Item Pipeline,实现高效、可扩展的 Web 数据采集。
Python ORM SQLAlchemy
使用 SQLAlchemy 核心和 ORM 层进行数据库操作,管理会话、映射关系。
Python Django 框架
学习 Django 的 MTV 架构、ORM、表单处理和后台管理,快速构建数据库驱动的网站。
Raspberry Pi 树莓派项目
基于树莓派搭建微型 Linux 服务器,使用 Python 控制 GPIO 引脚连接传感器与执行器。
Jupyter Notebook 数据科学
使用 Jupyter Notebook 进行数据清洗、可视化与建模,打造可复现的交互式数据分析报告。
PyCharm 开发环境配置
优化 PyCharm 设置,掌握虚拟环境管理、远程开发、代码质量检查等专业 Python 开发配置。
FastAPI 高性能 API
利用 FastAPI 类型提示和异步支持,快速生成 OpenAPI 文档并构建高性能接口。