生物信息学 开源项目 中级
Nextflow
用于构建可重复、可移植生物信息工作流的数据流式 pipeline 引擎。
- 医学子领域
- 生物信息学
- 资源类型
- 开源项目
- 开源协议
- Apache License 2.0
- 部署方式
- 本地 CLI;流程任务可通过 Docker/Singularity/Podman 容器化
部署引导
快速部署
Docker 命令
涉及患者数据的项目请仅用公开或脱敏数据集,部署说明可能随项目更新变化
git clone https://github.com/nextflow-io/nextflow.git
cd nextflow
docker compose up -d 简介
Nextflow 是常用于生物信息分析的工作流引擎,可把测序、质控、比对、定量、变异检测等步骤组织为可重复 pipeline,并在本机、HPC、云和容器环境中运行。它不是医学专用工具,但在医学基因组学和转化研究中非常常见。
部署步骤
- 安装 Java 运行环境。
- 安装 Nextflow:
curl -s https://get.nextflow.io | bash
- 将生成的
nextflow文件移动到 PATH 中,或在当前目录运行。 - 运行官方 hello 流程:
./nextflow run hello
- 如果流程需要 Docker 容器,先安装 Docker,然后运行支持 Docker profile 的流程,例如:
./nextflow run nextflow-io/hello -with-docker
- 对 nf-core 等正式流程,应按对应流程文档选择
-profile docker、-profile singularity或机构 HPC profile。
适用场景
- RNA-seq、WGS/WES、单细胞和宏基因组 pipeline。
- 多中心协作中固定流程版本和容器依赖。
- 将命令行脚本升级为可追踪、可恢复、可并行的研究流程。
- 医学基因组学平台和生物信息核心实验室的生产级工作流。