本站资源仅供教育与科研用途
返回资源列表
生物信息学 开源项目 中级

Nextflow

用于构建可重复、可移植生物信息工作流的数据流式 pipeline 引擎。

前往 GitHub 仓库
医学子领域
生物信息学
资源类型
开源项目
开源协议
Apache License 2.0
部署方式
本地 CLI;流程任务可通过 Docker/Singularity/Podman 容器化
仓库链接
https://github.com/nextflow-io/nextflow
生物信息工作流可重复研究DockerHPC
部署引导

快速部署

Docker 命令
git clone https://github.com/nextflow-io/nextflow.git
cd nextflow
docker compose up -d
涉及患者数据的项目请仅用公开或脱敏数据集,部署说明可能随项目更新变化

简介

Nextflow 是常用于生物信息分析的工作流引擎,可把测序、质控、比对、定量、变异检测等步骤组织为可重复 pipeline,并在本机、HPC、云和容器环境中运行。它不是医学专用工具,但在医学基因组学和转化研究中非常常见。

部署步骤

  1. 安装 Java 运行环境。
  2. 安装 Nextflow:
curl -s https://get.nextflow.io | bash
  1. 将生成的 nextflow 文件移动到 PATH 中,或在当前目录运行。
  2. 运行官方 hello 流程:
./nextflow run hello
  1. 如果流程需要 Docker 容器,先安装 Docker,然后运行支持 Docker profile 的流程,例如:
./nextflow run nextflow-io/hello -with-docker
  1. 对 nf-core 等正式流程,应按对应流程文档选择 -profile docker-profile singularity 或机构 HPC profile。

适用场景

  • RNA-seq、WGS/WES、单细胞和宏基因组 pipeline。
  • 多中心协作中固定流程版本和容器依赖。
  • 将命令行脚本升级为可追踪、可恢复、可并行的研究流程。
  • 医学基因组学平台和生物信息核心实验室的生产级工作流。