什么是 Detectron2？

Detectron2 是 Meta AI（前身为 Facebook AI）的下一代库，提供最先进的目标检测和分割算法。它基于 PyTorch 构建，是原始 Detectron 的完全重写，旨在更灵活、可扩展和更快。它为计算机视觉研究人员和从业者提供了一个基础工具，用于构建和部署高性能模型，以完成目标检测、实例分割、关键点检测和全景分割等任务。

主要特点

最先进的模型： 包括 Mask R-CNN、Faster R-CNN、RetinaNet 和 Panoptic-FPN 等顶级模型的实现。
模块化设计： 高度可扩展，允许研究人员轻松地为新模型和任务插入自定义模块。
模型动物园（Model Zoo）： 在各种数据集（COCO、LVIS 等）上提供了大量预训练模型，使用户能够快速入门，而无需从头开始训练。
高性能： 针对速度进行了优化，支持跨多个 GPU 的分布式训练，以加速研究和开发周期。
由 PyTorch 驱动： 与 PyTorch 深度学习框架完全集成，利用其动态计算图和广泛的生态系统。
多样化的任务支持： 原生支持广泛的视觉任务，包括边界框检测、实例分割、人体关键点检测和全景分割。

使用案例

自动驾驶： 实时识别和跟踪车辆、行人和交通标志。
医学成像： 在 MRI 或 CT 等医学扫描中分割肿瘤、细胞或其他解剖结构。
零售分析： 检测货架上的产品以进行库存管理或分析顾客客流模式。
卫星图像分析： 从卫星图像中识别建筑物、道路或农田。
机器人技术： 使机器人能够感知并与其环境中的物体互动。

入门指南

要开始使用 Detectron2，您首先需要安装它及其依赖项。

```bash

安装 PyTorch、torchvision 和其他依赖项

如果使用 GPU，请确保您有兼容的 CUDA 版本

pip install torch torchvision

从源代码安装 Detectron2

pip install ‘git+https://github.com/facebookresearch/detectron2.git’

这是一个简单的“Hello World”示例，使用预训练模型对样本图像运行推理。

```python import torch, torchvision import detectron2 from detectron2.utils.logger import setup_logger setup_logger()

import some common libraries

import numpy as np import os, json, cv2, random

import some common detectron2 utilities

from detectron2 import model_zoo from detectron2.engine import DefaultPredictor from detectron2.config import get_cfg from detectron2.utils.visualizer import Visualizer from detectron2.data import MetadataCatalog, DatasetCatalog

Download a sample image

!wget http://images.cocodataset.org/val2017/000000439715.jpg -q -O input.jpg im = cv2.imread(“./input.jpg”)

Create config and predictor

cfg = get_cfg()

Add project-specific config (e.g., TensorMask) here if you’re not running a model in detectron2’s core

cfg.merge_from_file(model_zoo.get_config_file(“COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml”)) cfg.MODEL.ROI_HEADS.SCORE_THRESH_TEST = 0.5 # set threshold for this model

Find a model from detectron2’s model zoo. You can use the URL

cfg.MODEL.WEIGHTS = model_zoo.get_checkpoint_url(“COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml”) predictor = DefaultPredictor(cfg) outputs = predictor(im)

Visualize the results

v = Visualizer(im[:, :, ::-1], MetadataCatalog.get(cfg.DATASETS.TRAIN[0]), scale=1.2) out = v.draw_instance_predictions(outputs[“instances”].to(“cpu”)) cv2.imwrite(“output.jpg”, out.get_image()[:, :, ::-1])

print(“推理完成。请检查 output.jpg 文件。”)

定价

Detectron2 是一个在 Apache 2.0 许可下发布的开源项目。它对学术和商业用途完全免费。

Detectron2