开源模型 | AI.DEV

变

什么是变分自编码器 (VAEs)？变分自编码器 (VAE) 是一种生成式神经网络，擅长学习数据集的底层结构。它由两个主要部分组成：一个编码器和一个解码器。编码器将输入数据（如图像）压缩到一个低维、连续的潜在空间中。与标准自编码器不同，...

查看工具 ↗

D

什么是DeepSpeed-MoE？DeepSpeed-MoE是DeepSpeed库的一个组件，DeepSpeed是微软开发的一个开源深度学习优化套件。它专门设计用于使大规模专家混合（MoE）模型的训练变得可行和高效。MoE模型通过为任...

查看工具 ↗

S

什么是 Stable Video Diffusion？Stable Video Diffusion (SVD) 是由 Stability AI 开发的一款强大的开源生成模型。它旨在将静态图像转换为简短的动态视频剪辑。SVD 建立在著名...

查看工具 ↗

P

什么是 PyTorch Hub？PyTorch Hub 是一个旨在促进研究可复现性和发现预训练模型的中央平台。它提供了一个简单统一的 API，用于探索和使用由社区和研究人员发布的各种模型。其主要目标是让开发人员和研究人员能够轻松加载和...

查看工具 ↗

G

什么是Gemma 7B？Gemma 7B是谷歌开发的一款轻量级、最先进的开源大型语言模型。它属于Gemma系列，该系列采用了与强大的Gemini模型相同的研究和技术构建。Gemma 7B专为可访问性和高性能而设计，是一个文本到文本、仅...

查看工具 ↗

P

什么是Phi-3 Mini？Phi-3 Mini是微软开发的38亿参数小型语言模型（SLM）。它是Phi-3系列开放模型的一部分，该系列旨在实现高能力和成本效益。尽管体积小巧，Phi-3 Mini在语言、编码和数学等各种基准测试中的表...

查看工具 ↗

C

Caffe 是什么？Caffe（Convolutional Architecture for Fast Feature Embedding）是一个由伯克利视觉与学习中心（BVLC）开发的深度学习框架。它的创建重点在于表达性、速度和模块...

查看工具 ↗

D

什么是 Detectron2？Detectron2 是 Meta AI（前身为 Facebook AI）的下一代库，提供最先进的目标检测和分割算法。它基于 PyTorch 构建，是原始 Detectron 的完全重写，旨在更灵活、可扩...

查看工具 ↗

E

什么是EfficientDet？EfficientDet是谷歌研究院开发的一系列目标检测模型，旨在实现高效率和高准确性。与以往那些常常为了精度而牺牲速度（或反之）的模型不同，EfficientDet引入了新颖的架构和缩放技术，创造出比...

查看工具 ↗

K

Keras是什么？Keras是一个用Python编写的高级开源神经网络API。它专为快速实验和易用性而设计，使开发人员能够用最少的代码构建和训练深度学习模型。Keras最初是作为一个独立的库创建的，现在是TensorFlow的官方高级...

查看工具 ↗

S

什么是 SSD (Single Shot MultiBox Detector)？SSD（Single Shot MultiBox Detector）是一种开创性的目标检测算法，它使用单个深度神经网络来检测图像中的物体。与先提出区域建议...

查看工具 ↗

M

MediaPipe 是什么？MediaPipe 是由谷歌开发的开源框架，旨在为实时和流媒体构建和部署设备端机器学习（ML）解决方案。它提供了一套跨平台、可定制的工具和库，用于处理视频和音频等时间序列数据。该框架为性能而生，使开发人员能...

查看工具 ↗