什么是 TensorFlow & PyTorch？

TensorFlow（由谷歌开发）和 PyTorch（由 Meta 开发）是两个占主导地位的开源深度学习框架，它们构成了现代人工智能开发的基石。它们为构建、训练和部署机器学习模型提供了全面而灵活的生态系统，从简单的回归到庞大的大型语言模型（LLM）。虽然两者最终目的相同，但它们在易用性、调试和部署方面有不同的理念，使它们适用于不同的需求和工作流程。

TensorFlow 的主要特点

可扩展性和生产就绪性： TensorFlow 以其强大的生产流程而闻名。像 TensorFlow Serving 这样的工具可以大规模部署模型，而 TensorFlow Lite 则支持在移动和嵌入式设备上进行设备端推理。
全面的生态系统： 它包括一套工具，如用于模型可视化的 TensorBoard、用于预训练模型的 TensorFlow Hub，以及用于大规模分布式训练的成熟生态系统。
静态计算图： TensorFlow 传统上使用“定义并运行”的方法，即首先定义模型的图，然后执行。这允许在性能和可移植性方面进行显著优化。
Keras 集成： 高级 Keras API 完全集成到 TensorFlow 中，使得快速构建和迭代标准神经网络架构变得异常容易。

PyTorch 的主要特点

Python 优先且直观： PyTorch 因其“Pythonic”设计而备受赞誉。它与 Python 语言及其数据科学生态系统（如 NumPy）无缝集成，使开发人员感觉直观。
动态计算图： PyTorch 使用“边运行边定义”的方法。图是在操作执行时动态构建的，这极大地简化了调试，并允许更灵活的模型架构，尤其是在研究中。
强大的 GPU 加速： 它为加速模型训练提供了简单而强大的 GPU 使用控制。
充满活力的研究社区： 由于其灵活性和易用性，PyTorch 已成为学术界和研究界的首选框架，导致了最先进模型的迅速采用。

使用案例

计算机视觉： 这两个框架都广泛用于图像分类、目标检测和分割。
自然语言处理（NLP）： 它们支持从情感分析和文本生成到像 BERT 和 GPT 这样复杂的基于 Transformer 的模型的一切。
强化学习： 构建和训练通过与环境互动来学习的智能体。
学术研究： 快速原型化和实验新颖的模型架构和学习技术。

入门指南

TensorFlow “Hello World” (使用 Keras)

此示例构建了一个简单的顺序模型，用于对 MNIST 数据集中的手写数字进行分类。

```python import tensorflow as tf

Load the dataset

mnist = tf.keras.datasets.mnist (x_train, y_train), (x_test, y_test) = mnist.load_data() x_train, x_test = x_train / 255.0, x_test / 255.0

Build the model

model = tf.keras.models.Sequential([ tf.keras.layers.Flatten(input_shape=(28, 28)), tf.keras.layers.Dense(128, activation=’relu’), tf.keras.layers.Dropout(0.2), tf.keras.layers.Dense(10) ])

Compile the model

model.compile(optimizer=’adam’, loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True), metrics=[‘accuracy’])

Train and evaluate

model.fit(x_train, y_train, epochs=5) model.evaluate(x_test, y_test, verbose=2)

PyTorch “Hello World”

此示例定义了一个简单的神经网络类并对其进行训练。

```python import torch import torch.nn as nn import torch.optim as optim

Define the model

class SimpleNet(nn.Module): def init(self): super(SimpleNet, self).init() self.fc1 = nn.Linear(784, 128) self.relu = nn.ReLU() self.fc2 = nn.Linear(128, 10)

def forward(self, x):
    x = x.view(-1, 784) # Flatten the image
    x = self.fc1(x)
    x = self.relu(x)
    x = self.fc2(x)
    return x

Dummy data

inputs = torch.randn(64, 1, 28, 28) # 64 images of 28x28 labels = torch.randint(0, 10, (64,))

Instantiate model, loss, and optimizer

model = SimpleNet() criterion = nn.CrossEntropyLoss() optimizer = optim.SGD(model.parameters(), lr=0.01)

Training loop

optimizer.zero_grad() outputs = model(inputs) loss = criterion(outputs, labels) loss.backward() optimizer.step()

print(f’Loss: {loss.item()}’)

定价

TensorFlow 和 PyTorch 都是完全免费的开源项目，分别由 Google 和 Meta 支持。您只需为您用于运行它们的云计算资源（如 GPU）付费。

TensorFlow & PyTorch