Gemma家族通过为开发人员和研究人员量身定制的模型进行扩张

developer.chat

11 April 2024

SEO Title

Gemma Family Expands with Models Tailored for Developers and Researchers

介绍前两个Gemma变体

CodeGemma：为开发人员和企业提供代码完成、生成和聊天
CodeGemma利用我们Gemma模型的基础，为社区带来了强大而轻量级的编码功能。CodeGemma模型有专门用于代码完成和代码生成任务的7B预训练变体，用于代码聊天和指令跟随的7B指令调优变体，以及适用于本地计算机的用于快速代码完成的2B预训练变体。CodeGemma模型具有以下几个优点：

智能代码完成和生成：完成行、函数，甚至生成整个代码块——无论您是在本地工作还是利用云资源。
增强的准确性：CodeGemma模型基于来自网络文档、数学和代码的5000亿个主要是英语的数据标记进行训练，生成的代码不仅在语法上更正确，而且在语义上更有意义，有助于减少错误和调试时间。
精通多种语言：您对Python、JavaScript、Java和其他流行语言的宝贵编码助手。
优化的工作流程：将CodeGemma模型集成到您的开发环境中，以编写更少的样板文件，并更快地关注有趣且差异化的重要代码。

This table compares the performance of CodeGemma with other similar models on both single and multi-line code completion tasks. Learn more in the technical report.

在我们的报告中了解更多关于CodeGemma的信息，或在本快速入门指南中尝试。

RecurrentGemma：研究人员在更大批量下进行高效、更快的推理

RecurrentGemma是一个技术上不同的模型，它利用递归神经网络和局部注意力来提高记忆效率。在实现与Gemma 2B模型类似的基准分数性能的同时，RecurratGemma独特的架构带来了几个优势：

减少内存使用：更低的内存要求允许在内存有限的设备上生成更长的样本，如单个GPU或CPU。
更高的吞吐量：由于其减少了内存使用，RecurrentGemma可以在显著更高的批处理大小下执行推理，从而每秒生成更多的令牌（尤其是在生成长序列时）。
研究创新：RecurrentGemma展示了一种实现高性能的非变压器模型，突出了深度学习研究的进步。

This chart reveals how RecurrentGemma maintains its sampling speed regardless of sequence length, while Transformer-based models like Gemma slow down as sequences get longer.

要了解底层技术，请查看我们的论文。为了进行实际探索，可以试试笔记本，它演示了如何微调模型。

建立在Gemma的基础上，扩展能力

在与原Gemma模型相同的原则指导下，新模型变体提供：

开放式可用性：鼓励创新和合作，使其对每个人都可用，并提供灵活的使用条件。
高性能和高效功能：利用特定于代码的领域专业知识和优化设计，提升开放模型的功能，以实现异常快速的完成和生成。
负责任的设计：我们对负责任的人工智能的承诺有助于确保模型提供安全可靠的结果。
多样化软件和硬件的灵活性：
- CodeGemma和RecurrentGemma：使用JAX构建，并与JAX、PyTorch、拥抱面部变换器和Gemma.cpp兼容。实现跨各种硬件的本地实验和经济高效的部署，包括笔记本电脑、台式机、NVIDIA GPU和谷歌云TPU。
- CodeGemma：此外还与Keras、NVIDIA NeMo、TensorRT LLM、Optimum NVIDIA、MediaPipe以及Vertex AI上的可用性兼容。
- RecurrentGemma：对上述所有产品的支持将在未来几周内提供。

Gemma 1.1更新

除了新的模型变体，我们还发布了Gemma 1.1，其中包括性能改进。此外，我们听取了开发人员的反馈，修复了错误，并更新了我们的条款，以提供更多的灵活性。

立即开始

这些第一个Gemma模型变体在世界各地都有售，从今天开始，在Kaggle、Hugging Face和Vertex AI模型花园上都有售。以下是如何开始：

访问模型：访问Gemma网站、Vertex AI模型花园、拥抱脸、NVIDIA NIM API或Kaggle以获取下载说明。
探索集成选项：查找将模型与您喜爱的工具和平台集成的指南和资源。
实验和创新：将Gemma模型变体添加到您的下一个项目中，并探索其功能。

我们邀请您尝试CodeGemma和RecurrentGemma模型，并分享您对Kaggle的反馈。让我们一起塑造人工智能驱动的内容创作和理解的未来。

登录发表评论

热门内容

今日:

总体:

最近浏览：

标签（标签）

Gemma家族通过为开发人员和研究人员量身定制的模型进行扩张

category

介绍前两个Gemma变体

RecurrentGemma：研究人员在更大批量下进行高效、更快的推理

建立在Gemma的基础上，扩展能力

Gemma 1.1更新

立即开始

标签

标签（标签）

Search

category

介绍前两个Gemma变体

RecurrentGemma：研究人员在更大批量下进行高效、更快的推理

建立在Gemma的基础上，扩展能力

Gemma 1.1更新

立即开始

标签