跳转到主要内容

标签(标签)

资源精选(342) Go开发(108) Go语言(103) Go(99) angular(83) LLM(79) 大语言模型(63) 人工智能(53) 前端开发(50) LangChain(43) golang(43) 机器学习(39) Go工程师(38) Go程序员(38) Go开发者(36) React(34) Go基础(29) Python(24) Vue(23) Web开发(20) Web技术(19) 精选资源(19) 深度学习(19) Java(18) ChatGTP(17) Cookie(16) android(16) 前端框架(13) JavaScript(13) Next.js(12) 安卓(11) 聊天机器人(10) typescript(10) 资料精选(10) NLP(10) 第三方Cookie(9) Redwoodjs(9) ChatGPT(9) LLMOps(9) Go语言中级开发(9) 自然语言处理(9) PostgreSQL(9) 区块链(9) mlops(9) 安全(9) 全栈开发(8) OpenAI(8) Linux(8) AI(8) GraphQL(8) iOS(8) 软件架构(7) RAG(7) Go语言高级开发(7) AWS(7) C++(7) 数据科学(7) 智能体(6) whisper(6) Prisma(6) 隐私保护(6) JSON(6) DevOps(6) 数据可视化(6) wasm(6) 计算机视觉(6) 算法(6) Rust(6) 微服务(6) 隐私沙盒(5) FedCM(5) 语音识别(5) Angular开发(5) 快速应用开发(5) 提示工程(5) Agent(5) LLaMA(5) 低代码开发(5) Go测试(5) gorm(5) REST API(5) kafka(5) 推荐系统(5) WebAssembly(5) GameDev(5) CMS(5) CSS(5) machine-learning(5) 机器人(5) 游戏开发(5) Blockchain(5) Web安全(5) nextjs(5) Kotlin(5) 低代码平台(5) 机器学习资源(5) Go资源(5) Nodejs(5) PHP(5) Swift(5) RAG架构(4) devin(4) Blitz(4) javascript框架(4) Redwood(4) GDPR(4) 生成式人工智能(4) Angular16(4) Alpaca(4) 编程语言(4) SAML(4) JWT(4) JSON处理(4) Go并发(4) 移动开发(4) 移动应用(4) security(4) 隐私(4) spring-boot(4) 物联网(4) 网络安全(4) API(4) Ruby(4) 信息安全(4) flutter(4) 专家智能体(3) Chrome(3) CHIPS(3) 3PC(3) SSE(3) 人工智能软件工程师(3) LLM Agent(3) Remix(3) Ubuntu(3) GPT4All(3) 软件开发(3) 问答系统(3) 开发工具(3) 最佳实践(3) RxJS(3) SSR(3) Node.js(3) Dolly(3) 移动应用开发(3) 低代码(3) IAM(3) Web框架(3) CORS(3) 基准测试(3) Go语言数据库开发(3) Oauth2(3) 并发(3) 主题(3) Theme(3) earth(3) nginx(3) 软件工程(3) azure(3) keycloak(3) 生产力工具(3) gpt3(3) 工作流(3) C(3) jupyter(3) 认证(3) prometheus(3) GAN(3) Spring(3) 逆向工程(3) 应用安全(3) Docker(3) Django(3) R(3) .NET(3) 大数据(3) Hacking(3) 渗透测试(3) C++资源(3) Mac(3) 微信小程序(3) Python资源(3) JHipster(3) 语言模型(2) 可穿戴设备(2) JDK(2) SQL(2) Apache(2) Hashicorp Vault(2) Spring Cloud Vault(2) Go语言Web开发(2) Go测试工程师(2) WebSocket(2) 容器化(2) AES(2) 加密(2) 输入验证(2) ORM(2) Fiber(2) Postgres(2) Gorilla Mux(2) Go数据库开发(2) 模块(2) 泛型(2) 指针(2) HTTP(2) PostgreSQL开发(2) Vault(2) K8s(2) Spring boot(2) R语言(2) 深度学习资源(2) 半监督学习(2) semi-supervised-learning(2) architecture(2) 普罗米修斯(2) 嵌入模型(2) productivity(2) 编码(2) Qt(2) 前端(2) Rust语言(2) NeRF(2) 神经辐射场(2) 元宇宙(2) CPP(2) 数据分析(2) spark(2) 流处理(2) Ionic(2) 人体姿势估计(2) human-pose-estimation(2) 视频处理(2) deep-learning(2) kotlin语言(2) kotlin开发(2) burp(2) Chatbot(2) npm(2) quantum(2) OCR(2) 游戏(2) game(2) 内容管理系统(2) MySQL(2) python-books(2) pentest(2) opengl(2) IDE(2) 漏洞赏金(2) Web(2) 知识图谱(2) PyTorch(2) 数据库(2) reverse-engineering(2) 数据工程(2) swift开发(2) rest(2) robotics(2) ios-animation(2) 知识蒸馏(2) 安卓开发(2) nestjs(2) solidity(2) 爬虫(2) 面试(2) 容器(2) C++精选(2) 人工智能资源(2) Machine Learning(2) 备忘单(2) 编程书籍(2) angular资源(2) 速查表(2) cheatsheets(2) SecOps(2) mlops资源(2) R资源(2) DDD(2) 架构设计模式(2) 量化(2) Hacking资源(2) 强化学习(2) flask(2) 设计(2) 性能(2) Sysadmin(2) 系统管理员(2) Java资源(2) 机器学习精选(2) android资源(2) android-UI(2) Mac资源(2) iOS资源(2) Vue资源(2) flutter资源(2) JavaScript精选(2) JavaScript资源(2) Rust开发(2) deeplearning(2) RAD(2)

category

2024年2月22日,谷歌宣布了Gemma,这是一个轻量级、最先进的开放模型家族,采用了与我们创建Gemini模型相同的研究和技术。我们很高兴与大家分享,谷歌云客户今天可以开始在Vertex AI中定制和构建Gemma模型,并在谷歌Kubernetes引擎(GKE)上运行它们。Gemma的发布和我们更新的平台功能是我们致力于让人工智能对谷歌云上的开发者更加开放和可访问的下一阶段。

Gemma现在可以在谷歌云上使用

Gemma模型与我们有能力的Gemini模型共享技术和基础设施组件。与其他开放式机型相比,这使Gemma机型的尺寸能够达到同类最佳性能。我们发布了两种尺寸的砝码:Gemma 2B和Gemma 7B。每种尺寸都发布了经过预训练和指令调整的变体,以实现研究和开发。

Gemma支持谷歌云开发人员现在喜欢和使用的工具,包括Colab和Kaggle笔记本电脑,以及JAX、PyTorch、Keras 3.0和Hugging Face Transformers等框架。Gemma模型可以在笔记本电脑、工作站或谷歌云上运行。有了这些新的开放模型,开发人员现在可以使用Vertex AI进行构建和自定义,并在GKE上运行。为了最大限度地提高业界领先的性能,我们与NVIDIA合作,为NVIDIA GPU优化Gemma。

在Vertex AI中解锁Gemma的力量

Gemma加入了Vertex AI Model Garden的130多个模型,包括我们最近宣布的Gemini扩展访问范围:Gemini 1.0 Pro、1.0 Ultra和1.5 Pro模型。

通过在Vertex AI上使用Gemma模型,开发人员可以利用端到端ML平台,使调整、管理和监控模型变得简单直观。有了Vertex AI,建设者可以减少运营开销,并专注于创建针对其用例进行优化的Gemma定制版本。例如,在Vertex AI上使用Gemma模型,开发人员可以:

  • 为文本生成、摘要和问答等轻量级任务构建生成型人工智能应用程序
  • 使用轻量级但定制的模型进行探索和实验,实现研发
  • 支持需要低延迟的实时生成AI用例,如流式文本

Vertex AI使开发人员能够轻松地将自己调整的模型转变为可扩展的端点,为各种规模的人工智能应用程序提供动力。

Gemma 在GKE上实现从原型到生产的规模

GKE提供了构建自定义应用程序的工具,从简单项目的原型到在企业规模上推出。如今,开发人员还可以直接在GKE上部署Gemma,创建自己的一代人工智能应用程序,用于构建原型或测试模型功能:

  • 使用熟悉的工具链将自定义、微调的模型与应用程序一起部署在可移植容器中
  • 自定义模型服务和基础架构配置,而无需调配或维护节点
  • 快速集成人工智能基础设施,具备扩展能力,以满足最苛刻的训练和推理场景

GKE提供高效的资源管理、一致的操作环境和自动缩放。此外,它有助于通过谷歌云人工智能加速器(包括GPU和TPU)的轻松协调来增强这些环境,以便在构建生成人工智能模型时更快地进行训练和推理。

立即在谷歌云上开始使用Gemma

今天,您可以在谷歌云的Vertex AI和GKE中开始使用Gemma模型。有关Gemma的更多信息,请访问ai.google.dev/Gemma上的快速入门指南。