for 知乎链接图标抓取
探索 Gemma:谷歌开源 AI 模型
2024-04-01 212 作者:
字号:【小】【中】【大】
分享到:

谷歌推出最新的开源大模型—Gemma,它采用了与Gemini模型相同的研究和技术所构建,但比Gemini更轻量级更先进。

Gemma是一系列轻量级、最先进的开放式模型,采用与创建Gemini模型相同的研究和技术而构建。Gemma 由 Google DeepMind 和 Google 的其他团队开发,其灵感来自 Gemini,其名称反映了拉丁语gemma,意思是“宝石”。

image.png

什么是gemma

Gemma 是 Google AI 系列的最新成员,包括源自 Gemini 模型的相同技术的轻量级顶级开放模型。

Gemma不仅仅只有2B 和 7B这两种规模,实际上是发布了Gemma系列(经过预训练的变体和指令优化的变体,大大小小50多种),Gemma 模型非常适合各种文本生成任务,包括问答、总结和推理。

同时,还能在Keras3.0(以集成主要框架JAX、PyTorch和TensorFlow)上用于推理和监督微调(SFT)的工具链。以及提供了谷歌Colab和Kaggle笔记本快速部署代码和HuggingFace等第三方AI平台的集成,使用户能快速上手体验。

功能介绍

1.以两种规模发布模型尺寸:Gemma 2B和Gemma 7B。每种规模都发布了预训练和指令调优的变体。

image.png

2.一个新的负责任的生成式AI工具包提供了指导和必要工具,用于使用Gemma创建更安全的AI应用。

3.为所有主要框架提供了推理和监督式微调(SFT)的工具链:通过原生Keras 3.0支持JAX、PyTorch和TensorFlow。

4.随时可用的Colab和Kaggle笔记本,以及与流行工具(如Hugging Face、MaxText、NVIDIA NeMo和TensorRT-LLM)的集成,使得开始使用Gemma变得简单。

5.预训练和指令调优的Gemma模型可以在您的笔记本电脑、工作站或Google Cloud上运行,通过Vertex AI和Google Kubernetes Engine(GKE)轻松部署。

6.在多个AI硬件平台上的优化确保了行业领先的性能,包括NVIDIA GPU和Google Cloud TPU。

尺寸性能

Gemma 模型与Gemini共享技术和基础设施组件,Gemini 是我们当今广泛使用的最大、功能最强大的 AI 模型。与其他开放式型号相比,这使得 Gemma 2B 和 7B 能够在其尺寸范围内实现同类最佳的性能。Gemma 模型能够直接在开发人员笔记本电脑或台式计算机上运行。值得注意的是,Gemma 在关键基准上超越了更大的模型,同时遵守关于安全和负责任的输出的严格标准。有关性能、数据集组成和建模方法的详细信息。

image.png

设计更加负责

Gemma 的设计以人工智能原则为核心。为了使 Gemma 预训练模型安全可靠,使用自动化技术从训练集中过滤掉某些个人信息和其他敏感数据。此外,利用人类反馈 (RLHF) 进行广泛的微调和强化学习,使指令调整模型与负责任的行为保持一致。为了了解和降低 Gemma 模型的风险状况,进行了稳健的评估,包括手动红队、自动对抗测试以及危险活动模型能力评估。

跨框架、工具和硬件进行优化

可以根据自己的数据微调 Gemma 模型,以适应特定的应用程序需求,例如摘要或检索增强生成 (RAG)。Gemma 支持多种工具和系统:

多框架工具:带上您最喜欢的框架,以及跨多框架 Keras 3.0、本机 PyTorch、JAX 和 Hugging Face Transformers 进行推理和微调的参考实现。

跨设备兼容性: Gemma 模型可以跨流行的设备类型运行,包括笔记本电脑、台式机、物联网、移动设备和云,从而实现广泛的 AI 功能。

尖端硬件平台:针对 NVIDIA GPU 优化 Gemma,从数据中心到云端再到本地 RTX AI PC,确保行业领先的性能并与尖端技术集成。

针对 Google Cloud 进行了优化: Vertex AI 提供了广泛的 MLOps 工具集,其中包含一系列调整选项以及使用内置推理优化的一键部署。完全托管的 Vertex AI 工具或自我管理的 GKE 提供高级自定义功能,包括从任一平台跨 GPU、TPU 和 CPU 部署到经济高效的基础设施。

image.png

Gemma是Google在2024年2月21日推出的一个新项目,旨在为用户提供丰富的提示、代码示例和集成方案,以便深入了解和使用这一平台。通过我们的初步测试,我们发现Gemma在运行时需要一定的时间。这不仅反映了其强大的功能和复杂的算法,也意味着用户在使用过程中需要耐心等待,以充分发挥Gemma的潜力。Google提供的资源非常有助于缩短学习曲线,让用户能够更快地掌握Gemma的使用方法,并有效地将其应用于各种项目中。


最新标签
最新更新
我要试用
验证码
奖励领取
验证码
关注或联系我们

微信公众号

业务咨询:400-9969-069(24小时服务) 028-86052918
售后热线:028-86052836
公司地址:成都市武侯区天益街38号理想中心3栋1810

在线客服
Copyright© 2022天健世纪. All Rights Reserved. 蜀ICP备16016808号
for 知乎链接图标抓取
×
快速定制通道
获取验证码
快速咨询