更新时间:2024-11-05 06:02:31
PaLM 结合 Google 和 Pathways 帮助扩展 AI 语言建模
硅谷科技巨头谷歌推出了 PaLM 或 Pathways 语言模型,以在全球科技市场推出下一代 AI 语言模型。谷歌添加了一个新的人工智能架构,其战略目标是通过 PaLM 提高人工智能语言模型的质量。让我们探索一下 PaLM 的功能和流程,这些功能和流程为 Google 成为科技市场的领先公司创造了充足的途径。
Pathways 将扩展到 5400 亿个参数,以实现 Google for PaLM 的突破性性能。它被称为可以有效地跨多个领域泛化的单一模型。Google 的 Pathways 专注于为加速器构建分布式计算。PaLM 由使用 Pathways 系统训练的仅解码器变压器模型组成。谷歌宣布,PaLM 已经成功地在多个不同任务中实现了最先进的小样本性能。
PaLM 展示了 Pathways 系统的首次大规模使用,将训练扩展到最大的基于 TPU 的系统配置,即 6144 芯片。AI 语言模型还有一个由英语和其他多语言数据集组合而成的训练数据集。它包括高质量的 Web 文档、对话、书籍、GitHub 代码、维基百科以及更多具有“无损”词汇的内容。无损词汇以保留空白和将词汇外的 Unicode 字符拆分为字节而闻名。
PaLM 在语言理解和生成、多步算术代码相关任务、常识推理、翻译等不同难度任务上表现出多项突破性能力。它在解决一些复杂问题的多语言 NLP 集上取得了性能。全球科技市场可以利用 PaLM 来区分因果、概念组合、不同的游戏等等。PaLM 还能够借助多步逻辑推理、深度语言、世界知识等,为不同的场景生成详细的解释。
Google 和 Pathways 在标准转换器模型架构的基础上创建了 PaLM,同时使用了解码器设置,例如 SwiGLU 激活、并行层、RoPE 嵌入和共享输入输出嵌入、多查询注意,以及无偏差和词汇.话虽如此,PaLM 将成为 Google 和 Pathways 之家的 AI 语言模型的坚实基础。