编程

面向开发者的 AI 术语表

359 2024-10-13 07:32:00

大多数开发者在学习如何使用 AI 库将 AI 集成到他们的应用中时都会遇到问题。AI 引入了许多新的术语、缩写词和技术,你必须理解它们才能构建一个好的系统。
本文将尽力向那些还不是 AI 专家的开发者解释了最重要的术语和缩写。

生成式 AI

生成式 AI 是一种在海量数据集上训练的模型,用于发现生成文本、图像、音频和视频等内容的模式.

LLM – 大语言模型(Large Language Model)

LLM 是一种专门用于基于文本数据的生成式 AI。

NLP – 自然语言处理(Natural Language Processing)

NLP 旨在使程序能够理解和生成人类语言。它是计算机科学的一个子领域,使用语言学、统计建模和机器学习。

AI Prompt

提示(Prompt)是提供给 AI 系统以实现预期结果的输入。这可以是任何形式的问题、指示或信息。

你通常可以通过重新表述你的提示或提供额外信息来调整人工智能系统提供的结果。

零样本提示(Zero-shot prompting)/直接提示(direct prompting)

使用没有示例的提示让 AI 系统执行其模型尚未训练过的任务被称为零样本或直接提示。然后,模型使用它学过的模式来创建结果。

这是最简单的提示形式。

单样本提示(One-shot prompting) / 少样本提示(few-shot prompting) / 多样本提示(multi-shot prompting)

一个包含一个或多个示例的提示,让 AI 系统执行其模型尚未训练过的任务,称为 one-shot, few-shot, or multi-shot prompt。然后,该模型使用提供的示例来推断它应该创建的结果的结构以及它已经学会创建它的模式。

RAG – 检索增强生成(Retrieval-Augmented Generation)

从不属于训练数据的可信来源向 LLM 提供事实称为检索增强生成(RAG)。这通常用于通过确保 LLM 使用最新和最可靠的信息来提高生成结果的质量。

你可以使用 RAG 来降低产生幻觉的风险。

Fine-tuning

微调(Fine-tuning)是一种使已经训练过的 LLM 适应特定任务的技术。它使用一个已经训练好的模型,并在一个较小的、特定于任务的数据集上进行进一步的训练。

Embeddings

嵌入(Embeddings)是数据的矢量表示,如单词、图像或文档,使模型能够比较和找到相似的数据。

Hallucination

幻觉(Hallucination)是 AI 系统作为事实呈现的虚假信息。

你可以使用 RAG 来降低产生幻觉的风险。

小结

当你试图学习如何将 AI 集成到应用中时,你必须熟悉许多新的术语、概念和缩写。

 

AI