AI 应用基础
1.概述
1.1 什么是 AI
AI(Artificial Intelligence,人工智能)是一个学科领域的统称,目标是使机器能够像人类一样思考、学习、推理和解决问题。
AI 不是一项单一的技术,而是一门致力于让机器模仿人类智能的综合性学科。
人类之所以能够进行独立的思考、学习以及推理,核心是因为大脑拥有极其复杂的神经网络(包括众多的神经元以及突触等结构)。通过代码加上特定的数学算法来模拟人脑神经网络,使其具备智能能力的程序,就是 AI 大模型。
1.2 什么是大模型
大模型也称为大语言模型(Large Language Models,简称 LLM),是 AI 技术的一个分支。
大模型本质是一段模拟人脑神经网络的代码程序,"大"指的是程序中涉及的参数量极其庞大(通常达到数十亿至数千亿级别),通过海量数据训练后,具备理解人类语言、逻辑推理并输出符合人类语言习惯的内容的能力。
主流大模型:
| 大模型 | 公司 |
|---|---|
| GPT | OpenAI |
| Gemini | |
| Grok | xAI |
| Claude | Anthropic |
| DeepSeek | 深度求索 |
| Qwen(通义千问) | 阿里巴巴 |
| 豆包 | 字节跳动 |
| 讯飞星火 | 科大讯飞 |
| 混元 | 腾讯 |
| Kimi | 月之暗面 |
1.3 什么是 AI 应用
AI 应用是指将 AI 大模型技术落地到具体的业务场景中,用来解决实际问题的产品或服务。
AI 应用示例:
- 豆包 AI:知识问答、生成图片、代码编写、文案创作、PPT 制作、语言翻译
- 智能客服:各类系统中的自动问答
- 视频内容 AI 自动提取:网盘、视频网站的内容摘要
- AI 数字人:低成本直播增收
- AI 短剧、电商平台 AI 购物助手
- 医院智能诊断系统、金融量化交易平台
2.大模型部署
2.1 部署方案
| 方案 | 优点 | 缺点 |
|---|---|---|
| 本地部署 | 数据安全、自主可控、长期成本低 | 初始成本高、需长期维护、性能受限 |
| 官方开放 API | 前期成本低、无需部署和维护、随时访问 | 隐私不能保障、长期成本高、可控性差 |
| 云服务平台 | 前期成本低、无需部署和维护、选择度高 | 安全及隐私不能保障、长期成本高 |
API 说明
API(Application Programming Interface,应用程序编程接口)是软件间的标准化"桥梁",允许开发者无需知晓内部细节即可调用外部功能或数据。
2.2 Ollama 本地部署
Ollama 是一个在本地运行、管理大语言模型的工具。
安装步骤:
- 访问官网:https://ollama.com/
- 下载对应操作系统的安装包
- 双击安装
使用命令:
# 运行大模型(首次会自动下载)
ollama run deepseek-r1:8b
# 查看已安装的模型
ollama list
# 删除模型
ollama rm 模型名注意
默认情况下,Ollama 会安装在 C 盘用户目录下(C:\Users\用户名)。如果想安装到其他目录,需要自定义安装。
自定义安装步骤:
- 不要双击
OllamaSetup.exe安装 - 在
OllamaSetup.exe所在目录打开 CMD 命令行 - 执行以下命令(指定安装目录):
OllamaSetup.exe /DIR="D:\develop\Ollama"- 配置环境变量
OLLAMA_MODELS,指定模型下载目录:
变量名:OLLAMA_MODELS
变量值:D:\develop\Ollama\models说明
/DIR参数指定 Ollama 的安装目录OLLAMA_MODELS环境变量指定下载的模型存放目录- 如果不配置
OLLAMA_MODELS,模型默认存放在 C 盘用户目录下
2.3 选择合适的模型参数规模
大模型有不同的参数规模版本,B 代表 10 亿参数。
DeepSeek R1 版本:
| 版本 | 参数量 | 模型大小 | 适用场景 |
|---|---|---|---|
| 1.5B | 15 亿 | 1.1G | 集成显卡、性能一般的电脑 |
| 7B | 70 亿 | 4.7G | 独立显卡、中等性能 |
| 8B | 80 亿 | 5.2G | 独立显卡、中等性能 |
| 14B | 140 亿 | - | 高性能显卡 |
| 70B | 700 亿 | - | 高端显卡 |
| 671B | 6710 亿 | - | 满血版本,需多张高端显卡 |
选择建议:
- 参数量越大,性能越高,但对算力要求也越高
- 满血版本(671B)大约需要 8 张 H200 英伟达显卡(上百 G 显存)
- 根据自己电脑的硬件情况选择合适的版本
- 如果显卡一般或使用集成显卡,选择 1.5B 即可
- 如果显卡性能较好(如 RTX 4070),可以选择 7B 或 8B
查看模型详情
在 Ollama 官网的 Models 页面,可以查看不同模型的详细信息,包括参数量、大小等。
2.4 DeepSeek 官方开放 API
主流大模型(如 DeepSeek、Kimi、通义千问等)官方都提供了开放 API,无需部署,可直接调用访问。
使用步骤:
- 访问 DeepSeek 官网(https://deepseek.com)
- 点击"API 开放平台"
- 注册账号并登录
- 充值(最低 1 元,选择"自定义"输入 1 元即可)
- 创建 API Key(密钥,用于身份验证和扣费)
API Key 安全
- API Key 是调用大模型的身份凭证,用于验证权限和账户扣费
- 建议将 API Key 配置在环境变量中,避免直接写在代码中导致泄露
