成功落地大模型五要素:
- 业务人员的积极
- 对 AI 能力的认知
- 业务团队自带编程能力
- 小处着手
- 老板的耐心
找落地场景的思路:
- 从最熟悉的领域入手
- 尽量找能用语言描述的任务
- 别求大而全。将任务拆解,先解决小任务、小场景
- 让 AI 学最厉害员工的能力,再让 ta 辅助其他员工,实现降本增效
训练:
- 大模型阅读了人类说过的所有的话。这就是「机器学习」
- 训练过程会把不同 token 同时出现的概率存入「神经网络」文件。保存的数据就是「参数」,也叫「权重」
推理:
- 我们给推理程序若干 token,程序会加载大模型权重,算出概率最高的下一个 token 是什么
- 用生成的 token,再加上上文,就能继续生成下一个 token。以此类推,生成更多文字
值得尝试 Fine-tuning 的情况:
- 提高模型输出的稳定性
- 用户量大,降低推理成本的意义很大
- 提高大模型的生成速度
- 需要私有部署
基础模型选型,合规和安全是首要考量因素。
需求 | 国外闭源大模型 | 国产闭源大模型 | 开源大模型 |
---|---|---|---|
国内 2C | 🛑 | ✅ | ✅ |
国内 2G | 🛑 | ✅ | ✅ |
国内 2B | ✅ | ✅ | ✅ |
出海 | ✅ | ✅ | ✅ |
数据安全特别重要 | 🛑 | 🛑 | ✅ |
然后用测试数据,在可以选择的模型里,做测试,找出最合适的。
为什么不要依赖榜单?
- 榜单已被应试教育污染。唯一值得相信的榜单:LMSYS Chatbot Arena Leaderboard
- 榜单体现的是整体能力。放到一件具体事情上,排名低的可能反倒更好
- 榜单体现不出成本差异