简介

发表于 2024-07-09

成功落地大模型五要素：

业务人员的积极
对 AI 能力的认知
业务团队自带编程能力
小处着手
老板的耐心

找落地场景的思路：

从最熟悉的领域入手
尽量找能用语言描述的任务
别求大而全。将任务拆解，先解决小任务、小场景
让 AI 学最厉害员工的能力，再让 ta 辅助其他员工，实现降本增效

训练：

大模型阅读了人类说过的所有的话。这就是「机器学习」
训练过程会把不同 token 同时出现的概率存入「神经网络」文件。保存的数据就是「参数」，也叫「权重」

推理：

我们给推理程序若干 token，程序会加载大模型权重，算出概率最高的下一个 token 是什么
用生成的 token，再加上上文，就能继续生成下一个 token。以此类推，生成更多文字

值得尝试 Fine-tuning 的情况：

提高模型输出的稳定性
用户量大，降低推理成本的意义很大
提高大模型的生成速度
需要私有部署

基础模型选型，合规和安全是首要考量因素。

需求	国外闭源大模型	国产闭源大模型	开源大模型
国内 2C	🛑	✅	✅
国内 2G	🛑	✅	✅
国内 2B	✅	✅	✅
出海	✅	✅	✅
数据安全特别重要	🛑	🛑	✅

然后用测试数据，在可以选择的模型里，做测试，找出最合适的。

为什么不要依赖榜单？

榜单已被应试教育污染。唯一值得相信的榜单：LMSYS Chatbot Arena Leaderboard
榜单体现的是整体能力。放到一件具体事情上，排名低的可能反倒更好
榜单体现不出成本差异