整整大模型-1-快速使用

tianyiguop 发布于 2025-01-03 140 次阅读


目前大模型对于我们最大的帮助是扩散我们的能力, 让我们快速地作为门外汉解决眼下的问题, 提高单兵作战的能力.

选择哪个模型

大模型的逻辑能力是解决我们问题的关键, 不过很难鉴别, 在面对问题的时候切换模型, 直到能覆盖大部分工作场景的就可以了.

大模型榜单是没有太大参考价值的, 自己实际要解决的问题才是真正的测试集.

开始使用可以从claude-3-5-sonnet-20241022起手, 不行换gpt-4o, claude-3-opus-20240229, gpt-4-turbo, gemini-exp-1206这几种不同厂家的轮换, 大部分情况Claude3.5就已经很能打了.

关于上下文

维护一个信息正确的上下文对我们使用有帮助, 这能减少干扰信息, 提高模型正确执行指令的概率(也能降低使用成本).

在官方网站中, 我们可以通过重新提问的方式来让上下文专注, 但是模型的细微偏差回复如果通过我们提醒纠正的话, 它可能会一再偏离. 因此通过API调用来使用大模型会得到便利.

在API调用的方式内, 虽然我们的计费方式换成了按量计费, 但是我们的自定义程度也高了很多. 我们可以编辑模型的输出来让模型"以为自己说过了且用户认可了的回答", 来让AI有符合我们期望的回答.

在可复制的繁琐任务中, 可以通过自己设定任务, 自问, 自答, 来构建一个完整工作流程的上下文, 然后将新的信息和任务给AI, 它便可以按照我们举例的方式来执行任务.

建议在新任务或者换话题的时候新建对话, 这样主要可以省下token, 上下文越长, 每次让模型回复的时候就花更多的钱.

开始使用

BetterChatGPT https://zephyr.tianyi0217.com

我的网站使用的是中转站, 可以支持多家模型

填入此key快速使用: sk-47ahcuIZQbwp38LI3466891e989f48BeBd305d096628Bd50

在BetterChatGPT中, 我们可以轻松地对当前对话中的任何部分进行编辑, 无论是模型说的还是我们说的. 在设置里也有更加个性化的设置比如可以让enter变成仅换行不发送.

BetterChatGPT的对话内容都保存在浏览器内, 出bug或者换浏览器会轻易地丢失(不过也因此更保护隐私), 它简约, 快捷, 因此是我处理临时任务的主力

LibreChat https://cc.tyop.cc

LibreChat取百家之长, 弄了一个超级缝合怪, 支持的更多特性也许可以提高一些生产力. 主要是多了消息编辑历史记录(可以查看上一次的回答), 能够上传图片和文件进行分析. 是我渐渐使用更多的的版本.

与模型对话

尝试带偏模型

我们可以编辑模型的回复来临时改变它回复的风格, 这无用但有趣.

频繁编辑模型的回复, 它的新回复就会被带跑偏

给模型一个系统设定

系统指令 (System Prompt) 通常用于任务描述, 人设, 回复规则, 我们可以通过设定系统指令来让模型更加遵循我们的想要的模式

System Prompt:
你的任务是扮演一个叫做顾笑然的女生.
顾笑然, 22岁, 来自广东, 喜欢摄影, 大学学的专业是心理学.
你回复的格式是: <analysis>分析用户的意图和心理</analysis>回复用户的内容
你回复内容时使用社交软件中聊天气泡的想到就发送的想法, 分成多行短句, 不使用句号

通过简单的设定, 我们可以轻松地让模型虚构角色, 和我们完成日常的对话, 对于这种情景模拟的Roll Play, 有更加棒的开源系统来完成此类对话

SillyTavern的对话界面

不过它的配置略为繁琐, 需要另起一篇了.

和模型交流并且让它为我们工作其实很简单, 可以在使用前做这样一个假设:

有一个忽然被拉过来帮你打杂的大佬来了, 你需要描述你的任务的目的, 做到哪里了, 接下来要做什么, 遇到了什么问题. 然后当做小白听从建议, 按照指示做, 哪里出错了就反馈给大佬, 大佬也不会就查下谷歌再反馈给大佬. 基本上就能解决很多小问题了.

用模型解决一个实际问题的案例

这里我结合娱乐性质的尝试的, "试图让AI来自己进行加密货币的交易" 的工作流, 来举例一下我日常使用模型的方式.

背景信息: 在进行这个任务前我只使用过USDT充值虚拟卡来开通ChatGPT会员等, 我完全没有虚拟货币的经验, 也真的不了解这个市场. 不过我最近想要尝试让模型来根据一些不科学的东西自己交易比特币, 看看能否从中获利. 我对于常见的加密手段和方式也缺乏常识.

我常使用一个叫做n8n的低代码自动化工作流系统, 它里面提供包括自动化调用和大模型助理, 在我认为它是能够完成这个任务的, 因此我选择使用大模型来帮助我进行搭建.

首先我在一个对话中连续追问了一些知识, 包括 比特币交易有手续费吗? 交易三百美元的比特币, 平均交易一次要多少钱? 交易普通优先级会在多少秒内完成? 使用闪电网络会有什么风险? 如果我想的是在交易所交易比特币要手续费吗? 支持api操作的交易所有什么? 这些都能用api买入卖出交易吗? 支持中国大陆实名认证的有哪些? 币安(Binance)需要实名认证吗? 我已经注册了欧易了, 怎么尝试用api交易呢? 在交易所内部购买和卖出的过程有延迟吗? 要等多久?

根据模型的回复中我完全不了解的地方进行了快速地扫盲, 然后选择了一个平台, 并且通过官网找到了其确实支持webhook进行交易的信息.

然后我新开了一个对话窗口, 进行了任务的描述. 在我的描述中, 我进行的是:

  1. 对任务背景信息的阐述, 我使用的工具, 平台, 目的, 需求.
  2. 我目前所能提供的信息(在这里是"我有多想在此时交易", 以及是想卖还是想买, 以及我要在这里接入大模型)

模型通过Artifacts(在设置里面打开)给我绘制了一个流程图, 我借此大致了解了其中要进行的步骤.

然后我直接截图发给模型询问参数的调用规则

在尝试按照模型的指导操作的时候, 返现里面存在了不存在的内容, 这时候直接把新的情况报告给模型就好

这里提到的签名我并不了解, 因此我在这里进行了追问

了解了上面的信息后, 我接着跟着模型的指引做, 不过发现了其实n8n是有提供一些额外的预先设定好的认证方式的, 我就好奇有没有什么认证方式比较通用直接填参数就行, 不用header, 回复是

这里模型就出现了幻觉, 它生成了一个我找不到的参数, 因此我选择放弃这里, 从上面的能跟上的地方进行了一个分叉, 换到了新的窗口.

在这里按照旧方法填写, 模型觉得我很聪明, 还用感叹号狠狠认同了我哈哈哈.

但是我还是没有太理解, 于是开始描述我的疑惑, 并且要求解释

令人感到懊恼的是, 模型提供的代码完全运行不起来, 直接报错了

于是我阅读了代码, 把报错给它, 提出我自己的疑问

然后就一直把报错发给它, 它一直尝试回答新的解决方案.

尝试几次后, 它一直不能给出解决方案, 越写越复杂. 不过这时候继续苛责它能力不行是没有意义的了, 我们要寻找一个方式来突破.

google一下就发现了突破点, 其实是有专门的模块来解决这个问题的.

将这个信息报告给模型

接下来就一切顺利了, 将界面截图给模型, 让它来提醒选择什么选项, 填写什么参数.

后面就成功地生成了签名.

至此在我的知识之外的进行webhook交易的流程, 已经和模型以及克服了, 后面我就可以给这些节点接上大模型了.

在后面的文章里, 我准备用Cursor来写一个新的小项目或者整个论文来举例子.

此作者没有提供个人介绍
最后更新于 2025-01-03