Skip to content

AI.xyz

AI.xyz 是一款用户友好的桌面AI客户端,支持众多先进的AI模型和API,提供直观界面与无缝集成,助力高效工作。

  • 下载: 关注微信公众号 【三十儿艺】,回复“888”即可获得下载链接
  • 交流群: 967640625

更新日志

1.0.0

2025.03.15

  • 新增自定义代理支持
  • 新增思考过程折叠功能
  • 新增输入框焦点定位快捷键
  • 修复 temperature 参数精度丢失问题
  • 修复复制文本时多余换行问题
  • 更新默认配置、优化交互细节

最近早起“肝”了一个月,AI.xyz 终于迎来了 1.0.0 版本。

别说普通用户了,其实 0.12.0 以前我自己都不用,因为它确实不好用。但最近这几个版本,我倒是挺自豪的——它终于从“样子货”变成了“可用”。从连续几个版本的更新日志就能看出来,所有的改动都是朝着真正为人使用的方向迈进的。这一个月里,它已经彻底融入了我的工作流,每天高频使用,哪里不爽改哪里。

工作流

AI 模型的发展真是日新月异,每个人都有自己的一套工作流。不知道大家平时是怎么用的,我还停留在复制粘贴、一问一答的形式,估计已经落后时代好几个版本了。像 cursor、cline 这类操作整个工作区的工具,我更是从来没用过。这里分享一下我的工作流。

1️⃣ 快速了解一个未知的概念或知识点

首选 qwen-max。这原本是百度的活儿,现在几乎都先用 AI.xyz 调用 qwen-max。如果解决不了,再回去问谷歌。当然,新闻和八卦还是首选百度。

2️⃣ 写文档、写博客、回复领导、同事

主要用 qwen-max 和 deepseek-r1。润色、检查病句、扩写这类需要文字产出的工作,除了 qwen-max,还会用到 deepseek-r1。费用大概 10 元/周,试过各种 API,真正给我带来生产力提升的就这两个。深度思考不见得更好用,处理简单问题时显得废话太多,还经常瞎扩写和发散。直接调整 temperature 参数又有点呆板,本来就慢还要反复对线好几轮。比如一句 20 字的话发给同事之前,我会让它检查错别字,结果它能思考半分钟。

国内其他模型的 API,我也经常测试和调试,出了最新款也会尝试,比如号称“思考+免费+快速”的 qwq-plus。同样的问题,不是我理解不了它,就是它 get 不到我的点。拿豆包、百度、星火这些 API 当作生产力工具,对我而言就是给自己添堵。

用 AI.xyz 一次次跟模型 Battle 后,软件自身终于被我调教的比较满意了。

3️⃣ 编程

我的水平还停留在应用层的初级程序员阶段,平时会写一些 C++、Go 和 Python。C++:只用 Copilot 的代码补全功能;Python 或其他纯脚本语言:用 Copilot Chat 中的 Claude 3.7、o1、4o 穿插着来;Go:刚学两个月,每天还在各种问思路、解决方案、如何实现以及代码优化等问题,所以什么工具都用。

Copilot Chat 偶尔比较慢,也会用 AI.xyz 去问问国内这些模型,有时候也好不错,不过代码渲染肯定没有成熟软件好看。

4️⃣ 其他

ChatGpt 镜像站。镜像站的年费大约是 400 元,基于 API 的网站不在我的考虑范围。镜像站有一个显著的问题——不够稳定!时不时地维护一天是常态。虽然我的使用频率不高,但确实离不开它。如果能用官方网站当然是最好的选择,但每月 150 元的订阅费用对我来说太贵了。

我的工作流主要针对需要立即响应的任务。

对于那些需要静下心来设计、推导或学习等耗时较长的事情,AI 工具只能起到类似字典的作用,也没有什么固定的工作流可言。至于Ollama本地运行(仅限于自己玩玩,作为生产力工具并不实用)、自己微调模型、建立专属数据库、使用多模态模型理解图片和语音,者通过扩散模型生成图片和视频等功能,我几乎用不到。

最多偶尔会生成几张插图。上周新出的 SD3.5 Large TurboX 真的是“真香”!我的 4070 生成 1K 分辨率的图片只需 10 秒一张,质量还不错。我已经删掉了其他所有模型,只留下了它。

1.x 版本迭代规划

接下来 1.x 版本应该不会再增加重大功能了,版本更新主要结合我的使用体验和用户反馈(大概率只有我自己在用)去打磨具体细节,朝着“小而美”的方向努力。

只优化用户(也就是我自己)实际会用到的功能,像 Word 理解、PDF 归纳这类暂时不会考虑。公式渲染、mermaid 图等功能到现在我也没研究过,也许未来会集成,但主要是因为我真心用不到。需要正经研究传统算法或者手动计算时,我会去 ChatGPT 原站 或其镜像站。至于写论文?不存在的,说实话,mermaid 图 我一次都没用过。

FAQ

  • AI.xyz 跟 ChatBox、Cherry Studio、NextChat 比起来有哪些优势?

如果绿色免安装不算的话,那就是被全面碾压。那些基于前端框架开发的 AI 对话客户端好看、好用还开源。

Keep It Simple, Stupid

0.15.0

2025.03.08

  • 限制单进程运行,避免多开问题
  • 支持直接重新生成对话功能,可对比不同模型效果
  • 优化显示细节,提升界面视觉体验
  • 更新软件图标,统一整体设计风格
  • 美化右键菜单,改进交互体验
  • 重构快捷键模块,区分全局与软件内快捷键,并支持单独配置
  • 修复最小化至系统栏后再显示时窗口尺寸调节异常问题
  • 修复对话内容中存在 HTML 标签和占位符时的渲染异常
  • 修复模型调整按钮按下时样式错误及鼠标滚轮滚动时 Tab 表格高亮异常
  • 移除第三方 libhv 依赖,迁移至 Qt 原生网络通信方案,提升稳定性与性能

0.14.0

2025.03.01

  • API模式新增【OllamaFormat】,支持调用本地部署模型连续对话/深度思考/多模态交互
  • 新增欢迎页面,新建对话不再立即创建而是跳转至欢迎页面
  • 全局界面样式升级,优化操作逻辑
  • 修复设置面板CPU占用过高问题,降低整体内存消耗
  • 升级Qt框架至6.8.2版本

0.13.0

2025.02.22

  • 新增对话列表与模型列表自由排序功能,支持拖拽调整顺序
  • 增强滚动交互逻辑,鼠标滚轮操作可中断自动定位,提升渲染效率
  • 模型列表新增图标显示,支持激活状态切换与表格UI优化
  • 支持一键删除全部会话,优化批量操作体验
  • 重构右键菜单与滚动条样式,提升界面操作流畅度
  • 移除对话收藏功能,简化核心交互逻辑
  • 修复若干界面渲染性能问题,降低内存占用

0.12.0

2025.02.16
- 支持多模态模式
- 输入框UI优化
- 修复对话中直接切换模型和新建对话偶发闪退BUG

更新了输入框布局,现在顺眼多了。现支持多模态对话,会将图片上传至 uguu。目前自定义 API 类型仅有「OpenAI兼容」一种,下周迁移原来的「Ollama」类型(目前版本无法使用 Ollama 的多模态)。百度智慧云则直接放弃,以后不再支持文心一系的模型。

0.11.0

2025.02.15
- 支持添加自定义模型
- 支持深度思考模式
- 修复部分电脑对话闪退BUG

赶个晚集,支持下显示思考过程和添加自定义模型。

0.10.0

2025.01.19
- 同一对话任务支持随时修改模型 
- 每个对话可以单独修改参数

0.9.0

2025.01.12
- 仅保留基本对话功能

25年第一个版本,重构了大部分逻辑。化繁为简,未来只会保留文本对话和助手调用功能。

0.8

2024.12.14
- 降低内存占用(默认占用180M->80M)

这是今年的最后一个版本,明年我打算把它改回去,化繁为简,只保留最初的文本对话功能。

Keep It Simple, Stupid

从7月15日提交第一行代码到现在,五个月里发布了超过20个版本。最开始只有文本对话,从引入语音合成开始能越来越多,文生图、图片编辑、语音转文本、文生视频、文生3D模型等等,当然全部都没人用,这玩意我自己都不用。

其实自定义配置服务商、自定义对话参数、指定对话重新生成等功能在11月底就基本完成了。不过想了想还是不合并了,那会让现在的使用复杂度再翻一倍,我需要重新思考一下自定义配置的方式。

我明白,即使明年我尽量把它做到小而美,也不会有用户。毕竟,它只是调用各服务商的接口,通过 API 获取的回答与直接使用各家网站得到的结果还有不小的差距。它唯一的价值可能就是让我学习下。它不会大放异彩,但在这个过程中,我收获了很多也感悟了很多。所以,无论结果如何,我都会继续努力,把它做到最好。

感觉自己越来越像“堂吉诃德”了,在我荒诞的冒险旅程吧继续前进吧,向着风车冲锋。

0.7.3

2024.11.16
- 增加视频工作台,支持文生视频、图生视频
- 增加对话API参数设置,所有模型独立设置随机性和惩罚等
- 文本对话-百度 speed -> speed pro
- 文本对话-阿里 稳定版 -> 最新快照
- 海外模型(自定义配置)和token统计在0.8版本统一加回

0.7.2

2024.11.10
- 配置文件从注册表改为本地文件
- 引入 Qt Quick 恢复模型预览功能
- 首页工具展示支持自定义显示
- 对话机器人展示模型支持隐藏未配置模型
- 移除海外大模型,后续重构为自定义模型
- 移除调用token计算

0.7.1

2024.11.03
- 增加纯文字视频生成
- Qt版本升级 (6.5.6 -> 6.8.0)
- 增强交互体验,修复若干已知BUG
- 暂时禁用了 TripoSR 模型预览,只将模型保存到本地
- 之前为了模型预览引入了vtk。现在想想就是个小项目感觉如果要用第三方库还是通过源码/静态链接,不要再预先编译/动态链接引入。把这块用Qt自身的重写下,后续把 libhv 也替换成Qt原生的。

0.7

2024.10.26
- 新增本地模型工作台,借助TripoSR实现本地图片转模型
- 本地图片工作台新增 SD3.5
- 对话机器人新增月之暗面(Kimi)
- 页面列表支持收藏、锁定
- 对话支持导出聊天记录
- 修复多屏幕多分辨率垂直布局时弹窗位置异常
- 修复多屏幕插拔后软件初始位置错误

0.6.2

2024.10.19
- API服务支持 DeepSeek 和 讯飞星火
- 本地部署支持 deepseek-llm 和 deepseek-v2,模型上传至网盘
- 设置增加:聊天窗口用户头像靠左还是靠右、代码缩进固定为空格

0.6.1

2024.10.18
- 支持扩散模型本地部署(SDXL-turbo、SD3-medium、Flux.1-schnell、Flux.1-dev)
- 合并图片生成和图像处理为图片工作台
- 图片浏览器显示当前图片尺寸和鼠标位置
- 优化图像蒙版绘制页面,蒙版颜色改为彩色按钮
- 根据输入图片自动计算合适的画笔尺寸、范围和颜色
- 优化拓展尺寸选择页面,左键修改范围右键拖拽
- 合并语音合成和语音转文本
- 增加语音转语音工具

0.6

2024.10.13
- 在线AI工具新增:语音转文本、图片生成、物体擦除、局部重绘、图像扩展、风格重绘
- 本地部署AI工具新增:本地对话机器人、本地应用机器人
- 聊天支持多模态对话
- 重构UI、QT版本升级 (5.15.17 -> 6.5.6)

0.5

2024.09.17
- 将语音合成集成进对话列表
- 语音合成增加试听、历史记录、收藏等功能

0.4

2024.09.06
- 新增功能
- 增加语音合成功能
- 增加更详细网络通讯错误日志
- 更新设置和模型选择UI
- 严重BUG
- 修复文心对话时有概率闪退问题

0.3

2024.08.31
更新日志
- 新增功能
- UI全面更新,适配更小屏幕,优化交互操作
- 重构助手功能,支持增删改查
- 修复BUG
- 修复若干已知BUG

0.2

2024.08.11
- 新增功能
- 支持本地token调用计算
- 支持账户token调用计算
- 设置增加直接退出选项
- 唤醒快捷键支持自定义
- 修复BUG
- 点击菜单栏图标无法最大/最小软件
- 代码无法自动换行
- 模型选择页面过长提问布局不合适
- 样式表增加通用控件
- 日志在控制台没有输出
- 删除libhv日志
- 无法连续删除对话

0.1

2024.08.03
- 增加基本功能
- 当前版本点关闭自动最小化到托盘,如果想彻底关闭需要创建快捷方式增加参数 -d
- 隐藏/唤醒 快捷键 ctrl shift p