即刻App年轻人的同好社区
下载
App内打开
AI工具派
9关注1k被关注2夸夸
探索最新AI工具,发现AI带来的无限可能性!
公众号/小红书:AI工具派
😄感谢关注♡欢迎一起讨论
AI工具派
1天前
Anthropic 官方发布《为 Claude 构建技能的完整指南》的 PDF 文档,详细介绍如何为 Claude 设计与编写 Skill(技能),以扩展行为与能力。

这份文档详细介绍了 Skill 的概念、设计原则、构建方法、测试流程、发布方式以及一些常见问题和解决方案。

为想要为 Claude 构建技能的用户提供了详细指导,帮助大家创建出高效、可靠的 Skill,提升 Claude 的能力和价值。

文档地址:resources.anthropic.com
03
AI工具派
3天前
阿里云新推出的Qwen Coding Plan,一款基于Qwen3.5模型的AI编程工具,使用 Qwen Coding Plan 可以让大家尽情体验 Qwen 最新模型。

重要亮点
1.Qwen3.5模型: 基于Qwen3.5模型,支持图片、视频、文本多模态输入。
2.超值优惠: 新客首月低至7.9元,老客使用优惠券更享5折惊喜。
3.无缝适配: 完美支持Qwen Code、Cursor、Cline、Claude Code等主流工具。
4.量大管饱: 每月高达9万请求额度,支持Qwen3.5-Plus、Qwen3-Max等最新模型。

详细介绍:mp.weixin.qq.com
21
AI工具派
11天前
讯飞星辰 MaaS 平台推出限时免费模型,包括新出的:

* GLM5
* GLM-4.7/4.7-flash
* MiniMax-M2.1
* Kimi-K2.5

截止时间 2026年3月5日,抓紧体验看看啦!

地址:maas.xfyun.cn
03
AI工具派
11天前
Kimi 官方发布了 Kimi K2.5 技术报告, 介绍了 Kimi K2.5 如何实现文本和视觉能力互相增强,希望帮助更多感兴趣的人了解模型背后的技术。

下面是 Kimi K2.5 实现文本和视觉能力互相增强的核心原理,包括以下几个方面:

1. 联合文本-视觉预训练:
早期视觉融合:在预训练阶段,K2.5 采用早期视觉融合策略,在训练早期就引入视觉数据,并保持恒定比例混合文本和视觉 token,使模型能够自然地发展出平衡的多模态表征。
MoonViT-3D:K2.5 采用 MoonViT-3D 作为视觉编码器,支持可变分辨率图像输入,并通过 NaViT 打包策略将图像划分为 patch 并顺序拼接成 1D 序列,从而能够高效地处理不同分辨率的图像和视频。

2. Zero-Vision SFT:
零视觉激活:K2.5 通过零视觉监督微调(Zero-Vision SFT)技术,仅使用文本数据即可激活视觉能力,避免了传统方法中需要人工标注或提示工程生成视觉数据的局限性。

3. 联合多模态强化学习:
基于结果回报的视觉强化学习:K2.5 在视觉定位与计数、图表与文档理解、视觉关键型 STEM 问题等任务上采用基于结果回报的视觉强化学习,进一步提升视觉能力。
视觉强化学习提升文本性能:研究发现,视觉强化学习不仅可以提升视觉能力,还可以在文本任务上产生可测量的改进,实现了文本和视觉能力的双向增强。

4. Agent 集群:
并行执行:Agent 集群允许模型将复杂任务分解为异构子问题,并由领域专门化的 agent 并发执行,从而实现并行化,进一步提升模型在多个领域的性能。

论文地址:arxiv.org
原文介绍:mp.weixin.qq.com
K2.5 技术报告:uygfgdai4lbbq.ok.kimi.link
03
AI工具派
12天前
简单整理了下 Chris 知道的 7 个 Seedance2.0 体验的入口,详细查看:mp.weixin.qq.com
01
AI工具派
12天前
秘塔新推出的AI语音输入法——秘塔回响。它可在0.5秒内将语音转换为文字,并支持50+种语言和方言。此外,秘塔回响还具备一键搜索、边说边下指令等高级功能,并提供免费使用。

重要亮点
1️⃣ 0.5秒语音转文字:高效便捷,节省时间。
2️⃣ 50+种语言支持:覆盖范围广,适用性强。
3️⃣ 一键搜索、边说边下指令:功能丰富,操作便捷。
4️⃣ 免费使用:性价比高。

详细介绍:mp.weixin.qq.com
00
AI工具派
13天前
就在刚刚,智谱 AI 上线全新 GLM5 模型!模型的地位是:最新旗舰对话、编程与智能体模型。

现在在 chat.z.ai 直接免费使用,并且官网页面样式也更新了。

另外智谱 AI 还上线其他几个垂直产品:
1. 图片文字识别 ocr.z.ai
2. 图片生成 image.z.ai
3. 音频生成 audio.z.ai

要春节了,大家又要开始热闹起来了。

Tips:这难道是在狙击 DeepSeek 吗?

坐等春节大家都新节目。
03
AI工具派
14天前
大家在使用各种 AI 聊天工具(如豆包、DeepSeek、元宝等)时,应该会经常遇到各种困扰:对话杂乱找不着、优质内容难沉淀、多平台切换繁琐、导出分享不便、隐私安全无保障,这些问题叠加,大幅影响AI使用效率与体验。

今天 Chris 推荐一款非常棒的工具,用来管理这些 AI 对话的消息,这就是 ChatTOC。

它能够全方位覆盖AI对话管理需求,核心优势如下:

1️⃣ 查找便捷:关键词搜索、时间筛选、标签筛选,多种方式精准定位对话;
2️⃣ 内容管理:收藏、分类、编辑、置顶,全方位沉淀优质AI干货;
3️⃣ 多平台适配:不仅支持豆包、DeepSeek、元宝等,还支持 ChatGPT、Gemini 等,还能自定义平台,灵活便捷;
4️⃣ 安全实用:本地处理、隐私加密、轻量不卡顿,兼顾安全与体验。

ChatTOC 功能全面,一站式解决所有AI对话管理难题,无需安装多个插件,兼顾实用性、便捷性与安全性,适配所有AI使用者,无论是新手还是老手,都能高效使用。

如果你也被 AI 对话管理难题困扰,ChatTOC 就非常适合你,功能全面、操作简单、安全实用,让AI使用更高效、更政企。

官方网址:chattoc.aichris.cc
01
AI工具派
15天前
阿里巴巴今天正式发布新一代图像生成及编辑模型Qwen-Image-2.0,该模型支持1K token的超长文字输入和2K高分辨率,可准确渲染复杂指令。

作为千问大模型的图像生成模型底座,Qwen-Image-2.0集生图和编辑于一体,在AI Arena文生图评测中斩获1029分,位列全球第三。该模型可应用于PPT、海报、漫画等多种场景,并提供更丰富的文字渲染和图像编辑功能,为用户带来更便捷、高效的图像创作体验。

Qwen-Image-2.0主要特色包括:
1️⃣ 更专业的文字渲染:1k token指令支持,直出专业信息图,包括PPT/海报/漫画等。
2️⃣ 更细腻的真实质感:2k分辨率支持,细腻刻画写实场景,包括人物/自然/建筑等。
3️⃣ 更强的语义遵循:理解生成一体化,生图编辑二合一。
4️⃣ 更轻量的模型架构:更小模型,更快速度。

关键内容:
1️⃣ 超长文字输入: 支持1K token的超长文字输入,可详尽描述任务,实现更专业的文字渲染。
2️⃣ 2K高分辨率: 可生成2K高分辨率的图像,图像质量更清晰。
3️⃣ 集生图和编辑于一体: 首次将图像生成和编辑统一到一个模型中去,提升性能。
4️⃣ 复杂指令渲染: 可准确渲染复杂指令,实现更丰富的图像效果。
5️⃣ 多种应用场景: 可应用于PPT、海报、漫画等多种场景,满足不同需求。

详细介绍:mp.weixin.qq.com
免费体验:chat.qwen.ai
10
AI工具派
15天前
哇塞,豆包送得太豪华了,都是硬货,宇树机器人、机器狗、汽车、大疆无人机、运动相机、豆包耳机等等,2 月 13 日开始👍

mp.weixin.qq.com
00