即刻App年轻人的同好社区
下载
App内打开
AI工具派
8关注1k被关注2夸夸
探索最新AI工具,发现AI带来的无限可能性!
公众号/小红书:AI工具派
😄感谢关注♡欢迎一起讨论
AI工具派
1天前
Lobe 推出了 AI/LLM 模型图标集,这对于 AI 开发者和自媒体博主来说是个福音,以后找 logo 无需再浪费时间。

目前包含 545+ 免费矢量图标,覆盖主流 AI 品牌和模型, 支持 React / SVG / PNG / WebP,实在是良心!~

网址:lobehub.com

赶紧收藏起来了
01
AI工具派
2天前
出海必读|万字详解 Product Hunt 从 0 开始登顶全流程

详细介绍:mp.weixin.qq.com

本文详细介绍了在Product Hunt上发布产品并取得高排名的流程和技巧。文章涵盖了从产品选择、目标制定、准备工作、打榜过程到打榜结束后的后续操作等各个环节,并提供了大量实用建议和案例。
重要亮点
1. Product Hunt 是一个聚集了大量早期用户和科技爱好者的平台,适合中国团队出海首选。
2. 打榜成功可以获得用户增长、品牌知名度、SEO排名提升、融资兴趣产品验证等多重收益。
3. 选择合适的打榜时间和目标名次对成功至关重要。
4. 需要准备详细的物料清单,包括标题、tagline、描述、图片/视频等。
5. 关注票数变化、DM拉票、回应用户评论、推动社媒推广等是打榜过程中的关键步骤。
00
AI工具派
2天前
深度丨AI Agents 技术栈图谱与分析

详情介绍:mp.weixin.qq.com

本文析了 AI Agents 技术栈,从模型服务、存储、工具库、框架到托管/服务,探讨了 Agent 架构的独特之处,并展望了 Agent 的未来发展。
重要亮点
AI Agents 技术栈分为三层:Agent 托管/服务、Agent 框架以及大语言模型与记忆存储。
Agent 需要状态管理和工具执行能力,与标准大语言模型架构不同。
Agent 框架需要管理 Agent、上下文窗口、跨 Agent 通信和记忆管理等。
Agent 托管和 Agent 服务是 Agent 的未来发展方向。
00
AI工具派
8天前
阶跃星辰的 “跃问视频” 悄然上线

阶跃星辰的 “跃问视频” Step-Video 视频生成模型 V1 版本已开启内测,部分头部创作者参与测试。

Step-Video 目前支持文生视频,可生成 1080P 最长 10s 的高清视频,生成速度较慢,平均一条需 2.5min。

“跃问视频” 有三个优势:自动优化提示词;美学风格在中国风题材上表现突出;在运动控制上表现优异。

Step-Video 的下一个版本也已在开发中。

官方网址:yuewen.cn
体验介绍:mp.weixin.qq.com
02
AI工具派
8天前
使用通义,一键生成毛衣风格图片

官方介绍:mp.weixin.qq.com

通义 APP 支持“局部风格化”功能,可以对任意图片内容,设置多种风格,比如:
1.针织风格
2.毛绒风格
3.冰雕风格
4.云朵风格
5.陶瓷风格
等等,还是很有趣的。

“局部风格化”功能采用通义实验室自研的 ACE 图片编辑模型,真正实现人人可参与,人人可创作。
02
AI工具派
13天前
GPT-4o 模型更新,版本号:gpt-4o-2024-11-20

GPT-4o 获得更新 🎉

该模型的创意写作能力得到了提升——更自然、更有吸引力、更有针对性的写作,以提高相关性和可读性。

它还可以更好地处理上传的文件,提供更深入的见解和更彻底的响应。

文档地址:platform.openai.com
00
AI工具派
13天前
速速白嫖,比肩 cursor 的神器,Codeium 为了推 Windsurf 也是拼了,直接送俩月 Pro 会员 上车🚗

领取地址:codeium.com

会员权益:
免费访问 Codeium Pro,其中包括 GPT-4、Claude 3.5 Sonnet、高级个性化、增加的上下文长度等。
520
AI工具派
13天前
🤖DeepSeek 推出全新模型 R1 - Lite - Preview 释放超强推理能力!

🤖DeepSeek 推出全新模型 R1 - Lite - Preview,
推理能力强且展示推理过程,不再是黑盒!

在多个权威评测中表现卓越,大幅超越 GPT4o、o1 - preview 等。
例如 AIME 测试中达 52.5% 正确率,编程竞赛也成绩斐然。

思维过程实时展示,经典问题测试全对。
虽为预览版且有局限,但已超预期。

🛠️ 开源模型和 API 即将推出!

模型迭代中,网页可用,每天 50 额度,快来体验!chat.deepseek.com
02
AI工具派
20天前
扣子上线了全新的智能语音 OpenAPI,让 AI 从“能说话”到“会说话”!

官方介绍和视频演示:mp.weixin.qq.com
申请地址:www.coze.cn

官方 demo 中演示了,大家可以看上面文章:
1. Demo 配置流程视频演示
2. 与智能体实时对话测试
3. 语音对话过程中,支持实时打断
4. 轻轻松松进行逼真的音色克隆

扣子智能语音的四个优势:
1.精准的识别: 使用大模型的 ASR 进行语音转文本,具备上下文理解能力(比如上文出现过的名词能在识别中复用,说话风格和代称也有更好理解),并对噪声、垂直领域、中英混说等复杂场景识别效果提升;
2.强大的 AI Agent 能力: 不只是听懂你说什么,更是真正理解你的需求。它包含了 Agent 各项能力,能够像人一样有记忆力(文件盒子、数据库、变量)、有知识(文本、表格、照片)、有技能(插件、触发器)、还能编排(工作流、图像流)等;
3.低延迟、可打断: 使用火山引擎 RTC 方案,把链路中的延迟充分降低,并确保即使在弱网络环境下也能通话顺畅。此外,智能体能毫秒级响应用户打断,流畅切换话题并即时反馈,模拟人类自然交流。火山引擎RTC的AI降噪可有效过滤超过90%的背景噪音,减少误打断,提升对话准确度;
4.自然的语音效果: 使用大模型的 TTS 进行文本转语音,根据上下文,智能预测文本的情绪、语调等信息;生成超自然、高保真、个性化的语音,在自然度、音质、韵律、气口、情感、语气词表达等方面更像真人;即使是中英文混说也能行云流水应答自如。
01
AI工具派
22天前
Qwen 2.5 Coder: 全系列升级的开源代码智能助手, 在 Ollama 全部可用

一、模型规格与版本
Qwen 2.5 Coder 推出了六种不同规模的模型,分别为 0.5B、1.5B、3B、7B、14B 以及 32B。这些模型都是专门针对代码开发进行优化。其中,最大的 32B 版本,据说其性能能够与 OpenAI 的 GPT - 4 相提并论呢。

链接地址:ollama.com

二、核心能力提升

代码生成:32B 版本在多个基准测试(EvalPlus、LiveCodeBench、BigCodeBench)中,达到了开源模型的最佳水平。
代码修复:在 Aider 基准测试里,它的得分达到了 73.7,已经十分接近 GPT - 4 的水平啦。
代码推理:该模型能够精准地理解代码执行过程,并且可以准确预测输入输出情况。

三、多语言支持

它支持超过 40 种编程语言呢。在 McEval 测试中,得分达到了 65.9。
尤其在 Haskell 和 Racket 等语言上,表现格外出色。
在多语言代码修复基准测试 MdEval 中,得分更是高达 75.2,在众多开源模型里可是排名第一哟。

四、人类偏好对齐
采用内部评估基准 Code Arena 来进行测试,评估方法类似于 Arena Hard,并且以 GPT - 4 作为评估模型。在人类偏好对齐方面,它可是展现出了十分明显的优势呢。

五、主要亮点

全系列模型能够覆盖从小型到超大型的不同规模需求,满足各种不同场景哦。
代码能力得到了全面的提升,各方面表现都更为出色啦。
在众多开源模型之中,它可是处于领先地位的呢。

执行命令:
32B: ollama run qwen2.5-coder:32b
14B: ollama run qwen2.5-coder:14b
7B: ollama run qwen2.5-coder:7b
3B: ollama run qwen2.5-coder:3b
1.5B: ollama run qwen2.5-coder:1.5b
0.5B: ollama run qwen2.5-coder:0.5b
02