即刻App年轻人的同好社区
下载
App内打开
AI百宝箱
62关注51被关注0夸夸
✅好玩的AIGC产品与应用
✅AI前沿技术、观点与趋势
AI百宝箱
3天前
【SiliconCloud API支持JSON模式,强化内容结构化输出】

现在,SiliconCloud平台所有语言模型都已支持JSON模式,能让模型输出JSON格式的字符串,以确保模型以预期的结构输出,便于后续对输出内容进行逻辑解析。

SiliconCloud API支持JSON模式,强化内容结构化输出

00
AI百宝箱
5天前
【硅基花样流动 | SiliconCloud 产品体验魔法师奖公布!】

【硅基花样流动】SiliconCloud 产品体验官招募活动第一期已圆满结束!现正式公布“体验魔法师奖”获奖名单 🎉

在此次活动中,我们收到了近 200 篇的合格投稿内容,见证了众多体验达人们的出色技术与创意,并从内容完整度、产品创新体验等多方面,评选出了 21 篇精品内容,发放“体验魔法师奖”。

恭喜所有获奖的体验魔法师们,也感谢每一位体验达人的积极贡献!是大家的参与和分享,留下了“硅基花样流动”的精彩瞬间!

硅基花样流动 | SiliconCloud 产品体验魔法师奖公布!

00
AI百宝箱
6天前
【硅基流动成立这一年】

8月,硅基流动正好成立满一周年。《智能涌现》与袁进辉复盘了过去他的心路历程,以及聊了聊新出发后的风景。

硅基流动成立这一年

00
AI百宝箱
11天前
【Embedding与Rerank模型RPM、TPM分别提升2倍、10倍|SiliconCloud API升级】

Embedding与Rerank模型RPM、TPM分别提升2倍、10倍|SiliconCloud API升级

00
AI百宝箱
11天前
【SiliconCloud API实战攻略:手把手教你配置OneAPI、LobeChat、MindSearch】

​为方便用户在各主流应用平台上接入SiliconCloud API,我们将手把手教您在OneAPI、LobeChat、MindSearch中配置SiliconCloud的API,快操作起来吧!

SiliconCloud API实战攻略:手把手教你配置OneAPI、LobeChat、MindSearch

00
AI百宝箱
13天前
【硅基流动荣登“2024年AIGC创新企业及产品创新”榜单】

8月22日,国际创新生态服务平台创业邦发布了《2024 AIGC年度榜单》(创新企业榜单、产品创新榜单),硅基流动荣登“2024年AIGC创新企业100强”榜单,SiliconCloud大模型云服务平台作为荣登“2024年AIGC产品创新100强”榜单。

硅基流动荣登“2024年AIGC创新企业及产品创新”榜单

00
AI百宝箱
17天前
【SiliconCloud x 捏Ta:10倍提效C端大规模内容生成】

捏Ta是一个以生成式AI为核心,为用户提供AI漫画和虚拟角色内容生成的平台,被视为以角色幻想故事智能创作为主的早期“小红书”。

基于捏Ta平台庞大的图片生成与角色故事创作需求,他们亟需通过推理优化来提升内容生成响应速度,从而提升用户体验,并降低推理成本。

通过对比多种不同的大模型API并对AI推理加速方案进行A/B实验,捏Ta团队最后选择将硅基流动的大模型API服务平台SiliconCloud和图片/视频推理引擎OneDiff引入其核心技术栈。

SiliconCloud x 捏Ta:10倍提效C端大规模内容生成

00
AI百宝箱
19天前
【10倍加速LLM计算效率:消失的矩阵乘】

矩阵乘法(MatMul)是深度学习中的主要计算瓶颈,尤其在ChatGPT等Transformer模型中,矩阵乘法的运行时长约占其总运行时长的45-60%,解决这一挑战对发展更经济的大模型具有重要意义。

为此,加州大学的研究人员在论文《Scalable MatMul-free Language Modeling(可扩展的无矩阵乘法语言模型构建)》 中试图通过消除矩阵乘法来构建更便宜、耗能更少的语言模型,这将有助于解决当今大语言模型所面临的环境负担高和经济效益低的问题。

基于该论文,本文作者Devansh在多个维度对无矩阵乘法语言模型的影响进行了深入分析。

10倍加速LLM计算效率:消失的矩阵乘

00
AI百宝箱
24天前
【SiliconCloud上线Qwen2-Math-72B-Instruct:让最强数学模型加速解题】

今天,SIliconCloud正式上线阿里通义近期开源的新一代数学模型Qwen2-Math-72B-Instruct,根据相关评测表现,它成为目前最先进的数学专项模型,SiliconCloud上的推理加速版Qwen2-Math-72B-Instruct可以帮助用户更快解题。

一键体验传送门:
cloud.siliconflow.cn
API文档:
docs.siliconflow.cn

SiliconCloud上线Qwen2-Math-72B-Instruct:让最强数学模型加速解题

00
AI百宝箱
25天前
【SiliconCloud上线InternLM2.5-20B-Chat,复杂场景推理能力全面增强】

今天,SIliconCloud正式上线推理加速后的新版本InternLM2.5-20B-Chat,其综合性能更为强劲,可以有效支持更加复杂的实用场景,接入MindSearch多智能体框架后能自主进行互联网搜索并从上百个网页中完成信息整合。

SiliconCloud上线InternLM2.5-20B-Chat,复杂场景推理能力全面增强

00