即刻App
年轻人的同好社区
下载
App内打开
LittleLark
130
关注
24
被关注
0
夸夸
🧚3D&2D Gen/VLM
Now@CityUHK | BEng@USTC
🏸要记得锻炼身体
🎃迷茫
LittleLark
1年前
阑夕ོ: 因为始终没有等到真正意义上的杀手级应用,AI很大程度上依然是一个新闻/资讯驱动型的行业,也就是隔三差五来一波「炸裂」,更新一下人类岗位被取代的进度百分比,然后大家继续该吃吃该喝喝,循环往复。 而普通人到底能用AI做什么,回答这个提问本身就是最大的PMF,大大小小的AI公司过去一年里都在寻找答案,但没有人敢自称已经找到了,别问,问就是未来可期。 在我看来,DeepSeek-R1的最大贡献,其实是把高阶AI给平权了,之前整个行业都在走生产力导向的路线,重视AI的提效价值,由此把高算力成本合理化,用「星际之门」这样的宏大工程叠加资本预期,成了唯一正确的方向。 所以Sam Altman说200美金/月的ChatGPT Pro在账面上是亏损的,OpenAI和微软合作了那么久,一旦新的数据中心需求被卡审计了,马上转头就和甲骨文勾兑上了,狼性归狼性,这条路确实是会越走越窄的。 AGI固然是个好东西,但它显然不应该建立在用起来肉疼这个前提上,无时不刻的向用户施以心理暗示,每次提问有没有创造足够的价值,如果没有,就不要浪费寸卡寸金的算力了,这就是生产力导向的叙事。 DeepSeek的最近3代模型,技术转进的阶梯感非常明显,V2是把AI的调用单价打下来,V3是在低价的同时跟上主流大模型,R1是加质不加价直接对齐最前沿的模型能力,保持不变的参数只有普惠这一条。 智能这种资源,也可以像水电煤一样取之即用,而水电煤的普及则会同时造福于工业生产和生活消费两端,对于AI行业来说,这是非常祛魅的设想,所以据我所知,大厂对于DeepSeek的这波出圈,感情上相当矛盾。 倒也不是不能理解,矛盾是因为短期损益和长期受益的混合。 短期损益在于堆卡这种变相发行入场券的游戏规则被打破了,本来可以靠财力储备去限制竞争对手的入局,现在行不通了,每个玩家都可以尽快站在巨人的肩膀上,看看GitHub上和DeepSeek有关的开源项目是怎么雨后春笋般出现的,就明白了。 长期受益在于加速AI的平权实际上有利于整个行业更快扩大消费级市场,而不是只能在降本增效的SaaS市场里作威作福,尤其是考虑到中国的SaaS产值本就疲软,让更多的用户可以一键获得最顶级的模型,为行业创造需求规模,堪称功德无量。 所以我不认同那种认为DeepSeek的成功是一种对抗性的胜利,这太强行了,而且如果你的崛起就会让别人遭殃,这样的狂热捧杀非常败坏路人缘,比如幻方其实是最早开始囤英伟达显卡的公司,要说英伟达因为DeepSeek崩了,梁文锋自己都得扣个问号。 优秀的公司涌现出来,一定会让全行业都变得更繁荣,包括也将推动竞争对手的进步,这和主观意志无关,是经济世界的客观规律。 而且如果你们真的看进去了梁文锋屈指可数的那几次对谈,就会发现他其实是一个纯粹远大于情绪的创业者,采访他的记者说幻方/DeepSeek带有强烈的文化吸引力,无论是组织还是做事,都遵循着有没有热情这个基本逻辑,包括找人也是,热情是藏不住的。 梁文锋自己打的比方,是买钢琴,一来要买得起——原始积累很重要——二来也得有一群急于在上面弹奏音乐的人,所以我很确信他不太会被噪音裹挟,事实上这次爆火,连加班都没怎么增加,发布的更新都是按照既定计划安排的。 不过国产AI行业也是实打实的连续两年没过好年了,不同的是,去年是惊惶焦虑,今年是志得意满,反转情节是真的爽。 很多人可能不太记得一年前是个什么形势了,我来帮你们唤醒一下长期记忆: 2024年2月,OpenAI在龙年大年初五发布了视频大模型Sora,和当时的视频大模型都是动态图片水平完全不同,演示里的运镜和动作无比流畅丝滑,再次上演了让全硅谷都看不懂的剧本。 那会儿的中国AI公司,处于一种集体懵逼的半植物人体征: 市面上能用到的最好产品是百度的文心一言——别笑,真就如此——李彦宏以胜利者的姿势劝大家放弃重复造轮子,字节跳动的CEO梁汝波在内部大会上起头反思公司为什么错过了GPT这场技术革命,朱啸虎锐评国产大模型公司没戏的「投降论」在朋友圈里刷屏,阿里因为FOMO的原因投了「AI六小龙」里的五家后被马云质疑「投这么多是不是看不懂」,腾讯则保持「超出三界外不在五行中」的查无此人状态,再往前一点,王慧文抱病撤出由他一手筹建的光年之外,不可置信的坊间传闻说是意识到追不上了所以才激流勇退⋯⋯ 这就是一年前的真实局面,当时没人能想到,翻盘能够来得如此之快,在短短一年时间里,从不够资格上桌吃饭,到霸榜全球应用商店,急风骤雨,摧枯拉朽。 我要说的是,DeepSeek不是一根孤单的独苗,比偶然更好更好的事情是必然,国产AI阵营这一年来的集体成长,兜住了很有可能是这一代人工业革命的在场权,能够正面迎战饱和式竞争: 有字节这样全量对标的,豆包、扣子、Trae成套开发,走的是用高投入换高回报的路线; 有通义这样正统开源的,通义家族的谱系之发达,已经在各大竞技场里刷了一年的分了; 有月暗这样精耕细作的,Kimi 1.5也是不逊色于o1的思维链模型,就是很不幸的和DeepSeek-R1撞车了哈哈哈; 有快手这样半路杀出的,可灵现在就是全球最强的视频大模型,没有之一,对Sora的幻灭要负全责; ⋯⋯ 甚至完全有理由相信,下一个现象级的国产大模型,可能都是上述没有提到的名字,科研固然没有意外,但市场充满随机性。 最后,建议大家勤用DeepSeek-R1,把它当成一个对话帮手,而不只是查询工具,思维链的展开,可以让你更好的理解如何控制需求(Prompt),并对过程中的偏差进行修正,这比只对结果方案提出「不够大气」的模糊反馈,要高效得多。 做好准备,迎接新的人机共生时代。
0
0
0
LittleLark
2年前
Kostja: 3D是什么?渲染,建模,贴图和3D有什么关系?AI+3D走得通吗?-科普向📝 我在今年认识了NeRF,DreamFusion,Gaussian Splatting,Magic3D等算法,产品逛过年初的Nvidia Picasso,Kaedim,Csm,Spline,Luma,Plask,Skybox到最近中国团队发布的MeshyAI,Tripo/Vast @Chris-Su 即使如此,每次想起3D我脑中依旧会浮现的是一排排旋转的立体模型小人,建筑物和地形 曲凯老师@曲凯 这篇播客采访了Meshy.AI 创始人胡渊鸣,系统性地梳理了图形学,3D,AI+3D的概念,下面是精要(语音转文字:飞书妙记 内容归纳:kimichat) “1. 图形学的定义: 图形学是一门研究如何通过计算机技术合成视觉内容的学科,包括真实感渲染、仿真、AI与图形学的结合等。 2. 渲染: 渲染是将3D模型转换为2D图像的过程,涉及到光线传播的仿真,目的是在屏幕上生成具有真实感的图像。 3. 3D数据表达方式: 点云:空间中的一组点,可以用来表示3D物体的表面。 体素:规则分布的3D点集合,类似于2D图像中的像素,但增加了一个维度。 神经辐射场(NeRF):使用神经网络来表示场景中每个点从不同角度观察时的外观。 高斯散射:一种点云表示方式,其中每个点具有特定的方向性和大小,可以表示3D场景的信息。 Mesh(三角网格):使用三角形网格来表示3D物体的表面,是实时图形领域中最常用的表示方式。 4. AI生成3D的任务: 文字生成贴图:将文字描述转换为3D模型的表面纹理。 文字生成3D模型:直接从文字描述生成3D模型和贴图。 图像生成3D模型和贴图:使用图像作为输入,生成3D模型和其表面的纹理。 5. 市场需求与技术挑战: 3D资产在游戏和影视行业中的需求很高,但AI生成3D内容的技术仍在发展中,面临质量、可控性、速度等挑战。 6. 创业与科研的结合: 胡渊鸣强调了理解市场需求的重要性,并分享了从科研转向创业的心路历程,以及如何将科研思维应用于商业环境中。” 我的笔记📋 1. 图形学追求将数字内容更好地视觉化 2. 游戏行业中实时渲染用得多,如Unity,Unreal Engine,对算力要求更高 3. 影视行业中offline CG用得更多,如3dmax,Maya,Houdini 4. “2D+时间维度=视频,2D+空间维度=3D” 5. 图像生成3D更加可控,多张图3D重建很成熟,目前想解决的是依靠多角度数据集和单张图片生成3D资产 6. 2D图片数据集Laion有58亿五千万张图,3D数据集Sketchfab只有5百万,并且有版权 7. 3D是toB的生意,创作者有很高的操作门槛,且市场规模只有2D市场的1/10~1/20 8. 硬件如Vision Pro可以扩大3D的使用场景 9. 生成式AI的出现让构建3D路径从模型到数据转向有了可能性 建议听一遍原文,非常有收获~ 关于AI,图形学和全息投影,你还可以听这期节目(https://www.xiaoyuzhoufm.com/episode/63e5c75b22388040c970a1ec) Tripo和MeshyAI效果怎么样,看看卡兹克@数字生命卡兹克 怎么玩的(https://mp.weixin.qq.com/s/BNeSLZ5qxTmJvFrWd0kvEQ) 目前OpenAI,谷歌等科技巨头对3D也感兴趣,英伟达2023年10个highlights里有三个和3D有关(https://twitter.com/DrJimFan/status/1738613195173159187) 随想:AI+3D有没有更广阔的使用场景?除了建筑,可能还有数字孪生,工业设计,GIS,遥感,医学影像等 求个点赞,错误和其他观点可以发在评论区🤔️
0
0
0
LittleLark
2年前
AlanJiang: 没想到自己研究生毕业时候写的碎碎念,昨儿被一个华科的同学捞起,他表示这对每一个在科研入门阶段的人会很有帮助,还专门发微信来感谢我。今儿专门发在这里,希望能让后来的朋友少走些弯路。 现在想起来还觉得有意思的一句话:“在动物世界里,学会生存的本领,同时保存自己的灵性,是一种晦涩的艺术。”
0
0
0
LittleLark
2年前
AlanJiang: 最近的直觉感受:如果你是AI领域的技术人员,不必被自己过去的NLP/CV/ML/Graphics履历所困住,在一个不熟悉的领域,是可以通过论文、开源代码、学术talk以及和大佬有诚意的cold call,在3个月内掌握绝大多数认知的。别人幸苦耕耘三年的东西,可能跟你三个月努力差不了太多。 真正难得的能力,是判断方向的战略思考能力,这是长期ROI最高的能力。一个人同时间段什么都做,往往意味着他缺乏这种能力,很多时候,选择不做什么比选择做什么更重要。一个组织也是这样。
1
0
0
LittleLark
2年前
时光机司机小Wong: 光照和材质联合估计和摄影测量结合做成了 Using only a mobile phone and it's flash, M-XR's software delivers a fully textured PBR asset automatically, without any manual work or artistic cleanup !
1
0
0
LittleLark
2年前
3D需要以渲染到2D屏幕上的方式呈现🤔所以说如果2D的视频如果足够精确而且可以提供反馈,或许真可以替代3D?
JasonM.: 去年 3月份发的一条朋友圈算是灵验了,可能大家也都想到了。我当时发的是:“想到一种恐怖的可能性,可交互式视频的AIGC有一天替代计算机图形学,成为人们制作交互式体验(游戏)的主要方式。”当然这个过程会很漫长,因为要实现realtime prompt 所需要的算力是可怕的。但是如果以终为始的话,可能做AIGC 就不要去做 3D 模型的 AIGC,这种路线最后只会被视频AIGC颠覆。
0
0
0
LittleLark
2年前
时光机司机小Wong: Apple这篇论文可以解决你的问题。用text让室内换装。RoomDreamer: Text-Driven 3D Indoor Scene Synthesis with Coherent Geometry and Texture https://arxiv.org/pdf/2305.11337.pdf
0
0
0
LittleLark
2年前
Paint🎨
P小二: Daily Papers and AI News Tracking(12.22) https://aigc.openbot.ai/p/daily-papers-and-ai-news-tracking1222
0
0
0
LittleLark
3年前
🫡
CyberDaily: Time发布的AI影响力100人 https://time.com/collection/time100-ai/ 背后那些数以万计的数据标注员同样伟大
0
0
0
LittleLark
3年前
mark
老蒋不一定靠谱: 最近在看鼎鼎有名的kk大神天涯神贴,十多年前的判断太准了,自顶向下自成体系的宏观判断很多,真的能穿越时间的很少很少很少
0
0
0
LittleLark
3年前
又是发疯的一天:我的人生,彻底失败😭😭😭
0
0
0
LittleLark
3年前
🥹
莫唯书Mark: AI界黄埔军校
0
0
0
LittleLark
3年前
😮💨
智能纪元AGI: 上海财经大学校长刘元春执笔的报告指出, 要高度警惕一个数据:今年以来中国高技术产业增速断崖式下滑,近二十年来首次陷入低迷。很可能反映外部科技封锁对国内高技术产业发展的影响,达到了一个临界点。这也导致青年群体失业率逆势攀升。如果不能及时扭转,未来中国高科技产业发展和高科技人才储备都可能发生变异。 刘元春等判断:今后青年失业难题可能会持续10年,短期内不断加剧。处理不当,将引发经济领域外的其他社会问题,甚至成为经济问题导火索。解决高校毕业生就业工作应与支持高技术产业发展政策协调配合;保青年就业要靠民间投资带动,关键在于完善法治建设,弥合人们对法治建设的信心缺失。
0
0
0
LittleLark
3年前
🧐
智能纪元AGI: 2023年退休人员基本养老金上调3.8% 人社部、财政部22日发布《关于2023年调整退休人员基本养老金的通知》,明确从2023年1月1日起,为2022年底前已按规定办理退休手续,并按月领取基本养老金的企业和机关事业单位退休人员,提高基本养老金水平,总体调整水平为22年退休人员月人均基本养老金的3.8%
0
0
0
LittleLark
3年前
mark
老蒋不一定靠谱: 在B站上看到了一个不错的试验,内容是看看一个人在啥也没有(没团队没任何物料)的情况下从0到1能不能搭起来一个淘宝店。试验结果是问题不大,一个能熟练运用AI工具的普通人,已经能够通过ChatGPT+midjourney的组合,来完成比较繁琐的开店流程。这还是个电商小白的假设性的模拟(并没有真实商品),如果是正经要开店的话,会比视频里更容易,因为有真实物料。 看多了超宏观视角探讨AI前景的内容,这种特别落地的挺好玩。大语言模型+AIGC影像应该能衍生出不少非常具体的商业机会,虽然没那么改变世界,但是让有想法有能力的普通人上杠杆更容易了。 B站上已经有一些AI相关的不错的视频,我推荐几个: “跟李沐学AI”的所有内容(但是有点难) “图灵的猫”最近的几期,可以看看思路 “量子位”的B站号 “洋洋杂谈”:一个硅谷AI领域工程师的对谈号,可以用来了解一些行业热点 【【渐构】万字科普GPT4为何会颠覆现有工作流;为何你要关注微软Copilot、文心一言等大模型-哔哩哔哩】 https://b23.tv/Goop9uR------爆款,适合听说过但还不太了解CHATGPT到底是什么的人看 【人工智能教父最新完整采访:ChatGPT的影响和潜力-哔哩哔哩】 https://b23.tv/NRPGN7C-------搬运内容,看个思路 【黄仁勋与OpenAI首席科学家Ilya Sutskever的炉边谈话 4K 中文字幕-哔哩哔哩】 https://b23.tv/5D5nRSm-------搬运内容,看个思路 另外入门各种AI工具,搞定注册布置环境常规应用之类的攻略,B站上也有很多,随便搜对应的AI应用就能搜到,midjourney在B站上就有超多教程(教程攻略内容一直是B站的强项)。 我过几天也会出一个探讨AI会让社会更平等还是更分化的视频,里面有一个暂时没在世面上看到的核心逻辑。
0
0
0
LittleLark
3年前
mark
Trent壁花少年: 用了不到两小时用ChatGPT将真格基金制作的1200个AI工具分类整理进了飞书表格,分享下整理方法和1200+的工具(文章来源@葬花达人鲁智深 ) 1200+工具通过公众号分5个文章发出的,每个工具的内容分别是工具名称、类型、介绍、费用和网址这5个字段的内容,如果一个一个的粘贴可能需要100+小时,所以就自然想到ChatGPT这个敲一切钉子的锤子 先写好了Prompt让ChatGPT将我发送的内容进行整理,整理效果如图一。很快就发现了一个问题,无论怎么调整Prompt他都无法记住,基本上经过两轮整理后就忘记要做什么 接下来想到了Poe新出的创建自定义bot的功能,我在bot里放置了同样的Prompt后生效了,发送的文字都能按照要求回传表格,Prompt见图二。接下来觉得这个效率还是有点慢,一是要来回复制粘贴,二是因为字符限制,每次只能整理10个左右的工具,如果这样整理可能还是要几十个小时 我又瞄向了Notion AI,将文章剪藏进Notion后使用Notion AI将文字批量转化为表格,这一步减少了一步复制粘贴的步骤,效率再次提升1/3,这时候时间已经过去了1个小时,才整理出不到200个 最后决定用老工具和新工具结合试试,我将两万多的文字(大约300个工具)直接粘贴进Excel里,然后让ChatGPT按照我的整理要求写出公式,奇迹出现了,公式非常有效,见图3,花了20分钟将剩下的1000个工具整理好了,如果不是ChatGPT我是想不到Excel还有这样使用场景的公式 结论就是ChatGPT这个可以敲一切钉子的锤子总还是需要一些技巧,不仅是Prompt,还有如何和现有工作流和软件结合的技巧 1200+的工具见链接:https://p89j9q5t4u.feishu.cn/wiki/wikcnEDEiXBaJDgw8XxZ4GumN2c #AI工作流
0
0
0
LittleLark
3年前
mark
CEO来信: 滴滴发布无人驾驶概念车 4月13日,滴滴自动驾驶发布Robotaxi概念车:DiDi NEURON,在无人驾驶时代致力于为乘客提供更好的出行服务。DiDi NEURON独创了车内机械臂,可以实现车内外的多种服务,如提行李、递水、叫醒等,最大程度优化乘坐体验与运营需求。 空间上,DiDi NEURON去掉驾驶位,最大限度释放了乘坐空间。车内大屏交互系统有会议、游戏、街景介绍、氛围选择等功能,将出行过程与丰富的场景结合。
0
0
0
LittleLark
3年前
mark
xyz_OWIA1A: 微软大中华区专家交流纪要 Keynote: 微软 23 年策略: all-in GPT;砍掉了一些产品线,比如 VIVA、工业元宇宙与数字孪生团队解散; 关于 4 月 18 号的国内Teams 发布会:与 Copilot 的推出没有必然联系, 22 年 11 月就规划好了 (去年没发布是因为 国内数据中心没落定),有无 copilot 功能不确定, copilot 这个功能 22 年就已测试成熟。 MS Office 整合 GPT 以后的 ARPU 值展望: ToC 端预计不会有 ARPU 值增长; 目前给企业级合作伙伴 24 年的报价单 也没提价;大中华区主要客户为 C 端与 SMB ,C 端 copilot 是比较通用化/标准化的 feature,不需要基于用户数据做特别训练,端侧算力就能满足需求,且微软在国内的数据中心能满足轻量化模型部署需求; SMB 与大 B 关注运营效率, 模型的定制化/调优属于增长服务,但不会通过提高年费方式实现收入,而是根据客户需求为功能的使用付费(流量/模型调用次数等) 。 大中华区策略: 短期侧重提高市占与渗透率,促进正版化提升 ,拉升用户留存与使用时间, 目前没有涨价的诉求。 数据监管面临的问题: 1) 数据安全:用户隐私数据/访问权限问题可以通过技术手段短期解决;合规/数据出境问题: 得看当地的监管政策, 目前是灰色地带; 3) ESG 与伦理问题:滞后与前两个问题解决; 跟意大利的沟通/GPT 封禁亚洲账号:大概率通过罚款形式解决; 封禁账号与意大利、三星、中美关系都没必然联系; 主要是保障用户行为合规, 在监管方面微软目前较谨慎; GPT 在大陆可用性问题: 短期在大陆开放使用的可用性不高。 原因有三: 1) 算力/存储问题: 国内数据中心资源不够, 考虑到中国区收入与经济回报比, 未来 3-5 年在国内大规模建设数据中心本地化训练的可能性不大;2) 数据出境: 大模型训练在美国,涉及数据出境问题; 3) 需要遵守美国的法规:尖端技术不可能立刻引进中国,比较典型的例子是 Teams,国内有一堆竞品才决定来中国, 怕被国内友商 copy,需要保持技术先进性; 国内企业出海/海外企业进入国内的 GPT 使用问题: 看数据中心所在地, GPT 可以私有化部署。国内企业出海数据中 心在海外可用; 海外企业进入国内,数据中心在国内也可用; 国内 AI 芯片好坏:寒武纪 MLU370 买得多, A100 的 60-70%;寒武纪服务态度与体系好;对接效率高;断货风险小; 壁仞宣传做得好,但实测的卡不太拿得到,量产能力可能不够。海光量也够、参数也不错,技术与供货角度都比较好 但海光在美国黑名单里面,有出海生意的厂商不敢用 ,容易被连坐。 Q&A: Q:OpenAI 为什么 17 年转向 PyTorch 框架? A:API 迭代稳定性比 Tensorflow 好,开发者调用/使用 GPT 的门槛更低。 Q:GPT4.0 的参数规模? GPT5.0 什么时候推出? A:万亿水平。 GPT5.0 已经训练完成,具体推出的时间点网上查到是啥就是啥(网上传的是 23 年底)。 GPT5.0 的参数 规模未知,得到 PR 文出来。目前大中华区 AI 实验室模型的参数调整已经暂停,什么时候重启不确定。 Q:GPT5.0 较之 4.0 主要提升的地方还是多模态的能力? A:除了多模态能力提升外,还有一些垂直应用场景的延伸&跟 partner 在应用场景的整合与细化。官方的 GPT5.0 信 息在 PR 没出来之前没有准确的数。ChatGPT 出来之前已经在做一些垂直场景的应用功能, 比如语音生成文本、虚拟 现实中的语音、文本生成、视觉交互、低代码开发等之前都有相关解决方案。 今年微软商业战略有些调整:把几条产品线取消, 比如微软 Viva (企业内部的 CRM、员工管理、知识库管理)、 hololens 事业部(商用混合现实技术产品线)中的 AR/VR/MR 原来是有针对工业元宇宙、数字孪生等场景有整合的解 决方案, 去年年底把工业元宇宙与数字孪生团队取消, 23 年 all-in GPT。 微软有 3 朵云:Azure 云服务(目前 GPT 部署在上面)、 GPT 将拓展到另外两朵云: 办公全家桶(MS 365、Teams、VIVA 等)、 Bussiness Application (PowerBI 等产品) 都会整合 GPT 能力。 Q:4 月 18 号世纪互联推广 Teams 与 MS 365? A:Teams 登陆中国去年 8 月就已经规划了,跟 Copilot 的发布没有必然联系。 Q:要发布的 Teams 国内版没有集成 Copilot 能力? A:这次会议的主题是“强 AI 时代的组织效能升级”,Teams 与 MS 365 套件本身就有些 AI 功能, copliot 是在原有 AI 能力基础上加持 GPT 能力,比如语音文本生成、格式/内容生成等。这些都在 Roadmap 上,去年 11 月已经在做战 略规划与小范围测试了。4 月 18 号这个节点与 Copilot 没有必然关系,去年就规划了这件事。 Q:4 月 18 号不会有 copilot 插件? A:不是因为 copilot 开的会,但这个功能什么时候发布不知道。开这个会是我们去年已经确定的“Win back”战略, 国内过去盗版昌盛、市占率也低, 也催着世纪互联来加速推这个事, 去年没发布是因为世纪互联在国内的数据中心建 设不够完备,微软在国内的北三数据中心落地后存储与算力上来了, 今年才要回到中国。总部本来也是不 care 的,但 大中华区有收入增长的诉求。 Copilot 这个 feature 去年已经测试的比较成熟了,18 号有发布可能,feature 全部ready。 Q:MS 365 之类的产品集成 copilot 能力后, 短/中/长期 ARPU 的展望? A:定价属于微软产品策略,由微软总部来定。中国产品价格也是总部设定。微软收入大头是 Modern Work Solution (全家桶)。报价模式:云计算服务是按流量付费,云计算服务截止今天没看到提价倾向。 Copliot 集成的 MS 365 后我不认为会有 ARPU 值增长,包括我们企业级的合作伙伴,在做报价单的时候目前明年价格 也没有明显变化。我们目前大中华区的策略是“Market Winback”,在国内我们市占不是很高,核心目标是拉升用户 留存与使用时间,单价目前没有涨价的诉求。ARPU 概念来自于电信运营商, 比如你用了 4G、5G 套餐,标准是 50 块 钱,但最后你的账单远高于 50 快,因为你的使用超出了套餐范围。云计算是一样的道理, 我们不是通过 ARPU 提升来 抬客单价,MS 365 与 Dynamic 365 我们的策略是维持当前 ARPU 的情况下,推出些增值的 feature 让客户买单。 C 端用户用通用的功能就能有较好的体验,我们训练好的模型通过插件/微服务的方式推给 C 端客户就行,比如网上传得 比较多的给 copliot 个大纲,生成个 PPT,这是比较通用的微服务。对于 B 端用户,模型要调优、要训练,训练过程中 就需要有增值服务,比如现在按 tokens 收费的方式,客户用量越大价格可能越高。中国区目前的策略是追求市占提升 与渗透率,针对的客户主要为中小型企业与 C 端客户,这些客户还是在力争开账户的阶段,体量还不大,能训练的数 据量没那么大。这方面担心两个问题: 1)中国区算力不够;2)监管问题,可能牵扯数据安全; 总结: 我们涨不涨价跟 C 端用户关系不大, C 端用的是标准化的产品与 feature、通用化的微服务; 对于 SMB 与 To 大 B 客户, 他们最关心的是 Opex,虽然有新增付费的功能点,但 B 端客户整体运营成本是降低的, 比如设计费用、人工 费用都会节省,对于微软是增收, 对于客户也有好处,但也不是通过直接提高产品年费的形式实现,而是客户根据需 求为新功能的使用付费。大企业的 IT 团队很强, 诉求也差异化,我们也只需要把 API 开放给他们, 定制调优他们自己 做, API 调用收 license/流量费这个我们会去做。 海外跟大中华区又不一样,海外我们的 SAAS/微服务比较好卖, 海外客户希望开箱即用。 海内外的策略规划与战略执行的思路类似, 只是中国区短期侧重市占与正版化多些。 Q:关于数据安全的问题,目前我们跟大陆监管机构如何沟通的? A:没有直接沟通。有关安全与合规问题,我们在中国的策略落地较之海外有时延,主因: 1)市场规范化程度; 2)地 缘政治/中美关系问题;合规问题目前还游走在灰色地带。 Q:目前我们面临哪些数据监管的问题? A:三个问题: 1)数据安全:用户隐私数据/数据访问权限问题;这是技术层面能解决的问题,比如通过网络访问节点 的权限控制能进行规范化,这是微软安全技术/合规体系比较成熟的部分,也已经融入三朵云的底座中去了,比如端点/OS/网络控制,我们只要进一步对数据访问进行规范化, 这个问题就能解决。我们已经做过实验,在 linux 服务器上, 针对 GPT 模型进行针对数据访问的微调, GPT 在用户访问时能反映某些问题涉及的数据是没有经过授权的, GPT 会终 止操作。 2)合规/数据出境问题: 不止是微软的问题,阿里、腾讯也有这个问题,全球也没有特别好的监管方法; 3) ESG 与伦理问题:系统性因素,需要技术与宏观监管体系都比较成熟后能克服。好的点是很多类似的问题以前也遇到 过,比如 4G、5G 普及过程中也有很多问题,后续都陆续解决。现在可以明确的是数据安全涉及的技术问题我们能很 快解决, 监管要求的变化需要等待与跟随。 Q:跟意大利目前是怎么沟通? A:现在还在沟通中,意大利其实算特例。全球范围内大型互联网企业 CEO 在当地被判刑的只有意大利,意大利对新 技术引进比较左派/排外。 当年也解决过很多 GDPR (一般资料保护规范)涉及的合规问题。归根到底这种问题的解决 最终就是罚款, Google 当年也面临过数据安全与反垄断的罚款,这个问题最终会解决。 Q:亚洲地区 GPT 账号出现大面积封禁的原因? A:有几件事是一起发生的: 1) 我们现在在查 1 人多账号、用户行为合规的问题; 2) 意大利、三星反馈 GPT 有数据 安全隐患;这些问题有些关联,我们规范账号与行为合规也是为了解决安全隐患,我们走在行业最前端,很多监管问 题最先遇到,从微软过往的运营角度来说,都是比较保守的, 在用户合规与监管方面我们暂时是比较保守的,通过安全审查后,账号访问权限还会放开。 关于 GPT 在大陆的可用性问题:一段时间内在大陆可用的可能性不高 ,两个原因: 1)算力/存储问题:在国内的数据 中心资源还不够;2)监管问题: GPT 模型目前不是在中国训练,涉及数据出境问题;还是可以翻墙出去用,但单个 IP 能有几个账号、整个收费模式如何还得看,当前以应对合规审查为第一优先级。(商业模式: funing-model:免费使 用,为流量/特定功能调用付费; Subscrption-model:订阅)。 Q:如果我们数据中心能满足几千上万 PD 的算力需求,可不可以在国内训练不出境,还会有监管问题? A:理论上可行。但我们在国内是要看收入与经济回报性价比的,这些投入在国内如果收不回成本就不值当。从中国区 对微软的收入贡献来看,未来 3-5 年在中国训练大模型的可能性不是很高。除了经济回报的问题,我们也遵从美国方 面的法规要求, 最先进的技术不能在大陆应用,就像 Teams ,国内出了这么多竞品后, Teams 才登陆中国, 就是因为 最先进的技术不能立刻来到国内。中国市场变化也特别快,有顶尖研发人才&相对便宜的工程师,我们的先进技术如果 马上带到大陆,被 copy 的可能性很大,不能保持技术先进性。腾讯与字节跳动都是微软头部客户,我们采用的是竞合 策略,我们希望在比较长的时间跨度能把优势技术赋能给他们, 而不是很短的时间就被他们学会我们的核心竞争力。 Q:如果说我们不能在国内训练模型,要应用 GPT 的话数据出海不可避免, 怎么赢回市场? A:ToB/ToC 是两个策略。“Win-back”是针对 ToC/SMB,用得多是通用功能,copilot 也不需要特别多定制化训练, 通过 API/微服务开放通用模型就可以。 Q:copilot 不需要针对国内用户数据训练? A:C/B 端客户用 Copilot 不涉及大规模数据训练,大 B 客户要定制化训练要上云。 Copilot 本质是订阅制产品的一个 功能,是我们“Win-back “市场的一个工具。 Q:copilot 通过目前啊流通的通识知识训练已经很成熟,不需要来自用户的增量数据? A:其实现在的 office 365 已经有很多 AI 功能,比如一键换肤/生成模版等等,copilot 只是进一步提高自动化水平, 你可以把这些 AI 功能全部集成, 通过对话式的方式快速实现, 文生图、语音生文本这些功能原来都不是集成 copilot 里的,而是要用到工业元宇宙等场景。 而且即使 copilot 需要做些推理,也不需要在 Azure 上专门推理,算力需求不 大,结构化的图片/文本不太占用太多算力,端侧可能就能满足算力需求。而且我们在世纪互联的数据中心上也部署了 轻量级的大模型(中模型)。 Q:我们内部觉得 ToC 这种模式不会涉及数据合规? A:不太会。 Q:国内企业出海/海外企业进国内的 GPT 使用问题? A:微软的合规体系在世界范围内都是最健全的,微软这套体系被安全审查的概率较小。我们反黑客/安全风险的能力 也是很强的。技术、架构体系、信誉都比较好。中国厂商出海会有美国贸易部门的黑名单问题,比如如果国内公司出 海,海外子公司不可能用华为云, 华为在黑名单里,再者有些芯片厂商可能也在黑名单里,那用这些芯片的服务器也 没法出海。国内企业出海直接用微软云与骨干传输网络就好,比如腾讯,是微软在大陆最大的游戏客户,腾讯在中东 没有数据中心与传输网络,在中东的生意是基于微软基础设施起步。腾讯后来做了自己的数据中心,他们的反攻击、 反入侵、社区运营等等很多东西是跟微软很类似的。做 ToB 大客户会涉及到利益交换。国内企业出海肯定可以用 GPT。 在华的外企方面,比如欧莱雅、一汽大众我们在谈 GPT 的使用。 Q:欧莱雅为什么能用? A:数据中心在中国,可以私有化部署。比如星巴克中国的数据中心在国内。 Q:国内厂商的算力储备? A:国内算力储备最多的是阿里(阿里云 A100 上万片左右;整个集团是 A100 阿里云 5 倍左右; 外部算力+集团+阿 里云差不多能到 10 万片算力 (1万片阿里云,其他 A100 是各业务线); 阿里今年 A100 有 30%+增速 ,8-9 个大客户 有大模型训练需求;已经在下单了,今年到明年初阿里集团能达到 10 万片量级); 大模型最好的是文心一言(Bert 体 系,年初 3000 台 A800 8 卡服务器;全年5 万张); 国内看好百度、字节,有算力、算法/模型团队、聚合数据能力强。
0
0
0