LittleLark的个人主页

即刻App年轻人的同好社区

下载

App内打开

LittleLark

130关注24被关注0夸夸

🧚3D&2D Gen/VLM
Now@CityUHK | BEng@USTC
🏸要记得锻炼身体
🎃迷茫

LittleLark

1年前

阑夕ོ: 因为始终没有等到真正意义上的杀手级应用，AI很大程度上依然是一个新闻/资讯驱动型的行业，也就是隔三差五来一波「炸裂」，更新一下人类岗位被取代的进度百分比，然后大家继续该吃吃该喝喝，循环往复。而普通人到底能用AI做什么，回答这个提问本身就是最大的PMF，大大小小的AI公司过去一年里都在寻找答案，但没有人敢自称已经找到了，别问，问就是未来可期。在我看来，DeepSeek-R1的最大贡献，其实是把高阶AI给平权了，之前整个行业都在走生产力导向的路线，重视AI的提效价值，由此把高算力成本合理化，用「星际之门」这样的宏大工程叠加资本预期，成了唯一正确的方向。所以Sam Altman说200美金/月的ChatGPT Pro在账面上是亏损的，OpenAI和微软合作了那么久，一旦新的数据中心需求被卡审计了，马上转头就和甲骨文勾兑上了，狼性归狼性，这条路确实是会越走越窄的。 AGI固然是个好东西，但它显然不应该建立在用起来肉疼这个前提上，无时不刻的向用户施以心理暗示，每次提问有没有创造足够的价值，如果没有，就不要浪费寸卡寸金的算力了，这就是生产力导向的叙事。 DeepSeek的最近3代模型，技术转进的阶梯感非常明显，V2是把AI的调用单价打下来，V3是在低价的同时跟上主流大模型，R1是加质不加价直接对齐最前沿的模型能力，保持不变的参数只有普惠这一条。智能这种资源，也可以像水电煤一样取之即用，而水电煤的普及则会同时造福于工业生产和生活消费两端，对于AI行业来说，这是非常祛魅的设想，所以据我所知，大厂对于DeepSeek的这波出圈，感情上相当矛盾。倒也不是不能理解，矛盾是因为短期损益和长期受益的混合。短期损益在于堆卡这种变相发行入场券的游戏规则被打破了，本来可以靠财力储备去限制竞争对手的入局，现在行不通了，每个玩家都可以尽快站在巨人的肩膀上，看看GitHub上和DeepSeek有关的开源项目是怎么雨后春笋般出现的，就明白了。长期受益在于加速AI的平权实际上有利于整个行业更快扩大消费级市场，而不是只能在降本增效的SaaS市场里作威作福，尤其是考虑到中国的SaaS产值本就疲软，让更多的用户可以一键获得最顶级的模型，为行业创造需求规模，堪称功德无量。所以我不认同那种认为DeepSeek的成功是一种对抗性的胜利，这太强行了，而且如果你的崛起就会让别人遭殃，这样的狂热捧杀非常败坏路人缘，比如幻方其实是最早开始囤英伟达显卡的公司，要说英伟达因为DeepSeek崩了，梁文锋自己都得扣个问号。优秀的公司涌现出来，一定会让全行业都变得更繁荣，包括也将推动竞争对手的进步，这和主观意志无关，是经济世界的客观规律。而且如果你们真的看进去了梁文锋屈指可数的那几次对谈，就会发现他其实是一个纯粹远大于情绪的创业者，采访他的记者说幻方/DeepSeek带有强烈的文化吸引力，无论是组织还是做事，都遵循着有没有热情这个基本逻辑，包括找人也是，热情是藏不住的。梁文锋自己打的比方，是买钢琴，一来要买得起——原始积累很重要——二来也得有一群急于在上面弹奏音乐的人，所以我很确信他不太会被噪音裹挟，事实上这次爆火，连加班都没怎么增加，发布的更新都是按照既定计划安排的。不过国产AI行业也是实打实的连续两年没过好年了，不同的是，去年是惊惶焦虑，今年是志得意满，反转情节是真的爽。很多人可能不太记得一年前是个什么形势了，我来帮你们唤醒一下长期记忆： 2024年2月，OpenAI在龙年大年初五发布了视频大模型Sora，和当时的视频大模型都是动态图片水平完全不同，演示里的运镜和动作无比流畅丝滑，再次上演了让全硅谷都看不懂的剧本。那会儿的中国AI公司，处于一种集体懵逼的半植物人体征：市面上能用到的最好产品是百度的文心一言——别笑，真就如此——李彦宏以胜利者的姿势劝大家放弃重复造轮子，字节跳动的CEO梁汝波在内部大会上起头反思公司为什么错过了GPT这场技术革命，朱啸虎锐评国产大模型公司没戏的「投降论」在朋友圈里刷屏，阿里因为FOMO的原因投了「AI六小龙」里的五家后被马云质疑「投这么多是不是看不懂」，腾讯则保持「超出三界外不在五行中」的查无此人状态，再往前一点，王慧文抱病撤出由他一手筹建的光年之外，不可置信的坊间传闻说是意识到追不上了所以才激流勇退⋯⋯ 这就是一年前的真实局面，当时没人能想到，翻盘能够来得如此之快，在短短一年时间里，从不够资格上桌吃饭，到霸榜全球应用商店，急风骤雨，摧枯拉朽。我要说的是，DeepSeek不是一根孤单的独苗，比偶然更好更好的事情是必然，国产AI阵营这一年来的集体成长，兜住了很有可能是这一代人工业革命的在场权，能够正面迎战饱和式竞争：有字节这样全量对标的，豆包、扣子、Trae成套开发，走的是用高投入换高回报的路线；有通义这样正统开源的，通义家族的谱系之发达，已经在各大竞技场里刷了一年的分了；有月暗这样精耕细作的，Kimi 1.5也是不逊色于o1的思维链模型，就是很不幸的和DeepSeek-R1撞车了哈哈哈；有快手这样半路杀出的，可灵现在就是全球最强的视频大模型，没有之一，对Sora的幻灭要负全责； ⋯⋯ 甚至完全有理由相信，下一个现象级的国产大模型，可能都是上述没有提到的名字，科研固然没有意外，但市场充满随机性。最后，建议大家勤用DeepSeek-R1，把它当成一个对话帮手，而不只是查询工具，思维链的展开，可以让你更好的理解如何控制需求（Prompt），并对过程中的偏差进行修正，这比只对结果方案提出「不够大气」的模糊反馈，要高效得多。做好准备，迎接新的人机共生时代。

0 00

LittleLark

2年前

Kostja: 3D是什么？渲染，建模，贴图和3D有什么关系？AI+3D走得通吗？-科普向📝 我在今年认识了NeRF，DreamFusion，Gaussian Splatting，Magic3D等算法，产品逛过年初的Nvidia Picasso，Kaedim，Csm，Spline，Luma，Plask，Skybox到最近中国团队发布的MeshyAI，Tripo/Vast @Chris-Su 即使如此，每次想起3D我脑中依旧会浮现的是一排排旋转的立体模型小人，建筑物和地形曲凯老师@曲凯这篇播客采访了Meshy.AI 创始人胡渊鸣，系统性地梳理了图形学，3D，AI+3D的概念，下面是精要（语音转文字：飞书妙记内容归纳：kimichat） “1. 图形学的定义：图形学是一门研究如何通过计算机技术合成视觉内容的学科，包括真实感渲染、仿真、AI与图形学的结合等。 2. 渲染：渲染是将3D模型转换为2D图像的过程，涉及到光线传播的仿真，目的是在屏幕上生成具有真实感的图像。 3. 3D数据表达方式：点云：空间中的一组点，可以用来表示3D物体的表面。体素：规则分布的3D点集合，类似于2D图像中的像素，但增加了一个维度。神经辐射场（NeRF）：使用神经网络来表示场景中每个点从不同角度观察时的外观。高斯散射：一种点云表示方式，其中每个点具有特定的方向性和大小，可以表示3D场景的信息。 Mesh（三角网格）：使用三角形网格来表示3D物体的表面，是实时图形领域中最常用的表示方式。 4. AI生成3D的任务：文字生成贴图：将文字描述转换为3D模型的表面纹理。文字生成3D模型：直接从文字描述生成3D模型和贴图。图像生成3D模型和贴图：使用图像作为输入，生成3D模型和其表面的纹理。 5. 市场需求与技术挑战： 3D资产在游戏和影视行业中的需求很高，但AI生成3D内容的技术仍在发展中，面临质量、可控性、速度等挑战。 6. 创业与科研的结合：胡渊鸣强调了理解市场需求的重要性，并分享了从科研转向创业的心路历程，以及如何将科研思维应用于商业环境中。” 我的笔记📋 1. 图形学追求将数字内容更好地视觉化 2. 游戏行业中实时渲染用得多，如Unity，Unreal Engine，对算力要求更高 3. 影视行业中offline CG用得更多，如3dmax，Maya，Houdini 4. “2D+时间维度=视频，2D+空间维度=3D” 5. 图像生成3D更加可控，多张图3D重建很成熟，目前想解决的是依靠多角度数据集和单张图片生成3D资产 6. 2D图片数据集Laion有58亿五千万张图，3D数据集Sketchfab只有5百万，并且有版权 7. 3D是toB的生意，创作者有很高的操作门槛，且市场规模只有2D市场的1/10～1/20 8. 硬件如Vision Pro可以扩大3D的使用场景 9. 生成式AI的出现让构建3D路径从模型到数据转向有了可能性建议听一遍原文，非常有收获～关于AI，图形学和全息投影，你还可以听这期节目（https://www.xiaoyuzhoufm.com/episode/63e5c75b22388040c970a1ec） Tripo和MeshyAI效果怎么样，看看卡兹克@数字生命卡兹克怎么玩的（https://mp.weixin.qq.com/s/BNeSLZ5qxTmJvFrWd0kvEQ）目前OpenAI，谷歌等科技巨头对3D也感兴趣，英伟达2023年10个highlights里有三个和3D有关（https://twitter.com/DrJimFan/status/1738613195173159187）随想：AI+3D有没有更广阔的使用场景？除了建筑，可能还有数字孪生，工业设计，GIS，遥感，医学影像等求个点赞，错误和其他观点可以发在评论区🤔️

0 00

LittleLark

2年前

AlanJiang: 没想到自己研究生毕业时候写的碎碎念，昨儿被一个华科的同学捞起，他表示这对每一个在科研入门阶段的人会很有帮助，还专门发微信来感谢我。今儿专门发在这里，希望能让后来的朋友少走些弯路。现在想起来还觉得有意思的一句话：“在动物世界里，学会生存的本领，同时保存自己的灵性，是一种晦涩的艺术。”

0 00

LittleLark

2年前

AlanJiang: 最近的直觉感受：如果你是AI领域的技术人员，不必被自己过去的NLP/CV/ML/Graphics履历所困住，在一个不熟悉的领域，是可以通过论文、开源代码、学术talk以及和大佬有诚意的cold call，在3个月内掌握绝大多数认知的。别人幸苦耕耘三年的东西，可能跟你三个月努力差不了太多。真正难得的能力，是判断方向的战略思考能力，这是长期ROI最高的能力。一个人同时间段什么都做，往往意味着他缺乏这种能力，很多时候，选择不做什么比选择做什么更重要。一个组织也是这样。

1 00

LittleLark

2年前

时光机司机小Wong: 光照和材质联合估计和摄影测量结合做成了 Using only a mobile phone and it's flash, M-XR's software delivers a fully textured PBR asset automatically, without any manual work or artistic cleanup !

1 00

LittleLark

2年前

3D需要以渲染到2D屏幕上的方式呈现🤔所以说如果2D的视频如果足够精确而且可以提供反馈，或许真可以替代3D？

JasonM.: 去年 3月份发的一条朋友圈算是灵验了，可能大家也都想到了。我当时发的是：“想到一种恐怖的可能性，可交互式视频的AIGC有一天替代计算机图形学，成为人们制作交互式体验（游戏）的主要方式。”当然这个过程会很漫长，因为要实现realtime prompt 所需要的算力是可怕的。但是如果以终为始的话，可能做AIGC 就不要去做 3D 模型的 AIGC，这种路线最后只会被视频AIGC颠覆。

0 00

LittleLark

2年前

时光机司机小Wong: Apple这篇论文可以解决你的问题。用text让室内换装。RoomDreamer: Text-Driven 3D Indoor Scene Synthesis with Coherent Geometry and Texture https://arxiv.org/pdf/2305.11337.pdf

0 00

LittleLark

2年前

Paint🎨

P小二: Daily Papers and AI News Tracking(12.22) https://aigc.openbot.ai/p/daily-papers-and-ai-news-tracking1222

0 00

LittleLark

3年前

🫡

CyberDaily: Time发布的AI影响力100人 https://time.com/collection/time100-ai/ 背后那些数以万计的数据标注员同样伟大

0 00

LittleLark

3年前

mark

老蒋不一定靠谱: 最近在看鼎鼎有名的kk大神天涯神贴，十多年前的判断太准了，自顶向下自成体系的宏观判断很多，真的能穿越时间的很少很少很少

0 00

LittleLark

3年前

又是发疯的一天：我的人生，彻底失败😭😭😭

0 00

LittleLark

3年前

🥹

莫唯书Mark: AI界黄埔军校

0 00

LittleLark

3年前

😮‍💨

智能纪元AGI: 上海财经大学校长刘元春执笔的报告指出，要高度警惕一个数据：今年以来中国高技术产业增速断崖式下滑，近二十年来首次陷入低迷。很可能反映外部科技封锁对国内高技术产业发展的影响，达到了一个临界点。这也导致青年群体失业率逆势攀升。如果不能及时扭转，未来中国高科技产业发展和高科技人才储备都可能发生变异。刘元春等判断：今后青年失业难题可能会持续10年，短期内不断加剧。处理不当，将引发经济领域外的其他社会问题，甚至成为经济问题导火索。解决高校毕业生就业工作应与支持高技术产业发展政策协调配合；保青年就业要靠民间投资带动，关键在于完善法治建设，弥合人们对法治建设的信心缺失。

0 00

LittleLark

3年前

🧐

智能纪元AGI: 2023年退休人员基本养老金上调3.8% 人社部、财政部22日发布《关于2023年调整退休人员基本养老金的通知》，明确从2023年1月1日起，为2022年底前已按规定办理退休手续，并按月领取基本养老金的企业和机关事业单位退休人员，提高基本养老金水平，总体调整水平为22年退休人员月人均基本养老金的3.8%

0 00

LittleLark

3年前

mark

老蒋不一定靠谱: 在B站上看到了一个不错的试验，内容是看看一个人在啥也没有（没团队没任何物料）的情况下从0到1能不能搭起来一个淘宝店。试验结果是问题不大，一个能熟练运用AI工具的普通人，已经能够通过ChatGPT+midjourney的组合，来完成比较繁琐的开店流程。这还是个电商小白的假设性的模拟（并没有真实商品），如果是正经要开店的话，会比视频里更容易，因为有真实物料。看多了超宏观视角探讨AI前景的内容，这种特别落地的挺好玩。大语言模型+AIGC影像应该能衍生出不少非常具体的商业机会，虽然没那么改变世界，但是让有想法有能力的普通人上杠杆更容易了。 B站上已经有一些AI相关的不错的视频，我推荐几个： “跟李沐学AI”的所有内容（但是有点难） “图灵的猫”最近的几期，可以看看思路 “量子位”的B站号 “洋洋杂谈”：一个硅谷AI领域工程师的对谈号，可以用来了解一些行业热点【【渐构】万字科普GPT4为何会颠覆现有工作流；为何你要关注微软Copilot、文心一言等大模型-哔哩哔哩】 https://b23.tv/Goop9uR------爆款，适合听说过但还不太了解CHATGPT到底是什么的人看【人工智能教父最新完整采访：ChatGPT的影响和潜力-哔哩哔哩】 https://b23.tv/NRPGN7C-------搬运内容，看个思路【黄仁勋与OpenAI首席科学家Ilya Sutskever的炉边谈话 4K 中文字幕-哔哩哔哩】 https://b23.tv/5D5nRSm-------搬运内容，看个思路另外入门各种AI工具，搞定注册布置环境常规应用之类的攻略，B站上也有很多，随便搜对应的AI应用就能搜到，midjourney在B站上就有超多教程（教程攻略内容一直是B站的强项）。我过几天也会出一个探讨AI会让社会更平等还是更分化的视频，里面有一个暂时没在世面上看到的核心逻辑。

0 00

LittleLark

3年前

mark

Trent壁花少年: 用了不到两小时用ChatGPT将真格基金制作的1200个AI工具分类整理进了飞书表格，分享下整理方法和1200+的工具（文章来源@葬花达人鲁智深） 1200+工具通过公众号分5个文章发出的，每个工具的内容分别是工具名称、类型、介绍、费用和网址这5个字段的内容，如果一个一个的粘贴可能需要100+小时，所以就自然想到ChatGPT这个敲一切钉子的锤子先写好了Prompt让ChatGPT将我发送的内容进行整理，整理效果如图一。很快就发现了一个问题，无论怎么调整Prompt他都无法记住，基本上经过两轮整理后就忘记要做什么接下来想到了Poe新出的创建自定义bot的功能，我在bot里放置了同样的Prompt后生效了，发送的文字都能按照要求回传表格，Prompt见图二。接下来觉得这个效率还是有点慢，一是要来回复制粘贴，二是因为字符限制，每次只能整理10个左右的工具，如果这样整理可能还是要几十个小时我又瞄向了Notion AI，将文章剪藏进Notion后使用Notion AI将文字批量转化为表格，这一步减少了一步复制粘贴的步骤，效率再次提升1/3，这时候时间已经过去了1个小时，才整理出不到200个最后决定用老工具和新工具结合试试，我将两万多的文字（大约300个工具）直接粘贴进Excel里，然后让ChatGPT按照我的整理要求写出公式，奇迹出现了，公式非常有效，见图3，花了20分钟将剩下的1000个工具整理好了，如果不是ChatGPT我是想不到Excel还有这样使用场景的公式结论就是ChatGPT这个可以敲一切钉子的锤子总还是需要一些技巧，不仅是Prompt，还有如何和现有工作流和软件结合的技巧 1200+的工具见链接：https://p89j9q5t4u.feishu.cn/wiki/wikcnEDEiXBaJDgw8XxZ4GumN2c #AI工作流

0 00

LittleLark

3年前

mark

CEO来信: 滴滴发布无人驾驶概念车 4月13日，滴滴自动驾驶发布Robotaxi概念车：DiDi NEURON，在无人驾驶时代致力于为乘客提供更好的出行服务。DiDi NEURON独创了车内机械臂，可以实现车内外的多种服务，如提行李、递水、叫醒等，最大程度优化乘坐体验与运营需求。空间上，DiDi NEURON去掉驾驶位，最大限度释放了乘坐空间。车内大屏交互系统有会议、游戏、街景介绍、氛围选择等功能，将出行过程与丰富的场景结合。

0 00

LittleLark

3年前

mark

xyz_OWIA1A: 微软大中华区专家交流纪要 Keynote：微软 23 年策略： all-in GPT；砍掉了一些产品线，比如 VIVA、工业元宇宙与数字孪生团队解散；关于 4 月 18 号的国内Teams 发布会：与 Copilot 的推出没有必然联系， 22 年 11 月就规划好了 (去年没发布是因为国内数据中心没落定)，有无 copilot 功能不确定， copilot 这个功能 22 年就已测试成熟。 MS Office 整合 GPT 以后的 ARPU 值展望： ToC 端预计不会有 ARPU 值增长；目前给企业级合作伙伴 24 年的报价单也没提价；大中华区主要客户为 C 端与 SMB ，C 端 copilot 是比较通用化/标准化的 feature，不需要基于用户数据做特别训练，端侧算力就能满足需求，且微软在国内的数据中心能满足轻量化模型部署需求； SMB 与大 B 关注运营效率，模型的定制化/调优属于增长服务，但不会通过提高年费方式实现收入，而是根据客户需求为功能的使用付费(流量/模型调用次数等) 。大中华区策略：短期侧重提高市占与渗透率，促进正版化提升，拉升用户留存与使用时间，目前没有涨价的诉求。数据监管面临的问题： 1) 数据安全：用户隐私数据/访问权限问题可以通过技术手段短期解决；合规/数据出境问题：得看当地的监管政策，目前是灰色地带； 3) ESG 与伦理问题：滞后与前两个问题解决；跟意大利的沟通/GPT 封禁亚洲账号：大概率通过罚款形式解决；封禁账号与意大利、三星、中美关系都没必然联系；主要是保障用户行为合规，在监管方面微软目前较谨慎； GPT 在大陆可用性问题：短期在大陆开放使用的可用性不高。原因有三： 1) 算力/存储问题：国内数据中心资源不够，考虑到中国区收入与经济回报比，未来 3-5 年在国内大规模建设数据中心本地化训练的可能性不大；2) 数据出境：大模型训练在美国，涉及数据出境问题； 3) 需要遵守美国的法规：尖端技术不可能立刻引进中国，比较典型的例子是 Teams，国内有一堆竞品才决定来中国，怕被国内友商 copy，需要保持技术先进性；国内企业出海/海外企业进入国内的 GPT 使用问题：看数据中心所在地， GPT 可以私有化部署。国内企业出海数据中心在海外可用；海外企业进入国内，数据中心在国内也可用；国内 AI 芯片好坏：寒武纪 MLU370 买得多， A100 的 60-70%；寒武纪服务态度与体系好；对接效率高；断货风险小；壁仞宣传做得好，但实测的卡不太拿得到，量产能力可能不够。海光量也够、参数也不错，技术与供货角度都比较好但海光在美国黑名单里面，有出海生意的厂商不敢用，容易被连坐。 Q&A： Q：OpenAI 为什么 17 年转向 PyTorch 框架？ A：API 迭代稳定性比 Tensorflow 好，开发者调用/使用 GPT 的门槛更低。 Q：GPT4.0 的参数规模？ GPT5.0 什么时候推出？ A：万亿水平。 GPT5.0 已经训练完成，具体推出的时间点网上查到是啥就是啥(网上传的是 23 年底)。 GPT5.0 的参数规模未知，得到 PR 文出来。目前大中华区 AI 实验室模型的参数调整已经暂停，什么时候重启不确定。 Q：GPT5.0 较之 4.0 主要提升的地方还是多模态的能力？ A：除了多模态能力提升外，还有一些垂直应用场景的延伸&跟 partner 在应用场景的整合与细化。官方的 GPT5.0 信息在 PR 没出来之前没有准确的数。ChatGPT 出来之前已经在做一些垂直场景的应用功能，比如语音生成文本、虚拟现实中的语音、文本生成、视觉交互、低代码开发等之前都有相关解决方案。今年微软商业战略有些调整：把几条产品线取消，比如微软 Viva (企业内部的 CRM、员工管理、知识库管理)、 hololens 事业部(商用混合现实技术产品线)中的 AR/VR/MR 原来是有针对工业元宇宙、数字孪生等场景有整合的解决方案，去年年底把工业元宇宙与数字孪生团队取消， 23 年 all-in GPT。微软有 3 朵云：Azure 云服务(目前 GPT 部署在上面)、 GPT 将拓展到另外两朵云：办公全家桶(MS 365、Teams、VIVA 等)、 Bussiness Application (PowerBI 等产品) 都会整合 GPT 能力。 Q：4 月 18 号世纪互联推广 Teams 与 MS 365？ A：Teams 登陆中国去年 8 月就已经规划了，跟 Copilot 的发布没有必然联系。 Q：要发布的 Teams 国内版没有集成 Copilot 能力？ A：这次会议的主题是“强 AI 时代的组织效能升级”，Teams 与 MS 365 套件本身就有些 AI 功能， copliot 是在原有 AI 能力基础上加持 GPT 能力，比如语音文本生成、格式/内容生成等。这些都在 Roadmap 上，去年 11 月已经在做战略规划与小范围测试了。4 月 18 号这个节点与 Copilot 没有必然关系，去年就规划了这件事。 Q：4 月 18 号不会有 copilot 插件？ A：不是因为 copilot 开的会，但这个功能什么时候发布不知道。开这个会是我们去年已经确定的“Win back”战略，国内过去盗版昌盛、市占率也低，也催着世纪互联来加速推这个事，去年没发布是因为世纪互联在国内的数据中心建设不够完备，微软在国内的北三数据中心落地后存储与算力上来了，今年才要回到中国。总部本来也是不 care 的，但大中华区有收入增长的诉求。 Copilot 这个 feature 去年已经测试的比较成熟了，18 号有发布可能，feature 全部ready。 Q：MS 365 之类的产品集成 copilot 能力后，短/中/长期 ARPU 的展望？ A：定价属于微软产品策略，由微软总部来定。中国产品价格也是总部设定。微软收入大头是 Modern Work Solution (全家桶)。报价模式：云计算服务是按流量付费，云计算服务截止今天没看到提价倾向。 Copliot 集成的 MS 365 后我不认为会有 ARPU 值增长，包括我们企业级的合作伙伴，在做报价单的时候目前明年价格也没有明显变化。我们目前大中华区的策略是“Market Winback”，在国内我们市占不是很高，核心目标是拉升用户留存与使用时间，单价目前没有涨价的诉求。ARPU 概念来自于电信运营商，比如你用了 4G、5G 套餐，标准是 50 块钱，但最后你的账单远高于 50 快，因为你的使用超出了套餐范围。云计算是一样的道理，我们不是通过 ARPU 提升来抬客单价，MS 365 与 Dynamic 365 我们的策略是维持当前 ARPU 的情况下，推出些增值的 feature 让客户买单。 C 端用户用通用的功能就能有较好的体验，我们训练好的模型通过插件/微服务的方式推给 C 端客户就行，比如网上传得比较多的给 copliot 个大纲，生成个 PPT，这是比较通用的微服务。对于 B 端用户，模型要调优、要训练，训练过程中就需要有增值服务，比如现在按 tokens 收费的方式，客户用量越大价格可能越高。中国区目前的策略是追求市占提升与渗透率，针对的客户主要为中小型企业与 C 端客户，这些客户还是在力争开账户的阶段，体量还不大，能训练的数据量没那么大。这方面担心两个问题： 1)中国区算力不够；2)监管问题，可能牵扯数据安全；总结：我们涨不涨价跟 C 端用户关系不大， C 端用的是标准化的产品与 feature、通用化的微服务；对于 SMB 与 To 大 B 客户，他们最关心的是 Opex，虽然有新增付费的功能点，但 B 端客户整体运营成本是降低的，比如设计费用、人工费用都会节省，对于微软是增收，对于客户也有好处，但也不是通过直接提高产品年费的形式实现，而是客户根据需求为新功能的使用付费。大企业的 IT 团队很强，诉求也差异化，我们也只需要把 API 开放给他们，定制调优他们自己做， API 调用收 license/流量费这个我们会去做。海外跟大中华区又不一样，海外我们的 SAAS/微服务比较好卖，海外客户希望开箱即用。海内外的策略规划与战略执行的思路类似，只是中国区短期侧重市占与正版化多些。 Q：关于数据安全的问题，目前我们跟大陆监管机构如何沟通的？ A：没有直接沟通。有关安全与合规问题，我们在中国的策略落地较之海外有时延，主因： 1)市场规范化程度； 2)地缘政治/中美关系问题；合规问题目前还游走在灰色地带。 Q：目前我们面临哪些数据监管的问题？ A：三个问题： 1)数据安全：用户隐私数据/数据访问权限问题；这是技术层面能解决的问题，比如通过网络访问节点的权限控制能进行规范化，这是微软安全技术/合规体系比较成熟的部分，也已经融入三朵云的底座中去了，比如端点/OS/网络控制，我们只要进一步对数据访问进行规范化，这个问题就能解决。我们已经做过实验，在 linux 服务器上，针对 GPT 模型进行针对数据访问的微调， GPT 在用户访问时能反映某些问题涉及的数据是没有经过授权的， GPT 会终止操作。 2)合规/数据出境问题：不止是微软的问题，阿里、腾讯也有这个问题，全球也没有特别好的监管方法； 3) ESG 与伦理问题：系统性因素，需要技术与宏观监管体系都比较成熟后能克服。好的点是很多类似的问题以前也遇到过，比如 4G、5G 普及过程中也有很多问题，后续都陆续解决。现在可以明确的是数据安全涉及的技术问题我们能很快解决，监管要求的变化需要等待与跟随。 Q：跟意大利目前是怎么沟通？ A：现在还在沟通中，意大利其实算特例。全球范围内大型互联网企业 CEO 在当地被判刑的只有意大利，意大利对新技术引进比较左派/排外。当年也解决过很多 GDPR (一般资料保护规范)涉及的合规问题。归根到底这种问题的解决最终就是罚款， Google 当年也面临过数据安全与反垄断的罚款，这个问题最终会解决。 Q：亚洲地区 GPT 账号出现大面积封禁的原因？ A：有几件事是一起发生的： 1) 我们现在在查 1 人多账号、用户行为合规的问题； 2) 意大利、三星反馈 GPT 有数据安全隐患；这些问题有些关联，我们规范账号与行为合规也是为了解决安全隐患，我们走在行业最前端，很多监管问题最先遇到，从微软过往的运营角度来说，都是比较保守的，在用户合规与监管方面我们暂时是比较保守的，通过安全审查后，账号访问权限还会放开。关于 GPT 在大陆的可用性问题：一段时间内在大陆可用的可能性不高，两个原因： 1)算力/存储问题：在国内的数据中心资源还不够；2)监管问题： GPT 模型目前不是在中国训练，涉及数据出境问题；还是可以翻墙出去用，但单个 IP 能有几个账号、整个收费模式如何还得看，当前以应对合规审查为第一优先级。(商业模式： funing-model：免费使用，为流量/特定功能调用付费； Subscrption-model：订阅)。 Q：如果我们数据中心能满足几千上万 PD 的算力需求，可不可以在国内训练不出境，还会有监管问题？ A：理论上可行。但我们在国内是要看收入与经济回报性价比的，这些投入在国内如果收不回成本就不值当。从中国区对微软的收入贡献来看，未来 3-5 年在中国训练大模型的可能性不是很高。除了经济回报的问题，我们也遵从美国方面的法规要求，最先进的技术不能在大陆应用，就像 Teams ，国内出了这么多竞品后， Teams 才登陆中国，就是因为最先进的技术不能立刻来到国内。中国市场变化也特别快，有顶尖研发人才&相对便宜的工程师，我们的先进技术如果马上带到大陆，被 copy 的可能性很大，不能保持技术先进性。腾讯与字节跳动都是微软头部客户，我们采用的是竞合策略，我们希望在比较长的时间跨度能把优势技术赋能给他们，而不是很短的时间就被他们学会我们的核心竞争力。 Q：如果说我们不能在国内训练模型，要应用 GPT 的话数据出海不可避免，怎么赢回市场？ A：ToB/ToC 是两个策略。“Win-back”是针对 ToC/SMB，用得多是通用功能，copilot 也不需要特别多定制化训练，通过 API/微服务开放通用模型就可以。 Q：copilot 不需要针对国内用户数据训练？ A：C/B 端客户用 Copilot 不涉及大规模数据训练，大 B 客户要定制化训练要上云。 Copilot 本质是订阅制产品的一个功能，是我们“Win-back “市场的一个工具。 Q：copilot 通过目前啊流通的通识知识训练已经很成熟，不需要来自用户的增量数据？ A：其实现在的 office 365 已经有很多 AI 功能，比如一键换肤/生成模版等等，copilot 只是进一步提高自动化水平，你可以把这些 AI 功能全部集成，通过对话式的方式快速实现，文生图、语音生文本这些功能原来都不是集成 copilot 里的，而是要用到工业元宇宙等场景。而且即使 copilot 需要做些推理，也不需要在 Azure 上专门推理，算力需求不大，结构化的图片/文本不太占用太多算力，端侧可能就能满足算力需求。而且我们在世纪互联的数据中心上也部署了轻量级的大模型(中模型)。 Q：我们内部觉得 ToC 这种模式不会涉及数据合规？ A：不太会。 Q：国内企业出海/海外企业进国内的 GPT 使用问题？ A：微软的合规体系在世界范围内都是最健全的，微软这套体系被安全审查的概率较小。我们反黑客/安全风险的能力也是很强的。技术、架构体系、信誉都比较好。中国厂商出海会有美国贸易部门的黑名单问题，比如如果国内公司出海，海外子公司不可能用华为云，华为在黑名单里，再者有些芯片厂商可能也在黑名单里，那用这些芯片的服务器也没法出海。国内企业出海直接用微软云与骨干传输网络就好，比如腾讯，是微软在大陆最大的游戏客户，腾讯在中东没有数据中心与传输网络，在中东的生意是基于微软基础设施起步。腾讯后来做了自己的数据中心，他们的反攻击、反入侵、社区运营等等很多东西是跟微软很类似的。做 ToB 大客户会涉及到利益交换。国内企业出海肯定可以用 GPT。在华的外企方面，比如欧莱雅、一汽大众我们在谈 GPT 的使用。 Q：欧莱雅为什么能用？ A：数据中心在中国，可以私有化部署。比如星巴克中国的数据中心在国内。 Q：国内厂商的算力储备？ A：国内算力储备最多的是阿里(阿里云 A100 上万片左右；整个集团是 A100 阿里云 5 倍左右；外部算力+集团+阿里云差不多能到 10 万片算力 (1万片阿里云，其他 A100 是各业务线)；阿里今年 A100 有 30%+增速，8-9 个大客户有大模型训练需求；已经在下单了，今年到明年初阿里集团能达到 10 万片量级)；大模型最好的是文心一言(Bert 体系，年初 3000 台 A800 8 卡服务器；全年5 万张)；国内看好百度、字节，有算力、算法/模型团队、聚合数据能力强。

0 00